تاریخ بهروزرسانی: 1404/03/08
حسین بیورانی
دانشکده علوم پایه / گروه آمار
پایاننامههای کارشناسیارشد
-
Statistical Inference of Generalized Poisson Regression Hurdle Model
1403Counting data is one of the most widely used data types because it is found in various sciences such as medicine, pharmacy, management, industry, and economics. Generally, a count regression model such as Poisson regression is used to analyze this type of data, but when the count data contains extra zeros, the results will not be efficient. Since extra zeros in the data cause over-dispersion, zero-inflated Poisson (ZIP) regression models are used for the Poisson distribution. Hurdle regression (HR) models are another type of modified count regression, HR is an effective model for dealing with zero-inflated data, which in combination with the generalized Poisson distribution can deal with over-dispersion or under-dispersion in addition to the problem of extra zeros. In this dissertation, we will study and analyze the generalized Hurdle Poisson regression model (GPHR) which has two properties of extra zero values and non-equality variance and mean. We will use different approaches to estimate the parameters of the discussed model. We will simulate the proposed methods by coding in R and compare the results using the evaluation criteria. Finally, we will apply the selected method to real data.
-
داده کاوی و تحلیل آماری اطلاعات بیمه مسئولیت بیمه گزاران شرکت بیمه ایران
1403دادهکاوی به عنوان یکی از روشهای نوین تحلیل دادهها، نقش مهمی در بهبود فرآیندهای تصمیمگیری در بیمه مسئولیت ایفا میکند. با استفاده از دادهکاوی، شرکتهای بیمه قادر به بررسی و تحلیل دادههای وسیع مشتریان، شناسایی الگوهای رفتاری و ارائه خدمات بهینه به آنها هستند. این تکنیک به تحلیل دقیقتر اطلاعات و مدیریت بهتر منابع شرکتهای بیمه کمک میکند. این پژوهش با هدف بررسی دادهکاوی در حوزه بیمه مسئولیت و تحلیل آماری اطلاعات مشتریان بیمه مسئولیت شرکت بیمه ایران انجام شده است. در فصل اول، به معرفی مفاهیم اساسی شامل دادهکاوی، بیمه مسئولیت، خوشهبندی، مدل لگاریتمی خطی و تحلیل واریانس پرداخته شده است. فصل دوم به توصیف و تحلیل اطلاعات مربوط به مشتریان بیمه مسئولیت این شرکت در سالهای ۱۳۹۳ تا ۱۴۰۲ اختصاص دارد. در فصل سوم، استنباط آماری و دادهکاوی اطلاعات بیمه گزاران بر اساس تکنیم های آماری خوشه بندی، تحلیل واریانس و نیز مدل لگاریتم خطی آمده است
-
مزایا و P -مقدار و عامل بیز در آزمون های آماری
1403در آزمون های آماری، استفاده از P -مقدار و عامل بیز به منظور ارزیابی و تحلیل نتایج آزمون ها رایج است. اما تفاوت ها و مزایا و معایب هر دو روش در تصمیم گیری های آماری می تواند به بهبود فهم ما از قواعد استنتاج آماری کمک کند. در این پایان نامه، قصد داریم مزایا و معایب استفاده از P -مقدار و عامل بیز را در آزمون های آماری مورد بررسی قرار داده و نقاط قوت و ضعف هر روش را مورد بررسی قرار دهیم. با بررسی این مسئله، می توان بهترین روش را برای استفاده در آزمون های آماری تعیین نمود تا به دقت و قدرت تحلیل نتایج آزمون های آماری افزوده شود.
-
ﻣﺪلﺑﻨﺪی ﻧﮕﻬﺪاری و ﻗﺎﺑﻠﯿﺖ اﻋﺘﻤﺎد ﻣﺒﺘﻨﯽ ﺑﺮ ﺑﺮدار ﻋﻼﻣﺖ ﺑﺮای ﯾﮏ ﺳﯿﺴﺘﻢ ﻣﻨﺴﺠﻢ ﺑﺎ در ﻧﻈﺮ ﮔﺮﻓﺘﻦ اﺛﺮ واﺑﺴﺘﮕﯽ و ﺷﺮاﯾﻂ ﻣﺤﯿﻄﯽ
1403در صنایع مختلف، بهویژه در حوزههایی که با سیستمهای پیچیده و حساس سروکار دارند، مانند صنعت هوافضا، انرژی و حملونقل، یکی از رویکردهای کلیدی، تمرکز بر قابلیت اعتماد و نگهداری پیشگیرانه است. در این رساله، این رویکرد با هدف بهبود کارایی سیستمهای منسجم ، کاهش هزینههای محیطی و تعمیراتی مورد توجه قرار گرفته است. تمرکز بر قابلیت اعتماد و نگهداری پیشگیرانه، به سازمانها این امکان را میدهد تا با پیشبینی و پیشگیری از خرابیها، عملکرد بهینهی سیستمها را حفظ کرده و به طور موثرتری از هزینههای غیرضروری جلوگیری کنند. همچنین در این رساله، با استفاده از بردار علامت و تابع کاپولای تعمیمیافته فارلی-گامبل-مورگنسترن $(FGM)$، یک مدل کلی برای میانگین طول عمر باقیمانده $(MRL) $ در تحلیل قابلیت اعتماد سیستمهای وابسته با ویژگی اشتراک بار ارائه میدهیم. این رویکرد با مدلهای پیشین تفاوت دارد، چرا که علاوه بر در نظر گرفتن ویژگی اشتراک بار، تاثیر شرایط محیطی بر سیستم را نیز بهطور همزمان بررسی میکند. همچنین، با بهرهگیری از مدل پیشنهادی و استدلال قضیهی تجدید-پاداش، یک سیاست جایگزینی سنی نیز تحلیل میشود. عملکرد مدل $ MRL$ پیشنهادی و نحوهی تغییرات راهحل بهینه با تغییر پارامترهای مدل، از طریق مثالهای عددی نیز نمایش داده میشود.
-
Analyzing the traffic accident frequency in Iraq using log-linear models
1403It's crucial to focus on urban and interurban traffic accidents as we are witnessing an increase in fatalities and injuries due to road accidents each year. This thesis aims to analyze the factors involved in traffic accidents by examining multi-dimensional cross-tables showing the frequency of deaths and injuries from 2020 to 2021. We will extract connection diagrams to illustrate the relationships between these variables. Using a specialized linear logarithm model for categorized data, we will estimate the model's parameters and interpret the results with the help of connection diagrams.
-
Artificial Neural Network Analysis Using Statistical Approaches
1403Neural networks, often viewed as black boxes due to their complex composition of functions and parameters, pose significant challenges for interpretability. This study addresses these challenges by exploring various methods for interpreting neural networks, focusing on both theoretical and practical aspects. Firstly, we demonstrate that the neural network estimator \ f_n \ can be interpreted as a nonparametric regression model constructed as a sieved M-estimator. This approach ensures the weak convergence of \ f_n \ within the metric space \ (\Theta, d) \, providing a solid theoretical foundation for understanding neural networks. Building on these theoretical insights, the study introduces statistical tests designed to assess the importance of input variables, offering a clearer understanding of their contributions to the model. Dimensionality reduction algorithms are also explored, highlighting their role in simplifying the model, enhancing both interpretability and accuracy. Furthermore, we show that statistical confidence intervals enhance model reliability by providing more robust estimates. Statistical tests are also employed to evaluate and interpret the performance of individual neurons, identifying their contribution to classification tasks and providing insights into the network's functioning. To validate these theoretical findings, simulations were conducted and applied to the IDC and Iris datasets. These experiments illustrate the practical utility of the proposed methods and affirm the effectiveness of the neural network estimator in real-world applications. This study contributes to the emerging field of Explainable Artificial Intelligence by presenting methodologies for interpreting traditional deep artificial neural networks through statistical frameworks, thereby facilitating a better understanding of the relationship between inputs and outputs and the performance of individual network components.
-
Exploring the characteristics and trends of crude oil and its refined products in an Iraq refinery using statistical analysis
1403One of the important sources of Iraq's income is crude oil, most of which is exported directly and a part of which will be converted into other products needed in refineries. In this thesis, we will examine and dissect the information on one of Iraq's refineries. For this purpose, while describing the information related to the production of that refinery using the techniques available in descriptive statistics, an attempt will be made to provide appropriate models for predicting the amount of production of the products. In the end, we will arrive at the final model for each product by using the model selection criteria, and we will act on the forecast for the next six periods using the selected final model.
-
دادهکاوی و تحلیل آماری شاخصهای اقتصادی ایران و روسیه
1403مقایسه شاخصهای اقتصادی ایران و روسیه به دلیل نقش محوری این دو کشور در صنعت، تجارت و اقتصاد منطقه و جهان اهمیت بسیار دارد. در این پایاننامه، قصد داریم تا با محوریت این دو کشور، به تحلیل مقایسهای شاخصهای اقتصادی آنها بپردازیم. هدف از این پژوهش، دادهکاوی و تحلیل آماری شاخصهای اقتصادی انتخابی و مهم دو کشور ایران و روسیه است تا از این طریق به درک عمیقتر و واقع بینانهتری از وضعیت اقتصادی آنها برسیم. شاخصهای اقتصادی انتخابی، مربوط به سالهای 1993 الی 2021 بوده که از وبگاه بانک جهانی استخراج شدهاند. پس از پالایش و معماری دادهها و انتخاب شاخصهای مهم اقتصادی، علاوه بر توصیف یک و چند متغیره از تکنیکهای آماری و دادهکاوی مانند: رگرسیون چندگانه، تحلیل عاملی، تحلیل همبستگی و سری زمانی استفاده خواهد شد
-
استنباط آماری برای مدلهای طول عمر تحت سانسور دادههای توام
1402در بسیاری از مطالعات طول عمر ، آزمایشگر ممکن است مجبور شود به علت صرفه جویی در وقت و هزینه به ثبت و اندازهگیری بخشی از اطلاعات مربوط به واحدهای آزمایشی بپردازد. به چنین دادههای به دست آمده از این آزمایشها، دادههای سانسور شده گویند. این پدیده ممکن است در هنگام آزمونهای طول عمر مقایسه محصولات از دو یا چند واحد مختلف تولیدی به طور همزمان و تحت شرایط یکسان صورت گیرد. در چنین شرایطی طرح سانسور توام پیشنهاد میشود. به عنوان مثال فرض کنید کارخانهای دارای دو خط تولید تلویزیون است. با استفاده از طرح سانسور توام، مدیر کارخانه میتواند همزمان کیفیت و عمر مفید تلویزیونهای تولید شده توسط دو خط تولید را مقایسه کند و در نهایت تصمیمگیریهای مربوط به بهبود فرآیند تولید را بر اساس نتایج آزمایش انجام دهد. با اعمال طرح سانسور توام، میتوان در مورد پارامترهای توزیع دو جامعه به طور همزمان استنباطهای آماری انجام داد. از جمله توزیعهای طول عمر میتوان به توزیع بور 12 و توزیع پواسن-نمایی اشاره کرد. توزیع بور 12 به دلیل مدل احتمالی و انعطافپذیری در بحث تحلیل بقا و قابلیت اطمینان به توزیعهای دیگر از جمله وایبول ، گاما ، رایس و توزیعهای مقدار غایی برتری دارد. علاوه بر این توزیع پواسن-نمایی برای تحلیل دادههایی که گاهی اوقات علت ازکارافتادگی واحد آزمایشی نامعلوم و یا تابع نرخ خطر دادهها افزایشی است ، مناسب میباشد. در این رساله با هدف طرح سانسور توام نوع دو به برآورد پارامترهای دو توزیع بور 12 دو پارامتری و دو توزیع پواسن-نمایی پرداخته میشود. ابتدا برآوردگرهای حداکثر درستنمایی پارامترها با استفاده از الگوریتم بیشینهسازی امید ریاضی محاسبه میشود و سپس برآوردگرهای بیزی با استفاده از روش نمونهگیری از نقاط مهم و براساس توزیعهای پیشین آگاهیبخش و ناآگاهیبخش و با در نظر گرفتن توابع زیان مربع خطا ، لاینکس و آنتروپی تعمیمیافته محاسبه میگردند. همچنین برآوردگرهای انقباضی خطی و پیشآزمون به منظور بهبود کارایی برآوردگرها ارائه میگردند. علاوه بر این بازههای اطمینان تقریبی با استفاده از مفهوم ماتریس اطلاع گمشده ، بازههای بوتاسترپ ، بازههای قابل قبول و چگالی پسین رفیع نیز محاسبه میشوند. پیشبینی نقطهای و بازهای واحدهای سانسور شده با استفاده از روشهای کلاسیک و بیزی براساس طرح سانسور توام نوع دو و با در نظر گرفتن دو توزیع بور 12 و همچنین دو توزیع پواسن-نمایی صورت میگیرد. عملکرد برآوردگرهای به دست آمده با استفاده از شبیهسازی مونت کارلو از لحاظ اریبی ، میانگین مربعات خطا ، کارایی و طول بازهها باهم مقایسه میگردند. پس از اطمینان از نتایج شبیهسازی و کارایی برآوردگرها، روشهای ارائه شده برای برآورد پارامترهای نامعلوم تحت سانسور توام ، برای مجموعهای از دادههای واقعی بررسی میشوند.
-
Estimation of logistic regression parameters in the presence of multicollinearity with application to medical data
1402Logistic regression, a widely utilized regression model for binary response variables, relies on the maximum likelihood method for parameter estimation. However, when multicollinearity exists among independent variables, the estimators become ineffective due to variance inflation. To address this issue, various methods, including ridge regression, have been proposed. Ridge regression is crucial in estimating the ridge adjustment parameter, and several formulas have been suggested for this purpose. This thesis aims to introduce and compare a comprehensive set of ridge parameter formulas for logistic regression, utilizing efficiency criteria. To achieve this objective, Monte Carlo simulations will be conducted by varying correlation, the number of predictor variables, and sample size. The performance of selected ridge estimators will be compared, and the most suitable ones will be identified and recommended. Furthermore, the introduced ridge estimators, with different parameters, will be applied to real-world examples in the field of medical sciences. The implementation of the research utilizes R software, and the codes employed are presented in a dedicated section, ensuring practicality and accessibility.
-
استنباط بیزی مدلهای رگرسیونی با فضای پارامتری محدود شده
1402از دیر باز تا کنون آماردانان، برای بهبود کارایی مسائل استنباطی استفاده از اطلاعات قبلی درباره پارامتر یا محدودیت روی مقادیر پارامترها را در تحلیل تشخیص دادهاند. این محدودیتها که در علوم مختلف کاربرد دارند، غالباً به طور طبیعی ایجاد میشوند و میتوان آنها را در قالب قیدهای مساوی و نامساوی خطی بیان نمود. در مدلهای رگرسیونی خطی و خطی تعمیمیافته، قیدهای مساوی خطی براساس اطلاعات محقق یا بر اساس انتخاب متغیرهای معنیدار در مدل تعیین میشود. بنابراین قیدهای مطرح شده، شامل اطلاعات ارزشمندی هستند که در برآورد پارامتر مدل، باید مورد توجه قرار گیرند چرا که نادیده گرفتن این اطلاعات میتواند از کیفیت برآوردگر تعیین شده بکاهد. کارهای بسیاری در زمینه استنباط کلاسیک با در نظر گرفتن قیدهای مساوی خطی و همچنین قیدهای نامساوی خطی انجام گرفته است. برخلاف استنباط کلاسیک، استنباط بیزی روی مدلهای رگرسیونی بویژه در مدلهای خطی تعمیمیافته با توجه به مزیتهای این روش، هنوز جای کار دارد. در این رساله با هدف استنباط بیزی در مدلهای رگرسیونی، نخست به بررسی الگوریتمهای موجود در برآورد پارامترهای مدل رگرسیون خطی با داشتن قیدهای نامساوی خطی پرداخته و سعی در بهبود و افزایش کارایی آنها خواهد شد. سپس به استنباط بیزی در مدلهای خطی تعمیمیافته با در نظر گرفتن قیدهای نامساوی خطی خواهیم پرداخت. الگوریتم جدیدی پیشنهاد میشود که برآوردگر بیزی مقید حاصل، کارایی مناسبتری نسبت به برآوردگر بیز نامقید و همچنین برآوردگر حداکثر درستنمایی داشته باشد. روش استنباطی خود را روی مدلهای رگرسیون گاما و بتا بکار خواهیم گرفت. از آنجا که در مباحث کاربردی مدلهای رگرسیونی، همخطی چندگانه بین متغیرهای مستقل، اغلب اتفاق میافتد، بحث همخطی در مدلهای رگرسیونی را مطرح و کارایی برآوردگرهای پیشنهادی را با برآوردگر ریج مقایسه خواهیم نمود. در پایان کاربرد برآوردگرهای بیزی مقید معرفی شده برای مجموعهای از دادههای واقعی، بررسی میشوند.
-
بهبود کارایی الگوریتمهای یادگیری ماشین با استفاده از روشهای رگرسیون تاوانیده
1402امروزه در مباحث مربوط به پیشبینی علاوه بر افزایش دقت الگوریتمهای موجود، کاهش بار محاسباتی نیز موضوع چالش برانگیزی است که توجهات بسیاری را به خود معطوف کرده است. از آنجایی که الگوریتمهای پایهی موجود، در این مورد کارایی و دقت کافی ندارند، برای حل این مساله از ترکیب الگوریتمهای یادگیری ماشین و روشهای آماری استفاده کردهایم. در این رساله به منظور بهبود کارایی الگوریتمهای یادگیری ماشین سه رویکرد ترکیبی پیشنهاد شده است. در رویکرد اول، از ترکیب جنگل تصادفی و روشهای رگرسیون تاوانیده برای کاهش تعداد درختان جنگل تصادفی استفاده میشود. این کار با کاهش خودکار درختان به کمک روشهای تاوانیده و تجمیع درختان باقیمانده، به کاهش بار محاسباتی کمک میکند. رویکرد دوم، بر بهبود دقت مدل با خوشهبندی دادههای ورودی، شناسایی زیرمجموعههای همگن از دادهها، تخصیص آنها به گروههای مشابه و کاهش تعداد درختان جنگل تصادفی در داخل خوشهها تمرکز دارد. به این صورت که در داخل هر خوشه، از جنگل تصادفی به عنوان پیشبینیکننده استفاده میشود. در نهایت، با کاهش تعداد درختان در درون هر خوشه با استفاده از روشهای تاوانیده و در مجموع کل خوشهها، خطای مدل و بار محاسباتی کاهش یافته و عملکرد مدل بهبود پیدا میکند. در ادامه، رویکرد سومی پیشنهاد میشود که از الگوریتمها و ساختارهای بهروز برای پیشبینی عمیقتر و دقیقتر استفاده میکند. در این رویکرد از ترکیب الگوریتم یادگیری عمیق، روشهای تاوانیده و روشهای یادگیری جمعی استفاده میشود. رگرسیونهای عمیق وظیفهی استخراج روابط بین ویژگیها و پیشبینی را به عنوان یادگیرنده بر عهده دارند. روشهای رگرسیون تاوانیده عمل کاهش تعداد پیشبینیکنندهها و روشهای جمعی عمل تجمیع یادگیرندههای باقیمانده را انجام میدهند. در نهایت، رویکردهای پیشنهادی با دیگر مدلهای مبنا براساس مطالعات شبیهسازی و سه مجموعه دادهی واقعی مورد ارزیابی قرار میگیرند. نتایج حاصل نشان میدهند که رویکردهای پیشنهادی، عملکرد بهتر و کارایی بیشتری نسبت به روشهای موجود دارند.
-
تجزیه و تحلیل سبد خرید بازار با روشهای دادهکاوی
1401تجزیه و تحلیل سبد خرید مشتریان، اجزای سبد محصولات خریداری شده توسط مشتریان در یک خرید را مطالعه می کند. این ایده وجود دارد که سبد محصولات خریداری شده، وابستگی بین محصولات یا خریدهای انجام شده بین دسته های مختلف محصولات را منعکس می کند و تعیین این وابستگی ها می تواند پشتوانه خوبی برای تصمیمات بازاریابی و فروش باشد. این پایان نامه بر آن است تا با تحلیل سبد خرید مشتریان در فروشگاه مواد غذایی فلورانس شهر تبریز و بررسی تراکش ثبت شده در طول یک ماه، الگوی خرید آنان را یافته و بررسی کند. بدین منظور از دو نرم افزار اکسل و پاوربی که هر دو متعلق به شرکت ماکروسافت هستند، بهره میگیریم.
-
مقایسه روشهای آماری و هوش مصنوعی در پیش بینی شاخص سهام شرکتهای اپل، گوگل و آمازون
1401الگوهای پیش بینی بازار سهام یک فعالیت پژوهشی مهم تلقی میشود چرا که قیمت سهام منجر به سودهای کلان، ناشی از تصمیمات درست و زیانهای فراوان ناشی از تصمیمات غلط میشود. وجود رکود و نوسانات دادهها، پیش بینیهای مربوط به بازار سهام را به عنوان یک چالش بزرگ برای سرمایه گذارانی ساخته است که از پول خود برای کسب سود استفاده میکنند. به منظور پیش بینیهای مربوط به بازار سهام، از روشهای ریاضی و ابزارهای یادگیری استفاده میشود. در این پایان نامه سعی میشود تا برای پیش بینی قیمت سهام روشهای کلاسیک آماری و یادگیری ماشین و هوش مصنوعی را بررسی و مقایسه گردد. همچنین به عنوان کاربرد قیمت سهام چند شرکت مشهور مانند اپل،گوگل و آمازون را با روشهای مذکور مدل سازی و به انتخاب مدل بهینه برای پیش بینی قیمت سهام هر کدام از این شرکتها دست پیدا کنیم.
-
تشخیص و آنالیز دادههای موثر برای رگرسیون ابعاد بالا
1401در دسترس بودن دادههای با ابعاد بالا که در آن تعداد متغیرها بهطور قابل ملاحظهای بیشتر از تعداد مشاهدات است، اکنون در بسیاری از زمینههای علمی به ویژه ژنومیکس و زیستشناسی مولکولی رایج است. اغلب در آنالیز دادههای ابعاد بالا فرض میشود تعداد متغیرهایی که در اصل با پاسخ مورد نظر مرتبط هستند، کم است. بررسی در مورد این تعداد کم از متغیرهای مهم به اهمیت روشهای انتخاب مدل در محیطهای ابعاد بالا تاکید کرده است. استفاده از روشهای درستنمایی تاوانیده با تکثیر مجموعه دادههای ابعاد بالا گسترش یافته است. با این وجود، هنگامی که تعداد مشاهدات در مقایسه با تعداد متغیرهای کمکی نسبتاً کم است، هر مشاهدهای بهطور بالقوه میتواند تاثیر بسزایی روی انتخاب مدل و استنباط داشته باشد. از این رو، تشخیص مشاهدات موثر در روشهای تاوانیده مهم است. در این پایاننامه، معیارهای تاثیر رگرسیون لاسو برای اندازهگیری تاثیر یک مشاهده روی مولفه انتخاب مدل رگرسیون برازش شده معرفی میشوند. همچنین، این معیارها تحت روش الاستیکنت برای شناسایی مشاهدات موثر در دادههای ابعاد بالا مورد مطالعه قرار میگیرند. روش الاستیکنت برای بهبود پیشبینیهای مدل، ویژگی حذف از لاسو و کاهش ضرایب از مدل ریج را ترکیب میکند. از طریق شبیهسازی و مجموعه دادههای واقعی نشان میدهیم که معیارهای تاثیر معرفی شده بهطور کارآمد مشاهدات موثر را شناسایی میکنند و میتوانند به آشکارسازی روابط پنهان در دادهها کمک کنند.
-
استنباط آماری و شبیهسازی برای رگرسیون فضایی
1401تحلیل دادههای فضایی اکتشافی اغلب یک گام اولیه برای رویکردهای مدلسازی رسمی است که به دنبال ایجاد روابط بین متغیر وابسته و سایر متغیرهای مستقل هستند که وابستگی فضایی وجود دارد. تمرکز در این پایان نامه بر مدلهای رگرسیون فضایی در یک فضای مقطعی ساده است، که شامل مدلهای رگرسیون تاخیر فضایی، خطا فضایی و دوربین فضایی میباشد. بدین منظور ضمن بررسی مدل مذکور و نحوه برآورد پارامترهای آن به آشنایی با انجام انواع رگرسیون فضایی با نرمافزار R خواهیم پرداخت. در پایان کاربرد مدلهای مورد بررسی را با دادههای واقعی نشان خواهیم داد و به انتخاب مدل مناسب میپردازیم.
-
Fitting the truncated regression model to count data
1401Regression is used to predict a count-dependent variable based on several independent variables. Because the dependent variable is count, simple linear regression is not used much, and more count regressions are used, the most common of which are Poisson regression and negative binomial regression, which belong to generalized linear models. In this thesis, while examining these two models in advance, we pay attention to the models that are truncated, and we will conduct a simulation study to analyze the performance of the proposed truncated regression models against the standard models, and in this regard, we will compare these models with We will compare. Finally, a practical example with real data is provided for the application of truncated models.
-
Classical and Bayesian parameters estimation of lifetime distributions based on censored data
1401In this thesis, classical and Bayesian estimators have been discussed for two- parameter Exponential-Logarithmic distribution based on type-I hybrid and progressive type-II censored samples. Maximum Likelihood Estimators (MLEs) in the traditional tech- nique are noted to lack closed form expressions. To compute the MLEs, we suggest using both the EM and SEM techniques. The asymptotic confidence intervals are built using the observed Fisher information matrix and the missing information principle. We develop the Bayes estimators using the Bayesian method in relation to various symmetric and asymmetric loss functions. We employ Tierney-Kadane and the significance sampling approaches in this regard. For illustrative purposes, Monte-Carlo simulation and a few real data set examples have been provided.
-
Estimation of gamma regression parameters in the presence of multicollinearity
1401The gamma regression model is one of the regression models that has found a lot of uses, particularly in a variety of sciences such as engineering, medicine, insurance, and the humanities, among other areas. When the response variable can only take positive restricted to positive real numbers, this model is utilized. The maximum likelihood approach is normally the one that is used whenever the covariates do not have any link with each other. This is because the maximum likelihood method is the most accurate estimation method. However, just like in linear regression models, it is possible that we come across situations in which there is a correlation or linear relationship between the covariates. In such a scenario, the inference that is drawn using this method will be incorrect due to the large estimate that is produced. In this thesis, we investigate how to estimate the parameters of a gamma regression model when there is multicollinearity between the covariates. We begin by presenting the ridge estimator for the gamma regression model. After that, we use the various techniques that have been suggested to estimate the ridge parameter in other regression models in the gamma regression model. Finally, we use Monte Carlo simulation to determine which ridge estimator provides the most accurate results. After that, we discuss the gamma regression model, and then apply the selected estimator to a practical scenario.
-
استنباط آماری برای مدل آمیخته متناهی رگرسیون خطی
1400یکی از تکنیک های بسیار کاربردی در مباحث چند متغیره، رگرسیون خطی و غیرخطی است. در رگرسیون یک متغیره وابسته وجود دارد که در روش کلاسیک اغلب این متغیر نرمال فرض می شود که این فرض در عمل با مشکلاتی روبرو است. به همین دلیل در دهه های اخیر رگرسیون با متغیر وابسته پواسن، گتما، نمائی و سایر توزیع های ساخته شده است. استفاده از توزیع آمیخته متناهی به غنای رگرسیون افزوده است. در این پایان نامه ضمن مروری بر رگرسیون خطی با توزیع آمیخته متناهی به انتخاب متغیر بیزی در این خصوص حواهیم پرداخت.
-
استنباط آماری در مدلهای خطی تعمیمیافتهی ابعاد بالا
1400پیشرفت روز افزون علوم مختلف از جمله پزشکی و بهداشتی و مدیریت باعث تولید حجم وسیعی از دادهها گشته است. در این گونه موارد انتخاب متغیر یک ابزار توانمند برای اکتشاف در زمینههای مختلف است، که از سالهای دور توجه بسیاری را به خود جلب کرده است. انتخاب متغیر با استفاده از روشهای رگرسیون تاوانیده صرفاً بر اساس متغیرهای پیشگوی موثر انجام میشود. از این رو عدم شناسایی متغیرها با خاصیت پیشگویی ضعیف، منجر به کاهش کارایی استنباطهای حاصل از روشهای رگرسیونی میگردد. در این رساله، استراتژی برآوردگرهای انقباضی نوع استاین و استاین مثبت، با هدف بهبود عملکرد پیشبینی در مدلهای خطی تعمیمیافته با بعد بالا مورد مطالعه قرار میگیرد. برآوردگرهای انقباضی معرفی شده ترکیب خطی از برآوردگرهای ریج وزنی و برآوردگرها با تاوان نوع لاسو هستند. تحت برخی شرایط نظم، رفتار مجانبی برآوردگرهای پیشنهاد شده مورد بررسی قرار میگیرد. به علاوه در قالب یک مطالعهی شبیهسازی و مثال واقعی کارایی آنها از دیدگاه میانگین توان دوم خطا مورد ارزیابی قرار میگیرد.
-
استنباط آماری مدلهای شمارشی آماسیده در صفر
1400مدلهای رگرسیون پواسن و دوجملهای منفی زیرمجموعهی مدلهای شمارشی هستند که در آنها متغیر پاسخ اعداد صحیح نامنفی را اختیار میکند. گاهی ممکن است تعداد زیادی از مشاهدات صفر باشند بهطوری که این تعداد بسیار بیشتر از صفرهای تولید شده از یک مدل شمارشی معمولی است. برای تحلیل چنین دادههایی از مدلهای شمارشی آماسیده در صفر استفاده میشود که در آنها فرض میشود دادهها از یک توزیع شمارشی معمولی و یک توزیع تباهیده در صفر تولید میشوند. در چنین حالتی، اگر دادههای تولیده شده از توزیع شمارشی دارای میانگین و واریانس یکسان باشند، از مدل پواسن آماسیده در صفر استفاده میشود، ولی زمانی که این دادهها بیشپراکنده باشند، مدل دوجملهای منفی آماسیده در صفر برای مدلبندی رابطهی بین متغیر پاسخ و متغیرهای پیشگو و برآورد پارامترهای مدل مناسب است. زمانی که در یک مدل رگرسیونی بین متغیرهای پیشگو همخطی چندگانه وجود داشته باشد از روش برآورد ریج و برآورد نوع-لیو برای برآورد پارامترهای مدل استفاده میشود، بهطوریکه کارایی آنها بیشتر از روش ماکسیمم درستنمایی است. از طرف دیگر به منظور بهبود عملکرد برآورد پارامترهای مدل، استفاده از اطلاعات پیشین در مورد تعدادی از پارامترها که تاثیر معنیداری روی متغیر پاسخ ندارند و ترکیب آنها با اطلاعات حاصل از نمونهی تصادفی میتواند مفید باشد. اطلاعات پیشین که بهصورت قیدهایی روی پارامترهای مدل ظاهر میشوند، قبل از به کارگیری در مدل آزمون میشوند. در صورتی که درست باشند موجب بهبود عملکرد برآورد پارامترهای مدل میشوند. برآوردگرهای حاصل از این روش را برآوردگرهای انقباضی میگویند که شامل برآوردگرهای انقباضی خطی، پیشآزمون، آزمون اولیه، نوع استاین و نوع-استاین مثبت هستند. در این رساله به منظور بهبود عملکرد پارامترهای مدل، برآوردگرهای انقباضی در مدل دوجملهای منفی آماسیده در صفر، مدل آمیختهی دوجملهای منفی، مدل آمیختهی دوجملهای منفی آماسیده در صفر و برآوردگرهای انقباضی نوع-لیو در مدل دوجملهای منفی آماسیده در صفر معرفی میشوند. به منظور مقایسهی عملکرد برآوردگرهای مختلف، کارایی نسبی برآوردگرها از نظر میانگین مربعات خطا با استفاده از شبیهسازی مونت کارلو مورد بررسی قرار میگیرد. همچنین اریبی و ریسک مجانبی برآوردگرهای مختلف بهصورت نظری بیان و اثبات میشوند. کارایی کلیه روشهای معرفی شده در مجموعه دادههای واقعی محاسبه میشود.
-
Bayesian beta regression models
1400Often in many applications, we are interested in examining the impact and relationship of different factors on a variable that is expressed as a ratio and percentage, such as disease rate, percentage of a disease in a particular area, unemployment ratio and inflation rate. To aim it, a appropiate regression model is chosen according to the type of response variable. When the response variable is in form of percentage or ratio, or even defined in the range like (a, b), the beta regression model is proposed. Beta regression model belongs to the family of generalized linear models. In this thesis, first the beta regression model by considering different models on the precision parameter are introduced and parameters of the model have been estimated in classical framework. Then we consider bayseian estimation of parameters. We show performance of the bayesian estimation of the parameters by using a Monte Carlo simulations and applying the bayesian model of beta regression to real data set will be the final application of this research.
-
طراحی شبکه پایش کیفیت آب زیرزمینی با استفاده از روش آنتروپی
1400شبکههای نظارت بر کیفیت آبهای زیرزمینی به دلیل محدودیت مالی و تغییر در نظارت و تعیین تعداد کافی ایستگاههای نظارتی و مکان آنها برای طراحی شبکه بسیار مهم است. یکی از امیدوارکنندهترین رویکردها برای طراحی شبکه، استفاده از روشهای آنتروپی است که مطالعات اولیه با بهرهگیری از اصل حداکثرسازی آنتروپی و استفاده از اطلاعات تئوری است. انواع آنتروپی عبارتند از آنتروپی حاشیهای، آنتروپی مشترک، آنتروپی مشروط، انتقال اطلاعات و همبستگی کل، که از موارد اساسی هستند و بهطور معمول در برنامههای آنتروپی برای طراحی شبکه نظارت استفاده میکنیم. درمنطقه مورد مطالعه با استفاده از روشهای شبکه عصبی مصنوعی(ANN) و K-همسایگی نزدیک (KNN) اطلاعات نقاط کور که در دسترس نمیباشد برآورد میشود و سپس با کمک الگوریتم بهینهسازی (DE) ارزیابی تفاضل اطلاعات خالص به دست آمده توسط ایستگاههای ماکسیمم میشود. تعداد و محل ایستگاههای پایش بهینه از میان چاههای فعال واقع در ناحیه مورد مطالعه انتخاب میشوند. توزیع مکانی چاههای انتخاب شده، پوشش کافی از کل محدوده موردنظر را فراهم میکندو در عینحال، حداکثر اطلاعات مفید را در مورد وضعیت کیفیت آبزیرزمینی به دست میدهد. همچنین با در نظر گرفتن هزینههای عملیاتی و زمانی از انتخاب ایستگاههای زائد اجتناب میگردد. روش آنتروپی پیشنهادی با روشهای مینیممسازی خطا و خوشهبندی K-میانگین مقایسه میشود تا شبکه پایش کیفیت آبزیرزمینی بهینهسازی شود.
-
Beta Regression Model and Its Applications
1400The linear regression model is a good method for predicting one variable (the response variable) in relation to other variables (auxiliary variables or independent variables). The model’s fundamental assumption is that the response variable contains real numbers. However, in practice, we frequently encounter cases where the response variable is restricted to specific ranges, such as data in the form of percentages and percentages restricted to (0, 1). Ratio and percentage data, on the other hand, are frequently skewed, and inference based on the assumption that the data is symmetric can be misleading. The beta regression model, defined in the (0, 1) range, is a suitable regression model for this type of data. The response variable is assumed to follow the beta distribution in this regression model. In this thesis, we present the beta regression model and the method for estimating model parameters when the independent variables are orthogonal and non-orthogonal. In first case, we will use the maximum likelihood estimators and for second one, we will use the common method of combating the multicollinearity in regression model such as Ridge and Liu estimator. In the following, by using Monte Carlo simulation, the mean squared error criterion and efficiency of the estimators are calculated. Finally, the applications of these estimators on the real life data set is examined.
-
انتخاب مدل آماری برای تولید ناخالص داخلی
1400تولید ناخالص داخلی یکی از عمدهترین و کاربردی ترین شاخصهای اقتصادی است؛ از این رو پیشبینی آن، همواره مورد توجه فعالان و پژوهشگران اقتصادی و علوم مرتبط از جمله علوم آماری بوده است. در این پژوهش هدف اصلی یافتن مناسبترین مدل آماری و الگوی مطلوب برای پیشبینی تولید ناخالص داخلی است. مدلهای سری زمانی به عنوان یکی از بهترین روشها برای پیشینی تولید ناخالص داخلی مورد انتخاب قرار گرفتهاند که از این میان تاکید این پژوهش بر مدلهای سری زمانی فصلی (روش تجزیه کلاسیک، روش هولت وینترز) و تکنیکهای مربوط به مدلهای ARIMA و سریهای فصلی SARMA و SARIMA میباشد. در مرحله بعد شاخصهای ارزیابی نیکویی برازش در مدلهای سری زمانی بررسی شده و تفاوت مدلهای خطی و غیرخطی، کارآیی و میزان خطای هرکدام مورد تجزیه و تحلیل قرار گرفته میشود تا در نهایت با مقایسه نتایج بهدست آمده بهترین مدل پیشنهاد شود
-
بررسی تاثیر انرژی تجدیدپذیر و تجدیدناپذیر بر رشد اقتصادی کشورهای مختلف
1400این پایاننامه با هدف بررسی تاثیر مصرف انرژی بر رشد اقتصادی کشورهای مختلف در طی دوره زمانی 1999 الی 2018 برای 65 کشور مختلف جهان با استفاده از تحلیل رگرسیونی پانل دیتا صورت گرفته است. در این راستا بررسی این اثر با تفکیک میان انرژی تجدیدپذیر و تجدیدناپذیر صورت گرفته است. در این راستا، نتایج تجزیه و تحلیل مربوط به کشور ایران نشان داده است که، مصرف انرژی تجدید ناپذیر بر رشد اقتصادی ایران تاثیر منفی و معنادار دارد. در این راستا این موضوع نشان میدهد که با افزایش مصرف این نوع انرژی، رشد اقتصادی کشور کاهش مییابد. این موضوع را میتوان نشات گرفته از هزینههای استحصال این نوع انرژی نسبت به سوختهای فسیلی دانست که در این راستا، هزینههای گزافی را در پی داشته و موجب کاهش کارایی مصرف این نوع انرژی و در نهایت کاهش رشد اقتصادی خواهد شد. همچنین نتایج تجزیه و تحلیل و مقایسه تاثیر انرژی تجدیدپذیر و انرژی تجدید ناپذیر بر رشد اقتصادی کشورهای آسیایی و اروپایی و 65 کشور جهان نشان داده است که برای کشورهای آسیایی، انرژیهای تجدیدناپذیر و تجدیدپذیر تاثیر مثبت و معناداری بر رشد اقتصادی این کشورها دارد. این در حالی است که مصرف انرژی تجدیدپذیر نسبت به انرژیهای تجدیدناپذیر بیشتر سبب افزایش رشد اقتصادی میشود. اما برای کشورهای اروپایی، انرژی تجدیدناپذیر تاثیر منفی و معناداری بر رشد اقتصادی دارند. در حالی که برای این گروه از کشورها انرژی تجدیدپذیر تاثیر مثبت و معناداری بر رشد اقتصادی این گروه از کشورها دارند. همچنین برای 65 کشور منتخب جهان، نتایج حاکی از آن است که میزان مصرف انرژیهای تجدیدپذیر و تجدیدناپذیر تاثیر مثبت و معناداری بر رشد اقتصادی کشورهای منتخب دارد. این در حالی است که تاثیر انرژیهای تجدیدپذیر بر رشد اقتصادی، از نظر مقداری بیشتر از انرژی تجدیدناپذیر است.
-
تحلیل آماری اطلاعات مادر و کودک در مرکز بهداشت میاندوآب
1399مطالعه حاضر با هدف تحلیل آماری اطلاعات مادر و کودک در مرکز بهداشت میاندوآب انجام گرفت. مطالعه حاضر از نظر هدف کاربردی، از نظر شیوه جمعآوری دادهها توصیفی ازنوع همبستگی بود. جامعه آماری تحقیق شامل 400 نفر خانم باردار بود که در زمان بارداری فرم مراقبت از آنها تکمیل و بعد از بارداری نیز وضعیت آنان به همراه کودکانشان بررسی و اطلاعات مربوطه ثبت شده است. ابزار جمعآوری دادهها، پرسشنامههای محقق ساخته بود. برای تحلیل دادهها از نرم افزار Spss22 استفاده شد. از آزمون کای دو جهت بررسی داده ها استفاده گردید. نتایج نشان داد برخی از بیماریهای مزمن مادران بر شاخصهای تنسنجی(قد و وزن و دور سر) کودکان تاثیر دارند.
-
پیشبینی قیمت بورس با استفاده از روش یادگیری عمیق
1398یش بینی قیمت سهام از اهمیت خاص برخوردار است که تاکنون تکنیک های مختلف آماری و غیر آماری برای آن به کار رفته است. به دلیل تاثیر عوامل داخلی و خارجی، سیاسی و اقتصادی و اجتماعی در قیمت سهام، پیش بینی آن به سادگی امکان پذیر نیست. ازروش هایی که می توان به پیش بینی قیمت سهام پرداخت، یادگیری عمیق است. این پایان نامه با استفاده از منبع [41] سعی در استفاده از مدل های یادگیری عمیق در پیش بینی قیمت سهام چهار بخش بیمه آسیا، بانک اقصاد نوین، تراکتورسازی ایران و شرکت پاﻻیش نفت تبریز دارد.
-
خانواده توزیع T-X و استنباط بیزی آن
1398توزیع های آماری کاربردهای زیادی در زمینه های مختلف دارند و اکثرا برای توصیف پدیده های جهان واقعی به کار برده می شوند. به همین دلیل خواص و ویژگی های آن ها به طور گسترده بررسی شده و علاوه بر توزیع های شناخته شده مانند توزیع های گاما، نمایی، نرمال و غیره، توزیع های جدید دیگری تولید شده اند. در این پژوهش، با استفاده از خانواده ی مولد توزیع T_X ، سه توزیع مختلف به نام توزیع لوماکس-نمایی، وایبل-رایلی و گاما-رایلی را معرفی نموده و بسیاری خواص آماری آن ها را بررسی و کارایی بهتر هر یک از آن ها را در مقایسه با نتایج مطالعه شده ی قبلی بیان می کند. همچنین خانواده ی مولد توزیع T-X را به حالت دومتغیره تعمیم می دهد. چندین توزیع دومتغیره جدید حاصل شده از این روش را معرفی نموده و با ذکر مثال های کاربردی کارایی بهتر آن ها را روشن می کند.
-
مروری بر تحلیل دادههای طولی با متغیرهای پاسخ گمشده
1397در مطالعات طولی هر فرد در طول زمان تحت اندازهگیریهای مکرر قرار میگیرد، در چنین مطالعاتی وجود دادههای ناکامل یا اصطلاحاً دادههای گمشده امری اجتنابناپذیر است زیرا ممکن است تعدادی از افراد به دلایل مختلف در تمام زمانهای اندازهگیری در دسترس نباشند. اگر دادههای گمشده غیرقابل چشمپوشی باشند، در اینصورت تحلیل دادهها با روشهای معمول منجر به تولید برآوردگرهای اریب و نتایج نامعتبر خواهد شد، در این مورد لازم است که مکانیزم دادههای گمشده را نیز مدلبندی کرد. از روش ماکسیمم درستنمایی برای تحلیل دادههای طولی ناکامل به طور گستردهای استفاده میشود، که برآوردگرهای ML معمول، نسبت به مشاهدات حدی یا نقاط پرت در دادهها حساساند، و در عمل در دادههای واقعی معمولا با مقادیر گمشده و نقاط پرت روبرو هستیم. از اینرو در این پایاننامه روش نیرومند را که در چارچوب روش ML توسعه یافته، برای تحلیل دادههای طولی ناکامل با مشاهدات حدی بررسی خواهیم کرد. در پایان ضمن شبیهسازی نتایج، یک مثال کاربردی نیز در زمینهی بیماران مبتلا به ایدز مدلبندی خواهد شد.
-
پیش بینی آماره های ترتیبی
1396در این پایان نامه برآوردها و پیش بینی مشاهدات تحت سانسور نوعII و سانسور هیبریدی و سانسور فزاینده هیبریدی نوع I در توزیع های پواسون نمائی، لاگ نرمال و بور نوع III مورد بررسی قرار می گیرد. در ابتدا برآوردگرهای ماکزیمم درستنمائی پارامترهای مجهول با استفاده از روش EM و SEM و برآوردهای فاصله ای با استفاده از ماتریس اطلاع فیشر به دست می آید سپس برآوردهای بیزی تحت توابع زیان مربع خطا، انتروپی و لاینکس با استفاده از چگالی های پیشین آگاهی بخش و ناآگاهی بخش مطرح می شود. برای دستیابی به برآوردهای بیزی پارامترها از تقریب ترنی_کیدن، تقریب لیندلی و روش نمونه گیری نقاط مهم استفاده می شود. همچنین به بیان پیش بینی مشاهدات سانسور شده و فواصل پیش بینی با روش های مختلف می پردازیم. در پایان برای ارزیابی یافته های تئوری از داده های واقعی و روش های شبیه سازی استفاده می کنیم
-
مدل نویز شده دو جمله ای برای تعیین اعتبار خوشه ها
1396امروزه شاهد تولید حجم عظیمی از دادهها در دنیای مدرن هستیم و یکی از علوم بسیار استراتژیک حائز اهمیت در دنیای دادهها علم داده کاوی است. از تکنیک های پر کاربرد داده کاوی میتوان به خوشه بندی اشاره کرد. خوشه بندی یک تابع کاوشی نظارت نشده ی داده کاوی به منظور کشف گروه بندی طبیعی درون دادههاست معمولا الگوریتمهای مختلف خوشه بندی نیازمند پارامتری به نام تعداد خوشهها هستند و تعیین تعداد بهینه آنها برای ارزیابی الگوریتمها به کار میرود . برای تعیین تعداد خوشهها سه روش شامل آزمون فرض، معیارهای داخلی و معیارهای خارجی وجود دارد که هر کدام دارای شاخصهای متعددی است و بدین منظور در کار پژوهشی حاضر، از مدل نویز شده دو جمله ای استفاده شده است . این پایان نامه در چهار فصل جداگانه جمع آوری شده است که در فصل اول مفاهیم وتعاریف اولیه، در فصل دوم خوشه بندی و انواع الگوریتمهای آن در نرم افزار R و در فصل سوم به تحلیل مدل نویز شده دو جمله ای و یک مثال عددی با استفاده از این مدل میپردازیم.
-
داده کاوی برای کلاهبرداری از کارت اعتباری
1395سالانه میلیاردها دلار به علت کلاهبرداری از کارتهای اعتباری از دست میرود. با توجه به اینکه استفاده از کارتهای اعتباری و معاملات آنلاین و به تبع آن حجم انبوه دادهها و میزان تقلب در این بخش روز به روز در حال افزایش است، بررسی تک تک این دادهها مستلزم صرف وقت و هزینه سنگینی است. لذا پیاده سازی یک سیستم اعلام موارد مشکوک، کشف تقلب به کمک تکنیکهای دادهکاوی ضروری به نظر میرسد. هدف از این پایان نامه کشف تقلب کارتهای اعتباری بانک انتخابی با استفاده از تکنیکهای دادهکاوی است.
-
پیش بینی شاخص سهام با استفاده از زنجیره های مارکف
1395سهم عظیمی از مشغله فکری سرمایه گزاران و دلالان و به طور کلی کسانی که با شاخص سهام درگیر هستند، شناخت درستی از روند افزایشی یا کاهشی شاخص سهام نداند. بدین منظور روش هایی برای حصول این شناخت ارائه شده است که مهترین آن، روشهائی است بر پایه استفاده از اطلاعات شاخص سهام از گذشته تا به حال به منظور شناخت درستی از روند آینده شاخص سهام استوار است. هدف از این پایان نامه تجزیه و تحلیل رفتار شاخص سهام شامل فرابورس، بورس و صنعت با استفاده از زنجیره های مارکف و الگوریتم EM است.
-
برآوردیابی براساس الگوریتم EM تصادفی
1395طرح سانسور فزایندهای نوع دو اولین بار توسط کمپس [3] در سال 199 معرفی گردیده است، به طوریکه این طرح سانسور در آزمونهای طول عمر و قابلیت اعتماد بسیار مورد استفاده قرار می گیرد. همچنین توزیع دو پارامتری بور نوع سه نیز در زمینه های کنترل کیفیت، مطالعات قابلیت اعتماد و مدلبندی داده های شکست و بقا بکار گرفته شده است. لذا با توجه به اهمیت این توزیع و همچنین این طرح سانسور و اینکه معادلات درستنمایی بر اساس نمونه های سانسور شده ی فزاینده نوع دو برای توزیع بور نوع سه جواب صریحی برای پارامترها ارائه نمی دهند. در این پایان نامه، روش سادهایبرای بدست آوردن برآوردگرهای ماکسیمم درستنمایی برای این دو پارامتر را با استفاده از الگوریتم امید ریاضی گرفتن-ماکزیمم کردن و امیدریاضی گرفتن-ماکزیمم کردن تصادفی ارائه میشود. با درنظر گرفتن ماتریس اطلاع فیشر برآوردهای بازه ای هم محاسبه میشود در ادامه برآوردهای بیزی را با بکار بردن روش تقریب لیندلی و تکنیک نمونه گیری از نقاط مهم محاسبه نموده و این برآوردها تحت سه تابع زیان مربع خطا، آنتروپی و لاینکس بدست آورده خواهند شد. سپس مسئله ی پیش بینی را در نظر گرفته و برآوردهای پیش بینی و بازه های پیشبینی پارامترها را برای مشاهدات سانسور شده با روش های مختلف بدست می آید. در پایان یک مجموعه ی داده ی واقعی را تجزیه تحلیل کرده و لازم به ذکر است که مطالعات شبیه سازی مربوطه برای مقایسه ی برآوردگرهای مختلف پیشنهادی در نرم افزار R انجام داده شده است و میزان کارآمدی روشه ای ارائه شده نیز باهم مقایسه شده اند
-
دادهکاوی اطلاعات دانشگاه فنی و حرفهای
1395پیشرفتهای بوجود آمده در جمعآوری دادهها و قابلیتهای ذخیرهسازی در طی دهههای اخیر باعث شده در بسیاری از علوم با حجم بزرگی از اطلاعات روبرو شویم. محققان در زمینههای مختلف مانند مهندسی، اقتصاد، ستاره شناسی و زیست شناسی هر روز با مشاهدات بیشتر و بیشتری روبرو میشوند. دادههای انبوه در مراکز آموزشی و پژوهشی و دانشگاهها نیز به چشم میخورد. یکی از این مراکز، دانشگاه فنی و حرفهای است که با بیش از 170 مرکز آموزشی در سطح کشور گسترده است. لذا بررسی اطلاعات مراکز و دانشکدههای دانشگاه فنی و حرفهای از جمله اهداف این پایاننامه است. در این پایاننامه علاوه بر توصیف اطلاعات دانشگاه فنی و حرفهای در بخشهای تعداد دانشجویان، تعداد کارمندان و هزینههای مصرفی، به استفاده از تکنیکهای خوشهبندی و طبقهبندی با الگوریتمهای مختلف پرداخته شده است.
-
داده کاوی به کمک تحلیل خوشه ای
1394امروزه ظهور تکنولوژیهای مدرن، انجام آزمایشات علمی و تحقیقات کاربردی در زمینههای مختلف، حتی کارهای سادهای مانند تلفن زدن، استفاده از کارتهای اعتباری و یا خریدهای روزانه منجر به تولید حجم انبوهی از دادهها شده است که حجم این دادهها میتواند به چندین پتابایت هم برسد. این دادههای حجیم میتوانند گویای الگوهای متنوعی باشند که منجر به استخراج نتایج مهمی در بسیاری از زمینهها میشوند. به فرآیند کشف دانش مفید و قابل استفاده از انبوه دادههای خام، دادهکاوی گفته میشود. این مطالعه در سه فصل جداگانه جمعآوری شده است که در فصل اول به مفهوم دادهکاوی و انواع روشهای آن اشاره شده است، در فصل دو، خوشهبندی و انواع الگوریتمهای آن بررسی میشود. فصل سوم شامل دادهکاوی اطلاعات شرکت گاز است که این دادهها ابتدا آمادهسازی شده، سپس روش خوشهبندی مناسب روی آنها اعمال و اطلاعات مفیدی از آنها استخراج شده است که میتواند برای برنامهریزیهای آینده مفید واقع شود.
-
برآورد حداکثر نمائی تاوانیده
1394برآورد حداکثر درستنمایی به دلیل خصوصیات خوبی همچون کارایی، سازگاری البته تحت شرایط نظم بسیار پرکاربرد است، ولی این روش در برآورد پارامتر توزیعهایی که تکیهگاه آنها به پارامتر بستگی دارد بسیار محافظهکارانه عمل میکند. روش درستنمایی ماکزیمم تاوانیده این مشکل را حل کرده و برآورد مناسبتری را برای پارامتر مکانی ارائه میکند به طوری که با انتخاب ضریب تاوان مناسب برآورد پارامتر نااریب بوده و دارای واریانس کمتری نسبت به برآورد حداکثر درستنمایی عادی خواهد بود. در این رساله سعی کردهایم تا برآورد حداکثر درستنمایی تاوانیده و برخی از انواع دادههای سانسور شده را معرفی کنیم. در فصل دوم این روش برآورد را برای توزیع نمایی دوپارامتری زمانی که دادهها کاملند به کار برده و اریبی و واریانس برآوردگرها را پیدا کردیم. در فصل سوم این روش برآورد را برای توزیع نمایی دوپارامتری برای دادههای سانسور شده به کار برده و اریبی و واریانس برآوردگرها را پیدا کردیم و در فصل چهارم برای انواع دادههای سانسور شده برآورد حداکثر در ستنمایی تاوانیده را شبیهسازی کرده و در نهایت روش برآورد حداکثر درستنمایی تاوانیده را با توجه به نتایج شبیهسازی با روش حداکثر درستنمایی عادی مقایسه کردیم.
-
استنباط آماری براساس رکوردهای توام
1394در این پایاننامه، استنباط آماری بر اساس "رکوردهای توام" از دو دیدگاه پارامتری و ناپارامتری مورد مطالعه قرار میگیرد. بدین منظور ابتدا طرح رکوردهای توام از دو دنبالهی مستقل را تنها با فرض پیوسته بودن توزیع جامعهی آماری آنها معرفی نموده و سپس به بررسی برآورد پارامتری از دو توزیع نمایی و مستقل بر اساس رکوردهای توام پایین و زمان رخداد آنها پرداخته و برآوردگرهای حداکثر درستنمایی شرطی، برآوردگرهای بیزی و توزیع دقیق آنها را به دست میآوریم. همچنین، به کمک برآوردگرهای بدست آمده و ویژگیهای آنها، بازههای اطمینان دقیق، مجانبی، بیزی و بازهی اطمینان بوتاسترپی به دو روش بوتاسترپ صدکی و روش بوتاسترپ تی را برای پارامترهای دو توزیع ارائه کرده و با مطالعهی شبیهسازی برای حجم نمونهی کوچک به ارزیابی عملکرد برآوردگرها و مقایسهی بازههای اطمینان مختلف میپردازیم. بخش ناپارامتری، به بررسی بازههای اطمینان آزاد توزیع توسعهیافته برای چندکها، بازههای اطمینان درونی و بیرونی برای بازههای چندکی و تفاضل چندکها از دو جامعهی همتوزیع اختصاص دارد.
-
توزیع نرمال گسسته
1393توزیع نرمال نقش کلیدی در استنباط آماری، مدلسازی تصادفی، شبیهسازی و مساحت بازی میکند. توزیعهای گسسته برای مدل بندی سناریوهای زندگی واقعی خیلی مهم هستند. تکنیکهای مختلفی برای تولید خانوادههایی از توزیعهای گسسته از توزیعهای پیوسته و بویژه توزیع نرمال توسعه یافتهاند،که به برخی از این تکنیکها در فصل 2 اشاره شده است. همچنین در فصل 3 کاربرد توزیع نرمال گسسته، ارزیابی قابلیت اطمینان از سیستمها از جمله روشهای شبیهسازی بیان شده است.
-
برآورد ناپارامتری میانگین تابع دسترسپذیری
1393تابع دسترس پذیری به عنوان یکی از ویژگی های قابلیت اعتماد سیستم های مختلف مورد توجه دانشمندان بوده و از اهمیت بسیاری برخوردار است. در این پایان نامه برآورد نقطه ای و فاصله ای تابع دسترس پذیری نقطه ای و حدی در سیستم های اصلاح پذیر مد نظر است
-
روشی برای تولید خانوادههای توزیعهای پیوسته
1393توزیع های آماری کاربردهای زیادی در علوم مختلف مانند اقتصاد، مهندسی، علوم اجتماعی، بهداشت و علوم زیستی دارند، و همچنین برای توصیف پدیده های جهان واقعی به کار می روند. علاقه به تعمیم توزیع های آماری به قوت خود باقی است. کلاس های تعمیم یافته ی زیادی از توزیع ها برای توصیف پدیده های مختلف بررسی شده و توسعه یافته اند. یک ویژگی رایج از این توزیع های تعمیم یافته این است که پارامتر زیادی دارند. در فصل 1 تعدادی از توزیعهای مورد استفاده در سایر فصول معرفی شده است. در فصل 2 روشی برای تولید خانواده های توزیع های پیوسته به نام خانواده ی X-T از توزیع ها ارائه شده است. در فصل 3 خانواده ی بتا-وایبل- X که حاصل از خانواده ی Y-X-T است، معرفی می شود. همچنین به عضوی از خانواده ی وایبل- X به نام وایبل–ریلی در فصل 4 پرداخته خواهد شد.
-
پیش بینی قیمت سهام با استفاده از شبکه های بیزی
1392پیشبینی قیمت سهام در فعالیتهای بازرگانی و اقتصاد ملی نقش بسزایی دارند. روشهای کلاسیک پیشبینی سری زمانی مانند مدلهای اتو رگرسیو، میانگین متحرک، اتو رگرسیو-میانگین متحرک و سایر مدلهای مشابه ، بر دو فرض ایستایی و خطی بودن بنیان نهاده شدهاند. در مورد عملکرد این مدلها ، بهخصوص در مورد سریهای زمانی قیمت و بازده سهام تردیدهایی ایجاد شده است . بررسیها نشان میدهد که قیمت سهام از نگاشتهای پیچیده غیرخطی و آشوبگرانه به وجود آمدهاند و اساساً استفاده از انواع مختلف روشهای خطی صحیح نمیباشد. یکی از روشهای جایگزین استفاده از روش غیرخطی شبکههای بیزی است که در برخی از موارد توانایی بالقوه مناسبی در پیشبینی سریهای زمانی از خود نشان میدهد. هدف اصلی پایاننامه، معرفی شبکه بیزی و بکارگیری این شبکه در پیشبینی سریهای زمانی و مقایسه آن با الگوریتمهای کلاسیک آن است. ییزو و کیتا (2012) الگوریتمی بر مبنای شبکه بیزی به منظور پیشبینی دادههای سری زمانی ارائه کردهاند. با دو مثال عددی به مقایسه این الگوریتم با الگوریتمهای کلاسیک خواهیم پرداخت.
-
تابع احتمال با استفاده از توزیع های پیوسته
1392توزیع های آماری به طور معمول برای توصیف پدیده های جهان واقعی بکار برده شده اند. به علت فواید توزیع های آماری، آن ها به طور گسترده بررسی شده و توزیع های جدیدی نیز به دست آمده اند. مقالات تحقیقاتی زیادی در مطالعه و کاربردهای توزیع های گسسته منتشر شده اند. تکنیک های مختلفی برای تولید خانواده هایی از توزیع های گسسته ارائه شده اند؛ که برخی از این تکنیک ها در فصل دو بیان شده اند. در این فصل توزیع های بور گسسته و لاپلاس گسسته ارائه و خواص آن ها بررسی شده است.\\ همچنین در فصل سه روشی برای تولید خانواده هایی با استفاده از توزیع های پیوسته و گسسته که به خانواده ی X-T معروف می باشد، ارائه شده است. این خانواده از توزیع ها در حالت های مختلف بررسی می شود. فصل چهارم به برآورد بیزی پارامترهای توزیع بور گسسته ی بیان شده در فصل دو اختصاص دارد
-
استنباط بیزی برای تحلیل داده های رسته ای
1392در این پایاننامه سعی داریم مروری بر روشهای بیزی در تجزیه و تحلیل داده های رسته ای داشته باشیم. در ابتدا از روش بیزی برای برآورد پارامترهای توزیع دوجمله ای و توزیع چندجمله ای استفاده می کنیم. همچنین به بررسی جداول توافقی و پارامترگذاری مدل لگ خطی می پردازیم. در ادامه پارامترهای مدل لگ خطی برای حالت دوطرفه را با استفاده از روش بیزی برآورد می کنیم و حالات مختلف آن را مورد بحث قرار می دهیم. در پایان برآوردی که برای پارامترهای مدل لگ خطی دوطرفه انجام دادیم را به حالت سه طرفه تعمیم داده و حالات مختلفی که بوجود می آید را بررسی می کنیم.
-
توزیع وایبل نمائی شده
1392در مدل فشار- نیرو، نیرو (X) و فشار (Y)، به عنوان متغیرهای تصادفی در نظر گرفته میشوند و قابلیت اعتماد یک مولفه در یک دوره، به صورت احتمال بیشتر بودن نیرو از فشار در طول دوره یعنی P(Y<X) تعریف می شود. هدف اصلی پایان نامه برآورد R= P(Y<X) ، زمانی که X و Y دو متغیر تصادفی از توزیع وایبل نمایی شده هستند، می باشد. خانواده وایبل نمایی شده که توسط مودهولکار و اسریواستارا در سال 1993 معرفی شده است، دو پارامتر شکل و یک پارامتر مقیاسی دارد و خانواده های وایبل و نمایی نمایی شده موارد خاصی از این خانواده هستند. با توجه به اهمییت توزیع وایبل نمایی شده در این پایان نامه به معرفی این توزیع و بیان ویژگی های آن می پردازیم و به دنبال آن به مدل فشار-نیرو نیز اشاره ای خواهیم داشت. سپس مسئله برآورد R را برای این توزیع مطرح می کنیم که برای اولین بار ارائه شده است.
-
داده کاوی با رگرسیون لجستیک
1391امروزه داده کاوی به عنوان یک ابزار و روش علمی جدید برای بررسی و تحلیل دادهها در پایگاههای بزرگ داده مطرح شده است. با استفاده از تکنیکهای این روش میتوان حجم وسیعی از دادههای خام را به اطلاعات مفید و قابل استفاده تبدیل کرد. داده کاوی تکنیکها و الگوریتمهای متنوع و متفاوتی برای تحلیل داده دارد. از این بین میتوان به معروفترین آنها از جمله شبکههای عصبی، درخت تصمیم، رگرسیون لجستیک، قوانین انجمنی و آنالیز خوشهای اشاره کرد. یکی از پرکاربردترین این روشها، رگرسیون لجستیک است. در شرایطی که متغیر پاسخ مورد نظر یک متغیر دو حالتی باشد، از این روش برای طبقه بندی یا پیش بینی متغیر پاسخ استفاده میشود. مزیت این روش نسبت به سایر روشها، قدرتمند و دقیق بودن آن و عدم نیاز به پیش شرطهای معمول است. در این پایاننامه مدل رگرسیون لجستیک و نحوه استفاده از آن بررسی میشود. سپس رگرسیون لجستیک برای پیش بینی دو متغیر مهم اقتصادی با استفاده از دادههای واقعی به کار گرفته میشود و در مورد ساخت یک مدل مناسب یا انتخاب بهترین مدل در بین مدلهای موجود بحث میشود.
-
استنباط آنلاین برای مسائل نقطه تغییر
1391مدلهای نقطه تغییر چندگانه معمولاً بر ناهمگنی و غیر یکنواختی موقتی یا فاصلهی روی دادهها اشاره میکنند. این مدل در دامنهی وسیعی از مدلبندی آماری مشاهده میشود، همچنین برای افزایش انعطافپذیری در مدل آماری استفاده میشود. هدف این پایاننامه انجام استنباط بیزی مدلهای نقطه تغییر با استفاده از ایدهی پالایههای ذره است. یک الگوریتم آنلاین دقیق را برای یک کلاس از مسائل نقطه تغییر چندگانه ارائه میکنیم. در این کلاس از مدلها خصوصیت استقلال شرطی صدق میکند. این الگوریتم بوسیلهی توزیع توام پسین واقعی، تعداد و موقعیت نقطه تغییرها را برای یک کلاس از مدلهای نقطه تغییرها شبیهسازی میکند. ارزش محاسباتی این الگوریتم دقیق روی تعداد مشاهدات به صورت درجه دوم افزایش مییابد. بعلاوه نشان میدهیم که چگونه میتوان ایدههای نمونهگیری مجدد در پالایه ذره را برای کاهش ارزش محاسباتی به صورت خطی روی تعداد مشاهدات استفاده کرد و دو الگوریتم نمونهگیری مجدد بهینهی را برای این مسائل پیشنهاد خواهیم کرد.
-
داده کاوی با استفاده از درخت تصمیم
1391داده کاوی به عنوان رشته جدید در جهان رو به افزایش پایگاههای داده بزرگ ظهور پیدا کرده است و به صورت فرایند کشف دانش منجر به همه روشهای ممکن برای رسیدن از داده خام به دانش مدیریت شده میشود. داده کاوی روشها و الگوریتمهای فراوانی دارد، از جمله درخت تصمیم، قوانین انجمنی، آنالیز خوشهای که حل مسائل دنیای واقعی را ممکن میسازند.یکی از الگوریتمهای دادهکاوی که اغلب مورد استفاده قرار میگیرد درخت تصمیم است. این روش توان دستهبندی و پیشبینی انواع متغیرها را داراست. مزیت غالب آن بر سایر تکنیکهای مدلبندی، داشتن توانایی تولید مدلهای پیشبین دقیق با نمایش درختی قابل تفسیر است که کاربر را قادر میسازد اطلاعات مفید را در کمترین زمان بدست آورد. الگوریتم هایی از جمله CHAID ،C5 ،C4:5 ،ID3 و CART به رشد درخت تصمیم در فرایند ساخت آن کمک می کنند. در این پایاننامه در مورد مفاهیم و الگوریتمهای دادهکاوی علیالخصوص درخت تصمیم ID3 و CHAID بحث می شود. سپس درخت تصمیم CHAID با استفاده از دادههای واقعی بانک بکار گرفته میشود.
-
رتبه بندی عملکرد بانکهای تجاری منتخب با استفاده از روش تاپسیس و آنالیز فرایند سلسله مراتبی فازی
1391هدف اصلی بانک های امروزی کسب مزیت رقابتی پایدار می باشد. ارزیابی مداوم عملکرد لازمه کسب مزیت رقابتی پایدار می باشد. در این تحقیق تلاش می گردد تا عملکرد پنج بانک تجاری بزرگ (ملی، ملت، تجارت، رفاه، و سپه) با استفاده از دو مدل فرایند تحلیل سلسله مراتبی فازی (FAHP) و تاپسیس (TOPSIS) مورد ارزیابی قرار گیرد. این تحقیق در شهر تبریز و در سال 1389 انجام شده است. در این تحقیق عملکرد مالی و غیر مالی شعبات مرکزی بانکهای فوق الذکر با استفاده از دو مدل فرایند تحلیل سلسله مراتبی و تاپسیس مورد مطالعه و رتبه بندی قرار گرفت. نتایج تحقیق نشان داد که اثرات معیارهای ارزیابی مختلف یکسان نبودند. بدین معنی معیارهایی که دارای تاثیر کمتری بر هزینه تامین مالی و یا دارای تاثیر بیشتری بر افزایش درآمد بوده اند، بیشتر مورد توجه واقع شده اند. همچنین مشخص گردید که نتایج حاصل از بکارگیری هر دو مدل یکسان می باشد. درنهایت طبق نتایج حاصل از تحقیق رتبه بندی بانک ها در هر دو بخش عملکرد مالی و غیرمالی به ترتیب عبارت است از: ملت، ملی، سپه، تجارت، و رفاه.
-
بررسی ارتباط بین ریسک و سرمایه با سودآوری بانک ها
1391هدف از این مطالعه بررسی تاثیر عوامل مشخصه بانک مشتمل بر نسبت کفایت سرمایه (CAR) و ریسک اعتباری (CRisk) بر سودآوری بانک های دولتی و خصوصی ایران است که توسط حاشیه سود خالص (NIM) اندازه گیری می شود. روابط بین نسبت کفایت سرمایه، ریسک اعتباری و حاشیه سود خالص با استفاده از داده های پانل با مدل اثرات ثابت (FEM) و به کمک یک نمونه 49تایی از صورت های مالی سالیانه سه بانک دولتی و چهار بانک خصوصی طی دوره هفت ساله 1389-1383 بررسی می شود. نتیجه گیری مطالعه ما این است که سودآوری بانک های دولتی به طور منفی و معنی داری از نسبت کفایت سرمایه و به طور مثبت و معنی داری از ریسک اعتباری (که توسط نسبت ذخایر مطالبات به کل تسهیلات تعیین می شود) تاثیر می پذیرد. همچنین، نتایج برآوردها نشان می دهد که سودآوری بانک های خصوصی به طور مثبت و معنی داری از هر دوی نسبت کفایت سرمایه و ریسک اعتباری تاثیر می پذیرد. این نتایج بدین معنی هستند که در دو سیستم بانکی نسبت کفایت سرمایه اثرات متفاوتی بر سودآوری دارد، در حالی که ریسک اعتباری به طور مثبت و معنی داری بر سودآوری هر دو سیستم بانکی اثرگذار است. این یافته ها نشان می دهد که هیچ ارتباط نظام مندی بین نسبت کفایت سرمایه و سودآوری وجود ندارد، ولی این فرضیه را که ارتباط مثبتی بین ریسک اعتباری و سودآوری است می توان تایید می کند.
-
تابع چگالی با کمترین فاصله کایدو با داشتن تابع چگالی پیشین و گشتاورها
1390برآورد تابع چگالی احتمال از مباحث کاربردی در آمار میباشد، که در تاکنون روشهای متفاوتی برای آن ارائه گردیده است. یک دیدگاه که در زمینه برآورد تابع چگالی وجود دارد، برآورد تابع چگالی با داشتن اطلاعات روی گشتاورهای توزیع میباشد. از جمله روشهایی که برای این منظور وجود دارد میتوان به اصل ماکزیمم آنتروپی، اصل کمترین تفاوت اطلاعات و اصل کمترین فاصله کایدو اشاره کرد. در این پایاننامه به بررسی اصل کمترین فاصله کایدو که توسط کومار و تانجا \cite{taneja, tan1} معرفی شده است میپردازیم. نخست به معرفی فاصله کایدو و اصل کمترین فاصله کایدو میپردازیم و سپس روش برآورد تابع چگالی را با داشتن تابع چگالی اولیه و اطلاعاتی در مورد تابع چگالی مجهول را بیان میکنیم. در ادامه برای زمانی که تابع چگالی اولیه یا مشاهده شده توزیع گاما \cite{kumarg} و وایبل و همچنین اطلاعات گشتاوری توزیع، اطلاعاتی در مورد میانگین هندسی، حسابی و یا واریانس میباشد تابع چگالی با کمترین فاصله کایدو را ارائه میدهیم و با مثالهای عددی نتایج بدست آمده را تشریح خواهیم نمود. در پایان به تعمیم روش کومار و تانجا برای برآورد تابع چگالی احتمال توام با کمترین فاصله کایدو خواهیم پرداخت. همانند حالت تکمتغیره، ضمن تعریف فاصله کایدو و اصل کمترین فاصله کایدو در حالت دومتغیره، روش برآورد تابع چگالی احتمال توام را بیان و سپس با در نظر گرفتن توزیع دیریکله و حاصلضرب دو توزیع نمایی به عنوان توزیع اولیه و اطلاعات رو گشتاور حاصلضرب یعنی $ E(XY) $ تابع چگالی را بدست میآوریم.
-
سیستم پیرسن و تابع چگالی پیرسن نوع حاصلضربی
1390خانواده توزیعهای پیرسن، خانوادهای شامل دوازده تابع چگالی احتمال پیوسته با چولگی و کشیدگیهای مختلف است که بسیاری از توزیعهای مهم و شناخته شده را هم شامل میشود. فصل اول این پایاننامه به معرفی خانواده توابع چگالی احتمال پیرسن یا سیستم پیرسن اختصاص دارد. در این فصل روش به دست آوردن این توابع چگالی احتمال، برآورد پارامترها و معیار تفکیک آنها را بیان میکنیم. از اعضای این خانواده میتوان برای برازش یک تابع چگالی احتمال پیوسته به دادههایی که توزیع نامشخصی دارند استفاده کرد که روش برازش توابع چگالی احتمال پیرسن به دادهها و چگونگی برآورد پارامترهای این توزیعها را ذکر کرده و آن را با یک مثال عددی شرح میدهیم. در فصل دوم، یک تابع چگالی احتمال جدید معرفی میشود که از حاصلضرب دو تابع چگالی احتمال پیرسن نوع VII ساخته شده است و آن را تابع چگالی پیرسن نوع VII حاصلضربی مینامیم. سپس به کاربردهایی از این توزیع اشاره کرده و به بررسی ویژگیهای ساختاری این توزیع جدید مانند تابع توزیع تجمعی، گشتاورها، برآورد ماکزیمم درستنمایی پارامترها، ماتریس اطلاع فیشر، میانگین انحراف از میانگین و میانه، آنتروپی و توزیع حدی آمارههای مرتب فرین میپردازیم. در آخر، دو تابع چگالی حاصلضربی جدید را با استفاده از خانواده پیرسن معرفی کرده و گشتاور مرتبه k ام آنها را محاسبه میکنیم. در فصل سوم، کاربردهایی از تعدادی از توابع چگالی احتمال پیرسن مطرح میشود. ابتدا کاربردی از تابع چگالی پیرسن نوع VII حاصلضربی بیان میشود و از این تابع چگالی به عنوان توزیع پسین یک متغیر تصادفی و برای انجام یک آزمون بیزی در مورد میانگین توزیع نرمال استفاده میشود. در بخش بعد با استفاده از تابع چگالی پیرسن نوع ،I یک تقریب پیوسته برای تابع احتمال دوجملهای با پارامترهای n=50 و p=0.3 به دست آورده و آن را با تقریبهایی که از روشهای دیگر به دست میآیند مقایسه میکنیم. کاربرد بعدی مربوط به تابع چگالی پیرسن نوع III است که از آن برای برآورد حداکثر حجم آب یک رودخانه در یک ایستگاه هیدرومتری به ازای دورههای بازگشت مختلف استفاده خواهیم کرد.
-
رتبهبندی با روشهای تصمیمگیری چندمعیاره
1389در این پایاننامه مبانی و مفاهیم اساسی روش های تصمیم گیری چند معیاره، برخی از روشهای وزندهی به شاخص های موثر در رتبه بندی، انواع روش های بی مقیاس کردن و نرمالسازی داده ها برای همگن کردن داده های غیرهمگن و تبدیل آنها به یک مقیاس، انواع روش های اندازه گیری فواصل داده ها از نقاط ایده آل، برخی از روش های رتبه بندی تعریف و نتایج به دست آمده از این روشها با ذکر مثالهای کاربردی نشان داده شده است. همچنین با ارائه مثالی نتایج حاصل از ترکیب آرای کارشناسان و متخصصین در روش رتبه بندی با تاپسیس بر اساس دو نوع ادغام خارجی و ادغام داخلی بررسی شده و نتایج انواع روش های بکار برده شده نشان داده شده است. در نهایت نتایج و رتبه های بهدست آمده برای 30 استان کشور بر اساس شاخص قیمت استان ها بر اساس انواع روش های محاسبه فواصل نقاط از نقاط ایده آل مانند روش اقلیدسی و روش منهاتان ارائه شده و همه این نتایج مورد مقایسه قرار گرفتند.
-
برآورد پارامتر n در توزیع دوجملهای
1389توزیع دوجملهای از توزیعهای بسیار پرکاربرد است. یکی ازمهمترین موضوعات در مورد این توزیع برآورد پارامتر n میباشدکه تاکنون براساس روشهای گشتاوری و ماکزیمم درستنمایی بوده است. استفاده از برآوردگرهای دیگر نادیده گرفته شده، هر چند در عمل، برای تعیین اندازه نمونه بیشتر با نگرش بیزی سروکار داریم. چنین نگرشی به محقق این امکان را میدهد که از اطلاعات پیشین آزمایش، پارامترهای مجهول را برآورد کند. در این پایان نامه هدف یافتن برآورد قابل قبول پارامتر n براساس تابع زیان بیزی است. بدین منظور با معلوم فرض نمودن پارامتر p و نیز با اختصاص توزیعهای پیشین برای n از بین توزیعهای معروف گسسته و استفاده از توابع زیانی چون تابع زیان مربع خطا و تابع زیان مربع خطای مقیاسی، اقدام به برآورد n خواهیم نمود.
-
فاصله اطمینان ناپارامتری برای چندک ها و اختلاف چندک ها بر اساس آماره های رکوردی
1388در این پایان نامه نشان داده می شود که چگونه روشهای استنباطی ناپارامتری می تواند براساس آماره های رکوردی توسعه پیدا کند. بحث ما شامل فاصله اطمینان برای چندکها واختلاف چندکها، فاصله اطمینان درونی و برونی برای فواصل چندکی و حد بالایی و پایینی برای اختلاف چندکها براساس آماره های رکوردی است.همچنین کرانهای بالایی برای فاصله اطمینان طول امید ریاضی به دست می آیند. لازم به ذکر است که این فواصل همگی آزاد توزیع می باشند. برای کمک به انتخاب مقادیر رکوردی مناسب برای فواصل اطمینان و برای نشان دادن مثالهای عددی جدولهایی را تهیه کرده ایم. این نتایج زمانی می توانند جالب باشند که فقط مقادیر رکوردی ثبت شده باشند. در پایان گروهی از داده های دمای ماهیانه مرکز تبریز (1330- 1386) به عنوان مثال کاربردی برای نشان دادن هدف استنباط رکوردی بحث وبررسی می شود.
-
تعیین حجم نمونهی بیزی با استفاده از تابع زیان
1388تعیین اندازهی نمونه، یکی از مراحل اساسی در انجام طرحهای آماری است. در اغلب این طرحها از روشهای کلاسیک مانند فرمول کوکران، قضیهی چبیشف و فاصله اطمینان استفاده میشود و متاسفانه کمتر به روشهای بیزی توجه میشود، هر چند در عمل ما بیشتر برای تعیین اندازهی نمونه با نگرش بیزی سروکار داریم، که این نگرش به محقق این امکان را میدهد که از اطلاعات پیشین آزمایش، پارامترهای مجهول را برآورد کند. در این پایاننامه با دیدگاه بیزی و به کارگیری نظریهی تصمیم برای تعیین اندازهی نمونهی بهینه اقدام میشود. برآورد بیزی اندازهی نمونه را با سه روش محاسبه میکنیم. 1) با استفاده از برآورد نقطهای پارامتر مورد نظر از توزیع پسین به وسیلهی تابع زیان. 2) با استفاده از ناحیههای p – تحمل با کمترین زیان پسین (LPL). 3) با استفاده از آزمون فرض و تابع زیان، یعنی اندازهی نمونه را طوری تعیین میکنیم که نتایج تصمیمهای اشتباه در مورد فرضهای تحت آزمون را نشان دهد.