Faculty Profile

تاریخ به‌روزرسانی: 1404/05/16

حسین بیورانی

دانشکده علوم پایه / گروه آمار

Theses Faculty

پایان‌نامه‌های کارشناسی‌ارشد

Statistical Inference of Generalized Poisson Regression Hurdle Model
1403
Counting data is one of the most widely used data types because it is found in various sciences such as medicine, pharmacy, management, industry, and economics. Generally, a count regression model such as Poisson regression is used to analyze this type of data, but when the count data contains extra zeros, the results will not be efficient. Since extra zeros in the data cause over-dispersion, zero-inflated Poisson (ZIP) regression models are used for the Poisson distribution. Hurdle regression (HR) models are another type of modified count regression, HR is an effective model for dealing with zero-inflated data, which in combination with the generalized Poisson distribution can deal with over-dispersion or under-dispersion in addition to the problem of extra zeros. In this dissertation, we will study and analyze the generalized Hurdle Poisson regression model (GPHR) which has two properties of extra zero values and non-equality variance and mean. We will use different approaches to estimate the parameters of the discussed model. We will simulate the proposed methods by coding in R and compare the results using the evaluation criteria. Finally, we will apply the selected method to real data.
داده کاوی و تحلیل آماری اطلاعات بیمه مسئولیت بیمه گزاران شرکت بیمه ایران
1403
داده‌کاوی به عنوان یکی از روش‌های نوین تحلیل داده‌ها، نقش مهمی در بهبود فرآیندهای تصمیم‌گیری در بیمه مسئولیت ایفا می‌کند. با استفاده از داده‌کاوی، شرکت‌های بیمه قادر به بررسی و تحلیل داده‌های وسیع مشتریان، شناسایی الگوهای رفتاری و ارائه خدمات بهینه به آن‌ها هستند. این تکنیک به تحلیل دقیق‌تر اطلاعات و مدیریت بهتر منابع شرکت‌های بیمه کمک می‌کند. این پژوهش با هدف بررسی داده‌کاوی در حوزه بیمه مسئولیت و تحلیل آماری اطلاعات مشتریان بیمه مسئولیت شرکت بیمه ایران انجام شده است. در فصل اول، به معرفی مفاهیم اساسی شامل داده‌کاوی، بیمه مسئولیت، خوشه‌بندی، مدل لگاریتمی خطی و تحلیل واریانس پرداخته شده است. فصل دوم به توصیف و تحلیل اطلاعات مربوط به مشتریان بیمه مسئولیت این شرکت در سال‌های ۱۳۹۳ تا ۱۴۰۲ اختصاص دارد. در فصل سوم، استنباط آماری و داده‌کاوی اطلاعات بیمه گزاران بر اساس تکنیم های آماری خوشه بندی، تحلیل واریانس و نیز مدل لگاریتم خطی آمده است
مزایا و P -مقدار و عامل بیز در آزمون های آماری
1403
در آزمون های آماری، استفاده از P -مقدار و عامل بیز به منظور ارزیابی و تحلیل نتایج آزمون ها رایج است. اما تفاوت ها و مزایا و معایب هر دو روش در تصمیم گیری های آماری می تواند به بهبود فهم ما از قواعد استنتاج آماری کمک کند. در این پایان نامه، قصد داریم مزایا و معایب استفاده از P -مقدار و عامل بیز را در آزمون های آماری مورد بررسی قرار داده و نقاط قوت و ضعف هر روش را مورد بررسی قرار دهیم. با بررسی این مسئله، می توان بهترین روش را برای استفاده در آزمون های آماری تعیین نمود تا به دقت و قدرت تحلیل نتایج آزمون های آماری افزوده شود.
ﻣﺪل‌ﺑﻨﺪی ﻧﮕﻬﺪاری و ﻗﺎﺑﻠﯿﺖ اﻋﺘﻤﺎد ﻣﺒﺘﻨﯽ ﺑﺮ ﺑﺮدار ﻋﻼﻣﺖ ﺑﺮای ﯾﮏ ﺳﯿﺴﺘﻢ ﻣﻨﺴﺠﻢ ﺑﺎ در ﻧﻈﺮ ﮔﺮﻓﺘﻦ اﺛﺮ واﺑﺴﺘﮕﯽ و ﺷﺮاﯾﻂ ﻣﺤﯿﻄﯽ
1403
در صنایع مختلف، به‌ویژه در حوزه‌هایی که با سیستم‌های پیچیده و حساس سروکار دارند، مانند صنعت هوافضا، انرژی و حمل‌ونقل، یکی از رویکردهای کلیدی، تمرکز بر قابلیت اعتماد و نگهداری پیشگیرانه است. در این رساله، این رویکرد با هدف بهبود کارایی سیستم‌ها‌ی منسجم ، کاهش هزینه‌های محیطی و تعمیراتی مورد توجه قرار گرفته است. تمرکز بر قابلیت اعتماد و نگهداری پیشگیرانه، به سازمان‌ها این امکان را می‌دهد تا با پیش‌بینی و پیشگیری از خرابی‌ها، عملکرد بهینه‌ی سیستم‌ها را حفظ کرده و به طور موثرتری از هزینه‌های غیرضروری جلوگیری کنند. همچنین در این رساله، با استفاده از بردار علامت و تابع کاپولای تعمیم‌یافته فارلی-گامبل-مورگنسترن ‎$(FGM)$‎، یک مدل کلی برای میانگین طول عمر باقی‌مانده ‎$(MRL) $‎ در تحلیل قابلیت اعتماد سیستم‌های وابسته با ویژگی اشتراک بار ارائه می‌دهیم. این رویکرد با مدل‌های پیشین تفاوت دارد، چرا که علاوه بر در نظر گرفتن ویژگی اشتراک بار، تاثیر شرایط محیطی بر سیستم را نیز به‌طور همزمان بررسی می‌کند. همچنین، با بهره‌گیری از مدل پیشنهادی و استدلال قضیه‌ی تجدید-پاداش، یک سیاست جایگزینی سنی نیز تحلیل می‌شود. عملکرد مدل ‎$ MRL$‎ پیشنهادی و نحوه‌ی تغییرات راه‌حل بهینه با تغییر پارامترهای مدل، از طریق مثال‌های عددی نیز نمایش داده می‌شود.
Analyzing the traffic accident frequency in Iraq using log-linear models
1403
It's crucial to focus on urban and interurban traffic accidents as we are witnessing an increase in fatalities and injuries due to road accidents each year. This thesis aims to analyze the factors involved in traffic accidents by examining multi-dimensional cross-tables showing the frequency of deaths and injuries from 2020 to 2021. We will extract connection diagrams to illustrate the relationships between these variables. Using a specialized linear logarithm model for categorized data, we will estimate the model's parameters and interpret the results with the help of connection diagrams.
Artificial Neural Network Analysis Using Statistical Approaches
1403
Neural networks‎, ‎often viewed as black boxes due to their complex composition of functions and parameters‎, ‎pose significant challenges for interpretability‎. ‎This study addresses these challenges by exploring various methods for interpreting neural networks‎, ‎focusing on both theoretical and practical aspects‎. ‎Firstly‎, ‎we demonstrate that the neural network estimator \ f_n \ can be interpreted as a nonparametric regression model constructed as a sieved M-estimator‎. ‎This approach ensures the weak convergence of \ f_n \ within the metric space \ (\Theta‎, ‎d) \‎, ‎providing a solid theoretical foundation for understanding neural networks‎. ‎ Building on these theoretical insights‎, ‎the study introduces statistical tests designed to assess the importance of input variables‎, ‎offering a clearer understanding of their contributions to the model‎. ‎Dimensionality reduction algorithms are also explored‎, ‎highlighting their role in simplifying the model‎, ‎enhancing both interpretability and accuracy‎. ‎ Furthermore‎, ‎we show that statistical confidence intervals enhance model reliability by providing more robust estimates‎. ‎Statistical tests are also employed to evaluate and interpret the performance of individual neurons‎, ‎identifying their contribution to classification tasks and providing insights into the network's functioning‎. ‎To validate these theoretical findings‎, ‎simulations were conducted and applied to the IDC and Iris datasets‎. ‎These experiments illustrate the practical utility of the proposed methods and affirm the effectiveness of the neural network estimator in real-world applications‎. ‎This study contributes to the emerging field of Explainable Artificial Intelligence by presenting methodologies for interpreting traditional deep artificial neural networks through statistical frameworks‎, ‎thereby facilitating a better understanding of the relationship between inputs and outputs and the performance of individual network components‎.
Exploring the characteristics and trends of crude oil and its refined products in an Iraq refinery using statistical analysis
1403
One of the important sources of Iraq's income is crude oil, most of which is exported directly and a part of which will be converted into other products needed in refineries. In this thesis, we will examine and dissect the information on one of Iraq's refineries. For this purpose, while describing the information related to the production of that refinery using the techniques available in descriptive statistics, an attempt will be made to provide appropriate models for predicting the amount of production of the products. In the end, we will arrive at the final model for each product by using the model selection criteria, and we will act on the forecast for the next six periods using the selected final model.
داده‌کاوی و تحلیل آماری شاخص‌های اقتصادی ایران و روسیه
1403
مقایسه شاخص‌های اقتصادی ایران و روسیه به دلیل نقش محوری این دو کشور در صنعت، تجارت و اقتصاد منطقه و جهان اهمیت بسیار دارد. در این پایان‌نامه، قصد داریم تا با محوریت این دو کشور، به تحلیل مقایسه‌ای شاخص‌های اقتصادی آن‌ها بپردازیم. هدف از این پژوهش، داده‌کاوی و تحلیل آماری شاخص‌های اقتصادی انتخابی و مهم دو کشور ایران و روسیه است تا از این طریق به درک عمیق‌تر و واقع بینانه‌تری از وضعیت اقتصادی آنها برسیم. شاخص‌های اقتصادی انتخابی، مربوط به سالهای ‎1993‎ الی ‎2021‎ بوده که از وبگاه بانک جهانی استخراج شده‌اند. پس از پالایش و معماری داده‌ها و انتخاب شاخص‌های مهم اقتصادی، علاوه بر توصیف یک و چند متغیره از تکنیک‌های آماری و داده‌کاوی مانند: رگرسیون چندگانه، تحلیل عاملی، تحلیل همبستگی و سری زمانی استفاده خواهد شد
استنباط آماری برای مدل‌های طول عمر تحت سانسور داده‌های توام
1402
در بسیاری از مطالعات طول عمر ، آزمایشگر ممکن است مجبور شود به علت صرفه ‌جویی در وقت و هزینه به ثبت و اندازه‌گیری بخشی از اطلاعات مربوط به واحدهای آزمایشی بپردازد. به چنین داده‌های به دست آمده از این آزمایش‌ها، داده‌های سانسور شده گویند‎.‎ این پدیده ممکن است در هنگام آزمون‌های طول عمر مقایسه محصولات از دو یا چند واحد مختلف تولیدی به طور همزمان و تحت شرایط یکسان صورت گیرد. در چنین شرایطی طرح سانسور توام پیشنهاد می‌شود. به عنوان مثال فرض کنید کارخانه‌ای دارای دو خط تولید تلویزیون است. با استفاده از طرح سانسور توام، مدیر کارخانه می‌تواند همزمان کیفیت و عمر مفید تلویزیون‌های تولید شده توسط دو خط تولید را مقایسه کند و در نهایت تصمیم‌گیری‌های مربوط به بهبود فرآیند تولید را بر اساس نتایج آزمایش انجام دهد‎.‎‎‎ با اعمال طرح سانسور توام، می‌توان در مورد پارامترهای توزیع دو جامعه به طور همزمان استنبا‎ط‎‎‌های آماری انجام داد. از جمله توزیع‌های طول عمر می‌توان به توزیع بور 12 و توزیع پواسن-نمایی اشاره کرد. توزیع بور 12 به دلیل مدل احتمالی و انعطاف‌پذیری در بحث تحلیل بقا و قابلیت اطمینان به توزیع‌های دیگر از جمله وایبول ، گاما ، رایس و توزیع‌های مقدار غایی برتری دارد. علاوه بر این توزیع پواسن-نمایی برای تحلیل داده‌هایی که گاهی اوقات علت ازکارافتادگی واحد آزمایشی نامعلوم و یا تابع نرخ خطر داده‌ها افزایشی است ، مناسب می‌باشد. در این رساله با هدف طرح سانسور توام نوع دو به برآورد پارامترهای دو توزیع بور 12 دو پارامتری و دو توزیع پواسن-نمایی پرداخته می‌شود. ابتدا برآوردگرهای حداکثر درستنمایی پارامترها با استفاده از الگوریتم بیشینه‌سازی امید ریاضی محاسبه می‌شود و سپس برآوردگرهای بیزی با استفاده از روش نمونه‌گیری از نقاط مهم و براساس توزیع‌های پیشین آگاهی‌بخش و ناآگاهی‌بخش و با در نظر گرفتن توابع زیان مربع خطا ، لاینکس و آنتروپی تعمیم‌یافته محاسبه می‌گردند. همچنین برآوردگرهای انقباضی خطی و پیش‌آزمون به منظور بهبود کارایی برآوردگرها ارائه می‌گردند. علاوه بر این بازه‌های اطمینان تقریبی با استفاده از مفهوم ماتریس اطلاع گمشده ، بازه‌های بوت‌استرپ ، بازه‌های قابل قبول و چگالی پسین رفیع نیز محاسبه می‌شوند. پیش‌بینی نقطه‌ای و بازه‌ای واحدهای سانسور شده با استفاده از روش‌های کلاسیک و بیزی براساس طرح سانسور توام نوع دو و با در نظر گرفتن دو توزیع بور 12 و همچنین دو توزیع پواسن-نمایی صورت می‌گیرد. عملکرد برآوردگرهای به دست آمده با استفاده از شبیه‌سازی مونت ‌کارلو از لحاظ اریبی ، میانگین مربعات خطا ، کارایی و طول بازه‌ها باهم مقایسه می‌گردند. پس از اطمینان از نتایج شبیه‌سازی و کارایی برآوردگرها، روش‌های ارائه شده برای برآورد پارامترهای نامعلوم تحت سانسور توام ، برای مجموعه‌ای از داده‌های واقعی بررسی می‌شوند.
Estimation of logistic regression parameters in the presence of multicollinearity with application to medical data
1402
Logistic regression, a widely utilized regression model for binary response variables, relies on the maximum likelihood method for parameter estimation. However, when multicollinearity exists among independent variables, the estimators become ineffective due to variance inflation. To address this issue, various methods, including ridge regression, have been proposed. Ridge regression is crucial in estimating the ridge adjustment parameter, and several formulas have been suggested for this purpose. This thesis aims to introduce and compare a comprehensive set of ridge parameter formulas for logistic regression, utilizing efficiency criteria. To achieve this objective, Monte Carlo simulations will be conducted by varying correlation, the number of predictor variables, and sample size. The performance of selected ridge estimators will be compared, and the most suitable ones will be identified and recommended. Furthermore, the introduced ridge estimators, with different parameters, will be applied to real-world examples in the field of medical sciences. The implementation of the research utilizes R software, and the codes employed are presented in a dedicated section, ensuring practicality and accessibility.
استنباط بیزی مدل‌های رگرسیونی با فضای پارامتری محدود شده
1402
از دیر باز تا کنون آماردانان، برای بهبود کارایی مسائل استنباطی استفاده از اطلاعات قبلی درباره پارامتر یا محدودیت روی مقادیر پارامترها را در تحلیل تشخیص داده‌اند. این محدودیت‌ها که در علوم مختلف کاربرد دارند، غالباً به طور طبیعی ایجاد می‌شوند و می‌توان آنها را در قالب قیدهای مساوی و نامساوی خطی بیان نمود. در مدل‌های رگرسیونی خطی و خطی تعمیم‌یافته، قیدهای مساوی خطی براساس اطلاعات محقق یا بر اساس انتخاب متغیرهای معنی‌دار در مدل تعیین می‌شود. بنابراین قیدهای مطرح شده، شامل اطلاعات ارزشمندی هستند که در برآورد پارامتر مدل، باید مورد توجه قرار گیرند چرا که نادیده گرفتن این اطلاعات می‌تواند از کیفیت برآوردگر تعیین شده بکاهد. کارهای بسیاری در زمینه استنباط کلاسیک با در نظر گرفتن قیدهای مساوی خطی و همچنین قیدهای نامساوی خطی انجام گرفته است. برخلاف استنباط کلاسیک، استنباط بیزی روی مدل‌های رگرسیونی بویژه در مدل‌های خطی تعمیم‌یافته با توجه به مزیت‌های این روش، هنوز جای کار دارد. در این رساله با هدف استنباط بیزی در مدل‌های رگرسیونی، نخست به بررسی الگوریتم‌های موجود در برآورد پارامترهای مدل رگرسیون خطی با داشتن قیدهای نامساوی خطی پرداخته و سعی در بهبود و افزایش کارایی آنها خواهد شد. سپس به استنباط بیزی در مدل‌های خطی تعمیم‌یافته با در نظر گرفتن قیدهای نامساوی خطی خواهیم پرداخت. الگوریتم جدیدی پیشنهاد می‌شود که برآوردگر بیزی مقید حاصل، کارایی مناسب‌تری نسبت به برآوردگر بیز نامقید و همچنین برآوردگر حداکثر درستنمایی داشته باشد. روش استنباطی خود را روی مدل‌های رگرسیون گاما و بتا بکار خواهیم گرفت. از آنجا که در مباحث کاربردی مدل‌های رگرسیونی، همخطی چندگانه بین متغیرهای مستقل، اغلب اتفاق می‌افتد، بحث همخطی در مدل‌های رگرسیونی را مطرح و کارایی برآوردگرهای پیشنهادی را با برآوردگر ریج مقایسه خواهیم نمود. در پایان کاربرد برآوردگرهای بیزی مقید معرفی شده برای مجموعه‌ای از داده‌های واقعی، بررسی می‌شوند.
بهبود کارایی الگوریتم‌های یادگیری ماشین با استفاده از روش‌های رگرسیون تاوانیده
1402
امروزه در مباحث مربوط به پیش‌بینی علاوه بر افزایش دقت الگوریتم‌های موجود، کاهش بار محاسباتی نیز موضوع چالش برانگیزی است که توجهات بسیاری را به خود معطوف کرده است. از آنجایی که الگوریتم‌های پایه‌ی موجود، در این مورد کارایی و دقت کافی ندارند، برای حل این مساله از ترکیب الگوریتم‌های یادگیری ماشین و روش‌های آماری استفاده کرده‌ایم. در این رساله به منظور بهبود کارایی الگوریتم‌های یادگیری ماشین سه رویکرد ترکیبی پیشنهاد شده است. در رویکرد اول، از ترکیب جنگل تصادفی و روش‌های رگرسیون تاوانیده برای کاهش تعداد درختان جنگل تصادفی استفاده می‌شود. این کار با کاهش خودکار درختان به کمک روش‌های تاوانیده و تجمیع درختان باقی‌مانده، به کاهش بار محاسباتی کمک می‌کند. رویکرد دوم، بر بهبود دقت مدل با خوشه‌بندی داده‌های ورودی، شناسایی زیرمجموعه‌های همگن از داده‌ها، تخصیص آن‌ها به گروه‌های مشابه و کاهش تعداد درختان جنگل تصادفی در داخل خوشه‌ها تمرکز دارد. به این صورت که در داخل هر خوشه، از جنگل تصادفی به عنوان پیش‌بینی‌کننده استفاده می‌شود. در نهایت، با کاهش تعداد درختان در درون هر خوشه با استفاده از روش‌های تاوانیده و در مجموع کل خوشه‌ها، خطای مدل و بار محاسباتی کاهش یافته و عملکرد مدل بهبود پیدا می‌کند. در ادامه، رویکرد سومی پیشنهاد می‌شود که از الگوریتم‌ها و ساختارهای به‌روز برای پیش‌بینی عمیق‌تر و دقیق‌تر استفاده می‌کند. در این رویکرد از ترکیب الگوریتم یادگیری عمیق، روش‌های تاوانیده و روش‌های یادگیری جمعی استفاده می‌شود. رگرسیون‌های عمیق وظیفه‌ی استخراج روابط بین ویژگی‌ها و پیش‌بینی را به عنوان یادگیرنده بر عهده دارند. روش‌های رگرسیون تاوانیده عمل کاهش تعداد پیش‌بینی‌کننده‌ها و روش‌های جمعی عمل تجمیع یادگیرنده‌های باقی‌مانده را انجام می‌دهند. در نهایت، رویکردهای پیشنهادی با دیگر مدل‌های مبنا براساس مطالعات شبیه‌سازی و سه مجموعه داده‌ی واقعی مورد ارزیابی قرار می‌گیرند. نتایج حاصل نشان می‌دهند که رویکردهای پیشنهادی، عملکرد بهتر و کارایی بیشتری نسبت به روش‌های موجود دارند.
تجزیه و تحلیل سبد خرید بازار با روش‌های داده‌کاوی
1401
تجزیه و تحلیل سبد خرید مشتریان، اجزای سبد محصولات خریداری شده توسط مشتریان در یک خرید را مطالعه می کند. این ایده وجود دارد که سبد محصولات خریداری شده، وابستگی بین محصولات یا خریدهای انجام شده بین دسته های مختلف محصولات را منعکس می کند و تعیین این وابستگی ها می تواند پشتوانه خوبی برای تصمیمات بازاریابی و فروش باشد. این پایان نامه بر آن است تا با تحلیل سبد خرید مشتریان در فروشگاه مواد غذایی فلورانس شهر تبریز و بررسی تراکش ثبت شده در طول یک ماه، الگوی خرید آنان را یافته و بررسی کند. بدین منظور از دو نرم افزار اکسل و پاوربی که هر دو متعلق به شرکت ماکروسافت هستند، بهره می‌گیریم.
مقایسه روش‌های آماری و هوش مصنوعی در پیش بینی شاخص سهام شرکت‌های اپل، گوگل و آمازون
1401
الگو‌های پیش بینی بازار سهام یک فعالیت پژوهشی مهم تلقی می‌شود چرا که قیمت سهام منجر به سود‌های کلان، ناشی از تصمیمات درست و زیان‌های فراوان ناشی از تصمیمات غلط می‌شود. وجود رکود و نوسانات داده‌ها، پیش بینی‌های مربوط به بازار سهام را به عنوان یک چالش بزرگ برای سرمایه گذارانی ساخته است که از پول خود برای کسب سود استفاده می‌کنند. به منظور پیش بینی‌های مربوط به بازار سهام، از روش‌های ریاضی و ابزار‌های یادگیری استفاده می‌شود. در این پایان نامه سعی می‌شود تا برای پیش بینی قیمت سهام روش‌های کلاسیک آماری و یادگیری ماشین و هوش مصنوعی را بررسی و مقایسه گردد. همچنین به عنوان کاربرد قیمت سهام چند شرکت مشهور مانند اپل،گوگل و آمازون را با روش‌های مذکور مدل‌ سازی و به انتخاب مدل بهینه برای پیش بینی قیمت سهام هر کدام از این شرکت‌ها دست پیدا کنیم.
تشخیص و آنالیز داده‌های موثر برای رگرسیون ابعاد بالا
1401
در دسترس بودن داده‌های با ابعاد بالا که در آن تعداد متغیرها به‌طور قابل ‌ملاحظه‌ای بیشتر از تعداد مشاهدات است، اکنون در بسیاری از زمینه‌های علمی به ویژه ژنومیکس و زیست‌شناسی مولکولی رایج است. اغلب در آنالیز داده‌های ابعاد بالا فرض می‌شود تعداد متغیرهایی که در اصل با پاسخ مورد نظر مرتبط هستند، کم است. بررسی در مورد این تعداد کم از متغیرهای مهم به اهمیت روش‌های انتخاب مدل در محیط‌‌های ابعاد بالا تاکید کرده است. استفاده از روش‌های درستنمایی تاوانیده با تکثیر مجموعه داده‌های ابعاد بالا گسترش یافته است. با این وجود، هنگامی که تعداد مشاهدات در مقایسه با تعداد متغیرهای کمکی نسبتاً کم است، هر مشاهده‌ای به‌طور بالقوه می‌تواند تاثیر بسزایی روی انتخاب مدل و استنباط داشته باشد. از این رو، تشخیص مشاهدات موثر در روش‌های تاوانیده مهم است. در این پایان‌نامه، معیارهای تاثیر رگرسیون لاسو برای اندازه‌گیری تاثیر یک مشاهده روی مولفه انتخاب مدل رگرسیون برازش شده معرفی می‌شوند. همچنین، این معیارها تحت روش الاستیک‌نت برای شناسایی مشاهدات موثر در داده‌های ابعاد بالا مورد مطالعه قرار می‌گیرند. روش الاستیک‌نت برای بهبود پیش‌بینی‌های مدل، ویژگی حذف از لاسو و کاهش ضرایب از مدل ریج را ترکیب می‌کند. از طریق شبیه‌سازی و مجموعه داده‌های واقعی نشان می‌دهیم که معیارهای تاثیر معرفی شده به‌طور کارآمد مشاهدات موثر را شناسایی می‌کنند و می‌توانند به آشکارسازی روابط پنهان در داده‌ها کمک کنند.
استنباط آماری و شبیه‌سازی برای رگرسیون فضایی
1401
تحلیل داده‌های فضایی اکتشافی اغلب یک گام اولیه برای رویکردهای مدل‌سازی رسمی است که به دنبال ایجاد روابط بین متغیر وابسته و سایر متغیرهای مستقل هستند که وابستگی فضایی وجود دارد. تمرکز در این پایان نامه بر مدل‌های رگرسیون فضایی در یک فضای مقطعی ساده است، که شامل مدل‌های رگرسیون تاخیر فضایی، خطا فضایی و دوربین فضایی می‌باشد. بدین منظور ضمن بررسی مدل مذکور و نحوه برآورد پارامترهای آن به آشنایی با انجام انواع رگرسیون فضایی با نرم‌افزار R‎ خواهیم پرداخت. در پایان کاربرد مدل‌های مورد بررسی را با داده‌های واقعی نشان خواهیم داد و به انتخاب مدل مناسب می‌پردازیم.
Estimation of gamma regression parameters in the presence of multicollinearity
1401
The gamma regression model is one of the regression models that has found a lot of uses, particularly in a variety of sciences such as engineering, medicine, insurance, and the humanities, among other areas. When the response variable can only take positive restricted to positive real numbers, this model is utilized. The maximum likelihood approach is normally the one that is used whenever the covariates do not have any link with each other. This is because the maximum likelihood method is the most accurate estimation method. However, just like in linear regression models, it is possible that we come across situations in which there is a correlation or linear relationship between the covariates. In such a scenario, the inference that is drawn using this method will be incorrect due to the large estimate that is produced. In this thesis, we investigate how to estimate the parameters of a gamma regression model when there is multicollinearity between the covariates. We begin by presenting the ridge estimator for the gamma regression model. After that, we use the various techniques that have been suggested to estimate the ridge parameter in other regression models in the gamma regression model. Finally, we use Monte Carlo simulation to determine which ridge estimator provides the most accurate results. After that, we discuss the gamma regression model, and then apply the selected estimator to a practical scenario.
Fitting the truncated regression model to count data
1401
Regression is used to predict a count-dependent variable based on several independent variables. Because the dependent variable is count, simple linear regression is not used much, and more count regressions are used, the most common of which are Poisson regression and negative binomial regression, which belong to generalized linear models. In this thesis, while examining these two models in advance, we pay attention to the models that are truncated, and we will conduct a simulation study to analyze the performance of the proposed truncated regression models against the standard models, and in this regard, we will compare these models with We will compare. Finally, a practical example with real data is provided for the application of truncated models.
Classical and Bayesian parameters estimation of lifetime distributions based on censored data
1401
In this thesis, classical and Bayesian estimators have been discussed for two- parameter Exponential-Logarithmic distribution based on type-I hybrid and progressive type-II censored samples. Maximum Likelihood Estimators (MLEs) in the traditional tech- nique are noted to lack closed form expressions. To compute the MLEs, we suggest using both the EM and SEM techniques. The asymptotic confidence intervals are built using the observed Fisher information matrix and the missing information principle. We develop the Bayes estimators using the Bayesian method in relation to various symmetric and asymmetric loss functions. We employ Tierney-Kadane and the significance sampling approaches in this regard. For illustrative purposes, Monte-Carlo simulation and a few real data set examples have been provided.
استنباط آماری برای مدل آمیخته متناهی رگرسیون خطی
1400
یکی از تکنیک های بسیار کاربردی در مباحث چند متغیره، رگرسیون خطی و غیرخطی است. در رگرسیون یک متغیره وابسته وجود دارد که در روش کلاسیک اغلب این متغیر نرمال فرض می شود که این فرض در عمل با مشکلاتی روبرو است. به همین دلیل در دهه های اخیر رگرسیون با متغیر وابسته پواسن، گتما، نمائی و سایر توزیع های ساخته شده است. استفاده از توزیع آمیخته متناهی به غنای رگرسیون افزوده است. در این پایان نامه ضمن مروری بر رگرسیون خطی با توزیع آمیخته متناهی به انتخاب متغیر بیزی در این خصوص حواهیم پرداخت.
استنباط آماری در مدل‌های خطی تعمیم‌یافته‌ی ابعاد بالا
1400
پیشرفت روز افزون علوم مختلف از جمله پزشکی و بهداشتی و مدیریت باعث تولید حجم وسیعی از داده‌ها گشته است. در این گونه موارد انتخاب متغیر یک ابزار توانمند برای اکتشاف در زمینه‌های مختلف است، که از سال‌های دور توجه بسیاری را به خود جلب کرده است. انتخاب متغیر با استفاده از روش‌های رگرسیون تاوانیده صرفاً بر اساس متغیرهای پیشگوی موثر انجام می‌شود. از این رو عدم شناسایی متغیرها با خاصیت پیشگویی ضعیف، منجر به کاهش کارایی استنباط‌های حاصل از روش‌های رگرسیونی می‌گردد. در این رساله، استراتژی برآوردگرهای انقباضی نوع استاین و استاین مثبت، با هدف بهبود عملکرد پیش‌بینی در مدل‌های خطی تعمیم‌یافته با بعد بالا مورد مطالعه قرار می‌گیرد. برآوردگرهای انقباضی معرفی شده ترکیب خطی از برآوردگرهای ریج وزنی و برآوردگرها با تاوان نوع لاسو هستند. تحت برخی شرایط نظم، رفتار مجانبی برآوردگرهای پیشنهاد شده مورد بررسی قرار می‌گیرد. به علاوه در قالب یک مطالعه‌ی شبیه‌سازی و مثال واقعی کارایی آن‌ها از دیدگاه میانگین توان دوم خطا مورد ارزیابی قرار می‌گیرد.
استنباط آماری مدل‌های شمارشی آماسیده در صفر
1400
مدل‌های رگرسیون پواسن و دوجمله‌ای منفی زیرمجموعه‌ی مدل‌های شمارشی هستند که در آن‌ها متغیر پاسخ اعداد صحیح نامنفی را اختیار می‌کند. گاهی ممکن است تعداد زیادی از مشاهدات صفر باشند به‌طوری که این تعداد بسیار بیشتر از صفرهای تولید شده از یک مدل شمارشی معمولی است. برای تحلیل چنین داده‌هایی از مدل‌های شمارشی آماسیده در صفر استفاده می‌شود که در آن‌ها فرض می‌شود داده‌ها از یک توزیع شمارشی معمولی و یک توزیع تباهیده در صفر تولید می‌شوند. در چنین حالتی، اگر داده‌های تولیده شده از توزیع شمارشی دارای میانگین و واریانس یکسان باشند، از مدل پواسن آماسیده در صفر استفاده می‌شود، ولی زمانی که این داده‌ها بیش‌پراکنده باشند، مدل دوجمله‌ای منفی آماسیده در صفر برای مدل‌بندی رابطه‌ی بین متغیر پاسخ و متغیرهای پیشگو و برآورد پارامترهای مدل مناسب است. زمانی که در یک مدل رگرسیونی بین متغیرهای پیشگو هم‌خطی چندگانه وجود داشته باشد از روش برآورد ریج و برآورد نوع-لیو برای برآورد پارامترهای مدل استفاده می‌شود، به‌طوری‌که کارایی آنها بیشتر از روش ماکسیمم درستنمایی است. از طرف دیگر به منظور بهبود عملکرد برآورد پارامترهای مدل، استفاده از اطلاعات پیشین در مورد تعدادی از پارامترها که تاثیر معنی‌داری روی متغیر پاسخ ندارند و ترکیب آن‌ها با اطلاعات حاصل از نمونه‌ی تصادفی می‌تواند مفید باشد. اطلاعات پیشین که به‌صورت قید‌هایی روی پارامترهای مدل ظاهر می‌شوند، قبل از به کارگیری در مدل آزمون می‌شوند. در صورتی که درست باشند موجب بهبود عملکرد برآورد پارامترهای مدل می‌شوند. برآوردگرهای حاصل از این روش را برآوردگرهای انقباضی می‌گویند که شامل برآوردگرهای انقباضی خطی، پیش‌آزمون، آزمون ‌اولیه، نوع استاین و نوع-استاین مثبت هستند. در این رساله به منظور بهبود عملکرد پارامترهای مدل، برآوردگرهای انقباضی در مدل دوجمله‌ای منفی آماسیده در صفر، مدل آمیخته‌ی دوجمله‌ای منفی، مدل آمیخته‌ی دوجمله‌ای منفی آماسیده در صفر و برآوردگرهای انقباضی نوع-لیو در مدل دوجمله‌ای منفی آماسیده در صفر معرفی می‌شوند. به منظور مقایسه‌ی عملکرد برآوردگرهای مختلف، کارایی نسبی برآوردگرها از نظر میانگین مربعات خطا با استفاده از شبیه‌سازی مونت کارلو مورد بررسی قرار می‌گیرد. همچنین اریبی و ریسک مجانبی برآوردگرهای مختلف به‌صورت نظری بیان و اثبات می‌شوند. کارایی کلیه روش‌های معرفی شده در مجموعه داده‌های واقعی محاسبه می‌شود.
Bayesian beta regression models
1400
Often in many applications, we are interested in examining the impact and relationship of different factors on a variable that is expressed as a ratio and percentage, such as disease rate, percentage of a disease in a particular area, unemployment ratio and inflation rate. To aim it, a appropiate regression model is chosen according to the type of response variable. When the response variable is in form of percentage or ratio, or even defined in the range like (a, b), the beta regression model is proposed. Beta regression model belongs to the family of generalized linear models. In this thesis, first the beta regression model by considering different models on the precision parameter are introduced and parameters of the model have been estimated in classical framework. Then we consider bayseian estimation of parameters. We show performance of the bayesian estimation of the parameters by using a Monte Carlo simulations and applying the bayesian model of beta regression to real data set will be the final application of this research.
طراحی شبکه پایش کیفیت آب زیرزمینی با استفاده از روش آنتروپی
1400
شبکه‌های نظارت بر کیفیت آب‌های ‌زیرزمینی به دلیل محدودیت مالی و تغییر در نظارت و تعیین تعداد کافی ایستگاه‌های نظارتی و مکان آن‌ها برای طراحی شبکه بسیار مهم است. یکی از امیدوارکننده‌ترین رویکردها برای طراحی شبکه، استفاده از روش‌های آنتروپی است که مطالعات اولیه با بهره‌گیری از اصل حداکثرسازی آنتروپی و استفاده از اطلاعات تئوری است. انواع آنتروپی عبارتند از آنتروپی حاشیه‌ای، آنتروپی مشترک، آنتروپی مشروط، انتقال اطلاعات و همبستگی کل، که از موارد اساسی هستند و به‌طور معمول در برنامه‌های آنتروپی برای طراحی شبکه نظارت استفاده می‌کنیم. درمنطقه مورد مطالعه با استفاده از روش‌های شبکه عصبی مصنوعی(ANN) و K-همسایگی نزدیک (KNN) اطلاعات نقاط کور که در دسترس نمی‌باشد برآورد می‌شود و سپس با کمک الگوریتم بهینه‌سازی (DE) ارزیابی تفاضل اطلاعات خالص به دست آمده توسط ایستگاه‌های ماکسیمم می‌شود. تعداد و محل ایستگاه‌های پایش بهینه از میان چاه‌های فعال واقع در ناحیه مورد مطالعه انتخاب می‌شوند. توزیع مکانی چاه‌های انتخاب شده، پوشش کافی از کل محدوده موردنظر را فراهم می‌کندو در عین‌حال، حداکثر اطلاعات مفید را در مورد وضعیت کیفیت آب‌زیرزمینی به دست می‌دهد. هم‌چنین با در نظر گرفتن هزینه‌های عملیاتی و زمانی از انتخاب ایستگاه‌های زائد اجتناب می‌گردد. روش آنتروپی پیشنهادی با روش‌های مینیمم‌سازی خطا و خوشه‌بندی K-میانگین مقایسه می‌شود تا شبکه پایش کیفیت آب‌زیرزمینی بهینه‌سازی شود.
Beta Regression Model and Its Applications
1400
The linear regression model is a good method for predicting one variable (the response variable) in relation to other variables (auxiliary variables or independent variables). The model’s fundamental assumption is that the response variable contains real numbers. However, in practice, we frequently encounter cases where the response variable is restricted to specific ranges, such as data in the form of percentages and percentages restricted to (0, 1). Ratio and percentage data, on the other hand, are frequently skewed, and inference based on the assumption that the data is symmetric can be misleading. The beta regression model, defined in the (0, 1) range, is a suitable regression model for this type of data. The response variable is assumed to follow the beta distribution in this regression model. In this thesis, we present the beta regression model and the method for estimating model parameters when the independent variables are orthogonal and non-orthogonal. In first case, we will use the maximum likelihood estimators and for second one, we will use the common method of combating the multicollinearity in regression model such as Ridge and Liu estimator. In the following, by using Monte Carlo simulation, the mean squared error criterion and efficiency of the estimators are calculated. Finally, the applications of these estimators on the real life data set is examined.
انتخاب مدل آماری برای تولید ناخالص داخلی
1400
تولید ناخالص داخلی یکی از عمده‌ترین و کاربردی ترین شاخص‌های اقتصادی است؛ از این رو پیش‌بینی آن، همواره مورد توجه فعالان و پژوهشگران اقتصادی و علوم مرتبط از جمله علوم آماری بوده است. در این پژوهش هدف اصلی یافتن مناسب‌ترین مدل آماری و الگوی مطلوب برای پیش‌بینی تولید ناخالص داخلی است. مدل‌های سری زمانی به عنوان یکی از بهترین روش‌ها برای پیش‌ینی تولید ناخالص داخلی مورد انتخاب قرار گرفته‌اند که از این میان تاکید این پژوهش بر مدل‌های سری زمانی فصلی (روش تجزیه کلاسیک، روش هولت وینترز) و تکنیک‌های مربوط به مدل‌های ‎ARIMA و سری‌های فصلی ‎SARMA‎ و ‎SARIMA‎ می‌باشد. در مرحله بعد شاخص‌های ارزیابی نیکویی برازش در مدل‌های سری زمانی بررسی شده و تفاوت مدل‌های خطی و غیرخطی، کارآیی و میزان خطای هرکدام مورد تجزیه و تحلیل قرار گرفته می‌شود تا در نهایت با مقایسه نتایج به‌دست آمده بهترین مدل پیشنهاد شود
بررسی تاثیر انرژی تجدیدپذیر و تجدیدناپذیر بر رشد اقتصادی کشورهای مختلف
1400
این پایاننامه با هدف بررسی تاثیر مصرف انرژی بر رشد اقتصادی کشورهای مختلف در طی دوره زمانی 1999 الی 2018 برای 65 کشور مختلف جهان با استفاده از تحلیل رگرسیونی پانل دیتا صورت گرفته است. در این راستا بررسی این اثر با تفکیک میان انرژی تجدیدپذیر و تجدیدناپذیر صورت گرفته است. در این راستا، نتایج تجزیه و تحلیل مربوط به کشور ایران نشان داده است که، مصرف انرژی تجدید ناپذیر بر رشد اقتصادی ایران تاثیر منفی و معنادار دارد. در این راستا این موضوع نشان میدهد که با افزایش مصرف این نوع انرژی، رشد اقتصادی کشور کاهش مییابد. این موضوع را میتوان نشات گرفته از هزینههای استحصال این نوع انرژی نسبت به سوختهای فسیلی دانست که در این راستا، هزینههای گزافی را در پی داشته و موجب کاهش کارایی مصرف این نوع انرژی و در نهایت کاهش رشد اقتصادی خواهد شد. همچنین نتایج تجزیه و تحلیل و مقایسه تاثیر انرژی تجدیدپذیر و انرژی تجدید ناپذیر بر رشد اقتصادی کشورهای آسیایی و اروپایی و 65 کشور جهان نشان داده است که برای کشورهای آسیایی، انرژیهای تجدیدناپذیر و تجدیدپذیر تاثیر مثبت و معناداری بر رشد اقتصادی این کشورها دارد. این در حالی است که مصرف انرژی تجدیدپذیر نسبت به انرژیهای تجدیدناپذیر بیشتر سبب افزایش رشد اقتصادی میشود. اما برای کشورهای اروپایی، انرژی تجدیدناپذیر تاثیر منفی و معناداری بر رشد اقتصادی دارند. در حالی که برای این گروه از کشورها انرژی تجدیدپذیر تاثیر مثبت و معناداری بر رشد اقتصادی این گروه از کشورها دارند. همچنین برای 65 کشور منتخب جهان، نتایج حاکی از آن است که میزان مصرف انرژیهای تجدیدپذیر و تجدیدناپذیر تاثیر مثبت و معناداری بر رشد اقتصادی کشورهای منتخب دارد. این در حالی است که تاثیر انرژیهای تجدیدپذیر بر رشد اقتصادی، از نظر مقداری بیشتر از انرژی تجدیدناپذیر است.
تحلیل آماری اطلاعات مادر و کودک در مرکز بهداشت میاندوآب
1399
مطالعه حاضر با هدف تحلیل آماری اطلاعات مادر و کودک در مرکز بهداشت میاندوآب انجام گرفت. مطالعه حاضر از نظر هدف کاربردی، از نظر شیوه جمع‌آوری داده‌ها توصیفی ازنوع همبستگی بود. جامعه آماری تحقیق شامل 400 نفر خانم باردار بود که در زمان بارداری فرم مراقبت از آنها تکمیل و بعد از بارداری نیز وضعیت آنان به همراه کودکانشان بررسی و اطلاعات مربوطه ثبت شده است. ابزار جمع‌آوری داده‌ها، پرسشنامه‌های محقق ساخته بود. برای تحلیل داده‌ها از نرم افزار Spss22 استفاده شد. از آزمون کای دو جهت بررسی داده ها استفاده گردید. نتایج نشان داد برخی از بیماری‌های مزمن مادران بر شاخص‌های تن‌سنجی(قد و وزن و دور سر) کودکان تاثیر دارند.
پیش‌بینی قیمت بورس با استفاده از روش یادگیری عمیق
1398
یش بینی قیمت سهام از اهمیت خاص برخوردار است که تاکنون تکنیک های مختلف آماری و غیر آماری برای آن به کار رفته است. به دلیل تاثیر عوامل داخلی و خارجی، سیاسی و اقتصادی و اجتماعی در قیمت سهام، پیش بینی آن به سادگی امکان پذیر نیست. ازروش هایی که می توان به پیش بینی قیمت سهام پرداخت، یادگیری عمیق است. این پایان نامه با استفاده از منبع [41] سعی در استفاده از مدل های یادگیری عمیق در پیش بینی قیمت سهام چهار بخش بیمه آسیا، بانک اقصاد نوین، تراکتورسازی ایران و شرکت پاﻻیش نفت تبریز دارد.
خانواده توزیع T-X و استنباط بیزی آن
1398
توزیع های آماری کاربردهای زیادی در زمینه های مختلف دارند و اکثرا برای توصیف پدیده های جهان واقعی به کار برده می شوند. به همین دلیل خواص و ویژگی های آن ها به طور گسترده بررسی شده و علاوه بر توزیع های شناخته شده مانند توزیع های گاما، نمایی، نرمال و غیره، توزیع های جدید دیگری تولید شده اند. در این پژوهش، با استفاده از خانواده ی مولد توزیع T_X ، سه توزیع مختلف به نام توزیع لوماکس-نمایی، وایبل-رایلی و گاما-رایلی را معرفی نموده و بسیاری خواص آماری آن ها را بررسی و کارایی بهتر هر یک از آن ها را در مقایسه با نتایج مطالعه شده ی قبلی بیان می کند. همچنین خانواده ی مولد توزیع T-X را به حالت دومتغیره تعمیم می دهد. چندین توزیع دومتغیره جدید حاصل شده از این روش را معرفی نموده و با ذکر مثال های کاربردی کارایی بهتر آن ها را روشن می کند.
مروری بر تحلیل داده‌های طولی با متغیرهای پاسخ گم‌شده
1397
در مطالعات طولی هر فرد در طول زمان تحت اندازه‌گیری‌های مکرر قرار می‌گیرد، در چنین مطالعاتی وجود داده‌های ناکامل یا اصطلاحاً داده‌های گم‌شده امری اجتناب‌ناپذیر است زیرا ممکن است تعدادی از افراد به دلایل مختلف در تمام زمان‌های اندازه‌گیری در دسترس نباشند. اگر داده‌های گم‌شده غیرقابل چشم‌پوشی باشند، در اینصورت تحلیل داده‌ها با روش‌های معمول منجر به تولید برآوردگرهای اریب و نتایج نامعتبر خواهد شد، در این مورد لازم است که مکانیزم داده‌های گم‌شده را نیز مدل‌بندی کرد. از روش ماکسیمم درستنمایی برای تحلیل داده‌های طولی ناکامل به طور گسترده‌ای استفاده می‌شود، که برآوردگرهای ML معمول، نسبت به مشاهدات حدی یا نقاط پرت در داده‌ها حساس‌اند، و در عمل در داده‌های واقعی معمولا با مقادیر گم‌شده و نقاط پرت روبرو هستیم. از این‌رو در این پایان‌نامه روش نیرومند را که در چارچوب روش ML توسعه‌ یافته، برای تحلیل داده‌های طولی ناکامل با مشاهدات حدی بررسی خواهیم کرد. در پایان ضمن شبیه‌سازی نتایج، یک مثال کاربردی نیز در زمینه‌ی بیماران مبتلا به ایدز مدل‌بندی خواهد شد.
پیش بینی آماره های ترتیبی
1396
در این پایان نامه برآوردها و پیش بینی مشاهدات تحت سانسور نوعII و سانسور هیبریدی و سانسور فزاینده هیبریدی نوع I در توزیع های پواسون نمائی، لاگ نرمال و بور نوع III مورد بررسی قرار می گیرد. در ابتدا برآوردگرهای ماکزیمم درستنمائی پارامترهای مجهول با استفاده از روش EM و SEM و برآوردهای فاصله ای با استفاده از ماتریس اطلاع فیشر به دست می آید سپس برآوردهای بیزی تحت توابع زیان مربع خطا، انتروپی و لاینکس با استفاده از چگالی های پیشین آگاهی بخش و ناآگاهی بخش مطرح می شود. برای دستیابی به برآوردهای بیزی پارامترها از تقریب ترنی_کیدن، تقریب لیندلی و روش نمونه گیری نقاط مهم استفاده می شود. همچنین به بیان پیش بینی مشاهدات سانسور شده و فواصل پیش بینی با روش های مختلف می پردازیم. در پایان برای ارزیابی یافته های تئوری از داده های واقعی و روش های شبیه سازی استفاده می کنیم
مدل نویز شده دو جمله ای برای تعیین اعتبار خوشه ها
1396
امروزه شاهد تولید حجم عظیمی از داده‌ها در دنیای مدرن هستیم و یکی از علوم بسیار استراتژیک حائز اهمیت در دنیای داده‌ها علم داده کاوی است. از تکنیک های پر کاربرد داده کاوی می‌توان به خوشه بندی اشاره کرد. خوشه بندی یک تابع کاوشی نظارت نشده ی داده کاوی به منظور کشف گروه بندی طبیعی درون داده‌هاست معمولا الگوریتم‌های مختلف خوشه بندی نیازمند پارامتری به نام تعداد خوشه‌ها هستند و تعیین تعداد بهینه آن‌ها برای ارزیابی الگوریتم‌ها به کار می‌رود . برای تعیین تعداد خوشه‌ها سه روش شامل آزمون فرض، معیار‌های داخلی و معیار‌های خارجی وجود دارد که هر کدام دارای شاخص‌های متعددی است و بدین منظور در کار پژوهشی حاضر، از مدل نویز شده دو جمله ای استفاده شده است . این پایان نامه در چهار فصل جداگانه جمع آوری شده است که در فصل اول مفاهیم وتعاریف اولیه، در فصل دوم خوشه بندی و انواع الگوریتم‌های آن در نرم افزار R و در فصل سوم به تحلیل مدل نویز شده دو جمله ای و یک مثال عددی با استفاده از این مدل می‌پردازیم.
پیش بینی شاخص سهام با استفاده از زنجیره های مارکف
1395
سهم عظیمی از مشغله فکری سرمایه گزاران و دلالان و به طور کلی کسانی که با شاخص سهام درگیر هستند، شناخت درستی از روند افزایشی یا کاهشی شاخص سهام نداند. بدین منظور روش هایی برای حصول این شناخت ارائه شده است که مهترین آن، روشهائی است بر پایه استفاده از اطلاعات شاخص سهام از گذشته تا به حال به منظور شناخت درستی از روند آینده شاخص سهام استوار است. هدف از این پایان نامه تجزیه و تحلیل رفتار شاخص سهام شامل فرابورس، بورس و صنعت با استفاده از زنجیره های مارکف و الگوریتم EM است.
داده کاوی برای کلاهبرداری از کارت اعتباری
1395
سالانه میلیاردها دلار به علت کلاهبرداری از کارت‌های اعتباری از دست می‌رود. با توجه به اینکه استفاده از کارت‌های اعتباری و معاملات آنلاین و به تبع آن حجم انبوه داده‌ها و میزان تقلب در این بخش روز به روز در حال افزایش است، بررسی تک تک این داده‌ها مستلزم صرف وقت و هزینه سنگینی است. لذا پیاده سازی یک سیستم اعلام موارد مشکوک، کشف تقلب به کمک تکنیک‌های داده‌کاوی ضروری به نظر می‌رسد. هدف از این پایان نامه کشف تقلب کارت‌های اعتباری بانک انتخابی با استفاده از تکنیک‌های داده‌کاوی است.
برآوردیابی براساس الگوریتم EM تصادفی
1395
طرح سانسور فزایندهای نوع دو اولین بار توسط کمپس [3] در سال 199 معرفی گردیده است، به طوریکه این طرح سانسور در آزمونهای طول عمر و قابلیت اعتماد بسیار مورد استفاده قرار می گیرد. همچنین توزیع دو پارامتری بور نوع سه نیز در زمینه های کنترل کیفیت، مطالعات قابلیت اعتماد و مدلبندی داده های شکست و بقا بکار گرفته شده است. لذا با توجه به اهمیت این توزیع و همچنین این طرح سانسور و اینکه معادلات درستنمایی بر اساس نمونه های سانسور شده ی فزاینده نوع دو برای توزیع بور نوع سه جواب صریحی برای پارامترها ارائه نمی دهند. در این پایان نامه، روش سادهایبرای بدست آوردن برآوردگرهای ماکسیمم درستنمایی برای این دو پارامتر را با استفاده از الگوریتم امید ریاضی گرفتن-ماکزیمم کردن و امیدریاضی گرفتن-ماکزیمم کردن تصادفی ارائه میشود. با درنظر گرفتن ماتریس اطلاع فیشر برآوردهای بازه ای هم محاسبه میشود در ادامه برآوردهای بیزی را با بکار بردن روش تقریب لیندلی و تکنیک نمونه گیری از نقاط مهم محاسبه نموده و این برآوردها تحت سه تابع زیان مربع خطا، آنتروپی و لاینکس بدست آورده خواهند شد. سپس مسئله ی پیش بینی را در نظر گرفته و برآوردهای پیش بینی و بازه های پیشبینی پارامترها را برای مشاهدات سانسور شده با روش های مختلف بدست می آید. در پایان یک مجموعه ی داده ی واقعی را تجزیه تحلیل کرده و لازم به ذکر است که مطالعات شبیه سازی مربوطه برای مقایسه ی برآوردگرهای مختلف پیشنهادی در نرم افزار R انجام داده شده است و میزان کارآمدی روشه ای ارائه شده نیز باهم مقایسه شده اند
داده‌کاوی اطلاعات دانشگاه فنی و حرفه‌ای
1395
پیشرفت‌های بوجود آمده در جمع‌آوری داده‌ها و قابلیت‌های ذخیره‌سازی در طی دهه‌های اخیر باعث شده در بسیاری از علوم با حجم بزرگی از اطلاعات روبرو شویم. محققان در زمینه‌های مختلف مانند مهندسی، اقتصاد، ستاره ‌شناسی و زیست شناسی هر روز با مشاهدات بیشتر و بیشتری روبرو می‌شوند. داده‌های انبوه در مراکز آموزشی و پژوهشی و دانشگاه‌ها نیز به چشم می‌خورد. یکی از این مراکز، دانشگاه فنی و حرفه‌ای است که با بیش از 170 مرکز آموزشی در سطح کشور گسترده است. لذا بررسی اطلاعات مراکز و دانشکده‌های دانشگاه فنی و حرفه‌ای از جمله اهداف این پایان‌نامه است. در این پایان‌نامه علاوه بر توصیف اطلاعات دانشگاه فنی و حرفه‌ای در بخش‌های تعداد دانشجویان، تعداد کارمندان و هزینه‌های مصرفی، به استفاده از تکنیک‌های خوشه‌بندی و طبقه‌بندی با الگوریتم‌های مختلف پرداخته شده است.
داده کاوی به کمک تحلیل خوشه ای
1394
امروزه ظهور تکنولوژی‌های مدرن، انجام آزمایشات علمی و تحقیقات کاربردی در زمینه‌های مختلف، حتی کارهای ساده‌ای مانند تلفن زدن، استفاده از کارت‌های اعتباری و یا خریدهای روزانه منجر به تولید حجم انبوهی از داده‌ها شده است که حجم این داده‌ها می‌تواند به چندین پتابایت هم برسد. این داده‌ها‌ی حجیم می‌توانند گویای الگوهای متنوعی باشند که منجر به استخراج نتایج مهمی در بسیاری از زمینه‌ها می‌شوند. به فرآیند کشف دانش مفید و قابل استفاده از انبوه داده‌های خام، داده‌کاوی گفته می‌شود. این مطالعه در سه فصل جداگانه جمع‌آوری شده است که در فصل اول به مفهوم داده‌کاوی و انواع روش‌های آن اشاره شده است، در فصل دو، خوشه‌بندی و انواع الگوریتم‌های آن بررسی می‌شود. فصل سوم شامل داده‌کاوی اطلاعات شرکت گاز است که این داده‌ها ابتدا آماده‌سازی شده، سپس روش‌ خوشه‌بندی مناسب روی آن‌ها اعمال و اطلاعات مفیدی از آن‌ها استخراج شده است که می‌تواند برای برنامه‌ریزی‌های آینده مفید واقع شود.
برآورد حداکثر نمائی تاوانیده
1394
برآورد حداکثر درستنمایی به دلیل خصوصیات خوبی همچون کارایی، سازگاری البته تحت شرایط نظم بسیار پرکاربرد است، ولی این روش در برآورد پارامتر توزیع‌هایی که تکیه‌گاه آنها به پارامتر بستگی دارد بسیار محافظه‌کارانه عمل می‌کند. روش درستنمایی ماکزیمم تاوانیده این مشکل را حل کرده و برآورد مناسبتری را برای پارامتر مکانی ارائه می‌کند به ‌طوری ‌که با انتخاب ضریب تاوان مناسب برآورد پارامتر نااریب بوده و دارای واریانس کمتری نسبت به برآورد حداکثر درستنمایی عادی خواهد بود. در این رساله سعی کرده‌ایم تا برآورد حداکثر درستنمایی تاوانیده و برخی از انواع داده‌های سانسور شده را معرفی کنیم. در فصل دوم این روش برآورد را برای توزیع نمایی دو‌پارامتری زمانی که داده‌ها کاملند به کار برده و اریبی و واریانس برآوردگرها را پیدا کردیم. در فصل سوم این روش برآورد را برای توزیع نمایی دو‌پارامتری برای دادههای سانسور شده به کار برده و اریبی و واریانس برآوردگرها را پیدا کردیم و در فصل چهارم برای انواع داده‌های سانسور شده برآورد حداکثر در ستنمایی تاوانیده را شبیه‌سازی کرده و در نهایت روش برآورد حداکثر درستنمایی تاوانیده را با توجه به نتایج شبیه‌سازی با روش حداکثر درستنمایی عادی مقایسه کردیم.
استنباط آماری براساس رکوردهای توام
1394
در این پایان‌نامه، استنباط آماری بر اساس "رکوردهای توام" از دو دیدگاه پارامتری و ناپارامتری مورد مطالعه قرار می‌گیرد. بدین منظور ابتدا طرح رکوردهای توام از دو دنباله‌ی مستقل را تنها با فرض پیوسته بودن توزیع جامعه‌ی آماری آنها معرفی نموده و سپس به بررسی برآورد پارامتری از دو توزیع نمایی و مستقل بر اساس رکوردهای توام پایین و زمان رخداد آنها پرداخته و برآوردگرهای حداکثر درستنمایی شرطی، برآوردگرهای بیزی و توزیع دقیق آنها را به دست می‌آوریم. همچنین، به کمک برآوردگرهای بدست آمده و ویژگی‌های آنها، بازه‌ها‌ی اطمینان دقیق، مجانبی، بیزی و بازه‌ی اطمینان بوت‌استرپی به دو روش بوت‌استرپ صدکی و روش بوت‌استرپ تی را برای پارامترهای دو توزیع ارائه کرده و با مطالعه‌ی شبیه‌سازی برای حجم نمونه‌ی کوچک به ارزیابی عملکرد برآوردگرها و مقایسه‌ی بازه‌های اطمینان مختلف می‌پردازیم. بخش ناپارامتری، به بررسی بازه‌های اطمینان آزاد توزیع توسعه‌یافته برای چندک‌ها، بازه‌های اطمینان درونی و بیرونی برای بازه‌های چندکی و تفاضل چندک‌ها از دو جامعه‌ی هم‌توزیع اختصاص دارد.
توزیع نرمال گسسته
1393
توزیع نرمال نقش کلیدی در استنباط آماری، مدلسازی تصادفی، شبیه‌سازی و مساحت بازی می‌کند. توزیع‌های گسسته برای مدل بندی سناریوهای زندگی واقعی خیلی مهم هستند. تکنیک‌های مختلفی برای تولید خانواده‌هایی از توزیع‌های گسسته از توزیع‌های پیوسته و بویژه توزیع نرمال توسعه یافته‌اند،که به برخی از این تکنیک‌ها در فصل ‎2‎ اشاره شده‌ است. همچنین در فصل ‎3‎ کاربرد توزیع نرمال گسسته، ارزیابی قابلیت اطمینان از سیستم‌ها از جمله روش‌های شبیه‌سازی بیان شده است.
برآورد ناپارامتری میانگین تابع دسترسپذیری
1393
تابع دسترس ‎پذیری به عنوان یکی از ویژگی ‎های قابلیت اعتماد سیستم ‎های مختلف مورد توجه دانشمندان بوده و از اهمیت بسیاری برخوردار است. در این پایان ‎نامه برآورد نقطه ‎ای و فاصله ‎ای تابع دسترس ‎پذیری نقطه ‎ای و حدی در سیستم ‎های اصلاح ‎پذیر مد ‎نظر است
روشی برای تولید خانواده‎های توزیع‎های پیوسته
1393
توزیع های آماری کاربردهای زیادی در علوم مختلف مانند اقتصاد، مهندسی، علوم اجتماعی، بهداشت و علوم زیستی دارند، و همچنین برای توصیف پدیده های جهان واقعی به کار می روند.‎‎ علاقه به تعمیم توزیع های آماری به قوت خود باقی است. کلاس های تعمیم یافته ی زیادی از توزیع ها برای توصیف پدیده های مختلف بررسی شده و توسعه یافته اند. یک ویژگی رایج از این توزیع های تعمیم یافته این است که پارامتر زیادی دارند. در فصل ‎1‎ تعدادی از توزیع‌های مورد استفاده در سایر فصول معرفی شده است. در فصل ‎2‎ روشی برای تولید خانواده های توزیع های پیوسته به نام خانواده ی ‎X-T‎ از توزیع ها ارائه شده است. در فصل ‎3‎ خانواده ی بتا-وایبل- ‎X‎ که حاصل از خانواده ی ‎Y-X-T‎ است، معرفی می شود.‎ همچنین به عضوی از خانواده ی وایبل- ‎X‎ به نام وایبل–ریلی در فصل ‎4‎ پرداخته خواهد شد.
پیش بینی قیمت سهام با استفاده از شبکه های بیزی
1392
پیش‌بینی‎ قیمت سهام در فعالیت‌های بازرگانی و اقتصاد ملی نقش بسزایی دارند. روش‌های کلاسیک پیش‌بینی‎ سری زمانی مانند مدل‌های اتو رگرسیو، میانگین متحرک، اتو رگرسیو-میانگین متحرک و سایر مدل‌های مشابه ، بر دو فرض ایستایی و خطی بودن بنیان نهاده شده‌اند. در مورد عملکرد این مدل‌ها ، به‌خصوص در مورد سری‌های زمانی قیمت و بازده سهام تردیدهایی ایجاد شده است . بررسی‌ها نشان می‌دهد که قیمت سهام از نگاشت‌های پیچیده غیرخطی و آشوبگرانه به وجود آمده‌اند و اساساً استفاده از انواع مختلف روشهای خطی صحیح نمی‌باشد. یکی از روش‌های جایگزین استفاده از روش غیرخطی شبکه‌های بیزی است که در برخی از موارد توانایی بالقوه مناسبی در پیش‌بینی سری‌های زمانی از خود نشان می‌دهد. هدف اصلی پایان‎‌نامه، معرفی شبکه بیزی و بکارگیری این شبکه در پیش‌بینی سری‌های زمانی و مقایسه آن با الگوریتم‌های کلاسیک آن است.‎ یی‌زو و کیتا (2012‌‎‎‎‎) الگوریتمی بر مبنای شبکه بیزی به منظور پیش‌بینی داده‌های‎ سری زمانی ارائه کرده‌اند. با دو مثال عددی به مقایسه این الگوریتم با الگوریتم‌های کلاسیک خواهیم پرداخت.
تابع احتمال با استفاده از توزیع‎ های پیوسته
1392
توزیع‎ های آماری به طور معمول برای توصیف پدیده‎ های جهان واقعی بکار برده شده‎ اند.‎ به علت فواید توزیع‎ های آماری، آن‎ ها به طور گسترده بررسی شده و توزیع‎ های جدیدی نیز به دست آمده‎ اند.‎ مقالات تحقیقاتی زیادی در مطالعه و کاربردهای توزیع‎ های گسسته منتشر شده‎ اند.‎ تکنیک‎ های مختلفی برای تولید خانواده‎ هایی از توزیع‎ های گسسته ارائه شده‎ اند؛ که برخی از این تکنیک‎ ها در فصل دو بیان شده‎ اند.‎ در این فصل توزیع‎ های بور گسسته و لاپلاس گسسته ارائه و خواص آن‎ ها بررسی شده است‎.\\‎ همچنین در فصل سه روشی برای تولید خانواده‎ هایی با استفاده از توزیع‎ های پیوسته و گسسته که به خانواده‎ ی ‎X-T‎ معروف می‎ باشد،‎ ارائه شده است. این خانواده از توزیع‎ ها در حالت‎ های مختلف بررسی می شود. ‎ فصل چهارم به برآورد بیزی پارامترهای توزیع بور گسسته‎ ی بیان شده در فصل دو اختصاص دارد
استنباط بیزی برای تحلیل داده های رسته ای
1392
در این پایاننامه سعی داریم مروری بر روشهای بیزی در تجزیه و تحلیل داده های رسته ای داشته باشیم. در ابتدا از روش بیزی برای برآورد پارامترهای توزیع دوجمله ای و توزیع چندجمله ای استفاده می کنیم. همچنین به بررسی جداول توافقی و پارامترگذاری مدل لگ خطی می پردازیم. در ادامه پارامترهای مدل لگ خطی برای حالت دوطرفه را با استفاده از روش بیزی برآورد می کنیم و حالات مختلف آن را مورد بحث قرار می دهیم. در پایان برآوردی که برای پارامترهای مدل لگ خطی دوطرفه انجام دادیم را به حالت سه طرفه تعمیم داده و حالات مختلفی که بوجود می آید را بررسی می کنیم.
توزیع وایبل نمائی شده
1392
در مدل فشار- نیرو، نیرو (X) و فشار (Y)، به عنوان متغیرهای تصادفی در نظر گرفته می‌شوند و قابلیت اعتماد یک مولفه در یک دوره، به صورت احتمال بیشتر بودن نیرو از فشار در طول دوره یعنی P(Y<X) تعریف می شود. هدف اصلی پایان نامه برآورد R= P(Y<X) ، زمانی که X و Y دو متغیر تصادفی از توزیع وایبل نمایی شده هستند، می باشد. خانواده وایبل نمایی شده که توسط مودهولکار و اسریواستارا در سال 1993 معرفی شده است، دو پارامتر شکل و یک پارامتر مقیاسی دارد و خانواده های وایبل و نمایی نمایی شده موارد خاصی از این خانواده هستند. با توجه به اهمییت توزیع وایبل نمایی شده در این پایان نامه به معرفی این توزیع و بیان ویژگی های آن می پردازیم و به دنبال آن به مدل فشار-نیرو نیز اشاره ای خواهیم داشت. سپس مسئله برآورد R را برای این توزیع مطرح می کنیم که برای اولین بار ارائه شده است.
داده کاوی با رگرسیون لجستیک
1391
امروزه داده کاوی به عنوان یک ابزار و روش علمی جدید برای بررسی و تحلیل داده‌ها در پایگاه‌های بزرگ داده مطرح شده است. با استفاده از تکنیک‌های این روش می‌توان حجم وسیعی از داده‌های خام را به اطلاعات مفید و قابل استفاده تبدیل کرد. داده کاوی تکنیک‌ها و الگوریتم‌های متنوع و متفاوتی برای تحلیل داد‌ه دارد. از این بین می‌توان به معروفترین آن‌ها از جمله شبکه‌های عصبی، درخت تصمیم، رگرسیون لجستیک، قوانین انجمنی و آنالیز خوشه‌ای اشاره کرد. یکی از پرکاربردترین این روش‌ها، رگرسیون لجستیک است. در شرایطی که متغیر پاسخ مورد نظر یک متغیر دو حالتی باشد، از این روش برای طبقه بندی یا پیش بینی متغیر پاسخ استفاده می‌شود. مزیت این روش نسبت به سایر روش‌ها، قدرتمند و دقیق بودن آن و عدم نیاز به پیش شرطهای معمول است. در این پایان‌نامه مدل رگرسیون لجستیک و نحوه استفاده از آن بررسی می‌شود. سپس رگرسیون لجستیک برای پیش بینی دو متغیر مهم اقتصادی با استفاده از داده‌های واقعی به کار گرفته می‌شود و در مورد ساخت یک مدل مناسب یا انتخاب بهترین مدل در بین مدل‌های موجود بحث می‌شود.
داده کاوی با استفاده از درخت تصمیم
1391
داده کاوی به عنوان رشته جدید در جهان رو به افزایش پایگاه‌های داده بزرگ ظهور پیدا کرده است و به صورت فرایند کشف دانش منجر به همه روش‌های ممکن برای رسیدن از داده خام به دانش مدیریت شده می‌شود. ‌داده کاوی روش‌ها و الگوریتم‌های فراوانی دارد‌، از جمله درخت تصمیم‌، قوانین انجمنی‌، آنالیز خوشه‌ای که حل مسائل دنیای واقعی را ممکن می‌سازند.‌‌یکی‌‌ از الگوریتم‌های داده‌کاوی که اغلب مورد استفاده قرار می‌گیرد درخت تصمیم است. ‌این‌ روش توان دسته‌بندی و پیش‌بینی انواع متغیرها را داراست. مزیت غالب آن بر سایر تکنیک‌های مدل‌بندی‌، داشتن توانایی تولید مدل‌های پیش‌بین دقیق با نمایش درختی قابل تفسیر است که کاربر را قادر می‌سازد اطلاعات مفید را در کمترین زمان بدست آورد. الگوریتم هایی از جمله CHAID ،C5 ،C4:5 ،ID3 و CART به رشد درخت تصمیم در فرایند ساخت آن کمک می کنند. در این پایاننامه در مورد مفاهیم و الگوریتم‌های داده‌کاوی علی‌الخصوص درخت تصمیم ID3 و‌ CHAID بحث می شود. سپس درخت تصمیم CHAID با استفاده از داده‌های واقعی بانک بکار گرفته می‌شود.
استنباط آنلاین برای مسائل نقطه تغییر
1391
مدل‌های نقطه تغییر‌ چندگانه معمولاً بر ناهمگنی و غیر یکنواختی موقتی یا فاصله‌ی روی داده‌ها اشاره می‌کنند. این مدل‌‌ در دامنه‌ی وسیعی از مدل‌بندی آماری مشاهده می‌شود‌، همچنین برای افزایش انعطاف‌پذیری در مدل آماری استفاده می‌شود. هدف این پایان‌‌‌نامه انجام استنباط بیزی مدل‌های نقطه تغییر با استفاده از ایده‌ی پالایه‌های ذره است. یک الگوریتم آنلاین دقیق را برای یک کلاس از مسائل نقطه تغییر چندگانه ارائه می‌کنیم. در این کلاس از مدل‌ها خصوصیت استقلال شرطی صدق می‌کند. این الگوریتم بوسیله‌ی توزیع توام پسین واقعی‌، تعداد و موقعیت نقطه تغییرها را برای یک کلاس از مدل‌های نقطه تغییرها شبیه‌سازی می‌کند. ارزش محاسباتی این الگوریتم دقیق روی تعداد مشاهدات به صورت درجه دوم افزایش می‌یابد. بعلاوه نشان می‌دهیم که چگونه می‌توان ایده‌های نمونه‌گیری مجدد در پالایه ذره را برای کاهش ارزش محاسباتی به صورت خطی روی تعداد مشاهدات استفاده کرد و دو الگوریتم نمونه‌گیری مجدد بهینه‌ی را برای این مسائل پیشنهاد خواهیم کرد.
رتبه بندی عملکرد بانکهای تجاری منتخب با استفاده از روش تاپسیس و آنالیز فرایند سلسله مراتبی فازی
1391
هدف اصلی بانک های امروزی کسب مزیت رقابتی پایدار می باشد. ارزیابی مداوم عملکرد لازمه کسب مزیت رقابتی پایدار می باشد. در این تحقیق تلاش می گردد تا عملکرد پنج بانک تجاری بزرگ (ملی، ملت، تجارت، رفاه، و سپه) با استفاده از دو مدل فرایند تحلیل سلسله مراتبی فازی (FAHP) و تاپسیس (TOPSIS) مورد ارزیابی قرار گیرد. این تحقیق در شهر تبریز و در سال 1389 انجام شده است. در این تحقیق عملکرد مالی و غیر مالی شعبات مرکزی بانکهای فوق الذکر با استفاده از دو مدل فرایند تحلیل سلسله مراتبی و تاپسیس مورد مطالعه و رتبه بندی قرار گرفت. نتایج تحقیق نشان داد که اثرات معیارهای ارزیابی مختلف یکسان نبودند. بدین معنی معیارهایی که دارای تاثیر کمتری بر هزینه تامین مالی و یا دارای تاثیر بیشتری بر افزایش درآمد بوده اند، بیشتر مورد توجه واقع شده اند. همچنین مشخص گردید که نتایج حاصل از بکارگیری هر دو مدل یکسان می باشد. درنهایت طبق نتایج حاصل از تحقیق رتبه بندی بانک ها در هر دو بخش عملکرد مالی و غیرمالی به ترتیب عبارت است از: ملت، ملی، سپه، تجارت، و رفاه.
بررسی ارتباط بین ریسک و سرمایه با سودآوری بانک ها
1391
هدف از این مطالعه بررسی تاثیر عوامل مشخصه بانک مشتمل بر نسبت کفایت سرمایه (CAR) و ریسک اعتباری (CRisk) بر سودآوری بانک های دولتی و خصوصی ایران است که توسط حاشیه سود خالص (NIM) اندازه گیری می شود. روابط بین نسبت کفایت سرمایه، ریسک اعتباری و حاشیه سود خالص با استفاده از داده های پانل با مدل اثرات ثابت (FEM) و به کمک یک نمونه 49تایی از صورت های مالی سالیانه سه بانک دولتی و چهار بانک خصوصی طی دوره هفت ساله 1389-1383 بررسی می شود. نتیجه گیری مطالعه ما این است که سودآوری بانک های دولتی به طور منفی و معنی داری از نسبت کفایت سرمایه و به طور مثبت و معنی داری از ریسک اعتباری (که توسط نسبت ذخایر مطالبات به کل تسهیلات تعیین می شود) تاثیر می پذیرد. همچنین، نتایج برآوردها نشان می دهد که سودآوری بانک های خصوصی به طور مثبت و معنی داری از هر دوی نسبت کفایت سرمایه و ریسک اعتباری تاثیر می پذیرد. این نتایج بدین معنی هستند که در دو سیستم بانکی نسبت کفایت سرمایه اثرات متفاوتی بر سودآوری دارد، در حالی که ریسک اعتباری به طور مثبت و معنی داری بر سودآوری هر دو سیستم بانکی اثرگذار است. این یافته ها نشان می دهد که هیچ ارتباط نظام مندی بین نسبت کفایت سرمایه و سودآوری وجود ندارد، ولی این فرضیه را که ارتباط مثبتی بین ریسک اعتباری و سودآوری است می توان تایید می کند.
سیستم پیرسن و تابع چگالی پیرسن نوع حاصلضربی ‎
1390
خانواده توزیع‌های پیرسن، خانواده‌ای شامل دوازده تابع چگالی احتمال پیوسته با چولگی و کشیدگی‌های مختلف است که بسیاری از توزیع‌های مهم و شناخته شده را هم شامل می‌شود. فصل اول این پایان‌نامه به معرفی خانواده توابع چگالی احتمال پیرسن یا سیستم پیرسن اختصاص دارد. در این فصل روش به دست آوردن این توابع چگالی احتمال، برآورد پارامترها و معیار تفکیک آن‌ها را بیان می‌کنیم. از اعضای این خانواده می‌توان برای برازش یک تابع چگالی احتمال پیوسته به داده‌هایی که توزیع نامشخصی دارند استفاده کرد که روش برازش توابع چگالی احتمال پیرسن به داده‌ها و چگونگی برآورد پارامترهای این توزیع‌ها را ذکر کرده و آن را با یک مثال عددی شرح می‌دهیم. در فصل دوم، یک تابع چگالی احتمال جدید معرفی می‌شود که از حاصلضرب دو تابع چگالی احتمال پیرسن نوع ‎VII‎ ساخته شده است و آن را تابع چگالی پیرسن نوع ‎VII‎ حاصلضربی می‌نامیم. سپس به کاربردهایی از این توزیع اشاره کرده و به بررسی ویژگی‌های ساختاری این توزیع جدید مانند تابع توزیع تجمعی، گشتاورها، برآورد ماکزیمم درستنمایی پارامترها، ماتریس اطلاع فیشر، میانگین انحراف از میانگین و میانه، آنتروپی و توزیع حدی آماره‌های مرتب فرین می‌پردازیم. در آخر، دو تابع چگالی حاصلضربی جدید را با استفاده از خانواده پیرسن معرفی کرده و گشتاور مرتبه ‎ k ‎ ام آن‌ها را محاسبه می‌کنیم. در فصل سوم، کاربردهایی از تعدادی از توابع چگالی احتمال پیرسن مطرح می‌شود. ابتدا کاربردی از تابع چگالی پیرسن نوع ‎VII‎ حاصلضربی بیان می‌شود و از این تابع چگالی به عنوان توزیع پسین یک متغیر تصادفی و برای انجام یک آزمون بیزی در مورد میانگین توزیع نرمال استفاده می‌شود. در بخش بعد با استفاده از تابع چگالی پیرسن نوع ،‎I‎ یک تقریب پیوسته برای تابع احتمال دوجمله‌ای با پارامترهای ‎ n=50‎ و ‎ p=0.3‎ به دست آورده و آن را با تقریب‌هایی که از روش‌های دیگر به دست می‌آیند مقایسه می‌کنیم. کاربرد بعدی مربوط به تابع چگالی پیرسن نوع ‎III‎ است که از آن برای برآورد حداکثر حجم آب یک رودخانه در یک ایستگاه هیدرومتری به ازای دوره‌های بازگشت مختلف استفاده خواهیم کرد.
تابع چگالی با کمترین فاصله کای‌دو با داشتن تابع چگالی پیشین و گشتاورها
1390
برآورد تابع چگالی احتمال از مباحث کاربردی در آمار می‌باشد، که در تاکنون روش‌های متفاوتی برای آن ارائه گردیده است. یک دیدگاه که در زمینه برآورد تابع چگالی وجود دارد، برآورد تابع چگالی با داشتن اطلاعات روی گشتاورهای توزیع می‌باشد. از جمله روش‌هایی که برای این منظور وجود دارد می‌توان به اصل ماکزیمم آنتروپی، اصل کمترین تفاوت اطلاعات و اصل کمترین فاصله کای‌دو اشاره کرد. ‎ در این پایاننامه به بررسی اصل کمترین فاصله کای‌دو که توسط کومار و تانجا ‎\cite{taneja‎, ‎tan1}‎ معرفی شده است می‌پردازیم. نخست به معرفی فاصله کای‌دو و اصل کمترین فاصله کای‌دو می‌پردازیم و سپس روش برآورد تابع چگالی را با داشتن تابع چگالی اولیه و اطلاعاتی در مورد تابع چگالی مجهول را بیان می‌کنیم. در ادامه برای زمانی که تابع چگالی اولیه یا مشاهده شده توزیع گاما ‎\cite{kumarg}‎ و وایبل و همچنین اطلاعات گشتاوری توزیع، اطلاعاتی در مورد میانگین هندسی، حسابی و یا واریانس می‌باشد تابع چگالی با کمترین فاصله کای‌دو را ارائه می‌دهیم و با مثال‌های عددی نتایج بدست آمده را تشریح خواهیم نمود. ‎ در پایان به تعمیم روش کومار و تانجا برای برآورد تابع چگالی احتمال توام با کمترین فاصله کای‌دو خواهیم پرداخت. همانند حالت تک‌متغیره، ضمن تعریف فاصله کای‌دو و اصل کمترین فاصله کای‌دو در حالت دومتغیره، روش برآورد تابع چگالی احتمال توام را بیان و سپس با در نظر گرفتن توزیع دیریکله و حاصلضرب دو توزیع نمایی به عنوان توزیع اولیه و اطلاعات رو گشتاور حاصلضرب یعنی ‎$ E(XY) $‎ تابع چگالی را بدست می‌آوریم.
رتبه‌بندی با روش‌های تصمیم‌گیری چندمعیاره
1389
در این پایان‌نامه مبانی و مفاهیم اساسی روش های تصمیم گیری چند معیاره، برخی از روش‎های وزن‎دهی به شاخص ‎های موثر در رتبه‎ بندی، انواع روش‎ های بی‎ مقیاس کردن و نرمال‎سازی داده ها برای همگن کردن داده‎ های غیرهمگن و تبدیل آنها به یک مقیاس، انواع روش های اندازه گیری فواصل داده ‎ها از نقاط ایده‎ آل، برخی از روش‎ های رتبه ‎بندی تعریف و نتایج به ‎دست آمده از این روش‎ها با ذکر مثال‎های کاربردی نشان‌ داده شده است. همچنین با ارائه مثالی نتایج حاصل از ترکیب آرای کارشناسان و متخصصین در روش رتبه‎ بندی با تاپسیس بر اساس دو نوع ادغام خارجی و ادغام داخلی بررسی شده و نتایج انواع روش های بکار برده شده نشان داده شده است. در نهایت نتایج و رتبه های به‎دست آمده برای 30 استان کشور بر اساس شاخص قیمت استان ‎ها بر اساس انواع روش‎ های محاسبه فواصل نقاط از نقاط ایده‎ آل مانند روش اقلیدسی و روش منهاتان ارائه شده و همه این نتایج مورد مقایسه قرار گرفتند.
برآورد پارامتر n در توزیع دوجمله‌ای
1389
توزیع دوجمله‌ای از توزیع‌های بسیار پرکاربرد است. یکی ازمهمترین موضوعات در مورد این توزیع برآورد پارامتر n می‌باشدکه تاکنون براساس روش‌های گشتاوری و ماکزیمم درستنمایی بوده است. استفاده از برآوردگرهای دیگر نادیده گرفته شده، هر چند در عمل، برای تعیین اندازه نمونه بیشتر با نگرش بیزی سروکار داریم. چنین نگرشی به محقق این امکان را می‌دهد که از اطلاعات پیشین آزمایش، پارامترهای مجهول را برآورد کند. در این پایان نامه هدف یافتن برآورد قابل قبول پارامتر n براساس تابع زیان بیزی است. بدین منظور با معلوم فرض نمودن پارامتر p و نیز با اختصاص توزیع‌های پیشین برای n از بین توزیع‌های معروف گسسته و استفاده از توابع زیانی چون تابع زیان مربع خطا و تابع زیان مربع خطای مقیاسی، اقدام به برآورد n خواهیم نمود.
فاصله اطمینان ناپارامتری برای چندک ها و اختلاف چندک ها بر اساس آماره های رکوردی
1388
در این پایان نامه نشان داده می شود که چگونه روشهای استنباطی ناپارامتری می تواند براساس آماره های رکوردی توسعه پیدا کند. بحث ما شامل فاصله اطمینان برای چندکها واختلاف چندکها، فاصله اطمینان درونی و برونی برای فواصل چندکی و حد بالایی و پایینی برای اختلاف چندکها براساس آماره های رکوردی است.همچنین کرانهای بالایی برای فاصله اطمینان طول امید ریاضی به دست می آیند. لازم به ذکر است که این فواصل همگی آزاد توزیع می باشند. برای کمک به انتخاب مقادیر رکوردی مناسب برای فواصل اطمینان و برای نشان دادن مثالهای عددی جدولهایی را تهیه کرده ایم. این نتایج زمانی می توانند جالب باشند که فقط مقادیر رکوردی ثبت شده باشند. در پایان گروهی از داده های دمای ماهیانه مرکز تبریز (1330- 1386) به عنوان مثال کاربردی برای نشان دادن هدف استنباط رکوردی بحث وبررسی می شود.
تعیین حجم نمونه‌ی بیزی با استفاده از تابع زیان
1388
تعیین اندازه‌ی نمونه، یکی از مراحل اساسی در انجام طرح‌های آماری است. در اغلب این طرح‌ها از روش‌های کلاسیک مانند فرمول کوکران، قضیه‌ی چبیشف و فاصله اطمینان استفاده می‌شود و متاسفانه کمتر به روش‌های بیزی توجه می‌شود، هر چند در عمل ما بیشتر برای تعیین اندازه‌ی نمونه با نگرش بیزی سروکار داریم، که این نگرش به محقق این امکان را می‌دهد که از اطلاعات پیشین آزمایش، پارامترهای مجهول را برآورد کند. در این پایان‌نامه با دیدگاه بیزی و به کارگیری نظریه‌ی تصمیم برای تعیین اندازه‌ی نمونه‌ی بهینه اقدام می‌شود. برآورد بیزی اندازه‌ی نمونه را با سه روش محاسبه می‌کنیم. 1) با استفاده از برآورد نقطه‌ای پارامتر مورد نظر از توزیع پسین به وسیله‌ی تابع زیان. 2) با استفاده از ناحیه‌های p – تحمل با کمترین زیان پسین (LPL). 3) با استفاده از آزمون فرض و تابع زیان، یعنی اندازه‌ی نمونه را طوری تعیین می‌کنیم که نتایج تصمیم‌های اشتباه در مورد فرض‌های تحت آزمون را نشان دهد.