تاریخ بهروزرسانی: 1403/10/20
کورش دادخواه
دانشکده علوم پایه / گروه آمار
پایاننامههای کارشناسیارشد
-
Comparative Analysis of Ridge Regression and Ridge-Type M-Estimators: A Robust Approach for Handling Outliers
1403Outliers present a major challenge in statistical analysis, especially in regression modeling. While ridge regression is commonly used to manage multicollinearity, it becomes less effective when outliers are involved due to its reliance on least squares estimation. To overcome this issue, Silvapulle,1991 introduced a ridge-type M-estimator specifically designed for handling outliers. Building on this approach, Acitas and Senoglu ,2019 developed a ridge-type estimator based on modified maximum likelihood (MML) estimation, which offers greater robustness against outliers, particularly when the error distribution follows long-tailed symmetry (LTS). This M.Sc. thesis aims to compare the performance of three estimators: the traditional ridge estimator, Silvapulle’s ridge-type M-estimator, and Acitas and Senoglu’s ridge-type MML estimator. The goal is to evaluate these estimators using the mean square error (MSE) criterion through Monte Carlo simulations and real-world datasets. By comparing these methods, the study seeks to identify the best technique for managing outliers and improving the accuracy of regression models. The research includes both a theoretical review and an empirical analysis. The theoretical component involves a comprehensive review of ridge regression, M-estimators, and the ridge-type MML estimator, with a focus on their statistical properties and outlier robustness. The empirical analysis will use Monte Carlo simulations to test the estimators under various conditions of multicollinearity and outlier contamination, as well as apply them to real-world datasets to validate their practical effectiveness. This study is expected to provide insights into the comparative strengths and weaknesses of the traditional ridge estimator, Silvapulle's ridge-type M-estimator, and the ridge-type MML estimator from Acitas and Senoglu. These findings will contribute to the field of robust regression modeling and offer practical value to statisticians, researchers, and practitioners, helping them handle outliers more effectively and improve regression model accuracy.
-
ارتقا رگرسیون بر پایه هسته با به کارگیری یک تابع زیان استوار تعمیمیافته و تکنیک کمترین مربعات بازموزن تکراری: یک مطالعه تطبیقی
1403روشهای مبتنی بر حداقل مربعات هسته به دلیل اجرای ساده و عملکرد تعمیمدهی مناسب، بهطور گسترده در مسائل رگرسیون مورد استفاده قرار گرفتهاند. از میان این روشها، رگرسیون حداقل مربعات بردار پشتیبان و ماشین یادگیری سریع از محبوبترین تکنیکها بهشمار میروند. با این حال، حساسیت بالای این روشها به دادههای پرت یک چالش اساسی است. برای رفع این مشکل، در این پایاننامه یک تابع زیان تعمیمیافته به نام ell_s-زیان مورد بررسی قرار گرفته است. با تکیه بر این تابع زیان جدید، دو رگرسیون مبتنی بر هسته با جایگزینی ell_2-زیان در LS-SVR و ELM با ell_s-زیان، بهمنظور افزایش استحکام در برابر دادههای پرت توسعه یافتهاند. ویژگیهای کلیدی تابع ell_s-زیان، شامل استحکام، عدم تقارن، و رفتارهای تقریب مجانبی آن، از نظر تئوری اثبات شدهاند. علاوه بر این، بهینهسازی و تفسیر روشهای مذکور از طریق حداقل مربعات بازموزون تکراری، با توجه به موزونسازی دادهها، صورت گرفته است.
-
رگرسیون استوار نیمهپارامتری ستیغی برای دادههای سانسور شده
1403مدل های خطی نیمه پارامتری به دلیل داشتن ویژگی های جالبی که ترکیبی از مدل های کاملا́ پارامتری و کاملا́ ناپارامتری دارند، توجه بسیاری از پژوهشگران را به خود جلب کرده اند. این مدل ها با استفاده از ترکیب ویژگی های هر دو نوع مدل، امکان ارائه تحلیل های دقیق تر و انعطاف پذیرتری را در مطالعات رگرسیون فراهم می کنند. در برازش هر مدل از جمله مدل رگرسیون نیمه پارمتری ممکن است اطلاعات کامل متغیر ها در دسترس پژوهشگر نباشد و با مسئله سانسور روبرو شود . اگر متغیر پاسخ برای کسری از مشاهدات سانسور شده باشد برآورد پارامترهای بدست آمده توسط روشهای رگرسیون مرسوم، اریب خواهند بود. در این پایانامه روش براورد مناسب پارمترها در مدل رگرسیون نیمه پارامتری در مواجه با داده های سانسور شده پیشنهاد شده است. علاوه بر داده های سانسور شده، یکی دیگر از مشکلاتی که ممکن است مدل رگرسیون نیمه پارامتری با آن مواجه شود مسئله حضور هم خطی در متغیر های توضیحی است. هم خطی مشکل ساز است و اثرات آن روی جنبه های متفاوت مدل های رگرسیونی شناخته شده است از جمله باعث تورم واریانس و علامت های اشتباه برآوردهای رگرسیونی و یا عدم اعتبار متغیرهای مهم میشود. در اینجا برای مواجه با همخطی در مدل های خطی نیمه پارامتری سانسور شده استفاده از براوردگر های ستیغی پیشنهاد شده است. از آنجایی که پژوهشگران شواهد زیادی برای داده های دور افتاده و اثرات نامطلوب آن بر برآوردهای پارامترهای مدل رگرسیونی ارائه داده اند استفاده از براوردگرهای کمترین توان دوم پیراسته یک روش قدرتمند برای تحلیل رگرسیون در حضور داده های نامطلوب است. با کاهش تاثیر مشاهدات دورافتاده، این روش میتواند نتایج قابل اعتمادتر و پایدارتری را ارائه دهد. تعمیم این براوردگرها به جهت سادگی تعریف و نقطه فروریزش بالا و استوار در برابر دورافتاده ها یکی از رایج ترین روش های برآوردی پرکاربرد هست. در این پایانامه در حضور داده های دورافتاده براوردگرهای کمترین توان های دوم معمولی و ستیغی در مدل رگرسیون نیمه پارامتری سانسور شده تعمیم داده شده است. در ادامه با استفاده از نتایج شبیه سازی مونت کارلو برآوردگرهای مطرح شده را با برآوردگر های معمولی مقایسه می شوند و در پایان آنها را برای یک مجموعه داده واقعی استفاده می شوند.
-
رابطه بین علائم استرس پس از سانحه با رشد پس از سانحه در دانشآموزان متوسطه دوم با تجربه تروما: نقش میانجیگری تابآوری و خودکارآمدی تحصیلی
1403هدف از پژوهش حاضر بررسی رابطه بین علائم استرس پس از سانحه با رشد پس از سانحه در دانشآموزان متوسطه دوم با تجربه تروما و نقش میانجیگری تابآوری و خودکارآمدی تحصیلی بود. جامعه آماری پژوهش حاضر شامل تمامی دانشآموزان مشغول به تحصیل در دوره متوسطه دوم مدارس عادی شهر سنندج سال تحصیلی 1402-1401 بود. با استفاده از روش نمونهگیری هدفمند به تناسب کل جامعه 415 دانشآموز انتخاب گردید. برای جمع آوری دادهها از پرسشنامه استرس پس از سانحه (PCL-5)، پرسشنامه رشد پس از سانحه تدسکی و کالهون (1996)، پرسشنامه تابآوری کانر و دیویدسون (2003) و پرسشنامه خودکارآمدی تحصیلی مک ایلروی و بانتیگ (2002) استفاده شد. داده-ها با استفاده از روش معادلات ساختاری مورد تجزیه و تحلیل قرار گرفتند. نتایج بهدست آمده از پژوهش نشان داد که بین استرس پس از سانحه با رشد پس از سانحه، خودکارآمدی تحصیلی و تاب آوری رابطهی منفی و معنا داری وجود دارد. همچنین، هر یک متغیرهای تاب آوری و خودکارآمدی تحصیلی قادرند نقش میانجی را در رابطهی بین علائم استرس پس از سانحه و رشد پس از سانحه ایفا کنند. بر همین اساس میتوان نتیجه گرفت، هر یک از متغیرهای خودکارآمدی تحصیلی و تاب آوری قادرند بر کاهش علائم اختلال استرس پس از سانحه و متقابلاً افزایش رشد پس از سانحه در دانش آموزان با تجربه تروما اثرگذار باشند. لذا تاکید و توجه به این متغیرها در مشاوره با دانش آموزان دارای علائم اختلال استرس پس از سانحه در مدارس کمک کننده خواهد بود.
-
رگرسیون استوار مبتنی بر روش حداقل مربعات هستهی باز موزون شده
1402پرداختن به چالش برازش داده ها در حضور داده پرت، یک تلاش تحقیقاتی حیاتی در میان برنامه های مختلف داده کاوی در دنیای واقعی است. اخیراً، رگرسیون استوار توجه قابل تاملی را از سوی محققان به خود جلب کرده است، که ریشه های آن به کارهای اولیه دانشمندان در آمار و ریاضیات بازمی گردد. تکنیک های متنوعی برای مقابله با مشکل رگرسیون استوار در سناریوهای عملی متعدد پدید آمده است. قابل ذکر است، مجموعه ای امیدوارکننده از روش ها، از تکنیک های یادگیری هسته مشتق شده از نظریه شبکه منظم سازی استفاده می کند. چندین تکنیک معروف، از جمله حداقل مربعات منظم (RLS) و رگرسیون بردار پشتیبان (SVR)، تحت مبانی نظری مشابه توسعه داده شدهاند. در زمینه مشکلات رگرسیون در دنیای واقعی، وجود نویز یک چالش اجتناب ناپذیر است که نیاز به بررسی دقیق دارد. در حوزه روش های یادگیری هسته، دو رویکرد رایج برای رفع این چالش به کار گرفته می شود. یک رویکرد شامل تقویت بهینه سازی رگرسیون با یک عبارت منظم سازی برای جلوگیری از بیش برازش دادهها است. شناخت نقش محوری منظم سازی در دستیابی به عملکرد تعمیم پیشرفته در روش های هسته ضروری است. رویکرد دوم، اگرچه گاهی نادیده گرفته میشود، اما به همان اندازه در کاهش مشکل نویز بسیار مهم است. برای مثال، روشهای رگرسیون مبتنی بر هسته سنتی، اغلب از یک تابع زیان درجه دوم استفاده میکنند که میتواند به طور قابلتوجهی تحتتاثیر عوامل پرت قرار گیرد، در نتیجه به طور بالقوه بر راهحل حاصل، تاثیر میگذارد. هدف این پایان نامه کمک به درک و ارتقای تکنیکهای رگرسیون استوار است. فصل اول مقدمه ای بر روش های هسته ارائه می کند. متعاقباً، فصل دوم به روشهای منظمسازی ریج و لاسو میپردازد، در حالی که فصل سوم روشهای رگرسیون هسته استوار را تعریف میکند. در نهایت، فصل چهارم روشهای عددی منتخب را بر روی دادههای واقعی و شبیهسازی شده پیادهسازی میکند و کاربرد عملی آنها را نشان میدهد.
-
مروری بر برآوردهای استوار و کارای مکان و پراکندگی چندمتغیره
1402میانگین نمونه و کوواریانس نمونه، عناصر اساسی اکثر روشها در تجزیه و تحلیل چند متغیره هستند. آنها برآوردگرهای حداکثر درستنمایی برای دادههای نرمال چند متغیره هستند. با این حال، مشخص است که حتی بخش کوچکی از مشاهدات غیر معمول ممکن است به طور جدی بر آنها تاثیر بگذارد. تعداد زیادی از رویکردها پیشنهاد شده است که ما در این پایان نامه 7 روش از آن ها را مرور میکنیم.
-
خوشه بندی استوار بر اساس برآورد چگالی هسته
1401یکی از مهم ترین کارها در دادهکاوی، خوشه بندی داده های موجود در یک مجموعه داده است. این تکنیک بهدنبال کشف ساختارهایی است که منجر به گروه بندی نمونه های موجود در یک مجموعه داده می شوند، بهگونه ای که نمونه های مشابه، درون دسته هایی که بیشترین شباهت را با هم داشته قرار می گیرند، در حالی که دارای تفاوتی قابل قبول با نمونه های سایر گروه ها هستند. الگوریتم های خوشه بندی را می توان به چند دسته کلی الگوریتم های خوشه بندی مبتنی بر مرکز، مبتنی بر اتصال، مبتنی بر توزیع، مبتنی بر گرید و مبتنی بر چگالی تقسیم نمود. از آنجا که روش های خوشه بندی مبتنی بر فاصله دارای معایبی از جمله موارد زیر هستند: ‐1مشخص کردن تعداد خوشه ها در ابتدای اجرای الگوریتم ‐2نامناسب بودن روش برای اشکال غیر محدب و چگالی های مختلف ‐3مشکل واکنش زنجیری‐4پیچیدگی زمانی و مکانی ‐5شناسایی نکردن نقاط نویز بهطور کامل ‐6ایجاد خوشه های نامطلوب؛ زیرا اساس کار این روش ها فاصله بین نمونههاست. برای غلبه بر این مشکلات از روش های خوشه بندی براساس چگالی استفاده می کنیم که بهینه تر عمل می کنند در این پایان نامه ابتدا بهمرور روش های خوشه بندی مطرح پرداخته و چند الگوریتم از هر روش را معرفی می کنیم که در ادامه روش ها و الگوریتم های موجود از نظر برخی از پارامترها مقایسه شده و به بررسی مزایا و معایب هر الگوریتم پرداخته شدهاست. در نهایت الگوریتم های خوشه بندی براساس چگالی را روی چندین داده مختلف با استفاده از نرمافزار Rاجرا می کنیم و میزان کارا بودن هر الگوریتم را محاسبه می کنیم.
-
رگرسیون خطی چند متغیره استوار در ابعاد بالا
1400دربرازش مدل خطی رگرسیون چندمتغیره در ابعاد بالا دو مشکل اساسی ممکن است اتفاق افتد. اولین مشکل می تواند ناشی از حضور داده پرت باشد. داده های پرت می توانند خط رگرسیونی برازش داده شده را منحرف کنند. دومین مشکل ممکن است به علت ابعاد بالای داده ها باشد. ابعاد بالای داده ها باعث همخطی شده و در نتیجه برآورد پارامترها به روش حدقل مربعات خطا، به علت تورم واریانس دچار مشکل می شود.هدف ما در این پایان نامه مرور و ارزیابی روش هایی برای برخورد با این مسائل است .برای رگرسیون داده های ابعاد بالا سه روش رگرسیون متغیر پاسخ روی موله های اصلی ، حداقل مربعات جزیی و رگرسیون لاسو بررسی می شود. سپس انواع روش های رگرسیونی استوار را مطالعه می کنیم . در فصل چهارم دو روش رگرسیون داده های ابعاد بالا و رگرسیون استوار را برای روش های رگرسیونی چند متغیره استوار در ابعاد بالا ادغام می کنیم . در فصل پایانی سعی میشود روش های پیشنهادی را به وسیله داده های واقعی و شبیه سازی با هم مقایسه کنیم.
-
مرور و ارزیابی آزمون های استوار و کارای آنالیز واریانس چندمتغیره یک راهه
1400در تحلیل واریانس چند متغیره یک راهه فرض برابری بردارهای میانگین در چند گروه آزمون خواهد شد. تحت فرض های کلاسیک معمولا از آماره لاندای ویلکس برای ازمون این فرض ها استفاده خواهد شد. اما چون این آماره تحت تاثیر داده های پرت قرار خواهد گرفت بنابراین به بررسی روش های استوار برای آزمون MANOVA یک راهه می پردازیم که ایده اصلی این روش ها جایگزینی برآوردگرهای استوار به جای برآوردگرهای کلاسیک در محاسبه آماره لاندای ویلکس است. همچنین چون در سال های اخیرتحلیل واریانس چند متغیره یک راهه بدون در نظر گرفتن فرض های کلاسیک مورد توجه قرار گرفته شده است پس در این پایان نامه برخی از این روش ها را بررسی خواهیم کرد.همچنین از ناحیه اطمینان بوت استرپی برای آزمون فرض برابری بردارهای میانگین استفاده خواهد شد که با جایگذاری برآوردهای مکانی دیگری مانند میانه و میانگین پیراسته به جای میانگین در این فاصله اطمینان تاثیر داده پرت نیز حذف خواهد شد.
-
شناسایی عوامل موثر بر فعالیت اثربخش شرکتها در شبکه کسبوکار (مورد مطالعه: شرکتهای صنایع غذایی ایران)
1398در محیط کسبوکاری پررقابت امروزی، استفاده از ارتباطات و فعالیت موثر در شبکههای کسبوکاری برای همهی سازمانهای تولیدی و خدماتی امری حیاتی است. سازمانها با محدودیتهای بسیاری از جمله کمبود منابع و قابلیتها مواجهاند. با استفاده از روابط و به اشتراکگذاری منابع، سازمانها میتوانند به بسیاری از این محدودیتها غلبه کرده و از مزایای عضویت در شبکه کسبوکار بهره ببرند. چرا که ماندن در شبکههای کسبوکاری فرصتهای زیادی پیش روی شرکتها قرار میدهد. در این پژوهش، مجموعه عوامل موثر بر فعالیت اثربخش در شبکه کسبوکار در صنعت مواد غذایی ایران مورد آزمون قرار گرفته است. جامعه آماری این پژوهش، مدیران ارشد و میانی شرکتهای فعال در صنعت مواد غذایی هستند. تعداد اعضای نمونه 205 نفر از مدیران ارشد و میانی شرکتهای صنایع غذایی شهر ارومیه و شرکتهای صنایع غذایی دارای دفتر مرکزی در شهر تهران هستند. برای جمعآوری دادهها از پرسشنامه و برای تجزیه و تحلیل دادههای جمعآوری شده از آمار توصیفی، آزمون مدل اندازهگیری و آزمون مدل ساختاری استفاده شده است. نتایج نشان میدهد که از بین 8 عامل تسهیم منابع، چشمانداز مشترک، اعتماد، تعهد، انتخاب شرکا، فناوری اطلاعات، انعطافپذیری شرکت شایستگی شبکه تنها دو عامل آخر بر فعالیت اثربخش شرکتها در شبکه کسبوکار در ایران اثر معنادار دارند و این اثر هم به صورت مثبت است. همچنین شایستگی شبکه دارای تاثیر بیشتری نسبت به انعطافپذیری دارد.
-
مرور آزمونهای موجود در شرایط غیرنرمال بودن و ناهم واریانسی برای آنالیز واریانس یک طرفه
1398آزمونهای آماری کلاسیک در بسیاری از حوزه ها استفاده می شود. این آزمون ها براساس فرضیات خاصی (به عنوان مثال، نرمال بودن و هم واریانسی) باید انجام شود تا نتایج دقیق حاصل شود. نقض چنین فرضیاتی یک مسئله رایج است که محققان با آن روبه رو هستند. آزمونهای آماری جایگزین قوی مانند آزمون ولش، آزمون یوئن برای میانگین های پیراسته و آزمون الکساندر- گاورن و جیمز برای مقابله با نقض این فرضیات استفاده می شود. نتایجی که بر اساس شبیه سازی های انجام شده به دست آمده است، مشخص می کند که برای نرخ خطای نوع اول بر اساس آزمونهای ارائه شده، آزمون بوت استرپ پارامتری عملکرد بهتری نسبت به سایر آزمون ها دارد. برای نرخ توان آزمون، آزمون تحلیل واریانس چارکی عملکرد بهتری دارد.
-
رگرسیون استوار و کشف دادههای پرت برای دادههای همبسته
1398در تحیل رگرسیونی، حضور نقاط دورافتاده در مجموعهی دادهها میتواند باعث انحراف برآوردگر توانهای دوم کلاسیک و ایجاد نتایج غیرعادی گردد. کشف دادههای پرت در زمینههای مختلف جذابیت قابل توجهی دارد. در روشهای کشف دادههای پرت موجود، اغلب خطای دادهها مستقل درنظر گرفته میشوند. اما این فرضیه در برخی از کاربردها وجود ندارد. در این پایاننامه، ابتدا مروری به رگرسیون خطی و مفاهیم دادههای پرت داریم. سپس در فصل دوم، چندین روش رگرسیون استوار به عنوان روشهای جایگزین برای روش کمترین توانهای دوم مورد مطالعه قرار گرفته است. در فصل سوم، یک روش احتمالی برای شناسایی دادههای پرت و بهروز رسانی استوار حل مسائل رگرسیون خطی دادههای همبسته را مرور میکنیم. در ابتدا، دادههای مشکوک با استفاده از روش مینیمم حجم بیضویوار و روش ماکسیمم درستنمایی پیراسته شناسایی میشوند. سپس، دادههای پرت از بین دادههای مشکوک بر اساس روش احتمالی دادههای پرت با درنظر گرفتن همبستگی بین دادهها تعیین خواهند شد. روش مطرح شده از طریق دادههای واقعی و شبیهسازی شده ارزیابی شده است.
-
بررسی رگرسیون استوار به روش هسته بر اساس توابع تاثیر و وزن
1397رگرسیون به روش هسته یک مفهوم اساسی در تحلیل رگرسیون است که به وسیله ی آن خط رگرسیونی را به داده ها برازش می دهیم. اما اگر در میان مشاهدات داده ی پرت وجود داشته باشد، استفاده از رگرسیون به روش هسته بازیان حداقل مربعات باعث برازش نادرست خط رگرسیونی خواهد شد. رگرسیون استوار حوزه ای از رگرسیون است که به آسانی از داده پرت تاثیر نمی گیرد و استواری به وسیله بازوزن دهی به برآورد حداقل مربعات به روش هسته با استفاده از توابع وزن مختلف فراهم می شود. در این پایان نامه توابع وزن را باهم مقایسه و سپس وزن هایی که استواری بیشتر و همگرایی سریع تر داشته باشند، انتخاب می شوند.
-
بررسی نمودارهای کنترل فرایند آماری استوار
1397نمودارهای کنترل ازجمله مهم ترین ابزارهای کنترل فرایند آماری هستند. طراحی مناسب نمودارهای کنترل نیازمند برآورد کردن مقادیر پارامترهای فرایند است. در این پایان نامه از برآوردگرهای استوار پراکندگی و مکانی، به منظور برآورد پارامترها استفاده می شود. نمودار کنترل استوار با عملکرد خوبی موردبررسی قرار می گیرد و برای زمانی که توزیع فاصله زیادی از نرمال دارد، همچنان عملکرد خوبی را از خود نشان می دهد. برای داده های خود همبسته نیز روش پیش بین هالت وینترز در نمودارهای کنترل با عملکرد خوبی مورد ارزیابی قرار می گیرد. زمانی که مشاهدات انفرادی است، از نمودارهای کنترل XMR استفاده می کنیم که هم برای داده های مستقل و هم برای داده های خود همبسته عملکرد خوبی را در حضور آلودگی دارد. درنهایت، نتایج روش ها را روی یک مجموعه داده واقعی بررسی می کنیم.
-
تاثیر ویژگی های کمیته حسابرسی بر اجرای توصیه های حسابرس داخلی در شرکت های پذیرفته شده در بورس اوراق بهادار تهران
1396چکیده صورت های مالی، اطلاعات مفید برای اتخاذ تصمیم گیری های اقتصادی و سرمایه گذاری ارائه می کنند که این اطلاعات برای استفاده کنندگان، در ارزیابی وضعیت و عملکرد مالی شرکت مهم هستند. ازاین رو صورت های مالی حسابرسی شده احتمالاً تنها منبع مورد اعتماد اطلاعات قابل دسترس است . از سوی دیگر، کمیته های حسابرسی باید به طرز صحیحی سازمان دهی شوند تا بتوانند منافع چشم گیری برای کلیه گروه ها داشته باشند و هم چنین بتوانند وظیفه مباشرت گزارشگری هیئت مدیره را تقویت نمایند و ارتباط بین حسابرس مستقل و مدیریت را بهبود بخشند. بنابراین هدف این پژوهش، بررسی رابطه بین تخصص کمیته حسابرسی و کیفیت حسابرسی است. این پژوهش ازلحاظ هدف کاربردی و ازلحاظ ماهیت، توصیفی– همبستگی است. جامعه آماری این پژوهش، شرکت های پذیرفته شده در بورس اوراق بهادار تهران طی سال های 1390-1395 می باشد که با روش حذف سیستماتیک، 57 شرکت در نمونه آماری این پژوهش قرارگرفته اند. جهت آزمون فرضیه های پژوهش از مدل رگرسیون چند متغیره و روش حداقل مربعات معمولی استفاده شد. یافته های پژوهش نشان می دهد، بین تخصص مالی کمیته حسابرسی و کیفیت حسابرسی رابطه معناداری وجود ندارد. همچنین به منظور روشن تر شدن موضوع، تخصص مالی کمیته حسابرسی به دو گروه تخصص حسابداری و غیر حسابداری تقسیم شد. نتایج نشان داد بین تخصص مالی حسابداری کمیته حسابرسی و کیفیت حسابرسی یک رابطه مثبت و معنادار و بین تخصص مالی غیر حسابداری کمیته حسابرسی و کیفیت حسابرسی یک رابطه منفی و معنادار وجود دارد. تجربه کمیته حسابرسی نیز باکیفیت حسابرسی یک رابطه مثبت و معنادار دارد. کلمات کلیدی: کمیته حسابرسی، تخصص مالی، حق الزحمه حسابرسی، کیفیت حسابرسی، حاکمیت شرکتی.
-
مطالعه ای در آزمون های همگنی واریانس ها در برابر فرض مخالف مرتب شده
1395مسئله ی شناسایی روند های یکنواخت در واریانس ها در بیشتر موارد کاربردی مطرح می شوند و از روش های آماری متعددی برای آزمون چنین مسائلی استفاده می شود. در این پایان نامه شش آزمون، لون، کنتراست دو گانه، کنتراست چند گانه، مدهولکر - مک درموت با مقادیر ساختگی میلر، روند لون و لون گونه ای تودرتو با دو روش حذف صفر ساختاری هاینز-هاینز و روش تصحیح صفر در توزیع های متقارن، چوله و دم سنگین با اندازه نمونه های متفاوت بررسی می شوند. هدف ما مقایسه عملکرد آزمون توزیع آزاد لون گونه ای تودرتو با سایر آزمون ها است. این مقایسات بر اساس بررسی نرخ خطای نوع اول و توان آزمون ها است. نتایج شبیه سازی نشان می دهند که آزمون توزیع آزاد لون گونه ای تودرتو، یک برآورد خیلی دقیق از اندازه را به دست می دهد و یک توان نزدیک به حالت ایده آل را برای انواع توزیع ها، اندازه نمونه ها و فرض های مخالف مختلف ارائه می دهد.
-
برآورد تابع چگالی در حضور داده های پرت
1395تابع چگالی احتمال مفهومی اساسی در آمار و احتمال است. به وسیله تابع چگالی احتمال می توان به رفتار تصادفی متغیرهای تصادفی پی برد. تکنیک برآورد چگالی هسته ای کلاسیک یکی از روشهای مرسوم در برآورد تابع چگالی است که در غیاب داده های پرت صورت می گیرد. اگر مشاهدات عاری از داده پرت باشند، استفاده از روش برآورد چگالی ه روش هسته ای بسیار کارا است؛ اما معمولاً در میان مشاهدات داده پرت وجود دارد. استفاده از روش برآورد هسته ای چگالی در حضور چنین مشاهداتی در میان داده ها باعث بیش برآوردی یا کم برآوردی در قسمتهایی از تابع چگالی خواهد شد؛ به عبارت دیگر مشاهدات پرت میزان اریبی برآورد چگالی را افزایش می دهند. بنابراین روش یا روشهایی برای برآورد چگالی وقتی که در مشاهدات داده پرت وجود دارد، مورد نیاز است. در این پایان نامه روشهای برآورد استوار چگالی مرور می شود. سپس روش جستجوی پیشرو معرفی و روش جدیدی بر اساس این رهیافت ارائه و پیشنهاد می شود.
-
تحلیل واریانس استوار بر اساس روش های جستجوی پیشرو و جایگشتی
1394برای مقایسه میانگین دو یا چند جامعه از آزمون تحلیل واریانس استفاده می شود. در صورت حضور نقاط دورافتاده در مجموعه داده ها، نتیجه آزمون کلاسیک تحلیل واریانس قابل اعتماد نیست. در این پایان نامه، ابتدا روش استوار تحلیل واریانس بر اساس جستجوی پیشرو ارائه می شود. روش جستجوی پیشرو روشی کاملا گرافیکی است. سپس به کمک توزیع جایگشتی آماره F بر اساس میانگین پیراسته، روش استوار جدیدی برای تحلیل واریانس پیشنهاد داده می شود. روش پیشنهادی برخلاف روش جستجوی پیشرو، به کمک توزیع جایگشتی آماره مورد بررسی، ما را از فرضیات محدود کننده روش پارامتری بی نیاز می کنند. در عین حال، به کمک پیراستن داده ها از مشاهدات دورافتاده، اعتبار نتایج حاصل تضمین می شود. مقایسه دو مدل شبیه سازی شده به وسیله توان آزمون و خطای نوع اول، حکایت از عملکرد خوب دو روش و البته سرعت بالاتر روش پیشنهادی دارد.در نهایت، نتایج دو روش را روی یک مجموعه داده واقعی بررسی می کنیم.
-
کشف داده های پرت براساس چگالی در داده های چندمتغیره
1394وجود مشاهدات پرت یکی از مهم ترین موضوعات در استنباط آماری است. با توجه به این که این مشاهدات تاثیر زیادی بر مدل برازش داده شده و استنباط های مربوط به آن دارند، پیدا کردن روش هایی برای کشف مشاهدات پرت ضروری است. در این پایان نامه چندین روش کشف مشاهدات پرت در مجموعه داده های تک متغیره و چندمتغیره معرفی شده است. این روش ها بر اساس فاصله و نزدیکترین همسایگی هستند. سپس چهار روش برای کشف مشاهدات پرت بر مبنای چگالی مورد بررسی قرار می گیرد که عبارتند از روشLOF ، روشDWOF ، کشف مشاهدات پرت با استفاده از روش برآورد استوار چگالی هسته و کشف مشاهدات پرت با استفاده از تابع وزنی هسته ای استوار. این روش ها نمره هایی را به مشاهدات اختصاص می دهد که میزان پرت بودن مشاهدات را تعیین می کنند. با استفاده از مقایسات شبیه سازی شده، میانگین و انحراف استاندارد نرخ خطا و زمان اجرای هر یک از روش ها را مورد بررسی قرار می دهیم.
-
تحلیل خوشه بندی استوار بر اساس روشهای k - میانگین
1393انحراف از فرض تئوری و وجود نقاط دور افتاده به طور معمول در بسیاری از کاربردهای آماری وجود دارد. این مشکل زمانی که از روش های خوشه بندی نیز استفاده می کنیم وجود دارد و سبب می شود، که این روش ها ما را به نتایج ناخوشایندی هدایت کنند. برآورد کننده ای که نسبت به نقاط دور افتاده و انحراف از فرض تئوری حساس نباشد را برآورد کننده ی استوار می نامند. ارتباط بین روش های استوار و تحلیل خوشه ای چارچوب متحد و جذاب خوشه بندی استوار را می سازد. در این پایان نامه سعی شده ضمن مرور روش های خوشه بندی به طور ویژه به روش هایی که بر اساس پیراسته کردن است بپردازد. پیراسته کردن سعی دارد، داده های دور افتاده ای که فرایند خوشه ای را منحرف می سازد، حذف کند
-
کاربرد تخمین های ناپارامتریک در تحلیل خطر احتمالی زمین لرزه
1393تحلیل خطر احتمالاتی زمین لرزه ابزاری سودمند است که محققین به کمک آن به برآورد شدت زمین لرزه و انجام پیش بینی های لازم جهت مقابله با زمین لرزه می پردازند. در تحلیل خطر لرزه ای احتمالاتی به کمک مدل های ریاضی به برآورد توزیع چگالـی بزرگای زمین لرزه هـای رخ داده پرداخته شده، سپس به کمک این توزیع چگالـی، پارامترهای لرزه خیـزی ناحیه مورد مطالعه تخمین زده مـی شود. به دلیل نقش مهم توزیع چگالی بزرگا در علم تحلیل خطر احتمالاتی لرزه ای استفاده از روش های ریاضی نوین جهت برآورد هرچه دقیق تر این توزیع همواره مورد توجه محققین بوده است. در این بین به اثبات رسیده است که استفاده از روش های آماری ناپارامتریک به عنوان یک روش جدید، می تواند دقت تخمین چگالی بزرگا را بهبود بخشد. به دلیل ماهیت پیچیده و غیرخطی توزیع بزرگای زمین لرزه، روش های سنتی پارامتریک که غالبا براساس رابطه ریشتر-گوتنبرگ می باشند، قادر به برآورد دقیق توزیع بزرگا در تمامی الگوهای لرزه خیزی نمی باشنـد. به همین دلیل استفاده از روش های ناپارامتریک به دلیل در نظر گرفتن کمترین فرضیات اولیه در مورد توزیع مورد نظر، در صورت وجود هرگونه پیچیدگی در توزیع واقعی بزرگا، یک جایگزین مناسب برای روش های پارامتریک سنتی باشد. شبیه سازی مونت کارلو کارآیی روش های ناپارامتریک نسبت به روش های پارامتریک را در تمامی الگوهای لرزهخیزی موجود، به اثبات رسانده است. به عنوان یک مطالعه موردی لرزه خیزی ایالت لرزه زمین ساخت البرز-آذربایجان با استفاده از روش های ناپارامتریک مورد بررسی قرار گرفته و با نتایج روش های پارامتریک مقایسه شده است. نتایج این بررسی نشان می دهد که در مورد ایالت لرزه زمین ساخت البرز-آذربایجان، روش های پارامتریک سنتی، سطح لرزه ای موجود را به صورت دست پایین نتیجه می دهند.