profile - دانشکده علوم
اعضای هیأت علمی دانشکده علوم
اسحاق الماسی
استادیار / علوم / گروه آمار
دروس ارائه شده نیمسال جاری
| نام درس | واحد | زمان ارائه درس | ترم |
|---|---|---|---|
| احتمال مهندسی(آمار و احتمال مهندسی) | 3 | هرهفته، شنبه ، 13:30-15:30، هفته هاي فرد ، دوشنبه ، 13:30-15:30 | نیمسال اول سال تحصیلی 1404-1405 |
| احتمال 1 | 4 | هرهفته، يك شنبه ، 15:30-17:30، هرهفته، سه شنبه ، 15:30-17:30 | نیمسال اول سال تحصیلی 1404-1405 |
| استنباط آماری2 | 4 | هرهفته، شنبه ، 15:30-17:30، هرهفته، دوشنبه ، 15:30-17:30 | نیمسال اول سال تحصیلی 1404-1405 |
| احتمال 1 | 3 | هرهفته، يك شنبه ، 15:30-17:30، هفته هاي فرد ، سه شنبه ، 15:30-17:30، هفته هاي زوج ، سه شنبه ، 15:30-17:30 | نیمسال اول سال تحصیلی 1404-1405 |
| کنترل کیفیت آماری | 3 | هرهفته، سه شنبه ، 13:30-15:30، هفته هاي فرد ، چهارشنبه ، 13:30-15:30 | نیمسال اول سال تحصیلی 1404-1405 |
پایاننامههای کارشناسیارشد
-
ارزیابی سرعت موج برشی در خاکهای ریزدانه براساس پارامترهای مکانیکی و عدد نفوذ استاندارد خاک
شیما عزیزی 1405 -
خوشه بندی بیزی ناپارامتری نیمه نظارت شده در ساختار SHM.
شهناز رحیمی چگنی 1404 -
پیش بینی بیماری آلزایمر با استفاده از یادگیری فدرال
شراره السادات علیزاده 1404 -
طراحی مدل بازاریابی الکترونیکی در بستر شبکه های اجتماعی با هدف افزایش درگیرسازی مشتریان ( مورد مطالعه شبکه اجتماعی اینستاگرام).
فاطمه بیابانی 1403پژوهش حاضر به طراحی مدل بازاریابی الکترونیکی در بستر شبکههای اجتماعی با هدف افزایش درگیرسازی مشتریان در اینستاگرام پرداخته است. این پژوهش بر مبنای هدف یک پژوهش کاربردی، بر مبنای گردآوری دادهها یک پژوهش توصیفی پیمایشی و بر مبنای رویکرد یا روش شناسی یک پژوهش آمیخته میباشد. در بخش کیفی، به تحلیل محتوا و روش دلفی پرداخته شده است. در بخش تحلیل محتوا، دادهها از طریق مطالعات اسنادی و کتابخانهای جمعآوری شده است و جامعه پژوهش شامل تمامی متون و مقالات مرتبط با موضوع پژوهش است. نمونهگیری از طریق تمامی مقالات در دسترس انجام شده است و تعداد نمونهها 37 مقاله مرتبط میباشد. تحلیل دادهها با استفاده از کدگذاری باز و دستهبندی مفهومی انجام شده و از نرمافزار Word برای این فرآیند استفاده شده است. در بخش دلفی، دادهها از طریق مصاحبههای عمیق نیمهساختاریافته و توزیع پرسشنامه در چندین دور جمعآوری شده که در دور دوم به اشباع نظری رسیده و مدل به 49 شاخص نهایی رسیده است. جامعه پژوهش در این بخش شامل اساتید و خبرگان متخصص در بازاریابی الکترونیک با سابقه فعالیت بالا بوده است. روش نمونهگیری در این مرحله قضاوتی و گلوله برفی بوده و دادهها با نرمافزار اکسل تحلیل شدهاند. در بخش کمی، از روش توصیفی پیمایشی برای جمعآوری دادهها استفاده شده است. دادهها از طریق توزیع پرسشنامه در میان کاربران اینستاگرام جمعآوری شدهاند. نمونهگیری با استفاده از نمونهگیری غیراحتمالی انجام شده و جامعه پژوهش، کاربرانی هستند که دارای ویژگیهایی نظیر تعداد دنبالکنندگان بالا، نرخ تعامل بالا و اعتبار صفحه میباشد.. و تعداد نمونهها شامل ??? نفر از کاربران اینستاگرام است. تحلیل دادهها با استفاده از آمار توصیفی و تحلیلی و تکنیکهای تحلیل عاملی تاییدی با استفاده از نرمافزار R تحلیل شده و در نهایت دادهها با استفاده از ضریب رگرسیونی اولویتبندی شدهاند. یافتههای پژوهش نشان میدهند که مدل نهایی شامل ?? شاخص، ?? مولفه و ? بعد اصلی است که شامل بازاریابی محتوایی، بازاریابی هیجانی، بازاریابی صفحه فرود، بازاریابی تعاملی و بازاریابی کاربردی میباشد. در مرحله توصیفی پیمایشی، با اعمال تغییرات بر اساس نظرات خبرگان، دو مولفه از مدل حذف شده و پنج مولفه جدید به عنوان شاخصهای دیگرساری مشتری افزوده شدهاند. به این ترتیب، تعداد شاخصها به ?? رسیده است. بر اساس نتایج تحلیل رگرسیونی، یافتههای بخش دوم نشان میدهند که اولویت تاثیر مولفهها بر درگیرسازی مشتری به ترتیب بهصورت زیر است: بازاریابی صفحهفرود، بازاریابی محتوایی، بازاریابی هیجانی، بازاریابی کاربردی و در نهایت بازاریابی تعاملی. نتایج این پژوهش نشان میدهند که تاثیر مولفههای مختلف بازاریابی الکترونیکی بر درگیرسازی مشتریان در بستر شبکه اجتماعی اینستاگرام بهطور متفاوتی توزیع شده است. از میان مولفهها، بازاریابی صفحهفرود بیشترین تاثیر را داشته است، که این امر نشاندهنده اهمیت طراحی و بهینهسازی صفحه فرود برای جذب و حفظ مشتریان میباشددر ادامه، بازاریابی محتوایی و هیجانی به ترتیب در رتبههای بعدی قرار دارند و این امر تاکید میکند که کسبوکارها باید محتوای جذاب، ارزشمند و مرتبط تولید کنند و به ایجاد ارتباطات عاطفی با مشتریان توجه ویژهای داشته باشند. در نهایت، برای دستیابی به نتایج بهینه، کسبوکارها باید از یک رویکرد جامع و ترکیبی از این مولفهها در استراتژیهای بازاریابی خود استفاده کنند.
-
بازسازی آماره های ترتیبی و داده های گم شده در توزیع های مقدار کرانگین
ساسان اکبری 1403آمده را با سایر روشها مقایسه و مورد ارزیابی قرار میدهیم.
-
پیش بینی سری های زمانی با استفاده از شبکه های عصبی
حدیث حیدریان 1403سری زمانی به مجموعهای از دادهها گفته می شود که در طول زمان ثبت شدهاند. برای مثال، می توان به سری زمانی قیمت یک سهم در بازار سهام، میزان بارش باران در یک ناحیه و ... اشاره کرد. یکی از مهمترین اهداف تحلیل سری های زمانی، پیش بینی مقادیر آینده آن است. روش های آماری متعددی برای پیش بینی سریهای زمانی مانند روش استفاده از مدل های تحلیل سری زمانی میانگین متحرک جمع بسته اتورگرسیو، مدل میانگین متحرک جمع بسته اتورگرسیو فصلی و روش های تجزیه موجک معرفی شدهاند. در کنار روش های آماری، شبکههای عصبی نیز ابزاری قدرتمند برای پیش بینی سری های زمانی هستند. به دلیل توانایی شبکههای عصبی در مدل سازی روابط و الگوهای پیچیده در دادهها، پیش بینی سری های زمانی با استفاده از آن ها بسیار مورد توجه محققان حوزه های مختلف قرار گرفته و به یک موضوع تحقیقاتی محبوب تبدیل شده است. استفاده از شبکههای عصبی پیچشی برای پیش بینی سری های زمانی، به عنوان یک روش موثر برای تحلیل و پیشبینی الگوهای تکراری در دادههای زمانی، شناخته شده است. این شبکهها طراحی شدهاند تا الگوهای مختلف را در دادههای زمانی تشخیص دهند و بتوانند با استفاده از این الگوها، پیشبینی های دقیقی برای مقادیر آینده دادهها ارائه کنند. شبکههای عصبی بازگشتی با حافظه طولانی کوتاه مدت (LSTM) و شبکههای عصبی بازگشتی با دروازههای بازگردان GRU، دو نوع شبکه عصبی هستند که به دلیل قابلیت حفظ حافظه در طول زمان، برای پیشبینی سری های زمانی مفید هستند. این شبکهها، با استفاده از یک واحد حافظه، اطلاعات قبلی را در خود نگه می دارند و با توجه به این اطلاعات، پیشبینی بعدی را انجام می دهند. در این پایان نامه، پیش بینی سریهای زمانی با شبکه عصبی پیچشی و شبکههای عصبی LSTM و GRU بررسی می شود. عملکرد این شبکهها در دقت پیش بینی مورد مقایسه قرار میگیرد. همچنین عملکرد آن ها با روش های آماری از قبیل SARIMA مقایسه میشود.کلید واژگان. پیش بینی سری های زمانی، حافظه طولانی کوتاهـمدت، شبکههای عصبی، شبکههای عصبی بازگشتی، شبکههای عصبی پیچشی، واحد بازگشتی دروازهدار.
-
مطالعه روش های عددی برای یافتن طرح های A-بهینه
نرگس نظری 1403 -
ارائه مدلی بر اساس داده کاوی و سامانه استنتاج فازی جهت تشخیص بیماری قلبی (مطالعه موردی:بیمارستان معاون صحنه)
احسان ناصرپور 1403این پژوهش به بررسی و پیادهسازیمدلی ترکیبی از منطق فازی و درخت تصمیم برای تشخیص بیماری قلبی با استفاده از دادههای پزشکی 920 بیمار (پایگاه داده UCI) پرداخته است. پس از بررسی و آمادهسازی دادهها، اطلاعات 304 بیمار بهعنوان دادههای کامل انتخاب شدند و فرآیند کمیسازی و نرمالسازی آنها با روش مین-ماکس انجام شد. پایگاه داده محلی بیمارستان معاون صحنه نیز برای تکمیل مدل استفاده گردید. مدل درخت تصمیم با دقت 78.30% و سطح زیر نمودار ROC برابر با 0.798 استخراج شد، اما خطای طبقهبندی حدود 22.36% گزارش شد. با توجه به درخت تصمیم، سامانه استنتاج فازی با 9 ورودی و 12 قانون فازی پیادهسازی شد. سپس، مدل ترکیبی درخت تصمیم-سامانه استنتاج فازی با 70 داده بیمارستانی اجرا و با 35 داده جدید ارزیابی گردید. نتایج نشان داد که مدل توانسته است دقت کلی 91.43% را در طبقهبندی دادهها به دست آورد. حساسیت مدل برای تشخیص افراد سالم و بیماران قلبی به ترتیب 89.47% و 93.75% بود. مقایسه با روشهای دیگر نشان داد که مدل پیشنهادی دقت بالاتری بین 1 تا 12 درصد نسبت به روشهای ماشین بردار پشتیبان، شبکه عصبی مصنوعی و k-نزدیکترین همسایگی دارد. نتایج این تحقیق نشان داد که استفاده از دادههای محلی و متناسب با ویژگیهای خاص هر منطقه میتواند دقت مدلهای یادگیری ماشینی را در کاربردهای پزشکی بهبود بخشد. مدل ترکیبی درخت تصمیم-فازی با دقت بالا و سادگی در پیادهسازی، بهعنوان ابزاری موثر برای تشخیص بیماریهای قلبی معرفی شد.
-
بهینه سازی فرایند حذف یون فلز سنگین از پساب با روش طرح D-بهینه و الگوریتم ژنتیک
محیا ارجمند نیا 1402در این پژوهش حذف فلز سنگین از پساب با استفاده ازترکیب روش های الکتروفنتون و فیلتراسیون غشایی مورد بررسی قرار گرفت. ادغام دو روش مذکور با هدف افزایش راندمان تصفیه صورت گرفت و تاثیر پارامترهای بهره برداری زمان واکنش، دانسیته جریان، اسیدیته محلول(pH)، نسبت حجمی هیدروژن پراکساید به پساب، نسبت مولی هیدروژن پراکساید به یون فروس (Fe2+)، غلظت نانوذره و غلظت خوراک ورودی بر روی درصد حذف این آلاینده مورد بررسی قرار گرفت. جهت بهینه سازی پارامترهای بهره برداری مذکور با هدف بیشینه سازی (Maximize) درصد حذف این آلاینده از دو روش بهینه سازی، معیار D-بهینگی که تابعی حقیقی مقدار بر حسب ماتریس اطلاع فیشر می باشد و روش ترکیبی شبکه عصبی مصنوعی-الگوریتم ژنتیک استفاده شده است. مقایسه تحلیل های آماری برای این دو روش با هدف یافتن تابع هدفی با کمترین میانگین مربعات خطا می باشد.
-
بررسی رگرسیون کاکس و الگوریتم ماشین بردار پشتیبان در تحلیل داده های بقا و مقایسه آن ها در یک مطالعه موردی
همام فائق حسین 1402یکی از موضوعات مورد علاقه در علم آمار زمان وقوع یک پیشامد خاص است. از این رو زیرشاخهای به اسم تحلیل بقا در آمار بوجود آمده است. به طور کلی تحلیل بقا مجموعهای از روشهای آماری برای تحلیل دادههایی است که متغیر پیامد در آنها زمان تا رخداد یک پیشامد خاص است. در تحلیلهای بقا معمولاً متغیر زمان را زمان بقا مینامیم. زیرا این متغیر تعیین کننده مدت زمانی است که یک فرد در طول دوره پیگیری "بقا یافته" است. همچنین چون معمولاً در این نوع تحلیلها، پیشامدهای مورد نظر مرگ، وقوع بیماری یا سایر تجربههای فردی است، پیشامد مورد نظر را شکست مینامیم. با این حال شکست لزوما بار معنایی منفی ندارد، برای مثال میتواند مدت زمان تا تولد اولین فرزند پس از ازدواج (به عنوان لحظه شروع مطالعه) باشد. بسیاری از تحلیلهای بقا با یک مشکل اساسی به نام سانسور مواجه هستند. سانسور زمانی رخ میدهد که ما بخشی از اطلاعات مربوط به زمان بقا را در اختیار داریم اما زمان بقای دقیق را نمیدانیم.\\\\ با گسترش علم و پیشرفت انواع روشهای تحلیل دادهها، روشهای تحلیل دادههای بقا نیز رو به پیشرفت هستند و کاربرد این علم در دادههای پزشکی و سایر رشتهها رو به فزونی است.\\\\ از روشهای رایج آماری برای تحلیل دادههای بقا رگرسیون مخاطرات متناسب کاکس میباشد، این مدل در مواقعی که با مسئله ابعاد بالا مواجه هستیم کارایی مطلوب را ندارد، یک روش جایگزین که در این پایان نامه معرفی میشود، استفاده از ماشین بردار پشتیبان است که یکی از ابزار یادگیری ماشین است و به خوبی میتواند با مسائل با ابعاد بالا کار کند و همچنین نیازی به برقرار بودن پیش فرضهای معمول رگرسیونی که در آمار کلاسیک داریم را ندارد.\\\\ نسخه اصلی ماشین بردار پشتیبان توانایی کار با دادههای بقا به دلیل وجود سانسورها را ندارد. یک ایده سادهلوحانه این است که نمونههای سانسور را از مطالعه حذف کنیم که در این صورت حجم زیادی از اطلاعات از دست خواهد رفت. در این پایان نامه با ایجاد تغییراتی روی قیود مسئله بهینهسازی ماشین بردار پشتیبان به یک نسخه از این روش میرسیم که مناسب تجزیه و تحلیل دادههای بقا هستند و از اطلاعات سانسورها بهره میبرد. این نسخه را ماشین بردار پشتیبان بقا مینامیم. در نهایت برای یک مطالعه موردی روش ماشین بردار پشتیبان بقا را برای تجزیه و تحلیل آن به کار خواهیم برد و آن را با روشهای کلاسیک در آمار مثل رگرسیون مخاطرات متناسب کاکس مقایسه خواهیم کرد.
-
پیش بینی بر اساس ترکیب مدلهای آمیخته
زهرا سهیلی کیا 1402در مدل های خطی، هنگامی که تعداد متغیرهای مستقل زیاد باشد، برای پیدا کردن مدلهای بهینه از بین مدلهای ممکن، استفاده از روشهایی مثل گام به گام، پیشرو، پسرو و ... راه حل معمول است. اما این روش های پیدا کردن مدل بهینه بهترین مدل را به معنای مطلق پیدا نمی کنند و مورد به مورد نتایج متفاوتی به بار می آورند. ممکن است یک مدل پیدا شده با این روشها بر حسب مقدار متوسط مربعات خطا بهترین باشد و یا ممکن است بر حسب ضریب تعیین بهترین باشد. به هر حال استفاده از این روشها مستلزم حذف کردن تعدادی از متغیرهای مستقل از تحلیل ها می شود، که می توانند در برخی کاربردها گمراه کننده و یا دست کم محدود کننده باشند. هنگامی که هدف پژوهشگر از تعیین مدلها پیش بینی مشاهدات جدید باشد استفاده از مدلهای به دست آمده از این روشهای حذف کننده متغیرها، می تواند تاثیر بیشتری در از دست دادن اطلاعات و کاهش دقت داشته باشد. هدف ما در این پایان نامه این است که به جای استفاده از رویکردهای حذفی متغیر های مستقل ، یک مدل را بر اساس ترکیب مدلهای ساده به گونه ای به دست آوریم که این ترکیب از مدلها قابل اتکاترین (به معانی مختلفی نظیر مینیمم MSE یا ماکسیمم اطلاع و ...) پیش بینی ها را تولید نماید.
-
مدلسازی فضایی نرخ بیکاری درشهرستانهای ایران براساس دادههای سرشماری نفوس و مسکن 1395
حامد سیفی 1402شهرستانها را روی تعداد بیکاران مورد بررسی و تفسیر قرار میدهیم.
-
پیشبینی پیشرفت تحصیلی دانشجویان دانشگاه رازی با استفاده از فنون دادهکاوی
الناز کسانی 1402یکی از عوامل مهم در بررسی آموزش، پیشبینی پیشرفت تحصیلی است و استفاده از فنون دادهکاوی یکی از راهکارهای نوین پیشبینی پیشرفت تحصیلی است. در این پایاننامه، فنون دادهکاوی در دو بخش روشهای ساده شامل درخت تصمیم، جنگل تصادفی، $K$-نزدیکترین همسایه و بخش روشهای پیچیدهتر شامل ماشین بردار پشتیبان و شبکه عصبی مورد مطالعه قرار گرفتهاند. همچنین دقت این روشها بر روی مجموعه دادههای مربوط به دانشجویان دانشگاه رازی از سال 1375 تا 1401 در مقطع کاردانی و کارشناسی مورد بررسی و مقایسه قرار گرفته است. از روشهای بررسی شده جنگل تصادفی بیشترین دقت پیشبینی را نتیجه داده است اما از لحاظ سرعت پاسخدهی هزینه محاسباتی بالایی دارد. روش $K$-نزدیکترین همسایه از لحاظ دقت خیلی نزدیک به روش جنگل تصادفی است با این تفاوت که زمان اندکی لازم است تا خروجیها حاصل شوند.
-
بررسی رابطه رفتار تودهوار سرمایهگذاران نهادی و کیفیت حسابرسی
قسام طلال حبیب 1401حسابرسی با کیفیت، نقش بسزایی در کاهش عدم تقارن اطلاعاتی و بهتبع آن، کاهش هزینه نمایندگی ایفا میکند. به بیانی، حسابرسان با فراهم آوردن شرایط مناسب برای ارائه اطلاعات با کیفیت به استفادهکنندگان، زمینه لازم برای کنترل رفتار خوشبینانه مدیران را مهیا میکنند. بنابراین سازوکار نظارتی قوی، مدیران را از بهرهگیری منابع نقدی در سرمایهگذاریهای کم بازده، باز میدارد. هدف این بررسی رابطه رفتار تودهوار سرمایهگذاران نهادی و کیفیت حسابرسی است. جامعه آماری پژوهش شرکتهای پذیرفته شده در بورس اوراق بهادار بغداد و نمونه مورد مطالعه، شامل 80 شرکت پذیرفته شده طی سالهای 2017 تا 2021 است. روش پژوهش توصیفی و از نظر ارتباط بین متغیرها همبستگی است و از نظر هدف کاربردی است. برای پردازش و آزمون فرضیهها از روش رگرسیونی و دادههای تابلویی و همچنین مدل اثرات ثابت استفاده شده است. نتایج تحلیل فرضیهها نشان داد رفتار تودهوار سرمایهگذاران نهادی با دوره تصدی حسابرس رابطه منفی و معناداری دارد، رفتار تودهوار سرمایهگذاران نهادی با اندازه موسسه حسابرسی رابطه منفی و معناداری دارد، و رفتار تودهوار سرمایهگذاران نهادی با تخصص حسابرس در صنعت رابطه منفی و معناداری دارد.
-
مروری بر الگوریتم های طبقه بندی داده کاوی و مقایسه آن ها روی یک مطالعه موردی
راضیه توانگر 1401 -
عوامل موثر بر شاخص¬های اندازه¬گیری فقر و انتخاب بهترین مدل
مریم امیری 1400 -
بررسی رگرسیون وایبول جریمهدار برای حالتهای بعد بالا
انسیه قبادی اصل 1400رگرسیون در آمار به معنی بازگشت به یک مقدار متوسط یا میانگین است، آماردانان همواره رابطه بین متغیرها را مورد بررسی قرار داده اند، از رایج ترین مدل هایی که به داده ها برازش داده می شوند، مدل های رگرسیونی هستند. تحلیل رگرسیون یک روش آماری برای تحلیل و مدل بندی داده های چند متغیره است. نوع خاصی از مدل های رگرسیونی ،مدل رگرسیونی بعد بالا است که در آن حجم متغیرهای مستقل از حجم نمونه بیشتر است، یعنی زمانی که n > p است، در این مدل ها به دلیل اینکه ماتریس X رتبه کامل ستونی نیست، پس برآورد کمترین مربعات OLSˆ? به صورت یکتا به دست نمی آید و برآورد پارامترها دقت پیش بینی خوبی نخواهد داشت. به همین دلیل در سال های اخیر روش هایی به نام رگرسیون جریمه دار یا روش های انقباضی مورد استفاده قرار گرفته است. مانند ریج، لاسو، لاسو گروهی و الاستیک نت که در این پایان نامه از تابع محدب لاسو استفاده شده است. لاسو به صورت نرم L1 از پارامترها تعریف می شود که ? بردار ضرایب رگرسیون و ? پارامتر جریمه است. هر چقدر مقدار ? بزرگتر باشد، یعنی جریمه ی بیشتری نسبت به ضرایب رگرسیون دارد در نتیجه متغیرهای کمتری در مدل قرار می گیرد و برعکس. معمولا دنباله ای از مقادیر ? تولید می شود، پس متغیرها برای هر مقداری از دنباله تعیین می شوند، بعد از آن یک مقدار از ? توسط اعتبارسنجی متقابل k حلقه ای انتخاب می شود و مجموعه ای متناظر از پیش بینی ها در مدل جای داده می شوند. همچنین برای نتایج شبیه سازی در این پایان نامه از معیار نظریه اطلاع و معیار اطلاع بیزی استفاده شده است و تمام این مسائل را در نرم افزار R مورد بحث و بررسی قرار میدهیم. کلیدواژه: رگرسیون وایبول، روش های جریمه دار، روش های انقباض،لاسو، معیار نظریه اطلاع، معیار اطلاع بیزی.
-
بررسی برخی از مدلهای شوک با استفاده از توزیعهای فاز -نوع
مریم مرادی 1400 -
بکارگیری الگوریتم جنگل های تصادفی با طبقه¬بندی چندکلاسی برای بهبود مدیریت ارتباط با مشتریان در صنعت بانکداری
زینب طاهری کل کشوندی 1400در مسائل دستهبندی، دادهها با توجه به وجه اشتراکی که دارند به چند دسته خاص تقسیم میشوند. دستهبندی ابزار مهمی برای تحلیل مشکلات آماری است. روشهای متعددی برای دستهبندی دادهها وجود دارد که برحسب اینکه متغیر پاسخ مشخص و یا نامشخص باشند به ترتیب به دو دسته کلی بانظارت و بدون نظارت تقسیمبندی میشوند. از جمله این روشها میتوان به روشهای کلاسیک رگرسیونی مثل رگرسیون با دادههای دودویی (لجستیک، پروبیت و...) اشاره کرد. همچنین روشهای دستهبندی براساس آموزش ماشین مثل درخت تصمیم، جنگل تصادفی و ... جایگزینهای مناسبی برای روشهای رگرسیون کلاسیک هستند. در این تحقیق ما به بررسی این روشها میپردازیم و در نهایت این روشها، برای مجموعه دادههای بانکی از یک کمپین بازاریابی تلفنی به کار برده میشود. روشهای مختلف با استفاده از معیار دقت و منحنی ROC مقایسه میگردند.
-
مقایسه برخی اندازه¬های ریسک متفاوت با استفاده از روش شبیه¬سازی
فاطمه باقری 1400درک مستقیم مفهوم ریسک مبتنی بر دو مفهوم اصلی است. یکی امکان برآمد منفی یعنی زیان و دیگری تغییرپذیری برحسب نتیجه مورد انتظار یعنی انحراف است. در ابتدا محققان در حوزه مالی و بیمه، به طور برجسته از معیارهای پراکندگی مانند واریانس استفاده می کردند، که در این حالت، آن ها روی جنبه دوم درک مفهوم ریسک متمرکز می شدند. در حالی که اخیراً با توجه به اهمیت ریسک های دمی از اندازه هایی مانند ارزش در معرض ریسک (خطر) و نقصان (کسری) مورد انتظار استفاده می شود؛ که تاکید ویژه ای روی جنبه اول درک مفهوم ریسک دارند. در این پایان نامه، اندازه ریسکی بررسی می شود که هر دو جنبه زیان و تغییرپذیری را در کمی سازی ریسک در نظر می گیرد. این معیار، به اندازه زیان-انحراف شهرت دارد؛ به طوری که در حالات خاصی تبدیل به اندازه ریسک مبتنی بر زیان و یا اندازه انحراف می شود. در ادامه شرایطی که این اندازه ریسک ترکیبی، منسجم، محدب و یا منسجم هم یکنوا است، بررسی می شود. سپس یازده اندازه ریسک مشهوری که حالات خاصی از اندازه های کلی زیان-انحراف هستند، در نظر گرفته می شوند. در پایان به کمک داده های شبیه سازی شده و داده های واقعی، مقادیر تجربی اندازه های ریسک زیان، انحراف و زیان-انحراف محاسبه و مقایسه می شوند
-
تقریب تابع درستنمایی در محاسبه ی بیزی تقریبی
میترا هواسی 1399 -
مقایسه¬ی روش¬های رده¬بندی دودویی برای تشخیص نوع توده¬ی سرطانی (بدخیم یا خوشخیم) براساس داده¬های سرطان سینه
محسن حق دوست 1399هدف ما در این پایاننامه، مقایسهی پنج روش ردهبندی، بیز ساده، ماشین بردار پشتیبان، شبکهی عصبی مصنوعی، رگرسیون لجستیک و جنگل تصادفی بر روی دادههای سرطان سینه برای تشخیص نوع تومور سرطانی خوشخیم و بدخیم میباشد تا بهترین روش را با توجه به معیارهای ارزیابی دودویی، صحت، دقت، حساسیت، تشخیص، امتیازF1 و ضریب همبستگی ماتیو انتخاب کنیم. معیار اصلی مقایسه دقت مدل میباشد سپس سایر معیارها مورد توجه قرار خواهد گرفت.
-
روشهای نمونهگیری جهت تحلیل مه داده در دادهکاوی
زینب نظری 1399چکیده حجم زیاد دادهها باعث افزایش زمان محاسبات میشود، بنابراین الگوریتمهای دادهکاوی نمیتوانند از همهی دادهها در تمام طول زمان اجرای برنامه استفاده کنند. لذا به کارگیری روشهای نمونهگیری در مه داده راه کار مناسبی است. در بررسی آماری جوامع فضایی دو یا چندبعدی، کسب اطلاعات از همهی نواحی مورد مطالعه اهمیت زیادی دارد. از آنجا که بررسی تمامی دادهها مشکل و یا غیر ممکن است، باید اطلاعات لازم را از طریق بررسی بخشی دادهها را به عنوان نمونه به دست آورد. در این حالت میتوان با استفاده از روش $LPM2-kd tree$ نمونهی مناسب را انتخاب نمود. همچنین در تحلیل مه داده، اریبی انتخاب در مه داده بسیار مهم است، به همین علت روشی را برای کاهش اریبی انتخاب معرفی میکنیم. در این روش با استفاده از روش نمونهگیری از نقاط مهم، روش نمونهگیری وارونی که توسط کیم (2019) ارائه شده است، معرفی خواهیم کرد. که خواص این روشهای نمونهگیری در محاسبات عددی بر روی دو جامعهی واقعی مورد بررسی قرار گرفته است. کلمات کلیدی: اریبی انتخاب، دادهکاوی، خوشهبندی، کشف دانش، نمونهگیری با احتمال نابرابر، نمونهگیری وارون، مه داده
-
برآورد و تحلیل تابع هزینه آب شرب شهری در شرکت آب و فاضلاب استان همدان در سال 1398
راضیه کرمی 1399 -
تعیین اندازه نمونه در بررسیهای نمونهای پیچیده
وحید لنجاب پور 1398 -
روش های شبیه سازی فرآیند های دیریکله پواسون دو پارامتری و گاوس معکوس نرمال شده
سیده شیوا موسوی 1398یکی از مباحث مهم در مبحث برآوردها استخراج نمونه از فرایند هایی است که شکل پیچیده ای دارند، ازجمله این فرایند ها می توان به فرایند دیریکله-پواسون دو پارامتری و گاوس-معکوس نرمال شده اشاره کرد. در این پایان نامه هدف ارائه روش هایی برای نمونه گیری تقریب هایی از این نوع فرایند ها می باشد که از سادگی و کارایی خوبی برخوردار هستند. به همین دلیل از روش شکست چوب که برای اهداف شبیه سازی کارآمد است استفاده می شود. سپس تقریب های به دست آمده از دو فرایند دیریکله-پواسون دو پارامتری و گاوس-معکوس نرمال شده را با هم مقایسه می کنیم. و در پایان الگوریتم های ساده و در عین حال کارآمد را با شبیه سازی تقریب هایی از دو فرایند ذکر شده مورد بررسی قرار داده و اجرا می کنیم.

