تحلیل عملکرد الگوریتمهای انتخاب ویژگی در مدلهای یادگیری جمعی بهمنظور کشف تقلب در داده های مالی

سال انتشار: 1402
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 50

فایل این مقاله در 9 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ICTBC07_015

تاریخ نمایه سازی: 26 اسفند 1402

چکیده مقاله:

امروزه تقلب در داده های مالی به یک نگرانی جدی در سطح جهانی تبدیل شدهاست. کشف به هنگام تقلب میتواند از وقوع تقلبات بیشتر و خسارات مالی جلوگیری کند. مرحله انتخاب ویژگیها، مهمترین مرحله در مسائل دادهکاوی برای کاهش ویژگیهای نامربوط از مجموعه داده اصلی است که میتواند » سرعت ردهبندها« را به دلیل کاهش اندازه مجموعه ویژگیها و »عملکرد مدلها« را به دلیل جلوگیری از بیشبرازش بهبود بخشد. ما در این مقاله به تحلیل عملکرد الگوریتمهای انتخاب ویژگی از ۴ دسته »آماری «، » مدلمحور «، »مبتنی بر درخت« و »تفسیرپذیری« بر روی مدلهای یادگیری جمعی میپردازیم و عملکرد آنها را بر روی ترکیبات مختلف از مدلهای منتخب در کارهای پیشین مورد ارزیابی قرار میدهیم. نتایج تجربی نشان میدهد الگوریتم تفسیرپذیری SHAP براساس معیارهای Precision و AUC-PR و الگوریتم درختی XGBoost براساس معیارهای F۱ و Recall بهترین عملکرد را در بین سایر الگوریتمها داشته و مجموعه ویژگیهای بهتری ارائه مینماید.

نویسندگان

سجاد علیزاده فرد

کارشناسی ارشد مهندسی کامپیوتر، دانشگاه علم و صنعت ایران، تهران