الگوریتمی جدید برای طبقه بندی مستندات، مبتنی بر وزن دهی به ویژگی ها و فایل ها

سال انتشار: 1394
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 387

فایل این مقاله در 10 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

SASTECH10_053

تاریخ نمایه سازی: 29 اردیبهشت 1398

چکیده مقاله:

با توجه به حجم روزافزون اطلاعات در دنیای کنونی، نیاز به ابزارهای قدرتمند جدید برای تبدیل داده به دانش مفید افزایش یافته است. یکی از روش های حیاتی کنترل و مدیریت داده ها، طبقه بندی متون میباشد. در این مقاله الگوریتمی برای طبقه بندی مستندات ارایه شده است، که دارای قابلیت هایی همچون کنترل کیفیت دسته بندی ایجاد شده براساس بازخورد معیار ارزیابی F؛ وزندهی به ویژگی ها با روش وزن دهی مبتنی بر طبقات و همچنین اختصاص دادن وزن به هر فایل در تمامی طبقات و انتقال فایل به طبقه ای که وزن بیشتری در آن طبقه دارد؛ میباشد. این روند باعث میشود حذف کلمات زاید به دلیل بهبود در کلاس ها با کیفیت بالاتری انجام شود. درنهایت الگوریتم را مورد ارزیابی قرار میدهیم؛ به این صورت که ابتدا تاثیر طبقه بندی تصادفی اولیه ی متفاوت، سپس تاثیر روش های مختلف وزندهیTFIDF،TFRF،TFCRF و روش وزندهی پیشنهادی را بر روی خروجی الگوریتم طبقه بندی پیشنهادی مورد بررسی قرار میدهیم. در پایان، الگوریتم پیشنهادی با سایر الگوریتم ها مقایسه میشود. نتایج نشان میدهد، تمامی موارد ذکر شده به صورت تجمعی باعث افزایش کیفیت و دقت در طبقه بندی میشود.

کلیدواژه ها:

نویسندگان

محبوبه ضیایی

کارشناسی ارشد هوش مصنوعی ، بخش مهندسی کامپیوتر،دانشگاه شهید باهنر کرمان

علی اکبر نیک نفس

استادیار ،بخش مهندسی کامپیوتر،دانشگاه شهید باهنر کرمان