مروری بر پرسش و پاسخ جهت استخراج کلمات کلیدی ظاهر نشده و استفاده همزمان از آن با کلمات کلیدی ظاهر شده در متن

سال انتشار: 1399
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 452

فایل این مقاله در 17 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CMECE02_002

تاریخ نمایه سازی: 15 مهر 1399

چکیده مقاله:

کلمات کلیدی شامل اطلاعات اصلی است که به افراد کمک می کند تا محتوای متن را درک کنند . استخراج چنین کلماتی، شناسایی خودکار اصطلاحات مهمی است که عناوین اصلی یک سند خاص داده شده را بطور دقیق و مختصر ضبط می کند که مسلماً، این فرآیند یک کار غیر بدیهی است که به تکنیک های پردازش زبان طبیعی زیادی احتیاج دارد. با توجه به اهمیت و ارتباط استخراج کلمات کلیدی با سایر کارهای NLP ، روش های مختلفی برای این فرآیند مطرح شده است. رویکردهای موجود به طور معمول از الگوریتم های یادگیری ماشین استفاده می کنند و انواع ویژگی ها را برای آموزش مدل های خود استخراج می نمایند و به بازدهی عالی می رسند . این رویکردها به طور کلی به سه دسته ی یادگیری با نظارت، بدون نظارت و رویکردهای مبتنی بر یادگیری عمیق تقسیم می شوند . در این مقاله به مرور برخی از کارهای صورت گرفته در دو حوزه ی استخراج کلمات کلیدی و پرسش و پاسخ پرداخته شده است و برای کارهای گفته شده نیز ارزیابی هایی صورت گرفته شده است. نتایج نیز حاکی است که در قسمت پرسش و پاسخ شبکه های LSTM با توجه به ماهیت آن ها برای متن های طولانی بهتر هستند در حالی که شبکه های CNN برای بدست آوردن نمره مطابقت در سطوح مختلف یک سند (سطح کلمه، سطح عبارت، سطح جمله) مناسب می باشند

کلیدواژه ها:

استخراج کلمات کلیدی ظاهر شده ، استخراج کلمات کلیدی ظاهر نشده ، حوزه پرسش و پاسخ ، حوزه NLP ، یادگیری عمیق

نویسندگان

مصطفی رمضانیان

گروه مهندسی کامپیوتر، واحد نیشابور، دانشگاه آزاد اسلامی، نیشابور، ایران

مهرداد جلالی

دانشیار گروه مهندسی کامپیوتر، واحد مشهد، دانشگاه آزاد اسلامی، مشهد، ایران

رضا قائمی

استادیار گروه مهندسی کامپیوتر، واحد قوچان، دانشگاه آزاد اسلامی، قوچان، ایران