مروری بر تکنیک های تشخیص متن در صحنه

سال انتشار: 1402
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 40

فایل این مقاله در 9 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ICTBC07_057

تاریخ نمایه سازی: 26 اسفند 1402

چکیده مقاله:

تشخیص متن در تصویر صحنه، به دلیل وجود طیف گسترده ای از کاربردها و چالش ها، به یکی از موضوعات تحقیقاتی بسیار فعال در بینایی ماشین و هوش مصنوعی تبدیل شده است. تحقیقات انجام شده میتوانند در کاربردهای مختلف از هدایت افراد کم بینا گرفته تا درک معنایی از صحنه های طبیعی، مورد استفاده قرار گیرند. این مقاله به بررسی دقیق و عمیق پیشرفت های اخیر در موضوع تشخیص متن در تصویر صحنه میپردازد و برخی از روشهایی که ارائه شدهاند را بیان می کند. لازم به ذکر است اکثر روشهای پیشرفتهی جدید برای تشخیص متن بر اساس یادگیری عمیق عمل میکنند به همین دلیل بخشی از این مطالعه نیز به مرور این روش ها می پردازد. همچنین مقالات زیادی وجود دارد که بر روشهای سنتی برای تشخیص متن در تصویر تمرکز دارند. در این پژوهش برخی از روشهای تشخیص متن در تصویربه منظور استخراج ویژگی های دیداری و معنایی مناسب از تصاویر، از شبکه های عصبی کانولوشنال عمیق،تشخیص متن چند مقیاسی به طور خلاصه بیان و ارزیابی میگردد. نهایتا با توجه به نتایج به دست آمده، نتیجه گیری انجام میشود.

کلیدواژه ها:

پردازش تصویر ، تشخیص متن صحنه ، یادگیری عمیق ، شبکه های عصبی کانولوشن عمیق

نویسندگان

مجید جان نثاری لادانی

عضو هیات،علمی گروه فناوری اطلاعات و ارتباطات،دانشگاه فنی و حرفه ای

مریم کریمی

دانشجوی کارشناسی مهندسی حرفه ای نرم افزار، گروه مهندسی کامپیوتر،دانشگاه فنی و حرفه ای