شناسایی گوینده در شرایط نوفه ای با استفاده از ویژگی های فیلتربانک گاماتون و تبدیل کسینوسی گسسته و قطبی

سال انتشار: 1399
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 54

فایل این مقاله در 12 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

JR_CSJI-5-2_005

تاریخ نمایه سازی: 14 بهمن 1402

چکیده مقاله:

احراز هویت افراد بر مبنای صوت یکی از موارد مهم پژوهشی در دهه اخیر بوده است. این موضوع در حوزه هایی مانند ردیابی گویندگان، ورود امن گویندگان به دستگاه های مختلف و سایر سامانه های مربوط به پردازش گفتار، کاربرد فراوانی دارد. هدف از یک سیستم احراز هویت گوینده، تشخیص هویت افراد با استفاده از سیگنال صدای انسان می باشد. یکی از چالش های مهم موجود در حوزه احراز هویت گوینده، افزایش کارایی این سیستم در شرایط نوفه ای شدید می باشد. در این پژوهش با استفاده از فیلتربانک گاماتون و ارائه ویژگی جدیدی از تبدیل های کسینوسی گسسته و قطبی، روشی برای افزایش کارایی سیستم احراز هویت گوینده در شرایط نوفه ای شدید طراحی شده است. مقایسه نتایج روش پیشنهادی با روش های موجود نشان می دهد، روش پیشنهادی توانسته است با دقت بیشتری، هویت افراد را در شرایط نوفه ای مختلف شناسایی کند. روش پیشنهادی به صورت کمی در محیط نوفه سفید با نسبت سیگنال به نوفه ۲۰، ۱۰ و ۵ به ترتیب ۸۹، ۷۷ و ۶۱ درصد دقت و در محیط نوفه توامان خیابانی و سفید با نسبت سیگنال به اختلال ۲۰، ۱۰ و ۵ به ترتیب ۸۷، ۷۱ و ۵۱ درصد دقت داشته است. همچنین، دقت روش پیشنهادی در مقایسه با روش جدید ضرایب کپسترال فرکانس گاماتون بهبود یافته، به طور متوسط ۴درصد، افزایش یافته است.

کلیدواژه ها:

نویسندگان

فرنوش عارفی

کارشناس ارشد فناوری اطلاعات، پژوهشکدە فضای مجازی - دانشگاه شهید بهشتی - تهران - ایران

بهزاد سعیدی

کارشناس ارشد مهندسی برق، دانشکده مهندسی برق - دانشگاه شهید بهشتی - تهران - ایران