از دیرباز تشخیص و بازشناسی صحبت به عنوان اولین وسیله ارتباطی بین انسان ها از اهمیت بسیاری
برخوردار بوده است. تاکنون تکنیکهای بازشناسی صحبت با استفاده از پردازش صوت با تنوع بسیار و با موفقیت
نسبی بکار گرفته شدهاند. اما وجود نویز در برخی شرایط، عامل اصلی بروز اشتباهات اساسی در تشخیص بوده
است که در این گونه موارد استفاده از پردازش تصویر و به ویژه بررسی شکل لبها و حرکت آنها میتواند ب رای
ارتقاء نتایج مورد استفاده قرار گیرد. فرآیند لبخوانی و به عبارت دیگر تشخیص دیداری گفتار دو مرحله اصلی
قابل بررسی دارد. مرحله اول جداسازی ناحیه دهان و بطور کلی استخراج مشخصه های دیداری و مرحله دوم
دستهبندی و تشخیص کلمات میباشد. در این پروژه برای استخراج مشخصه های دیداری دو روش استفاده
و در روش دوم از روش مبتنی بر تبدیل موجک بهره جسته ایم . در SFCM نمودهایم. در روش اول از الگوریتم
مرحله بعد توسط پارامترهای تعریف شده، یکسری ویژگی مربوط به تصاویر لب را استخراج می نماییم . در آخر
توسط شبکه عصبی به دستهبندی ویژگیها و تشخیص واکهها میپردازیم.
مقدمه
کارایی ضعیف سیستمهای تشخیص صوت و سیستمهای تصدیق گوینده در محیطهای نویزی سبب شد تا

 

موضوعات: بدون موضوع
[یکشنبه 1398-07-14] [ 05:02:00 ق.ظ ]