تکه هایی از متن به عنوان نمونه :
چکیده
پارامترهای کدکردن براساس پیشبینی خطی یا ضرایب LPC بطور گسترده در فشرده سازی سیگنال گفتار مورد استفاده قرار میگیرد. از سوی دیگر، شبکه های عصبی مصنوعی به عنوان سیستم هوشمندی هستند که میتوانند در سیستمهای خطی و غیرخطی مانند کدینگ گفتار و تصویر بکار روند. در این تحقیق دو نمونه از شبکه های عصبی مبتنی بر تکنیک چندی سازی برداری به نامهای شبکه کوهنن و ARTMAP معرفی میشوند، که از آنها برای دسته بندی بردارهای حاصل از پردازش سیگنال گفتار ورودی استفاده میشود، در این تکنیک با بهره گرفتن از زوجهای خط طیفی (LSP) بعنوان یک پارامتر قابل جایگزینی بجای ضرایب LPC میتوان نرخ بیت را کاهش داد در حالیکه کیفیت گفتار سنتز شده تقریباً حفظ میشود و این بدلیل این است که وقتی از پارامترهای LSP استفاده میشود، فرکانس های فرمنت (Formant) خوبی بدست می آید که مشابه فرکانسهای اصلی سیگنال گفتار میباشد. با این روش، نرخ بیت با توجه به واکدار یا بی واک بودن قاب گفتار مربوطه بین 2 تا 33 درصد کاهش می یابد. همچنین در این تحقیق شبکه های عصبی کوهنن و نظریه تشدید تطبیقی به
عنوان دو شبکه عصبی بدون سرپرست و روش چندی سازی بردارهای یادگیری به عنوان یک شبکه عصبی با سرپرست معرفی و نتایج حاصل از هریک با هم مقایسه میشوند. نمونه های صوتی بکار رفته نیز به زبان فارسی میباشند.
مقدمهاین مطلب را هم بخوانید :
بایگانیهای آموزشی - مرجع مقالات
هایی که توسط مؤلف برای زبان فارسی تجربه شده اند، قابل ذکر است. برای کدکننده های گفتار نیز شبکه های عصبی در حوزه کاری مورد استفاده قرار گرفته اند: پیش بینی کننده های نورونی برای بهبود کیفیت و کاهش پیچیدگی محاسباتی در کدکننده ها. در این تحقیق یک روش جدید برای کد کردن گفتار با نرخ بیت کم معرفی میشود که از پارامترهای LSP برای استخراج و نگاشت ویژگیهای سیگنال گفتار با بهره گرفتن از نوعی شبکه عصبی مصنوعی بنام شبکه خود سازمانده (SOM) استفاده میکند. استفاده از این روش نرخ بیت گفتار بازسازی شده را کاهش می دهد، در حالی که کیفیت سیگنال تفاوت آشکاری با گفتار اصلی ندارد. برای اندازه گیری کیفیت گفتار سنتز شده از معیار میانگین امتیاز آرا داده شده (MOS) استفاده می شود.