تکه هایی از متن به عنوان نمونه :
چکیده
علیرغم تاثیر مثبت حالت گفتار در انتقال مفهوم درست جمله به شنونده، این تغییر به سبب تحول بنیادینی که در پارامترهای گفتار ایجاد می نماید، موجب افت شدید نرخ بازشناسی گفتار با مدل های عادی می گردد. به منظور رشد نرخ بازشناسی گفتار فارسی با حالت، از چند سال گذشته تحقیقاتی آغاز شده و در نخستین گام با افزودن فرمنت های اول تا سوم – یا شیب آنها – به انتهای بردار ویژگی نرخ بازشناسی گفتار کمی بهبود یافته است.
در این گزارش ابتدا با بهره گرفتن از شبکه های عصبی مصنوعی، فرمنت های گفتار با حالت را به فرمنت گفتار عادی به هنجار نموده و با اضافه نمودن فرمنت به هنجار شده به انتهای بردار ویژگی، رشد نرخ بازشناسی مشاهده شده است. در ادامه با بهره گرفتن از نسبت فرمنت های گفتار با حالت به گفتار عادی در تکنیک های پیچش فرکانسی و به هنجارسازی طول لوله صوتی – به هنجارسازی گوینده – به صورت مستقیم، بلوک های سیستم بازشناسی گفتار را تغییر داده و با استخراج ضرایب جدید کپسترال، درصد جملات
صحیح شناخته شده افزایش یافته است.
مقدمهاین مطلب را هم بخوانید :
۱۰ نکتهای که بهتر است قبل از تجربه Red Dead Redemption 2 یاد بگیرید
کنند. در این رویکرد، گفتار به کمک تعدادی واحد آوایی (مانند کلمه، هجا، سه واجی یا واج) مدل می شود و در بازشناسی نیز از تشخیص این واحدها و کنار هم قرار دادن آنها، متن متناسب با گفتار تشخیص داده می شود. سیستم های بازشناسی گفتار با این رویکرد دارای دو فاز آموزش و آزمون می باشند که در فاز آموزش الگوهای مربوط به هر کلاس که همان واحدهای آوایی هستند، با بهره گرفتن از روش هایی مدلسازی می شوند. مقایسه گفتار ورودی با الگوهای آموزش داده شده جهت تشخیص واحدهای آوایی موجود در گفتار ورودی، در فاز آزمون انجام می گردد. در فاز آموزش معمولا دو نوع مدل آوایی و زبانی آماده می شود که در فاز آزمون از آنها استفاده شود. استخراج مدل های آوایی از روی دادگان گفتاری با بهره گرفتن از روش های مختلفی امکانپذیر است که از مهمترین آنها می توان روش های مدل پیچش زمانی پویا یا DTW (که در گوشی های تلفن همراه برای شماره گیری صوتی با بیان نام فرد به کار می رود)، شبکه عصبی مصنوعی و مدل مخفی مارکوف (HMM) را نام برد. از میان این روش ها، مدل مخفی مارکوف به نسبت سایرین موفق تر عمل کرده و عمده سیستم های کاربردی امروزی از آن استفاده می نمایند.
یکی از ویژگی های مهم گفتار، حالت گفتار فرد می باشد. به عبارت دیگر انتقال حالت درونی فرد به شنونده در مکالمات اهمیت بسزایی دارد زیرا اگر حالت بیان یک جمله تغییر کند، آن عبارت می تواند مفهوم متفاوت و یا حتی متناقض پیدا کند. اعمال حالت و یا تاکید به گفتار موجب تغییرات اساسی در پارامترهای استخراج شده از گفتار گردیده و بازشناسی گفتار با حالت را با چالشی بزرگ مواجه نموده و نرخ بازشناسی را کاهش می دهد.