روشی جدید برای بهسازی سیگنال های صوتی با استفاده از آنالیز lpc در روش فیلتر کالمن

Σχετικά έγγραφα
محاسبه ی برآیند بردارها به روش تحلیلی

روش محاسبه ی توان منابع جریان و منابع ولتاژ

ﯽﺳﻮﻃ ﺮﯿﺼﻧ ﻪﺟاﻮﺧ ﯽﺘﻌﻨﺻ هﺎﮕﺸﻧاد

آزمون مقایسه میانگین های دو جامعه )نمونه های بزرگ(

تخمین با معیار مربع خطا: حالت صفر: X: مکان هواپیما بدون مشاهده X را تخمین بزنیم. بهترین تخمین مقداری است که متوسط مربع خطا مینیمم باشد:

جلسه ی ۱۰: الگوریتم مرتب سازی سریع

تصاویر استریوگرافی.

مدار معادل تونن و نورتن

مثال( مساله الپالس در ناحیه داده شده را حل کنید. u(x,0)=f(x) f(x) حل: به کمک جداسازی متغیرها: ثابت = k. u(x,y)=x(x)y(y) X"Y=-XY" X" X" kx = 0

آزمایش 1: پاسخ فرکانسی تقویتکننده امیتر مشترك

آزمایش 8: تقویت کننده عملیاتی 2

جلسه ی ۲۴: ماشین تورینگ

مفاهیم ولتاژ افت ولتاژ و اختالف پتانسیل

به نام خدا. الف( توضیح دهید چرا از این تکنیک استفاده میشود چرا تحلیل را روی کل سیگنال x[n] انجام نمیدهیم

فصل چهارم : مولتی ویبراتورهای ترانزیستوری مقدمه: فیدبک مثبت

همبستگی و رگرسیون در این مبحث هدف بررسی وجود یک رابطه بین دو یا چند متغیر می باشد لذا هدف اصلی این است که آیا بین

جلسه ی ۴: تحلیل مجانبی الگوریتم ها

تحلیل مدار به روش جریان حلقه

جلسه 9 1 مدل جعبه-سیاه یا جستاري. 2 الگوریتم جستجوي Grover 1.2 مسا له 2.2 مقدمات محاسبات کوانتمی (22671) ترم بهار

جلسه ی ۳: نزدیک ترین زوج نقاط

مسائل. 2 = (20)2 (1.96) 2 (5) 2 = 61.5 بنابراین اندازه ی نمونه الزم باید حداقل 62=n باشد.

Angle Resolved Photoemission Spectroscopy (ARPES)

تلفات خط انتقال ابررسی یک شبکة قدرت با 2 به شبکة شکل زیر توجه کنید. ژنراتور فرضیات شبکه: میباشد. تلفات خط انتقال با مربع توان انتقالی متناسب

جلسه 3 ابتدا نکته اي در مورد عمل توابع بر روي ماتریس ها گفته می شود و در ادامه ي این جلسه اصول مکانیک کوانتمی بیان. d 1. i=0. i=0. λ 2 i v i v i.

تئوری جامع ماشین بخش سوم جهت سادگی بحث یک ماشین سنکرون دو قطبی از نوع قطب برجسته مطالعه میشود.

تمرینات درس ریاض عموم ٢. r(t) = (a cos t, b sin t), ٠ t ٢π. cos ٢ t sin tdt = ka۴. x = ١ ka ۴. m ٣ = ٢a. κds باشد. حاصل x٢

جلسه ی ۵: حل روابط بازگشتی

Beta Coefficient نویسنده : محمد حق وردی

آموزش SPSS مقدماتی و پیشرفته مدیریت آمار و فناوری اطالعات -

جلسه 14 را نیز تعریف کرد. عملگري که به دنبال آن هستیم باید ماتریس چگالی مربوط به یک توزیع را به ماتریس چگالی مربوط به توزیع حاشیه اي آن ببرد.

بسم اهلل الرحمن الرحیم آزمایشگاه فیزیک )2( shimiomd

هدف از این آزمایش آشنایی با رفتار فرکانسی مدارهاي مرتبه اول نحوه تأثیر مقادیر عناصر در این رفتار مشاهده پاسخ دامنه

فصل دهم: همبستگی و رگرسیون

جلسه 12 به صورت دنباله اي از,0 1 نمایش داده شده اند در حین محاسبه ممکن است با خطا مواجه شده و یکی از بیت هاي آن. p 1

هو الحق دانشکده ي مهندسی کامپیوتر جلسه هفتم

قاعده زنجیره ای برای مشتقات جزي ی (حالت اول) :

1) { } 6) {, } {{, }} 2) {{ }} 7 ) { } 3) { } { } 8) { } 4) {{, }} 9) { } { }

چکیده مقدمه کلید واژه ها:

6- روش های گرادیان مبنا< سر فصل مطالب

فیلتر کالمن Kalman Filter

کنترل تطبیقی غیر مستقیم مبتنی بر تخصیص قطب با مرتبه کسری

دبیرستان غیر دولتی موحد


جلسه 15 1 اثر و اثر جزي ی نظریه ي اطلاعات کوانتومی 1 ترم پاي یز جدایی پذیر باشد یعنی:

جلسه 22 1 نامساویهایی در مورد اثر ماتریس ها تي وري اطلاعات کوانتومی ترم پاییز

نویسنده: محمدرضا تیموری محمد نصری مدرس: دکتر پرورش خالصۀ موضوع درس سیستم های مینیمم فاز: به نام خدا

سپیده محمدی مهدی دولتشاهی گروه الکترونیک موسسه آموزش عالی جهاد دانشگاهی استان اصفهان استاد یار دانشکده مهندسی برق دانشگاه آزاد اسالمی واحد نجف آباد

تعیین محل قرار گیری رله ها در شبکه های سلولی چندگانه تقسیم کد

Spacecraft thermal control handbook. Space mission analysis and design. Cubesat, Thermal control system

دانشکده ی علوم ریاضی جلسه ی ۵: چند مثال

شبکه های عصبی در کنترل

مقایسه کارایی آنالیز مولفه های اصلی و تبدیل کسینوسی گسسته در شناسایی چهره با استفاده از تبدیل موجک و ماشین بردار پشتیبان

به نام خدا. Sparse Coding ستاره فرامرزپور

راهنمای کاربری موتور بنزینی )سیکل اتو(

سايت ويژه رياضيات درسنامه ها و جزوه هاي دروس رياضيات

نمونه برداری از سیگنالهای زمان پیوسته

جلسه 2 جهت تعریف یک فضاي برداري نیازمند یک میدان 2 هستیم. یک میدان مجموعه اي از اعداد یا اسکالر ها به همراه اعمال

پروژه یازدهم: ماشین هاي بردار پشتیبان

تحلیل الگوریتم پیدا کردن ماکزیمم

جلسه 16 نظریه اطلاعات کوانتمی 1 ترم پاییز

هندسه تحلیلی بردارها در فضای R

مارکوف 1.مقدمه: سید مهدی صفوی محمد میکاییلی محمد پویان چکیده ما با مطالعه مدل مخفی میدان تصادفی مارکوف از الگوریتم EM

تابع هزینه حداقل میانگین مربعات توأم با حداقل واریانس خطا

ویرایشسال 95 شیمیمعدنی تقارن رضافالحتی

معادلهی مشخصه(کمکی) آن است. در اینجا سه وضعیت متفاوت برای ریشههای معادله مشخصه رخ میدهد:

شاخصهای پراکندگی دامنهی تغییرات:

سلسله مزاتب سبان مقدمه فصل : زبان های فارغ از متن زبان های منظم

عنوان: رمزگذاري جستجوپذیر متقارن پویا

یدنب هشوخ یاه متیروگلا

فصل سوم .)MAC( و الگوریتم کنترل مدل )کنترل کننده مدل الگوریتمی-پاسخ ضربه-( )DMC(

طراحی و تعیین استراتژی بهره برداری از سیستم ترکیبی توربین بادی-فتوولتاییک بر مبنای کنترل اولیه و ثانویه به منظور بهبود مشخصههای پایداری ریزشبکه

1 دایره فصل او ل کاربردهای بسیاری داشته است. یک قضیۀ بنیادی در هندسه موسوم با محیط ثابت دایره دارای بیشترین مساحت است. این موضوع در طراحی

فصل چهارم : مولتی ویبراتورهای ترانزیستوری مقدمه: فیدبک مثبت

مکانيک جامدات ارائه و تحليل روش مناسب جهت افزایش استحکام اتصاالت چسبي در حالت حجم چسب یکسان

فهرست مطالب جزوه ی فصل اول مدارهای الکتریکی مفاهیم ولتاژ افت ولتاژ و اختالف پتانسیل تحلیل مدار به روش جریان حلقه... 22

1- مقدمه ای بر شبیه سازی< سر فصل مطالب

جلسه ی ۱۸: درهم سازی سرتاسری - درخت جست و جوی دودویی

فصل 5 :اصل گسترش و اعداد فازی

جلسه 28. فرض کنید که m نسخه مستقل یک حالت محض دلخواه

باشند و c عددی ثابت باشد آنگاه تابع های زیر نیز در a پیوسته اند. به شرطی که g(a) 0 f g

بررسی پایداری نیروگاه بادی در بازه های متفاوت زمانی وقوع خطا

ارزیابی بهره وری متقاطع DEA بر پایه بهبود پارتو

در اين آزمايش ابتدا راهاندازي موتور القايي روتور سيمپيچي شده سه فاز با مقاومتهاي روتور مختلف صورت گرفته و س سپ مشخصه گشتاور سرعت آن رسم ميشود.

اصول انتخاب موتور با مفاهیم بسیار ساده شروع و با نکات کاربردی به پایان می رسد که این خود به درک و همراهی خواننده کمک بسیاری می کند.

محاسبات کوانتمی 1 علم ساخت و استفاده از کامپیوتري است که بر پایه ي اصول مکانیک کوانتم قرار گرفته است.

تئوری رفتار مصرف کننده : می گیریم. فرض اول: فرض دوم: فرض سوم: فرض چهارم: برای بیان تئوری رفتار مصرف کننده ابتدا چهار فرض زیر را در نظر

Econometrics.blog.ir

فصل پنجم زبان های فارغ از متن

حفاظت مقایسه فاز خطوط انتقال جبرانشده سري.

جلسه 2 1 فضاي برداري محاسبات کوانتمی (22671) ترم بهار

فصل چهارم تعیین موقعیت و امتدادهای مبنا

طرح یافتن مکان خطا در خطوط انتقال چندترمینالی با استفاده از اندازه گیریهای ناهمگام )آسنکرون(

تخمین نقطه تغییر در ماتریس کواریانس فرآیند نرمال چند متغیره با استفاده از شبکه عصبی

و شبیه سازی فرآیندهای تصادفی با رویکردی کاربردی در ریاضیات مالی

فعالیت = ) ( )10 6 ( 8 = )-4( 3 * )-5( 3 = ) ( ) ( )-36( = m n m+ m n. m m m. m n mn

هدف از انجام این آزمایش بررسی رفتار انواع حالتهاي گذراي مدارهاي مرتبه دومRLC اندازهگيري پارامترهاي مختلف معادله

Top Down Parsing LL(1) Narges S. Bathaeian

Combined Test غربالگری پیش از تولد جهت شناسایی ناهنجاری های شایع مادرزادی سواالت و جوابهای مربوط به خانمهایی که میخواهند این آزمایش را انجام دهند.

فصل سوم جریان های الکتریکی و مدارهای جریان مستقیم جریان الکتریکی

دانشکده علوم ریاضی دانشگاه گیلان آزمون پایان ترم درس: هندسه منیفلد 1 باشد. دهید.f (gx) = (gof 1 )f X شده باشند سوالات بخش میان ترم

Transcript:

روشی جدید برای بهسازی سیگنال های صوتی با استفاده از آنالیز lc در روش فیلتر کالمن بتول گرایلی ملک خیلی محمدرضا کرمی مالئی 2 - کارشناس ارشد مهندسی برق 2- دانشیار دانشکده مهندسی برق و کامپیوتر دانشگاه صنعتی نوشیروانی بابل b.gerayli@stu.nit.ac.ir ارائه دهنده: بتول گرايلي ملك خيلي خالصه در این مقاله روشی جدید برای بهسازی سیگنال های صوتی ارائه شده است. این روش که مبتنی بر روش فیلتر کالمن می باشد از ضرایب پیشگویی )LPC( برای تخمین و استخراج نویز استفاده می کند. سپس از این نویز برای تخمین پارامتر های فیلتر کالمن استفاده گردیده است. در حالی خطی که در روش های قبلی از قسمت های سكوت گفتار )غیرگفتاری( برای تخمین نویز صوتی به کار گرفته می شد. در ادامه به مقایسه روش های پیشنهادی و روش موجود پرداخته و مشاهده گردید که روش پیشنهادی به میزان چشمگیری معیار ارزیابی ادراکی کیفی گفتار )PESQ( 2 سیگنال )MOS( هم استفاده شده است که نتیجه آزمایش شنوایی نیز آغشته به نویز را بهبود بخشیده است. همچنین در این مقاله از معیار آزمایش شنوایی 3 بیانگر این نتایج هستند. واژه های کلیدی: بهسازی سیگنال های صوتی فیلتر کالمن آنالیز LPC. مقدمه و] کاهش و یا حذف نویز یكی از مباحث مهم در سیستم پردازش سیگنال های صوتی مانند سیستم های ارتباطی کدینگ سیگنال های صوتی و بازشناسی گفتار می باشد به همین دلیل روش های متعددی برای کاهش میزان نویز در سیگنال های صوتی ارائه شده است. از این میان می توان به روش های مبتنی بر فیلتر کالمن [,2,3,4] تفریق طیفی[ 5 ] فیلتر وینر[ 6 در روش های مبتنی بر فیلتر کالمن سه فرض ذیل برقرار می باشد: نویز و سیگنال جمع شونده باشند. نویز و سیگنال ناهمبسته باشند. یک کانال در دسترس باشد. تبدیل موجک [7] اشاره نمود. در میان روش های تک کاناله بهسازی گفتار فیلتر کالمن یكی از موثرترین آنها می باشد. در این روش عمدتا سیگنال گفتار به صورت یک فرایند AR شناخته می شود و عملیات حذف نویز در دو مرحله صورت می گیرد: در مرحله اول واریانس نویز و پارامترهای گفتار تخمین زده شده و در مرحله دوم با استفاده از فیلتر کالمن سیگنال گفتار تخمین زده می شود. روش های مختلف فیلتر کالمن در تخمین پارامترهای گفتار و چگونگی Linear redictive coefficient 2 Percetual Evaluation of Seech Qualit 3 Mean Oinion Score

اعمال الگوریتم کالمن باهم تفاوت دارند []. در برخی از روش ها پارامترهای گفتار را از روی گفتار بدون نویز تخمین زده و آن را به فیلتر کالمن اعمال می کنند [2]. در حالی که در سایر روش ها این پارامترها از روی گفتار نویزی استخراج شده و به عنوان تخمین پارامترهای گفتار به کار می روند. در این مقاله ابتدا روش فیلتر کالمن را شرح داده و سپس با استفاده از آنالیز [8,9,0] LPC به تخمین نویز از روی سیگنال صوتی پرداخته می شود. بدین ترتیب مشاهده می گردد که پارامترهای نویز تخمینی به میزان زیادی به پارامترهای نویز واقعی نزدیک است و به همین دلیل سبب بهبود چشمگیر روش فیلترکالمن شده است. 2. فیلتر کالمن : فیلتر کالمن یک فیلتر انطباقی حداقل مربعات خطا است که یک راه حل بازگشتی محاسباتی بهینه را برای تخمین یک سیگنال در حضور نویز گوسی فراهم می کند. این الگوریتم با استفاده بهینه از اطالعات غیر دقیق روی یک سیستم خطی با خطا های گوسی به طور مداوم سیستم را بروز رسانی کرده و بهترین تخمین را از حالت فعلی سیستم می زند. عملكرد فیلتر کالمن شامل دو مرحله است: مرحله اول پیش بینی و در مرحله دوم تصحیح. در اولین مرحله حالت سیستم با مدل دینامیكی پیش بینی می گردد و در مرحله دوم با مدل مشاهده اصالح می شود تا کواریانس خطای تخمین حداقل گردد و تخمین بهینه شود. مدل گفتار نویزی و فیلتر کالمن فرض براین است که سیگنال گفتار در طول هر فریم )( سیگنال گفتار x(k) با یک مدل AR مرتبه P به صورت )( مدل می شود[ 4 ]: که x(k) kامین نمونه گفتار و ایستان است و مدل AR گفتار در تمام قسمت ها یكسان باقی مانده است. x(k) = Σ α i x(k i) + u(k), i =. P α i است : )2( ها ضرایب پیشگویی خطی LP( ) مدل AR هستند و u(k) خطای پیشگویی است که دارای توزیع نرمال )N(0,Q)( می باشد که Q ماتریس کواریانس نویز فرایند است. سیگنال مشاهده شده ی y(k) مطابق )2( با نویز سفید جمع شونده n(k) آلوده شده y(k) = Hx(k) + n(k) در )2( n(k) نویز سفید گوسی و ناهمبسته با u(k) است. n(k) است. سیستم را با معادالت حالت زیر مدل می کنیم: )3( دارای توزیع نرمال (N(0,R)) می باشد. R ماتریس کواریانس نویز اندازه گیری x(k) = Ax(k ) + y(k) = Hx(k) + Gu(k) )4( n(k) که x(k) = [x(k + )... x(k)] T بردار حالت P بعدی A ماتریس انتقال P P بعدی است که در )5( نشان داده شده است: =H G T به ترتیب بردار سطری مشاهدات و بردار ورودی می باشد. )5( که G = [0 0... 0 ] T دارای طولی به اندازه P )مرتبه ) LP می باشد و Frame 2

( x(k k را به عنوان تخمین قیاسی در زمان k و x(k k) را تخمین حالت استقرایی می گویند که در زمان k اندازه y(k) را نشان می دهد. تخمین خطاهای استقرایی و قیاسی در )6( و )7( تعریف شده است: e (k) = x(k) x(k k ) )6( e(k) = x(k) x(k k) )7( P (k) = E{e (k) e T (k)} )8( کواریانس خطای تخمین قیاسی و استقرایی به ترتیب در ) 8 (و )9( تعریف شده است : P(k) = E{e(k) e T (k)} )9( در فرمول استنتاج شده از فیلتر کالمن هدف یافتن معادله ای است که تخمین حالت استقرایی را به عنوان یک ترکیب خطی از تخمین قیاسی و اختالف وزنی بین اندازه گیری واقعی و پیشگویی شده را محاسبه کند که به صورت )( می باشد: x(k k) = x(k k ) + K(k)(y(k) Hx(k k )) ) ( اختالف )) Hx(k k (y(k) را نوآوری نشان می دهد. )ابداع( اندازه گیری می نامند. نوآوری اختالف بین مقدار پیشگویی شده و اندازه گیری واقعی را K(k) = P (k)h T (HP (k)h T + R) ) ( k(k) را بهره کالمن می گویند که کواریانس خطای استقرایی را به حداقل می رساند. در معادله )( مشاهده می شود که کواریانس نویز اندازه گیری R به صفر میل می کند و بهره کالمن وزن نوآوری را سنگین تر می کند) 2 (. از سویی دیگر کواریانس خطای تخمین قیاسی بهره کالمن را به سمت صفر می برد و وزن نوآوری سبک تر می شود) 3 (. lim K(k) = H R 0 lim K(k) = 0 P (k) 0 که درشكل )2( ) 3( )( معادالت فیلتر کالمن به دو گروه معادالت به روز رسانی زمان )پیشگویی( و معادالت به روز رسانی اندازه گیری )تصحیح( تقسیم می شود نشان داده شده است: شكل )(: معادالت فیلتر کالمن 3. ضرایب پیشگویی خطی )LPC( Innovation 3

از آنجایی که در الگوریتم پیشنهادی از آنالیز LPC برای تخمین نویز استفاده شده است لذا در این بخش به اختصار به توضیح این آنالیز می پردازیم. ضرایب پیشگویی خطی یكی از قدرتمند ترین ابزار ها در پردازش گفتار می باشد[ 5 ]. ایده کلی این آنالیز این است که هر نمونه از سیگنال صوتی را می توان به صورت معادله ای خطی بر حسب خروجی ها و ورودی های قبلی نوشت: s(n) = α k s(n k) k= q + b l u(n l) l=0 (4) b l و α k به ترتیب ضرایب مخرج و صورت فیلتر می باشند و( u(n سیگنال ورودی است که برای حروف صدا دار یک قطار ضربه و برای حروف بی صدا یک رشته نویز تصادفی می باشد. تابع تبدیل سیستم با به کار بردن تبدیل Z روی معادله )4( بدست می آید. H(z) = S(z) U(z) q l=0 b l. z l = (5) k= α k. z k در عمل برای سیگنال های صوتی یک مدل تمام قطب تقریب بسیار خوبی برای تابع تبدیل H(Z) داشت: است [6] و می توان آن را به صورت زیر نشان H(z) = α k= k. z k = A(z) (6) برای سیگنال گفتار انسان یک عدد صحیح در محدود 4 0 انتخاب می شود. نكته اساسی در محاسبه ضرایب پیشگویی خطی این است که این ضرایب بایستی مستقیما از سیگنال گفتار بدست آیند. به همین منظور و به علت ماهیت تغییر پذیری سیگنال گفتار )با زمان( ابتدا عمل پنجره گذاری بر روی سیگنال انجام می شود و سپس ضرایب lc در فریم های کوتاه محاسبه می شود[ 5 ]..3 تخمین نویز با توجه به توضیحات ارائه شده با تقریب خوبی می توان هر نمونه از سیگنال صوتی را تنها با نمونه قبلی از همان سیگنال صوتی )بدون استفاده از نمونه ما قبل ورودی ) محاسبه نمود[ 6 ] : ŝ(n) = α k s(n k= k) (7) با توجه به شكل )2( سیگنال خطا در حقیقت اختالف بین سیگنال صوتی اصلی و سیگنال صوتی تخمین زده شده از روی نمونه ی ما قبل می باشد: شكل) 2 (: بلوک دیاگرام نحوه محاسبه تابع خطا e(n) = s(n) ŝ(n) = s(n) k= α k s(n )8( k) 4

که اگر از طرفین معادله فوق تبدیلZ گرفته شود داریم : E(z) = S(z)[ k= α k z k ] = A(z) S(z) )9( است. تابع E(z) تبدیل Z سیگنال خطا می باشد که دارای ماهیت نویزی است. می توان گفت که فیلتر خطی قسمت غیر وابسته سیگنال را جدا می کند که قسمت اعظم آن نویز می باشد. برای اثبات این ادعا کافی است تابع خود همبستگی سیگنال e(n) را محاسبه نماییم. در شكل )3( تابع خود همبستگی سیگنال خطا که متعلق به یک سیگنال صوتی از پایگاه داده TIMIT می باشد رسم گردیده است. همان طور که مشاهده می شود سیگنال e(n) دارای ماهیت نویزی می باشد چرا که سیگنال خود همبستگی آن همانند تابع خود همبستگی سیگنال تصادفی نویز است. ما در الگوریتم پیشنهادی خود از این سیگنال برای تخمین نویز استفاده کرده ایم که سبب بهبود PESQ سیگنال های صوتی آغشته به نویز گردیده شكل) 3 (: تابع خود همبستگی سیگنال خطا اگر چه سیگنال e(n) همان سیگنال نویز اضافه شده به سیگنال صوتی تمیز نمی باشد اما اکثر مشخصات آن را در بر دارد. از طرفی در خروجی فیلتر( A(z مقداری از سیگنال نا همبسته مربوط به سیگنال گفتار نیز وجود دارد که در مقابسه با نویز قابل چشم پوشی است. 4. بهبود الگوریتم فیلتر کالمن با استفاده از روش پیشنهادی تخمین نویز ( آنالیز ) LPC در روش فیلتر کالمن ما نیازمند تخمین نویز می باشیم تا بتوانیم پارامتر های نویز را بدست آورده و از آن در الگوریتم کالمن بهره جوییم. معموال برای تخمین سیگنال نویز از قسمت سكوت سیگنال گفتار آغشته به نویز استفاده می گردد. برای این امر عموما از فریم اول سیگنال آغشته به نویز به عنوان قسمت سكوت سیگنال گفتار استفاده می شود که این روش تخمین نویر نیازمند دو فرض اساسی می باشد: - فریم اول سیگنال گفتار واقعا قسمت سكوت سیگنال باشد. 2- نویز در سراسر سیگنال به یک اندازه تاثیر گذاشته باشد. در عمل لزوما دو شرط فوق بر قرار نمی باشد. در مورد فرض اول ضعف شدید روش های موجود هنگامی آشكار می گردد که فریم اول یک فریم سكوت نباشد. و همچنین در مورد فرض دوم که با توجه به منابع متعدد نویز و نیز تصادفی بودن آن عموما میزان نویز در تمام طول سیگنال به یک اندازه نمی باشد. به همین منظور ما در روش پیشنهادی خود از هر فریم و با توجه به مشخصات آن فریم برای تخمین نویز در آن استفاده نموده ایم. بدین طریق مساله تغییر میزان نویز در طول سیگنال حل می شود. بدین منظور ابتدا سیگنال صوتی به فریم های کوچكتر )0ms-20ms( محاسبه می گردد. در مرحله بعد سیگنال صوتی از فیلتر A(z) تقسیم بندی شده است و سپس ضرایب LP هر یک از فریم ها عبور داده می شود. در نهایت از خروجی فیلتر A(z) که مبین اختالف سیگنال اصلی و سیگنال تخمینی است )که دربخش 3 به آن پرداخته شده است( و بیشتر از سیگنال اصلی دارای ماهیت نویزی می باشد به عنوان نویز تخمینی استفاده می گردد. 5

5. معیار ارزیابی PESQ ارزیابی ادراکی کیفی گفتار) PESQ ( در سال.6 برای نشان دادن کیفیت ادراکی و شنیداری سیگنال صوتی است[ 2 ]. 2 از طرف اتحادیه بین الملی ارتباطات راه دور ارائه شده است[ ]. در حقیقت PESQ معیاری این معیار با مطالعه رفتار سیستم شنوایی و مغز انسان و شبیه سازی عكس العمل آن در برابر سیگنال گفتار تمیز و سیگنال آلوده به نویز میزان شباهت این دو سیگنال را پیش بینی می کند. مقادیر PESQ در بازه.5- تا 4.5 تغییر می کند و هر چه این مقدار برای دو سیگنال بیشتر بوده شباهت این دو سیگنال به یكدیگر نیز بیشتر است. مزیت استفاده از این معیار ارزیابی در مقایسه و اعوجاج ناشی از کدینگ نیز می پردازد و در کنار میزان با معیار های دیگر این است که این معیار به بررسی تاثیرات اعوجاج هایی همچون تاخیر نویز سیگنال آنها را نیز در ارزیابی کیفیت سیگنال گفتار به کار می برد. پیاده سازی و مقایسه روش ها در این قسمت به مقایسه روش پیشنهادی با روش موجود می پردازیم. بدین منظور در نمودار )( روش فیلتر کالمن را با روش فیلتر کالمن بهبود یافته و با معیار ارزیابی PESQ به ازای SNR های مختلف )نویز از نوع سفید گوسی( مقایسه نموده ایم تا میزان توانایی روش تخمین نویز پیشنهادی در بهبود SNR سیگنال های صوتی در تمامی محدوده های PESQ است. مختلف) تا دسی بل( مشخص گردد. این مقایسه در نمودار )( نمایش داده شده نمودار )( مقایسه بین حالت سیگنال گفتار نویزی روش موجود و روش پیشنهادی با معیار PESQ جهت بررسی بیشتر روش پیشنهادی و مقایسه آن با روش موجود به عنوان نمونه شكل موج و نمودار اسپكتروگرام سیگنال صوتی تمیز و سیگنال آغشته به نویز با SNR=0dB وسیگنال های خروجی در روش فیلتر کالمن و فیلتر کالمن بهبود یافته رسم گردیده است. همان طور که از شكل های )4( و )5( مشخص است سیگنال صوتی خروجی در روش پیشنهادی به میزان قابل توجهی نسبت به روش موجود بهبود یافته است. Delay 6

شكل )5(: اسپكتروگرام سیگنال های خروجی در روش موجود و پیشنهادی شكل )4(: شكل موج سیگنال های خروجی در روش موجود و پیشنهادی 7. آزمایش شنوایی )MOS( در بحث های قبلی مقایسه روش های موجود و پیشنهادی با معیار ارزیابیPESQ انجام پذیرفته است. اینک می خواهیم مقایسه کیفی بین روش موجود و روش پیشنهادی انجام دهیم. بدین منظور از تست شنوایی [3] برای مقایسه روش ها استفاده نموده ایم. ابتدا ده سیگنال صوتی از پایگاه داده timit با SNR اولیه 0dB با فرض اینكه نویز از نوع سفید گوسی می باشد را به الگوریتم های موجود و پیشنهادی اعمال نموده ایم سپس از شش نفر )سه نفر زن و سه نفر مرد از طیف سنی جوان تا پیر( برای نمره دهی به سیگنال های غنی شده بر اساس جدول )( استفاده نموده ایم[ 7 ]. میانگین نمرات این شش نفر به این ده سیگنال صوتی )6 بار آزمایش به ازای SNR اولیه( در شكل )6( آورده شده است. نویز غیر قابل درک است جدول - معيار آزمايش شنوايي[ 7 ] کیفیت شنیده شدن نویز نویز قابل درک است اما اذیت کننده نیست نویز قابل درک است وکمی اذیت کننده است نویز اذیت کننده است اما نمی توان کال مخالفت کرد نویز بسیار اذیت کننده است نمره 5 4 3 2 7

شكل) 6 (: مقایسه روش پیشنهادی و روش موجود با استفاده از تست (MOS) 8. نتیجه گیری در این مقاله روش فیلتر کالمن برای بهبود سیگنال گفتار آغشته به نویز بیان و تشریح شده است. با مطالعه این روش بهسازی گفتار نقطه ضعف آن را در عدم تخمین صحیح نویز تشخیص داده ایم. به منظور رفع این مشكل ایده استفاده از آنالیز LPC برای تخمین نویز شكل گرفته شد. از بررسی این به این نكته رسیدیم که در روش فیلتر کالمن به تخمینی از نویز و پارامتر های آن نیازمند می باشیم. بدین منظور به دنبال روشی رفتیم تا بتواند تخمین بهتر و درست تری از نویز را در اختیار قرار دهد. در آنالیز LPC به دنبال فیلتر و مدلی از حنجره هستیم تا بتواند کلیه مشخصه های حنجره را در خود داشته باشد و در صورت اعمال نویز در ورودی در خروجی آن سیگنال گفتار را داشته باشیم. پس در صورت اعمال سیگنال گفتار به مدل )فیلتر( معكوس بایستی سیگنال نویز را در خروجی آن داشته باشیم. قسمت ناهمبسته سیگنال گفتار نویزی در خروجی فیلتر ظاهر می شود که به علت خطی بودن فیلتر قسمت اعظم آن نویز می باشد. از این نویز در غنی سازی سیگنال گفتار استفاده نموده و از آن در اصالح روش فیلتر کالمن کمک گرفته ایم. با مقایسه روش پیشنهادی و روش موجود مشاهده می شود که روش پیشنهادی نه تنها PESQ سیگنال بهبود یافته را افزایش داده است بلكه در آزمایش شنوایی نیز بهتر از روش موجود پاسخ داده است. 9. مراجع [] K.K.Paliwal and A.Basu, A Seech Enhancement Method Based on Kalman Filtering, in Prec.ICASSP,87, PP.77-80,98. [2] E.Grivel,M.Gabrea and M.Najim, seech enhancement az a realization issue,signal Processing,Vol82,.963-978,Dec 2002. [3] Nari Tanabe, Toshiniro Furukawa, Hideaki Matsue and Shigeo Tsujii., Kalman Filter for Robust Noise Suression in White and Colored Noise, IEEE International Symosium on Circuits and Systems, 2008.72-75. [4] Marcel Gabrea, A SINGLE MICROPHONE NOISE CANCELLER BASED ON AN ADAPTIVE KALMAN FILTER, 25th IEEE Canadian Conference on Electrical and Comuter Engineering (CCECE),202. [5] S. Kamath and P. Loizou, A Multi-band sectral subtraction method for Enhancing seech corruted by colored noise, Proceedings of ICASSP-22, Orlando, FL, May 22. [6]P. S. Whitehead, D. V. Andeson and M. A.Clements, Adative acoustic noise suression for seech enhancement, IEEE International Conference on Multimedia & Exo., Jul. 23. [7]Y. Ghanbari and M. R. Karami-Mollaee, A new aroach for seech enhancement based on adative thresholding of wavelet ackets, Seech communication 48 (2006) 927-940. 8

[8]J. Tierney,A study of LPC analysis of seech in additive noise, IEEE Trans. Acoust. Seech and Signal rocessing, ASSP-28, 4, 379-389,Aug.980. [9]L. R. Rabiner and R. W. Schafer, Digital rocessing of seech signals, Prentice Hall, 978. [0]J. R. Deller, J. H. L. Hansen and J. G. roakis, Discrete-time rocessing of seech signals, 2nd edition, IEEE ress, 2000. [] Percetiial evaluation of seech quality (PESQ), an objective method for end-to-end seech quality assessment of narrow-band telehone networks and seech codecs,recommendation P.862, International Telecommunications Union (ITU-T), Feb. 200. [2] N. Kitawaki, and T. Yamada, Subjective and Objective Quality Assessment for Noise Reduced Seech, ETSI Worksho on Seech and Noise in Wideband Communication, 2007. [3]Y. Ghanbari and M. R. Karami, Sectral Subtraction in the Wavelet Domain for Seech Enhancement, International Journal of Imaging Systems and Technology, vol., no., Aug. 2004. 9