سمینار بررسی سیستم ها و مدارهای مجتمع (IC) کدکننده سیگنال گفتار
نوشته شده توسط : admin

دانشگاه آزاد اسلامی

واحد تهران جنوب

دانشکده تحصیلات تکمیلی

سمینار برای دریافت درجه کارشناسی ارشد

مهندسی برق – الکترونیک

عنوان:

بررسی سیستم ها و مدارهای مجتمع (IC) کدکننده سیگنال گفتار

برای رعایت حریم خصوصی اسامی استاد راهنما،استاد مشاور و نگارنده درج نمی شود

تکه هایی از متن به عنوان نمونه :

(ممکن است هنگام انتقال از فایل اصلی به داخل سایت بعضی متون به هم بریزد یا بعضی نمادها و اشکال درج نشود ولی در فایل دانلودی همه چیز مرتب و کامل است)

چکیده:

با پیشرفت علم و تکنولوژی در زمینه مخابرات و فناوری اطلاعات یافتن روش هایی برای انتقال و ارسال سریع و کم حجم داده های صوتی و تصویری و… اهمیت به سزایی پیدا می کند. فشرده سازی یا کدینگ اطلاعات به معنای کاهش نرخ بیت ارسال یا دریافت داده ها که امروزه عمدتا دیجیتالی هستند، می باشد که موجب افزایش سرعت و پهنای باند مجاز و کاهش پیچیدگی و قیمت تمام شده برای ارسال و دریافت اطلاعات می شود. فشرده کردن سیگنال گفتار نیز به عنوان یکی از سیگنال های ارتباطی بخصوص در حوزه های مخابرات، ارتباطات سیار، پروتکل های ارسال صوت از طریق اینترنت (VoIP) و… امری ضروری و مهم تلقی می شود. امروزه وجود مدارهای مجتمع یا آی سی (IC) هایی که می توان الگوریتم های مختلف کدینگ گفتار را روی آنها پیاده کرد، کار کدکردن گفتار را تسهیل کرده است.

کدکننده های سیگنال صوتی یا گفتار به سه دسته عمده: کدکننده های مبتنی بر شکل موج، کدکننده های پارامتری یا VOCODERها و کدکننده های هایبرید یا ترکیبی تقسیم می شود. کدکننده های جدید مبتنی بر ادراک انسان بوده و با توجه به ویژگی های روان شنیداری سیستم شنوایی انسان طراحی می شوند، کدکننده های دارای الگوریتم MPEG معروف ترین دسته از این نوع کدکننده ها می باشند.

مقدمه:

بحث کدینگ سیگنال گفتار یکی از قدیمی ترین و مهم ترین مباحث در زمینه ارسال داده های صوتی می باشد. کدینگ در واقع فشرده سازی سیگنال گفتار در طرف فرستنده و تبدیل آن به کدهایی است که در عین داشتن نرخ بیت کم و سرعت انتقال بالا، پارامترهای اصلی و اساسی گفتار مورد نظر را نیز شامل شود، به گونه ای که در طرف گیرنده و پس از عمل دیکدینگ بتوان سیگنالی مشابه سیگنال ورودی به دست آورد. آشنایی با مفاهیمی همچون چگالی طیفی توان (PSD)، تابع خودهمبستگی (ACF)، پریود گام (Pitch)، چندی سازی (Quantizing)، روش پیش بینی خطی (LP) و… برای درک مفاهیم هر بخش الزامی است. در این مقوله ابتدا یک مقدمه کلی درباره مفاهیم اساسی و پارامترهای سیگنال گفتار و تکنیک ها و الگوریتم های مختلف کدینگ گفتار بیان می شود، سپس به بررسی و تفصیل سیستم ها و مدارهای مجتمعی (IC) که برای پیاده سازی سخت افزاری برخی از مهمترین الگوریتم ها از جمله مدولاسیون دلتای وفقی کدهای پالسی (ADPCM) از کدکننده های مبتنی بر شکل موج، کدکننده با پیش بینی خطی (LPC) که ساده ترین کدکننده پارامتری (VOCODER) است، LD-CELP که از خانواده کدکننده های هایبرید است، CS-ACELP، کدکننده های با تحریک چند باندی (MBE) و کدکننده های مبتنی بر ادراک (Perceptual) که کدکننده های MPEG از آن جمله اند، استفاده می شود، می پردازیم. بدون شک سیستم هایی که در اینجا معرفی می شود فقط به عنوان یک سیستم یا آی سی نمونه و پایه است و نمونه های بسیار دیگری با مدارهای پیچیده تر موجود می باشند ولی اساس کار آنها هم شبیه به سیستم های گفته شده است.

فصل اول

مقدمه ای بر کدینگ سیگنال گفتار و انواع آن

1-1- مشخصه های اصلی سیگنال گفتار:

در مقایسه با سیگنال های قطعی، سیگنال های تصادفی مانند سیگنال گفتار، موسیقی، ویدئو و سایر سیگنال های حاوی اطلاعات، به کمک فرمول های ریاضی قابل توصیف نیستند. این سیگنال ها معمولا توسط توابع آماری مشخص می شوند. چگالی طیفی توان (PSD)، تابع خود همبستگی (ACF)، تابع توزیع تجمعی (CDF) و تابع چگالی احتمال (PDF)، متداول ترین توابع بکار رفته می باشد. ارسال اطلاعات گفتار یکی از اساسی ترین اهداف ارتباطات مخابراتی است.

اصوات تولید شده توسط لوله صوتی انسان را به دو دسته واکدار و بی واک می توان تقسیم کرد. هنگام تولید اصوات واکدار تارهای صوتی به ارتعاش در می آیند و یک شکل موج شبه تناوبی با انرژی زیاد تولید می شود، در حالی که در مورد اصوات بی واک کم انرژی، تولید صوت با ارتعاش تارهای صوتی همراه نمی باشد و منبع تولید صوت مشابه مولد نویز عمل می کند. سیگنال تحریک که با E(z نشان داده می شود بعدا در هنگام عبور از لوله صوتی، فیلتر می شود که شبیه به یک فیلتر شکل طیف با تابع انتقال H(z)=1/A(z. شکل طیفی با توجه به مشخصه های لوله صوتی، تشعشع از لب ها و غیره تعیین می شود. مدل ساده شده تولید گفتار را در شکل 1-1 می بینید.

شکل موج قطعات واکدار و بی واک گفتار علاوه بر چگالی توان مربوطه در شکل های 1-2 و 1-3 مشاهده می شود. به وضوح قطعات بی واک دامنه کوچکتری دارند که این در چگالی طیفی توان نیز خود را نشان می دهد. همچنین از روی شکل 1-3 مشاهده می شود که اصوات کم انرژی بی واک مانند نویز سفید، منحنی چگالی طیفی توان مسطح تری دارند. طیف سیگنال مسطح تر به معنی غیرقابل پیش بینی تر بودن رفتار آن بوده و برای فشرده سازی قابل اطمینان نمی باشد.

برای دانلود متن اینجا کلیک کنید.





لینک بالا اشتباه است

برای دانلود متن کامل اینجا کلیک کنید

       
:: بازدید از این مطلب : 480
|
امتیاز مطلب : 0
|
تعداد امتیازدهندگان : 0
|
مجموع امتیاز : 0
تاریخ انتشار : دو شنبه 4 مرداد 1395 | نظرات ()
مطالب مرتبط با این پست
لیست
می توانید دیدگاه خود را بنویسید


نام
آدرس ایمیل
وب سایت/بلاگ
:) :( ;) :D
;)) :X :? :P
:* =(( :O };-
:B /:) =DD :S
-) :-(( :-| :-))
نظر خصوصی

 کد را وارد نمایید:

آپلود عکس دلخواه: