Digital Speech Processing
نویسنده:
saeed seyedtabaii
تاریخ انتشار:
07 June 2023
دیدگاه ها:
Comments Off on Digital Speech Processing
درس اصلی مقطع کارشناسی ارشد و دکترای تخصصی رشته مهندس برق
Units: 3
Course text
Discrete Time Processing of Speech Signal, J.R. Deller, J.H.L. Hansen, J.G. Proakis, Wiley,2000 اين کتاب در کتابخانه موجود است
Course outline
- Digital signal processing: مقدمه بر پردازش سيگنال و صوت
- نمونه برداري، افزايش و کاهش فرکانس نمونه برداري
- تحليل طيف سيگنالهاي گسسته
- سيستم و فيلترهاي گسسته
- Speech production, Modelling: – توليد صوت انساني
- – آواهاي فارسي و کد گذاري آواها
- پروژه 1 استخراج مشخصات صوت فارسي با praat و SFS
- مدلسازي اکوستيکي و ديجيتالي توليد صوت (
- بخش 3: تحليل سيگنال صوتي: short time energy,
- –short time autocorrelation
- STFT 1
- تحليل سيگنال صوت
- FILTER BANKS 1
- -Linear Prediction Coding
- Covariance LPC 1
- -Cepstrum 1
- feature extraction
- بخش 4: کدينگ سيگنال صوتي Linear, logarithmic, adaptive PCM
- 9: ADPCM, LDM,
- : source hybrid coding ,
- CELP
- بخش 5: توليد سيگنال صوتي speech synthesis 22- کلمه به کد آوا front end 2
- 3- کد آوا به صوت back end 2
- 4- Linear Prediction method
- بخش 6: شناسايي سيگنال صوتي—–5- مقدمه شناسايي تک کلمه
- -آموزش HMM 2
- -شناسايي صوت پيوسته
- language modeling
- – شناسايي گوينده
- – درک زبان
Labs
آزمايشها
آزمايش 1: ويرايش سيگنال–
آزمايش2: فيلتر ديجيتال–
آزمايش 3: آناليز و سنتز در فيلتر بانكها-
آزمايش 4: آناليز طيف و مدلسازي–
آزمايش5: آناليز فرمنت و پيچ–
– آزمايش 6: متن به صوت–
آزمايش 7: توليد سيگنال براي توليد صوت–
آزمايش 8: شناسايي تك كلمه-
آزمايش 9: شناسايي صوت
پروژه هاي درس
پروژه 1: مدلسازي اندامي و زماني-فركانسي صوت فارسي دانشجويان: موضوع جلسات 5 و 6 كلاس
پروژه 2: توليد صوت فارسي بر اساس مدلسازي فركانسي: formant Based
پروژه 3: پروژه انتخابي شناسايي و يا توليد صوت
جلسات درس
پردازش صوت: نرم افزارهابراي اجراي برنامه ها به ميکرفن و هدفون (يا بلندگو ) نياز است. |
|
برنامه هاي ويرايش و تحليل سيگنال صوتي: speech filling system (SFS): اين برنامه منبع باز براي ويرايش و تحليل سيگنال صوتي استفاده مي شود. براي برداشتن فايلها اينجا و براي اجرا اينجا را کليک کنيد. برنامه هاي تجاري تحليل سيگنال صوت مانند GoldWave ، cooledit، All editor هستند. براي برداشتن فايلهاي all editor اينجا را کليک کنيد. برنامه را روي کامپيوتر خود نصب کرده استفاده کنيد. Voice box مجموعه برنامه هاي پردازش صوت در محيط MATLAB است. از آن مي توان بعنوان SPEECH TOOLBOX در كنار برنامه هاي نوشته شده MATLAB سود برد. براي راهنماي آن اينجا و براي فايلهاي آن اينجا را کليک کنيد.
برنامه هاي شناسايي و توليد صوت و آوا امکانات پردازش صوت در Windows LPC: برنامه توليد اوا به روش linear predictive coding. بعد از اجرا، صفحه برنامه ظاهر مي گردد. براي شنيدن صدا نياز به بلندگو يا گوشي است. با كليك روي آن برنامه اجرا مي شود. برنامه چند زبانهMBOLA : مقدمه : اين برنامه قابليت تبديل نگارش آوايي زبانهاي مختلف از جمله فارسي به صوت را دارد. اين برنامه به زبان C نوشته شده و ليست برنامه آن در دسترس است. براي راهنمايي اينجا را کليک کنيد. براي اجرا، برنامه را به کامپيوتر خود منتقل کرده آن را باز و اجرا کنيد. براي برداشتن برنامه ها اينجا را کليک کنيد. INVTOOL-MODELTALKER: اين برنامه قادر است متون انگليسي را قرائت کند بعلاوه مي تواند نوعي نگارش اوايي (نگارش فونتيکي) مربوط به خود را نيز قرائت کند. آنرا امتحان کنيد. اين برنامه نوشتار انگليسي را تلفظ مي كند. بعلاوه داراي invtool است كه اجازه مي دهد با تن صداي كاربر اين قرائت صورت گيرد. براي اين منظور كاربر جملاتي را قرائت مي كند. بعد از پايان قرائت؛ تن صدا مورد پردازش قرار گرفته و در قرائت هاي بعدي متن اين تن مورد استفاده قرار مي گيرد. براي برداشتن برنامه اينجا را کليک کنيد. برنامه Festival: اين برنامه منبع باز براي توليد صوت استفاده مي گردد. ما اين برنامه را امتحان نکرده ايم. برا برداشتن فايلهاي آن اينجا را کليک کنيد. براي برداشتن برنامه هاي منبع باز کدينگ سيگنال صوتي CELP, LDCELP, LP10 را کليک کنيد. براي برنامه هاي منبع باز فرمنتي توليد صوت، اينجا را کليک کنيد. |
فایلها و اسلایدهای مربوط درس