Beszédkommunikáció

A tantárgy angol neve: Speech Communication

Adatlap utolsó módosítása: 2012. május 30.

Tantárgy lejárati dátuma: 2015. június 30.

Budapesti Műszaki és Gazdaságtudományi Egyetem
Villamosmérnöki és Informatikai Kar

Villamosmérnöki szak

Mérnök Informatikus szak

Szabadon választható tantárgy

Tantárgykód Szemeszter Követelmények Kredit Tantárgyfélév
VITMJV62   4/0/0/v 4  
3. A tantárgyfelelős személy és tanszék Dr. Vicsi Klára,
4. A tantárgy előadója
 Név: Beosztás: Tanszék, Intézet:
 Dr. Vicsi Klára tud. tanácsadó TMIT
 Szaszák György (gyakorlat) tanszéki mérnök TMIT
 Sztahó Dávid (gyakorlat) PhD hallgató TMIT
5. A tantárgy az alábbi témakörök ismeretére épít Alap mérnöki, fizikai ismeretek
6. Előtanulmányi rend
Kötelező:
NEM ( TárgyTeljesítve("BMEVITT9162") )

A fenti forma a Neptun sajátja, ezen technikai okokból nem változtattunk.

A kötelező előtanulmányi rendek grafikus formában itt láthatók.

Ajánlott:

Nincs.

Nem vehetik fel, akik hallgatták a vitt9162 (Beszédkommunikáció:a beszéd képzése, érzékelése, megértése) tárgyat

7. A tantárgy célkitűzése

A tárgy bevezető, alapozó tudást ad a beszédkommunikáció alapjairól: az emberi beszédről, mint az emberi kommunikáció egyik alapvető eszközéről. Tárgyalja az emberi beszédkeltés fiziológiai és akusztikai leírását és az emberi beszédfeldolgozás kognitív folyamatait. A tárgy továbbá rendszerezett ismereteket kíván adni a digitális beszédfeldolgozásról, a gépi beszéd felismerésről. Olyan alapokat nyújt, amely további kurzusokkal, vagy önképzéssel bővíthető, mint pl. a beszédanalizálási és kódolási módszerek, a gépi beszédfelismerés, beszélő-felismerés és szintézis, a beszédakusztika alkalmazása a gyógyászatban, stb.

A beszédkommunikáció egy interdiszciplináris terület. A tantárgy nagymértékben támaszkodik a fizikai, mérnöki alapismeretekre, de nyelvészeti, fonetikai, pszichológiai, foniátriai és audiológiai ismeretekhez is hozzájuttatja a hallgatókat.

8. A tantárgy részletes tematikája

1. hét.

A beszédfolyamat információelméleti jellemzői. A beszédkommunikáció körfolyamata. a multimodalitás szerepe.

A beszéd leírása nyelvi fogalmakkal, üzenetek megfogalmazása, az egyes nyelvek szerinti különbözőségek és egyezőségek.

2. hét.

A beszélt és írott nyelv közötti különbség jellemzése, gépi feldolgozásbeli eltérések.

Fonetikai átírási fajták és jelentőségük általában a nyelvtudományban, és a gépi beszédfeldolgozásban.

Gyakorlat: Az LSA által fejleszett fonetizátor elvi alapjainak megismerése és használata a gyakorlatban

3. hét

A beszéd fizikai jellemzői, alap( pl. hangnyomás, hangenergia, hangszínkép, hangmagasság stb.) és származtatott ( pl. színkép stb.)menyiségek leírása

Gyakorlat: kitartott hangok, folyamatos beszéd gördülő spektrum vizsgálata

4. hét

A hangképzés folyamatainak leírása, a különböző hangképzési folyamatok modellezése, a beszédhangok fonetikai tárgyalása,  Artikulációs bázis.

Gyakorlat: az artikuláció és a fizikai produktum kapcsolatának vizsgálata. Dinamikai jellemzők elemzése.

5. hét

Beszédfolyamat elemei, és az elemek rendszere: -fizikai és nyelvi leírás

Gyakorlat: az artikuláció és a fizikai produktum kapcsolatának vizsgálata, színképi összetevők elemzése.

6. hét

A magyar beszédfolyamat jellemzői

Gyakorlat: A beszéd szupraszegmentális elemeinek vizsgálata

7. hét

 A beszédadatbázisok általános jellemzése, létrehozása, adatbázisok a beszédfelismerés területén.

Gyakorlat: BABEL, MTBA, MRBA, Speechdat adatbázisok annotálási, szegmentálási módszereinek megismerése

8. hét

Varianciák a beszéd képzése során:

Egy beszélőn belül, beszélők között, folyamatos beszéd ejtésvariációi

A beszéd statisztikai elemzése

9. hét

Beszéd torzulásai a közvetítő csatornákon keresztül. Természetes hangtérben:  visszhangok, zajhatás,stb.

Elektromos átalakításon keresztül.

A beszédérthetőség fogalma

10. hét

Pszichoakusztikai alapfogalmak, beszédpercepció. Percepciós bázis

Gyakorlat: hallásküszöb mérés

11. hét

Beszéd számítógépes feldolgozása

Gyakorlat: érzelemfelismerés-percepciós vizsgálat

12. hét

Gépi beszédfelismerés, felismerők osztályozása, alkalmazása a gyakorlatban

Gyakorlat: Dragon, MS, és az LSA által fejlesztett beszédfelismerő megismerése, összehasonlítása.

13. hét:

Statisztikai elvű gépi felismerők elvi alapjai

Gyakorlat: felismerő nyelvi modelljének kialakítása az LSA által fejlesztett beszédfelismerő fejlesztői környezet segítségével

9. A tantárgy oktatásának módja (előadás, gyakorlat, laboratórium)

előadás

10. Követelmények
  • A szorgalmi időszakban: évközi ZH
  • A vizsgaidőszakban: írásbeli vizsga
  • Elővizsga: nincs
11. Pótlási lehetőségek Sikertelen zárthelyi a szorgalmi időszakban a pótzárthelyin pótolható. A sikertelen (pót)zárthelyi a pótlási héten különeljárási díj ellenében egy további alkalommal pótolható.
12. Konzultációs lehetőségek

1111 Budapest, Sztoczek u. 2.  St. ép. 202 szoba

tel.4631940

vicsi@.tmit.bme.hu

13. Jegyzet, tankönyv, felhasználható irodalom
  1. Vicsi K.:Beszédkommunikáció jegyzet, melyet az órákon kapnak meg a hallgatók, továbbá:
  2. Gósy, M.: Fonetika, a beszéd tudománya, Osiris Kiadó, Budapest, 2004.
  3. Kent, R. D, Charles, R.: The Acoustic Analysis of Speech, Singular Publishing Group, Inc.San Diego, California, 1992.
  4. Lass, N., J.: Experimental Phonetics, Mosby-Year Book, Inc.St. Louis, 1996.
  5. Morgan, Gold: Speech and Audio Signal Processing, John Wiley&Sons, Inc., New York, 2000.
  6. O’Shaughnessy, D: Speech Communications: Human and Machine IEEE Press, 2000.
  7. Owens, F. J.: Signal Processing of Speech, The Macmillan Press Ltd., London, 1993.
14. A tantárgy elvégzéséhez átlagosan szükséges tanulmányi munka
Kontakt óra  60
Félévközi készülés órákra   5
Felkészülés zárthelyire  15
Házi feladat elkészítése  10
Kijelölt írásos tananyag elsajátítása    -
Vizsgafelkészülés  30
Összesen120
15. A tantárgy tematikáját kidolgozta
 Név: Beosztás: Tanszék, Intézet:
 Dr. Vicsi Klára tud. főmunkatárs TMIT