Budapest University of Technology and Economics, Faculty of Electrical Engineering and Informatics

    Belépés
    címtáras azonosítással

    vissza a tantárgylistához   nyomtatható verzió    

    Beszédkommunikáció

    A tantárgy angol neve: Speech Communication

    Adatlap utolsó módosítása: 2012. május 30.

    Tantárgy lejárati dátuma: 2015. június 30.

    Budapesti Műszaki és Gazdaságtudományi Egyetem
    Villamosmérnöki és Informatikai Kar

    Villamosmérnöki szak

    Mérnök Informatikus szak

    Szabadon választható tantárgy

    Tantárgykód Szemeszter Követelmények Kredit Tantárgyfélév
    VITMJV62   4/0/0/v 4  
    3. A tantárgyfelelős személy és tanszék Dr. Vicsi Klára, Távközlési és Médiainformatikai Tanszék
    4. A tantárgy előadója
     Név: Beosztás: Tanszék, Intézet:
     Dr. Vicsi Klára tud. tanácsadó TMIT
     Szaszák György (gyakorlat) tanszéki mérnök TMIT
     Sztahó Dávid (gyakorlat) PhD hallgató TMIT
    5. A tantárgy az alábbi témakörök ismeretére épít Alap mérnöki, fizikai ismeretek
    6. Előtanulmányi rend
    Kötelező:
    NEM ( TárgyTeljesítve("BMEVITT9162") )

    A fenti forma a Neptun sajátja, ezen technikai okokból nem változtattunk.

    A kötelező előtanulmányi rendek grafikus formában itt láthatók.

    Ajánlott:

    Nincs.

    Nem vehetik fel, akik hallgatták a vitt9162 (Beszédkommunikáció:a beszéd képzése, érzékelése, megértése) tárgyat

    7. A tantárgy célkitűzése

    A tárgy bevezető, alapozó tudást ad a beszédkommunikáció alapjairól: az emberi beszédről, mint az emberi kommunikáció egyik alapvető eszközéről. Tárgyalja az emberi beszédkeltés fiziológiai és akusztikai leírását és az emberi beszédfeldolgozás kognitív folyamatait. A tárgy továbbá rendszerezett ismereteket kíván adni a digitális beszédfeldolgozásról, a gépi beszéd felismerésről. Olyan alapokat nyújt, amely további kurzusokkal, vagy önképzéssel bővíthető, mint pl. a beszédanalizálási és kódolási módszerek, a gépi beszédfelismerés, beszélő-felismerés és szintézis, a beszédakusztika alkalmazása a gyógyászatban, stb.

    A beszédkommunikáció egy interdiszciplináris terület. A tantárgy nagymértékben támaszkodik a fizikai, mérnöki alapismeretekre, de nyelvészeti, fonetikai, pszichológiai, foniátriai és audiológiai ismeretekhez is hozzájuttatja a hallgatókat.

    8. A tantárgy részletes tematikája

    1. hét.

    A beszédfolyamat információelméleti jellemzői. A beszédkommunikáció körfolyamata. a multimodalitás szerepe.

    A beszéd leírása nyelvi fogalmakkal, üzenetek megfogalmazása, az egyes nyelvek szerinti különbözőségek és egyezőségek.

    2. hét.

    A beszélt és írott nyelv közötti különbség jellemzése, gépi feldolgozásbeli eltérések.

    Fonetikai átírási fajták és jelentőségük általában a nyelvtudományban, és a gépi beszédfeldolgozásban.

    Gyakorlat: Az LSA által fejleszett fonetizátor elvi alapjainak megismerése és használata a gyakorlatban

    3. hét

    A beszéd fizikai jellemzői, alap( pl. hangnyomás, hangenergia, hangszínkép, hangmagasság stb.) és származtatott ( pl. színkép stb.)menyiségek leírása

    Gyakorlat: kitartott hangok, folyamatos beszéd gördülő spektrum vizsgálata

    4. hét

    A hangképzés folyamatainak leírása, a különböző hangképzési folyamatok modellezése, a beszédhangok fonetikai tárgyalása,  Artikulációs bázis.

    Gyakorlat: az artikuláció és a fizikai produktum kapcsolatának vizsgálata. Dinamikai jellemzők elemzése.

    5. hét

    Beszédfolyamat elemei, és az elemek rendszere: -fizikai és nyelvi leírás

    Gyakorlat: az artikuláció és a fizikai produktum kapcsolatának vizsgálata, színképi összetevők elemzése.

    6. hét

    A magyar beszédfolyamat jellemzői

    Gyakorlat: A beszéd szupraszegmentális elemeinek vizsgálata

    7. hét

     A beszédadatbázisok általános jellemzése, létrehozása, adatbázisok a beszédfelismerés területén.

    Gyakorlat: BABEL, MTBA, MRBA, Speechdat adatbázisok annotálási, szegmentálási módszereinek megismerése

    8. hét

    Varianciák a beszéd képzése során:

    Egy beszélőn belül, beszélők között, folyamatos beszéd ejtésvariációi

    A beszéd statisztikai elemzése

    9. hét

    Beszéd torzulásai a közvetítő csatornákon keresztül. Természetes hangtérben:  visszhangok, zajhatás,stb.

    Elektromos átalakításon keresztül.

    A beszédérthetőség fogalma

    10. hét

    Pszichoakusztikai alapfogalmak, beszédpercepció. Percepciós bázis

    Gyakorlat: hallásküszöb mérés

    11. hét

    Beszéd számítógépes feldolgozása

    Gyakorlat: érzelemfelismerés-percepciós vizsgálat

    12. hét

    Gépi beszédfelismerés, felismerők osztályozása, alkalmazása a gyakorlatban

    Gyakorlat: Dragon, MS, és az LSA által fejlesztett beszédfelismerő megismerése, összehasonlítása.

    13. hét:

    Statisztikai elvű gépi felismerők elvi alapjai

    Gyakorlat: felismerő nyelvi modelljének kialakítása az LSA által fejlesztett beszédfelismerő fejlesztői környezet segítségével

    9. A tantárgy oktatásának módja (előadás, gyakorlat, laboratórium)

    előadás

    10. Követelmények
    • A szorgalmi időszakban: évközi ZH
    • A vizsgaidőszakban: írásbeli vizsga
    • Elővizsga: nincs
    11. Pótlási lehetőségek Sikertelen zárthelyi a szorgalmi időszakban a pótzárthelyin pótolható. A sikertelen (pót)zárthelyi a pótlási héten különeljárási díj ellenében egy további alkalommal pótolható.
    12. Konzultációs lehetőségek

    1111 Budapest, Sztoczek u. 2.  St. ép. 202 szoba

    tel.4631940

    vicsi@.tmit.bme.hu

    13. Jegyzet, tankönyv, felhasználható irodalom
    1. Vicsi K.:Beszédkommunikáció jegyzet, melyet az órákon kapnak meg a hallgatók, továbbá:
    2. Gósy, M.: Fonetika, a beszéd tudománya, Osiris Kiadó, Budapest, 2004.
    3. Kent, R. D, Charles, R.: The Acoustic Analysis of Speech, Singular Publishing Group, Inc.San Diego, California, 1992.
    4. Lass, N., J.: Experimental Phonetics, Mosby-Year Book, Inc.St. Louis, 1996.
    5. Morgan, Gold: Speech and Audio Signal Processing, John Wiley&Sons, Inc., New York, 2000.
    6. O’Shaughnessy, D: Speech Communications: Human and Machine IEEE Press, 2000.
    7. Owens, F. J.: Signal Processing of Speech, The Macmillan Press Ltd., London, 1993.
    14. A tantárgy elvégzéséhez átlagosan szükséges tanulmányi munka
    Kontakt óra  60
    Félévközi készülés órákra   5
    Felkészülés zárthelyire  15
    Házi feladat elkészítése  10
    Kijelölt írásos tananyag elsajátítása    -
    Vizsgafelkészülés  30
    Összesen120
    15. A tantárgy tematikáját kidolgozta
     Név: Beosztás: Tanszék, Intézet:
     Dr. Vicsi Klára tud. főmunkatárs TMIT