Budapest University of Technology and Economics, Faculty of Electrical Engineering and Informatics

    Belépés
    címtáras azonosítással

    vissza a tantárgylistához   nyomtatható verzió    

    Intelligens szövegelemzés a gyakorlatban

    A tantárgy angol neve: IntelligentText Analysis in Real-Life Applications

    Adatlap utolsó módosítása: 2018. március 6.

    Budapesti Műszaki és Gazdaságtudományi Egyetem
    Villamosmérnöki és Informatikai Kar

    Mérnökinformatikus Szak

    Szabadon választható tantárgy

    Tantárgykód Szemeszter Követelmények Kredit Tantárgyfélév
    VIMIAV18   1/0/1/f 2  
    3. A tantárgyfelelős személy és tanszék Dr. Mészáros Tamás Csaba, Méréstechnika és Információs Rendszerek Tanszék
    A tantárgy tanszéki weboldala http://www.mit.bme.hu/oktatas/targyak/vimiav18
    4. A tantárgy előadója Dr. Mészáros Tamás, egy. docens, Méréstechnika és Információs Rendszerek Tanszék
    5. A tantárgy az alábbi témakörök ismeretére épít Programozási gyakorlat, XML alapismeretek
    7. A tantárgy célkitűzése A gyakorlatorientált tantárgy célja természetes nyelvű szövegek tudásalapú feldolgozásával kapcsolatos módszerek és eszközök bemutatása. A hallgatók megismerkedhetnek a szövegbányászat klasszikus módszerein túlmutató, szemantikus technológiákat (RDF, OWL, Linked Open Data, SPARQL), internetes tudástárakat (DBpedia, FactForge), nyelvi elemzőket (ACE PE, NLTK, ANTLR), és autonóm ágensrendszereket alkalmazó szövegelemzési módszerekkel. A tantárgy ipari projektek és kutatói együttműködések tapasztalataira és feladatkészletére épít például az információkeresés, a digitális bölcsészet és az ember-gép kommunikáció területén.
    8. A tantárgy részletes tematikája

    1. hét. A szövegelemzés tipikus problémái az információkeresés, az ember-gép interfészek és a digitális bölcsészet témaköreiből.

    2. hét. A szövegelemzés alapvető módszerei: indexkészítés és statisztikai módszerek, természetes nyelvű szövegfeldolgozás (NLP). A módszerek problémái és korlátai.

    3. hét. Tudásalapú módszerek bevezetésének területei és lehetőségei: nyelvi, tárgyterületi és alkalmazói tudás. Esettanulmányok.

    4-5. hét. Autonóm, tudásalapú ágensek és alkalmazásuk az intelligens szövegelemzésben: természetes nyelvű ember-gép interfészek és több-ágens elemzőrendszerek (előadás és laboratórium).

    6-7. hét. Nyelvi tudás reprezentációja, kontrollált természetes nyelvek (CNL) létrehozása és feldolgozása. Alkalmazásuk természetes nyelvű interfészek megvalósításában.

    8. hét. Ágensalapú ember-robot természetes nyelvű interfész fejlesztése Android és Robot Operating System környezetben (laboratórium).

    9-10. hét. Szakértői tudás reprezentációja: kiterjesztett szótárak, RDF tudásbázisok és ontológiák (OWL), valamint felhasználásuk a szövegelemzésben (normalizálás, entitásfelismerés, szemantikus annotálás).

    11. hét. Szakértői tudás bevitele és szerkesztése kontrollált természetes nyelven (laboratórium).

    12. hét. Kontrollált természetes nyelvű annotálórendszer (tudásbázis-építés) digitális bölcsészeti rendszerben (laboratórium).

    13. hét. Internetes tudásbázisok (DBpedia, FactForge, MusicBrainz, OpenStreetMap stb.) és lekérdező módszereik (REST, SPARQL). Tudásintegrációs technikák (Linked Open Data).

    14. hét. Külső tudástárak integrációja és felhasználása az ágensalapú elemzőrendszerben (laboratórium). Esettanulmányok: Apache Stanbol és Marmotta.

    9. A tantárgy oktatásának módja (előadás, gyakorlat, laboratórium)

    A tantárgy előadásokból és laboratóriumi foglalkozásokból épül fel. A laboratóriumi foglalkozásokon a hallgatók egyrészt ipari és kutatási projektek eredményeivel ismerkednek meg, másrészt önállóan választott problémák megoldásán dolgoznak a tantárgyban megismert módszerekkel és eszközökkel.

    10. Követelmények

    a. A szorgalmi időszakban: zárthelyi sikeres (legalább 40%-os) teljesítése és egy választott otthoni feladat megoldása.

    A zárthelyi az előadások anyagára épít, a hallgatók alapvető tájékozottságát ellenőrzi.

    Az otthoni feladat programozási jellegű, pontos részletei az oktatóval egyeztethetők, összehangolhatók témalabor és önálló laboratórium feladattal. Megoldásával a hallgatók a gyakorlati ismeretek elsajátításáról adnak számot.

    b. A vizsgaidőszakban: -

    11. Pótlási lehetőségek

    A zárthelyi dolgozat pótlására a TVSZ-nek megfelelően egy alkalommal biztosítunk lehetőséget.

    Az otthoni feladat különeljárási díj megfizetése mellett a pótlási időszak végéig adható le késedelmesen (TVSZ).

    12. Konzultációs lehetőségek

    Otthoni feladatok megoldásához órarendi időben.

    13. Jegyzet, tankönyv, felhasználható irodalom

    Tamás Mészáros, „Agent-supported Knowledge Acquisition for Digital Humanities Research", In: A. Szakál (szerk.) IEEE International Conference on Systems, Man, and Cybernetics Conference Proceedings: SMC 2016. Budapest, Hungary, 2016.

    C. Bizer, T. Heath, and T. Berners-Lee, „Linked data-the story so far", Semantic Services, Interoperability and Web Applications: Emerging Concepts, pp. 205-227, 2009.

    Tamás Mészáros, Tadeusz Dobrowiecki, „Controlled Natural Languages for Interface Agents" In: IFAAMAS AAMAS 2009: 8th international conference on Autonomous agents and multiagent systems. Budapest, Magyarország, 2009

    Mészáros Tamás, „Kontrollált természetes nyelvek", tanulmány,  BME MIT, 2009.

    Dezsényi Csaba, Varga Péter, Mészáros Tamás, Strausz György, Dobrowiecki Tadeusz, „Tudásalapú információkinyerés: az IKF projekt" In: Tudományos és Műszaki Tájékoztatás 51:(5) pp. 193-208., 2004

    Mészáros Tamás, „Dokumentum analízis és keresés", tanulmány,  I2RT-TR-1341, 2001.

    Mészáros Tamás, „Szövegelemzési módszerek és esettanulmányok", tanulmány, I2RT-TR-1342, 2002.

    14. A tantárgy elvégzéséhez átlagosan szükséges tanulmányi munka
    Kontaktóra28
    Készülés előadásra3
    Készülés laborra7
    Készülés zárthelyire
    6
    Házi feladat elkészítése
    16
    Összesen60
    15. A tantárgy tematikáját kidolgozta

    Név:

    Beosztás:

    Tanszék, Int.:

    Dr. Mészáros Tamás

    egyetemi docens

    BME MIT