Budapest University of Technology and Economics, Faculty of Electrical Engineering and Informatics

    Belépés
    címtáras azonosítással

    vissza a tantárgylistához   nyomtatható verzió    

    Írásfelismerés

    A tantárgy angol neve: Optical Character Recognition

    Adatlap utolsó módosítása: 2016. április 11.

    Budapesti Műszaki és Gazdaságtudományi Egyetem
    Villamosmérnöki és Informatikai Kar

    Villamosmérnöki szak, Mérnök informatikus szak , Egészségügyi mérnök szak, Gazdaságinformatikus szak 

    Szabadon választható 

    Tantárgykód Szemeszter Követelmények Kredit Tantárgyfélév
    TE91MM14   2/2/0/v 3  
    3. A tantárgyfelelős személy és tanszék Dr. Kornai András,
    A tantárgy tanszéki weboldala http://algebra.bath.bme.hu/kornai
    4. A tantárgy előadója Dr. Kornai András
    5. A tantárgy az alábbi témakörök ismeretére épít Programozási ismeretek: unix / linux python (C++ hasznos lehet)
    7. A tantárgy célkitűzése Választható tárgy a VIK hallgatóinak
    8. A tantárgy részletes tematikája

    1. Áttekintés: Mitől optikai az optikai karakterfelismerés? Az OCR alapvető fajtái: dinamikus vagy kép-alapú, nyomtatott vagy kézírásos.  Szöveg és ábra-típusok, írások, betűtípusok.  Zajszűrés, binarizálás, a dokumentum felbontása.  Egy konkrét feladat: matematikakönyvből LaTeX kód. Mit lehet automatizálni, és mit nem?

    2. Az alacsonyszintű képfeldolgozás alapjai. Zajszűrés, határkeresés, szinredukció, binarizálás, csontvázépítés, vektorizáció, lánckódolás. Poligonok, kritikus pontok.  Iránykeresés, dőlésbecslés, zónákra bontás.

    3. A szövegzóna elemzése: sorok, iniciálé. A latin alapú ábécék struktúrája. Alapvető font-osztályok.  A binárisés az általános osztályozási feladat. Standard adatbázisok.

    4. A jegyszámítás (feature extraction). A legfontosabb jegyosztályok, geometriai momentumok, Zernike momentumok. Szegmentálás és osztályozás mint egymást követő feladatok, típushibák. Adattömörítés, a legegyszerűbb nyelvmodellek.

    5. Az osztályozók főbb típusai. Hasonlósági (nearest neighbor), ideghálózati (neural network), lineáris, határszélesítő (max margin), maxent, és egyéb osztályozási módszerek.

    6. A szegmentálási, osztályozási, és nyelvmodellezési problémák közös megoldása rejtett Markov modellekkel. Szavazás, tényezők integrálása, modellek integrálása.

     

    9. A tantárgy oktatásának módja (előadás, gyakorlat, laboratórium) Előadás
    10. Követelmények Vizsga vagy projekt
    11. Pótlási lehetőségek

    Sikeres projekt vagy esszé.

    12. Konzultációs lehetőségek Az oktatóval előzetesen egyeztetve, igény szerint.
    13. Jegyzet, tankönyv, felhasználható irodalom http://people.mokk.bme.hu/~kornai/ocr alatt
    14. A tantárgy elvégzéséhez átlagosan szükséges tanulmányi munka
    Kontakt óra28
    Félévközi készülés órákra
    Felkészülés zárthelyire
    Projekt készítése47
    Kijelölt írásos tananyag elsajátítása
    Vizsgafelkészülés15
    Összesen90
    15. A tantárgy tematikáját kidolgozta Dr Kornai András