Budapest University of Technology and Economics, Faculty of Electrical Engineering and Informatics

  Belépés
  címtáras azonosítással

  vissza a tantárgylistához   nyomtatható verzió    

  Írásfelismerés

  A tantárgy angol neve: Optical Character Recognition

  Adatlap utolsó módosítása: 2016. április 11.

  Budapesti Műszaki és Gazdaságtudományi Egyetem
  Villamosmérnöki és Informatikai Kar

  Villamosmérnöki szak, Mérnök informatikus szak , Egészségügyi mérnök szak, Gazdaságinformatikus szak 

  Szabadon választható 

  Tantárgykód Szemeszter Követelmények Kredit Tantárgyfélév
  TE91MM14   2/2/0/v 3  
  3. A tantárgyfelelős személy és tanszék Dr. Kornai András,
  A tantárgy tanszéki weboldala http://algebra.bath.bme.hu/kornai
  4. A tantárgy előadója Dr. Kornai András
  5. A tantárgy az alábbi témakörök ismeretére épít Programozási ismeretek: unix / linux python (C++ hasznos lehet)
  7. A tantárgy célkitűzése Választható tárgy a VIK hallgatóinak
  8. A tantárgy részletes tematikája

  1. Áttekintés: Mitől optikai az optikai karakterfelismerés? Az OCR alapvető fajtái: dinamikus vagy kép-alapú, nyomtatott vagy kézírásos.  Szöveg és ábra-típusok, írások, betűtípusok.  Zajszűrés, binarizálás, a dokumentum felbontása.  Egy konkrét feladat: matematikakönyvből LaTeX kód. Mit lehet automatizálni, és mit nem?

  2. Az alacsonyszintű képfeldolgozás alapjai. Zajszűrés, határkeresés, szinredukció, binarizálás, csontvázépítés, vektorizáció, lánckódolás. Poligonok, kritikus pontok.  Iránykeresés, dőlésbecslés, zónákra bontás.

  3. A szövegzóna elemzése: sorok, iniciálé. A latin alapú ábécék struktúrája. Alapvető font-osztályok.  A binárisés az általános osztályozási feladat. Standard adatbázisok.

  4. A jegyszámítás (feature extraction). A legfontosabb jegyosztályok, geometriai momentumok, Zernike momentumok. Szegmentálás és osztályozás mint egymást követő feladatok, típushibák. Adattömörítés, a legegyszerűbb nyelvmodellek.

  5. Az osztályozók főbb típusai. Hasonlósági (nearest neighbor), ideghálózati (neural network), lineáris, határszélesítő (max margin), maxent, és egyéb osztályozási módszerek.

  6. A szegmentálási, osztályozási, és nyelvmodellezési problémák közös megoldása rejtett Markov modellekkel. Szavazás, tényezők integrálása, modellek integrálása.

   

  9. A tantárgy oktatásának módja (előadás, gyakorlat, laboratórium) Előadás
  10. Követelmények Vizsga vagy projekt
  11. Pótlási lehetőségek

  Sikeres projekt vagy esszé.

  12. Konzultációs lehetőségek Az oktatóval előzetesen egyeztetve, igény szerint.
  13. Jegyzet, tankönyv, felhasználható irodalom http://people.mokk.bme.hu/~kornai/ocr alatt
  14. A tantárgy elvégzéséhez átlagosan szükséges tanulmányi munka
  Kontakt óra28
  Félévközi készülés órákra
  Felkészülés zárthelyire
  Projekt készítése47
  Kijelölt írásos tananyag elsajátítása
  Vizsgafelkészülés15
  Összesen90
  15. A tantárgy tematikáját kidolgozta Dr Kornai András