Belépés címtáras azonosítással
magyar nyelvű adatlap
Írásfelismerés
A tantárgy angol neve: Optical Character Recognition
Adatlap utolsó módosítása: 2016. április 11.
Villamosmérnöki szak, Mérnök informatikus szak , Egészségügyi mérnök szak, Gazdaságinformatikus szak
Szabadon választható
1. Áttekintés: Mitől optikai az optikai karakterfelismerés? Az OCR alapvető fajtái: dinamikus vagy kép-alapú, nyomtatott vagy kézírásos. Szöveg és ábra-típusok, írások, betűtípusok. Zajszűrés, binarizálás, a dokumentum felbontása. Egy konkrét feladat: matematikakönyvből LaTeX kód. Mit lehet automatizálni, és mit nem?
2. Az alacsonyszintű képfeldolgozás alapjai. Zajszűrés, határkeresés, szinredukció, binarizálás, csontvázépítés, vektorizáció, lánckódolás. Poligonok, kritikus pontok. Iránykeresés, dőlésbecslés, zónákra bontás.
3. A szövegzóna elemzése: sorok, iniciálé. A latin alapú ábécék struktúrája. Alapvető font-osztályok. A binárisés az általános osztályozási feladat. Standard adatbázisok.
4. A jegyszámítás (feature extraction). A legfontosabb jegyosztályok, geometriai momentumok, Zernike momentumok. Szegmentálás és osztályozás mint egymást követő feladatok, típushibák. Adattömörítés, a legegyszerűbb nyelvmodellek.
5. Az osztályozók főbb típusai. Hasonlósági (nearest neighbor), ideghálózati (neural network), lineáris, határszélesítő (max margin), maxent, és egyéb osztályozási módszerek.
6. A szegmentálási, osztályozási, és nyelvmodellezési problémák közös megoldása rejtett Markov modellekkel. Szavazás, tényezők integrálása, modellek integrálása.
Sikeres projekt vagy esszé.