Információ - és tudás integrálás

A tantárgy angol neve: Information and Knowledge Integration

Adatlap utolsó módosítása: 2010. április 14.

Budapesti Műszaki és Gazdaságtudományi Egyetem
Villamosmérnöki és Informatikai Kar

Mérnök Informatikus Szak
MSc képzés
Intelligens Rendszerek Szakirány

Tantárgykód Szemeszter Követelmények Kredit Tantárgyfélév
VIMIM222 2 2/1/0/v 4  
3. A tantárgyfelelős személy és tanszék Dr. Strausz György,
4. A tantárgy előadója

 Név: Beosztás:  Tanszék, Int.:
 Strausz György Docens MIT

5. A tantárgy az alábbi témakörök ismeretére épít

Mesterséges Intelligencia
Adatbázisok

6. Előtanulmányi rend
Kötelező:
NEM ( TárgyEredmény( "BMEVITMMA06" , "jegy" , _ ) >= 2
VAGY
TárgyEredmény("BMEVITMMA06", "FELVETEL", AktualisFelev()) > 0
VAGY
TárgyEredmény( "BMEVIMIMB01" , "jegy" , _ ) >= 2
VAGY
TárgyEredmény("BMEVIMIMB01", "FELVETEL", AktualisFelev()) > 0 )

A fenti forma a Neptun sajátja, ezen technikai okokból nem változtattunk.

A kötelező előtanulmányi rendek grafikus formában itt láthatók.

Ajánlott:
Nincs
7. A tantárgy célkitűzése

Elosztott számítógépes környezetekben (internet, intranet) bőséges információ áll rendelkezésre számos területre vonatkozóan. Ezen adatok, ismeretek integrálása, kombinálása kiszélesíti az információs rendszerek szolgáltatásainak körét, újfajta alkalmazások megvalósítását teszi lehetővé.
A tárgy célkitűzése megismertetni a hallgatókat elosztott információs bázisok (adatbázisok, XML dokumentumok, szöveg korpuszok) integrálásának, az elérhető információk kinyerésének módszereivel. A tantárgy követelményeit eredményesen teljesítő hallgatóktól elvárható, hogy:
(1)    tisztában legyenek nagyméretű, heterogén, elosztott információs rendszerek kezelésének problémáival,
(2)    ismerjék az információkinyerés módszereit és technológiáit mind intranetes adatbázisok, mind internetes információs források esetében,
(3)    ismerjék a web továbbfejlesztésére vonatkozó javaslatokat, a kialakuló új technológiákat, ezek fejlesztésének módszereit,
(4)    képesek legyenek információ integrációs rendszerek tervezésre, az információs források és adatainak leírására szolgáló logikai modellek létrehozására,
(5)    tájékozottak legyenek a mesterséges intelligencia fogalmi modellezésre vonatkozó új eredményeivel, áttekintésük legyen a jelenleg elérhető modellekről, alkalmazásokról és eszközökről

8. A tantárgy részletes tematikája
  • Bevezetés (2 óra elmélet/előadás):
    Az elosztott, heterogén információs környezet jellemzőinek áttekintése, az információs környezet új minőségében rejlő lehetőségek. Az információ integrálás igénye.
  • Információ integrálás módszerei (4 óra elmélet/előadás):
    Mediátor/integrátor megközelítés bemutatása. Mediátorok szerepe, tervezési módszerei. Virtuális és materializált információ integrációs megközelítések előnyei, hátrányai.
  • Virtuális adatintegráció technikái (6 óra elmélet/előadás):
    Lokális és globális nézeteken alapuló virtuális integrációs sémák. Ontológiák szerepe a fogalmi heterogenitás feloldásában. Virtuális integrációt támogató mediátorok felépítése. Lekérdezések megfogalmazása, lefordítása, optimalizálása, futtatása a különböző virtuális sémák felhasználásával.
  • Adattárház rendszerek (4 óra elmélet/előadás):
    A materializált integráció előnyei és problémái. Adattárház rendszerek építésének folyamata. Adatok tárolása, lekérdezése adattárház rendszerekben.
  • Interneten elérhető információk integrálása  (6 óra elmélet/előadás):
    Információ keresés félig-strukturált információs forrásokban. Jelenleg elérhető internetes kereső rendszerek technológiái, képességei, hiányosságai. Szemantikus web koncepció lényege, technológiái. A szemantikus web technikák alkalmazása webes információs források integrálásában.
  • Adatbányászat és szövegbányászat (6 óra elmélet/előadás):
    Az adat- és szövegbányászat célkitűzései. Adatbányászati alkalmazás megvalósításának folyamata (adatok előfeldolgozása, kezelése). Alapvető adatbányászati algoritmusok (gyakori minták, gyakori sorozatok, asszociációs szabályok, klaszterezési eljárások).
    Nyelvtechnológia alapjai (morphológia, nyelvtanok, fordítás). Keresési technikák szöveges forrásokban. Információkinyerés szöveges dokumentumokból.
  • Tanulás információ integrációs rendszerekben (4 óra elmélet/előadás):
    Induktív tanuló algoritmusok az információ integrációs rendszerekben. Adaptív mediátor sémák. Wrapperek tanulása.
  • Alkalmazási területek bemutatása (4 óra elmélet/előadás):
    Virtuális elektronikus piactér rendszerek. Adatintegráció nagyvállalati információs rendszerekben. Korszerű webes keresőrendszerek. Információ kivonatolás webes forrásokból.
9. A tantárgy oktatásának módja (előadás, gyakorlat, laboratórium) Előadás az szorgalmi időszak első 7 hetében (heti 4 óra), gyakorlat a szorgalmi időszak második felében (heti 2 óra).
10. Követelmények
  1. Szorgalmi időszakban: 
    Házi feladat sikeres elkészítése és leadása a félév végéig.
  2. Vizsgaidőszakban: Szóbeli vizsga. A vizsgára bocsátás feltétele az elfogadott házi feladat.
  3. Osztályozás: A vizsga osztályzata a szóbeli vizsgán megszerzett jegy.
11. Pótlási lehetőségek

A házi feladat bemutatása a pótlási héten még lehetséges.

12. Konzultációs lehetőségek Igény szerint, egyeztetett időpontokban.
13. Jegyzet, tankönyv, felhasználható irodalom
  • J. Minker (ed.): "Logic-based Artificial Intelligence", Kluwer Academic Publishers, Jan 2001 /
  • Planning for Information Gathering: A Tutorial Survey,, E. Lambrecht and S. Kambhampati, ASU CSE Tech Report 96-017, May 1997.
  • Szeredi Péter, Lukácsy Gergely, Benkő Tamás, A szemantikus világháló elmélete és gyakorlata∞, TypoTex∞, Budapest, 2005
14. A tantárgy elvégzéséhez átlagosan szükséges tanulmányi munka
Kontakt óra42
Félévközi készülés órákra
Felkészülés zárthelyire
Házi feladat elkészítése30
Kijelölt írásos tananyag elsajátítása
Vizsgafelkészülés48
Összesen120
15. A tantárgy tematikáját kidolgozta

 Név: Beosztás:  Tanszék, Int.:
 Strausz György Docens MIT