Bioinformatika

A tantárgy angol neve: Bioinformatics

Adatlap utolsó módosítása: 2009. november 20.

Tantárgy lejárati dátuma: 2015. június 30.

Budapesti Műszaki és Gazdaságtudományi Egyetem
Villamosmérnöki és Informatikai Kar

Mesterképzés (MSc):

mérnök informatikus szak

Intelligens rendszerek szakirány (MIT)

kötelezően választható tárgy

Tantárgykód Szemeszter Követelmények Kredit Tantárgyfélév
VIMIM201 2 2/1/0/v 4  
3. A tantárgyfelelős személy és tanszék Dr. Antal Péter, Méréstechnika és Információs Rendszerek Tanszék
4. A tantárgy előadója

Antal Péter

6. Előtanulmányi rend
Ajánlott:

Valószínűségszámítás, Algoritmusok elmélete, Mesterséges intelligencia

7. A tantárgy célkitűzése

Az 1990-es évek technikai áttörései alapvető változást hoztak a biológiai és orvosi kutatások számára. Egyrészt a genom programokhoz kötődően egyre több organizmus teljes genetikai szekvenciája vált és válik ismertté, másrészt a �gén-chip�-ek segítségével nagyszámú (�összes�) gén aktivitásának egyidejű megfigyelése is lehetővé vált. A biológiai adatok mennyiségének és dimenzióinak több nagységrendbeli hirtelen megnövekedése egy tudománytörténeti fordulópontot jelent a biológia és biomedicinák számára, amit jelez egy új tudományágnak a bioninformatikának a létrejötte is. Az egységesen �bioinformatikának� nevezett terület a statisztikai adatelemzésnek, a tudásmérnökségnek, a mesterséges intelligencia kutatásoknak, a számítógépes nyelvészetnek és az informatikának is húzóágazata, trend teremtője lett. Ez különösen igaz az ezek integrálását jelentő �intelligens rendszerek� kutatására és fejlesztésére, mivel

a biológiai adatok elemzése tipikusan elosztottan, az internet segítségével megy végbe, elosztott adat és tudásbázisok, szolgáltatások százainak a segítségével..

A tárgy a bioinformatika statisztikai, algoritmikai, információtechnológiai és tudásreprezentációs aspektusait mutatja be, egyrészt az alapvető ismeretek átadását, másrészt egyes aktuális kutatási témák bemutatását célozva. Bevezetésként a biológiában végbe ment paradigmaváltást ismertetjük (genomika, proteomika szemlélet), illetve az ezeket lehetővé tevő szekvencia adatok és génkifejeződés adatok (génchip adatok) természetét. Ezt követően a szekvenciák illesztéséhez, kereséséhez és elemzéséhéz kapcsolódó módszereket, illetve alapvető gén és fehérje predikciós módszereket ismertetünk. A génkifejeződés adatok elemzésénél különféle kluszterező módszereket mutatunk be, illetve részletesen bemutatjuk a valószínűségi gráf modellek (Bayes és Markov hálók) felhasználását. Az �adatbányászati� módszerek mellett bemutatunk �szövegbányászat�-i módszereket is, illetve ezek kapcsolódását a statisztikai adatelemzéshez. Végül betekintést adunk biológiai adat és tudásbázisokba, internetes szolgáltatásokba és integrálásukba.

8. A tantárgy részletes tematikája
  1. Genomika, poszt-genomika és �in silico� biológia. Biológiai alapok. Szekvencia adatok. Génchipek, génkifejeződés adatok, tárolási szabványok és statisztikai előfeldolgozás. Távlatok, ígéretek, farmakogenomika és személyre szabott gyógyszerek.
  2. Biológia/orvosbiológiai adat és tudásbázisok, internetes szolgáltatások és integrációs eszközök áttekintése. Szekvencia adatbázisok, fehérje adatbázisok, génaktivitás-mintázatok adatbázisai, metabolikus hálózat tudásbázisok, mutációs adatbázisok, ontológiák, tezauruszok és publikációs adatbázisok.
  3. Szekvencia elemzés. Páronkénti illesztés. Rejtett Markov modellek. Többszörös illesztés. Rejtett Markov modell profil konstrukció.
  4. Nyelvtanok felhasználása szekvencia modellezésben. Környezetlen független sztochasztikus nyelvtanok felhasználása.
  5. Fehérje osztályozás és predikció. Terminológia és alapvető módszerek.
  6. Génkifejeződés adatok statisztikai elemzése kluszterezéssel. Kluszterező módszerek. A kiértékelés és értelmezés problémája.
  7. Génkifejeződés adatok statisztikai elemzése interakciós hálózati modellekkel. Valószínűségi modellek, Bayes hálók és Markov hálók. Bayes hálók bioinformatikai alkalmazásai. Valószínűségi és okozati (kauzális) értelmezés.
  8. Tanulás Bayes hálókban. Kauzális modellek tanulása statisztikai adatokból háttértudás felhasználásával.
  9. �Szövegbányászat�-i módszerek Információ keresés. Gén és fehérje név felismerés. Relációk automatikus kivonatolása szintaktikai (nyelvészeti) és statisztikai módszerekkel. Szakirodalmi hálók és tudásbázisok automatikus építése. A szövegbányászat eredményeinek felhasználása a statisztikai adatelemzésben.
  10. Gén predikció. Promoter predikció. Esettanulmány: heterogén a priori ismeretek integrált valószínűségi felhaszálása mikrobiális promoter predikció esetén.
9. A tantárgy oktatásának módja (előadás, gyakorlat, laboratórium)

Előadás és gyakorlat

10. Követelmények

a. A szorgalmi időszakban:

·egy házi feladat, melynek kiadása a 4. oktatási héten történik. A házi feladat bemutatása és értékelése egy közös nyilvános bemutató keretében történik a 13. oktatási héten . A megoldás működését a bemutató keretében egy előadással és demonstrációval kell demonstrálni, és ugyanezen alkalommal a dokumentációt is le kell adni.  A házi feladatra max. 50 pontot lehet kapni, a szükséges minimum a pontok 40%-a.

b. pótlási héten: elővizsga igény szerint.

 b. A vizsgaidőszakban: írásbeli vizsga. A vizsgára bocsátás feltétele a házi feladat minimális szintű teljesítése.

c. Osztályozás:

A vizsga osztályzata a vizsgaeredmény alapján kerül megállapításra.  

 

11. Pótlási lehetőségek

A házi feladat beadás a pótlási héten előzetesen megadott bemutató időpontjában, a dokumentáció egyidejű leadása mellett pótolható.

12. Konzultációs lehetőségek

Megbeszélés alapján.

13. Jegyzet, tankönyv, felhasználható irodalom

Biological Sequence Analysis : Probabilistic Models of Proteins and Nucleic Acids by Richard Durbin (Author), Sean R. Eddy (Author), Anders Krogh (Author), Graeme Mitchison (Author)

Statistical Methods in Bioinformatics: An Introduction by Gregory R. Grant, Warren J. Ewens

Bioinformatics: Sequence and Genome Analysis by David W. Mount

DNA Microarrays and Gene Expression : From Experiments to Data Analysis and Modeling by Pierre Baldi (Author), G. Wesley Hatfield (Author), Wesley G. Hatfield

Bioinformatics: The Machine Learning Approach, Second Edition (Adaptive Computation and Machine Learning) by Pierre Baldi, Soren Brunak, Sren Brunak

Bioinformatics: Databases and Systems by Stanley Letovsky (Editor)

Modern Information Retrieval by R. Baeza-Yates, Berthier Ribeiro-Neto, Ricardo Baeza-Yates

Learning in Graphical Models (Adaptive Computation and Machine Learning) by Michael Irwin Jordan (Editor)

Graphical Models (Oxford Statistical Science Series, 17) by Steffen L. Lauritzen

14. A tantárgy elvégzéséhez átlagosan szükséges tanulmányi munka
Kontakt óra42
Félévközi készülés órákra6
Felkészülés zárthelyire
Házi feladat elkészítése24
Kijelölt írásos tananyag elsajátítása
Vizsgafelkészülés48
Összesen120
15. A tantárgy tematikáját kidolgozta Antal Péter