Belépés címtáras azonosítással
magyar nyelvű adatlap
Biztonság a gépi tanulásban
A tantárgy angol neve: Security in Machine Learning
Adatlap utolsó módosítása: 2020. november 4.
Mérnök informatikus szak
Villamosmérnöki szak BSc és MSc képzés
Szabadon választott
Név:
Beosztás:
Tanszék, Int.:
Dr. Ács Gergely
Egyetemi adjunktus
HIT
Matematikai analízis, Valószínűségszámítás, Programozási ismeretek legalább 1 nyelven
A tárgy részletes betekintést nyújt a gépi tanulási modellek támadhatóságának, megkerülésének problémáiba, valamint az azok ellen létező védekezési technikákba. A tárgyat elvégző hallgatók olyan elméleti és gyakorlati ismereteket szereznek, melyek a gépi modellek biztonságossá tételének alapját képezik. Továbbá a tárgy lehetővé teszi a fenyegetettségek megértését és felmérését, az alkalmas védelmi technológiák kiválasztását és integrálását. A tárgy célja olyan ismeretek átadása, mely mára már a mindennapokban használt gépi tanulási modellek elengedhetetlen része.
1. hét: Bevezetés és motiváció
A félév során bemutatott gépi tanulási modellek bemutatása, matematikai hátterük áttekintése I: Tanulás alapjai, generalizáció, overfitting, lineáris modellek, döntési fák, random forest, ensemble tanulás, k-NN
2. hét:
A félév során bemutatott gépi tanulási modellek bemutatása, matematikai hátterük áttekintése II: Neurális hálók, tanuló algoritmusok (gradiens süllyedés), regularizáció
3. hét:
A gépi tanulási modellek támadhatósági problémájának részletes bemutatása, FGSM (Fast Gradient Sign Method), illusztratív esettanulmányok
4. hét:
Támadó minták a való világban. Önvezető autók megtévesztése, személy- és arcfelismerő alkalmazások kikerülése. Iteratív modellek. Deep fool.
5.hét:
Támadó minták transzferabilitása különböző modellek és tanító adathalmazok között. Kereszt-tanításos támadás. Együttes (ensemble) modellek használata.
6.hét:
Fekete doboz (black box) támadások. Modell-lopás, modell-visszafejtés.
7.hét:
A támadó minták létezésének vizsgálata. Túlzott linearitás, túltanulás és döntési határvonalak (Linearity Hypothesis and Curvature of Decision Boundaries).
8.hét:
Az „egypixeles" támadás bemutatása. Input megváltoztatásának minimalizálása.
9.hét:
Védekezési technikák bemutatása I. - Adversarial training, distillation, error correcting codes, droput, input reconstruction
10.hét:
Védekezési technikák bemutatása II. - Virtual adversarial training, generative pretraining, perturbation
11.hét:
Certified robustness. Differenciális adatvédelem és a támadó minták kapcsolata.
12.hét:
Értelmezhetőség (interpretability), leírhatóság (explainability) és vizuálizáció nehézségei, valamint ezek fontossága a támadások elkerülése céljából.
13.hét:
A támadó minták, mint nem robusztus attribútumok. Robosztus és nem robusztus attribútumok szétválasztása. Generalizációs korlátok, „no free lunch theorem".
14.hét:
Támadó minták az emberi agyban. Ember és gép képességeinek összehasonlítása jóindulatú és rosszindulatú minták esetén. Természetes támadó minták generálása.
a. A szorgalmi időszakban: 1 db nagy házi feladat elvégzése, és legalább elégséges szintű teljesítése. A házi feladat szakcikkek feldolgozása és előadása. A cikkeket az első órán osztjuk ki, minden diák 1-2 cikket kap nehézségtől és terjedelemtől függően. A bevezető órák után következik a cikkek bemutatása. Egy cikket körülbelül 40-50 perc alatt kell előadni egy diáknak a csoport számára. Előadás közben bármilyen segédanyag használható. A cikkek feldolgozásához segítséget nyújtunk a hallgatóknak. Továbbá, csak az a hallgató kaphat jegyet, aki az órák legalább 80%-án részt vett. (Ez 13 óra esetén 10 órát jelent.)
b. A vizsgaidőszakban:
c. Elővizsga:
Előadókkal külön egyeztetett időpontban
Előadások anyaga on-line elérhető, minden témakörhöz külön irodalomjegyzékkel ellátva.
Lestyán Szilvia
doktorandusz
adjunktus