Belépés címtáras azonosítással
magyar nyelvű adatlap
Ajánlórendszerek: algoritmusok és alkalmazások
A tantárgy angol neve: Recommender Systems: Algorithms and Applications
Adatlap utolsó módosítása: 2012. március 29.
Tantárgy lejárati dátuma: 2014. július 31.
Mérnök informatikus szakSzabadon választható tantárgy
1. hét: Bevezetés az ajánlórendszerek világábaBemutatkozás. A tárgy követelményeinek ismertetése. Az information overload. Ajánlórendszerek szükségessége és elsődleges feladata. Ajánlórendszerek alkalmazásának területei. Elvárások az ajánlórendszerekkel szemben felhasználói és üzleti irányból. Az ajánlórendszer, mint üzlet. Az ajánlórendszer, mint tudományterület. Kapcsolódó tudományterületek. Kihívások. Ajánlási problémák bemutatása és csoportosítása. Az ajánlórendszer komponensei. Az ajánló által felhasznált adatok.
2. hét: Egyszerű ajánlókAz adatbányászatban elterjedt klasszikus eszközök rövid bemutatása. Adatok előfeldolgozásának lépései (mintavételezés, dimenziócsökkentés, zajszűrés). Osztályozók (döntési fa, szabály alapú osztályozók, neurális hálózatok, SVM). Klaszterezők (K-means, sűrűség alapú módszerek), gyakori mintakeresés (asszociációs szabályok).Ajánlórendszerek építése a klasszikus módszerek használatával. Ezen módszerek elemzése, és korlátaik ismertetése.
3. hét: Tartalom alapú szűrés (Content Based Filtering, CBF)A szövegbányászat klasszikus eszköztárának bemutatása (tokenizálás, stopszó szűrés, szótövezés és lemmatizálás). A vektortérmodell. Súlyozási sémák. Zónák. CBF rendszerek általános felépítése. Profilkészítés. A CBF rendszerekben alkalmazott algoritmusok. Előnyök és hátrányok. Az újdonság probléma (serendipity problem) és lehetséges megoldásai.
4. hét: A kollaboratív szűrés alapjai (Collaborative Filtering, CF)A kollaboratív szűrés koncepciójának bemutatása. Felhasználó és termék irányú kollaboratív szűrés. Hasonlóság és távolság mértékek. Legközelebbi szomszéd módszerek. Normalizálás és súlyozás. A CF módszerek korlátai.
5–7. hét: Mátrixfaktorizáció alapú algoritmusokA CF területen kiemelkedő mátrixfaktorizáció (MF) alapú módszerek ismertetése. Mátrixok felbontása alacsony rangú mátrixok szorzatára. Optimalizálási kritériumok, hibamértékek. A lineáris regresszió és különböző változatai). Az elterjedt MF algoritmusok ismertetése (BRISMF, ALS, SVD, SVD+, SVD++, NSVD1). Probabilisztikus (Bayesiánus) mátrixfaktorizációs eljárások (PMF, BPMF), generatív modellezés. Az MF módszerek korlátai. Egy sorrendezésre optimalizáló MF módszer ismertetése (OrdRec framework).
8. hét: Implicit feedback alapú ajánlási problémaA gyakorlatban elterjedt implicit feedback alapú probléma ismertetése. Az explicit feedback gyűjtésének problémája. Eltérés az explicit és az implicit feedback alapú probléma között. AZ implicit feedback alapú modellezés nehézségei. Modellezési megközelítések. Néhány explicit feedback alapú algoritmus implicit változatának ismertetése (szomszéd módszerek, iALS, iNSVD1).
9. hét: Ajánlórendszerek validációjaOffline validáció. Az offline kiértékelés során leggyakrabban használt hibaértékek. Értékelésbecslés validációja. Értékelésbecsléshez kapcsolódó hibamértékek (RMSE, MAE). Termékek sorrendezésének validációja. Sorrendezéshez kapcsolódó hibamértékek (Recall, Precision, ARP, NDCG).Online validáció. Elterjedt online mérőszámok (CTR, uplift). A predikciótól a tényleges ajánlásig. Algoritmusok/ajánlók online összehasonlítása. Az A/B tesztelés. Összefüggés az offline és az online mértékek között.
10. hét: Számonkérés és esettanulmányA 10. héten kerül sor az aláíráshoz szükséges zárthelyi megírására az óra időpontjában.Esettanulmány: a NetFlix verseny és tanulságai (meghívott vendégelőadó).
11. hét: Kontextus-vezéreltség (context awareness) ajánlórendszerekbenA kontextus definíciói. Az ajánlórendszerek és a kontextus. Gyakran használt kontextus típusok. Kontextus-vezérelt algoritmusok csoportosítása a kontextus felhasználása alapján. Kontextus-vezérelt algoritmusok előnyei. A kontextus beépítésének lehetősége az algoritmusokba. Néhány konkrét algoritmus bemutatása.
12. hét: Csoportajánlási problémák (group recommendation) és kényszerek melletti ajánlásA csoportnak ajánlás problémája. Konszenzuskeresés csoportban. Predikciós értékek aggregálása. Aggregálási módszerek (átlagolás, least misery, average without misery). Egyszerű csoport ajánlók bemutatása.A kényszerek melletti ajánlás problémájának bemutatása. Kényszerfeltételek eredete és hatása az ajánlásra. Néhány egyszerű kényszereket figyelembe vevő algoritmus ismertetése.
13. hét: Ajánlók hatékonyságának növeléseAjánló algoritmusok kombinálása: hasonló és különböző módszerek kombinálása.Aktív tanulás (active learning): jelentőséggel bíró értékelések megtalálása, a cold start probléma fennállásának lerövidítése.Online tanulás (online learning): modellek real-time frissítése, alkalmazkodás a felhasználó aktuális ízléséhez.Magyarázatgenerálás: jelentősége, felhasználó bizalmának megszerzése, magyarázat generálása MF módszerekhez, magyarázatgenerálás CBF módszerekhez.Szociális hálók felhasználása ajánlórendszerekhez.
14. hét: KitekintésAjánlórendszerek összetevői az ajánló algoritmuson felül. Éles ajánlórendszerekkel szemben támasztott követelmények a jó modellezési képességen túl. A teljesítményt befolyásoló egyéb tényezők.Aktív kutatási területek ismertetése és ízelítő érdekes, megoldatlan problémákból.
• Francesco Ricci, Lior Rokach, Bracha Shapira, Paul B. Kantor (eds.): Recommender Systems Handbook. Springer 2011, ISBN 978-0-387-85819-7
• Dietmar Jannach, Markus Zanker, Alexander Felfernig, Gerhard Friedrich: Recommender systems: An Introduction, Cambridge University Press 2010, ISBN 978-0-521-49336-9