Budapest University of Technology and Economics, Faculty of Electrical Engineering and Informatics

  Belépés
  címtáras azonosítással

  vissza a tantárgylistához   nyomtatható verzió    

  Ajánlórendszerek: algoritmusok és alkalmazások

  A tantárgy angol neve: Recommender Systems: Algorithms and Applications

  Adatlap utolsó módosítása: 2012. március 29.

  Tantárgy lejárati dátuma: 2014. július 31.

  Budapesti Műszaki és Gazdaságtudományi Egyetem
  Villamosmérnöki és Informatikai Kar

  Mérnök informatikus szak
  Szabadon választható tantárgy

  Tantárgykód Szemeszter Követelmények Kredit Tantárgyfélév
  VITMAV10   4/0/0/v 4  
  3. A tantárgyfelelős személy és tanszék Dr. Magyar Gábor Béla,
  4. A tantárgy előadója
   Név: Beosztás: Tanszék, Intézet:
   Dr. Tikk Domonkos PhD tud. munkatárs TMIT
   Hidasi Balázs doktorandusz TMIT
  5. A tantárgy az alábbi témakörök ismeretére épít – Alapvető mátrixelméleti és algoritmus ismeretek
  6. Előtanulmányi rend
  Ajánlott:
  nincs
  7. A tantárgy célkitűzése A tárgy célja, hogy részletes ismereteket nyújtson az ajánlórendszerek területén. A tárgy egyaránt fókuszál az algoritmikus megoldásokra, és a gyakorlati megvalósítások sajátosságaira és üzleti vetületeire.
  8. A tantárgy részletes tematikája

  1. hét: Bevezetés az ajánlórendszerek világába
  Bemutatkozás. A tárgy követelményeinek ismertetése. Az information overload. Ajánlórendszerek szükségessége és elsődleges feladata. Ajánlórendszerek alkalmazásának területei. Elvárások az ajánlórendszerekkel szemben felhasználói és üzleti irányból. Az ajánlórendszer, mint üzlet. Az ajánlórendszer, mint tudományterület. Kapcsolódó tudományterületek. Kihívások. Ajánlási problémák bemutatása és csoportosítása. Az ajánlórendszer komponensei. Az ajánló által felhasznált adatok.

  2. hét: Egyszerű ajánlók
  Az adatbányászatban elterjedt klasszikus eszközök rövid bemutatása. Adatok előfeldolgozásának  lépései (mintavételezés, dimenziócsökkentés, zajszűrés). Osztályozók (döntési fa, szabály alapú osztályozók, neurális hálózatok, SVM). Klaszterezők (K-means, sűrűség alapú módszerek), gyakori mintakeresés (asszociációs szabályok).
  Ajánlórendszerek építése a klasszikus módszerek használatával. Ezen módszerek elemzése, és korlátaik ismertetése.

  3. hét: Tartalom alapú szűrés (Content Based Filtering, CBF)
  A szövegbányászat klasszikus eszköztárának bemutatása (tokenizálás, stopszó szűrés, szótövezés és lemmatizálás). A vektortérmodell. Súlyozási sémák. Zónák.
  CBF rendszerek általános felépítése. Profilkészítés. A CBF rendszerekben alkalmazott algoritmusok. Előnyök és hátrányok. Az újdonság probléma (serendipity problem) és lehetséges megoldásai.

  4. hét: A kollaboratív szűrés alapjai (Collaborative Filtering, CF)
  A kollaboratív szűrés koncepciójának bemutatása. Felhasználó és termék irányú kollaboratív szűrés. Hasonlóság és távolság mértékek. Legközelebbi szomszéd módszerek. Normalizálás és súlyozás. A CF módszerek korlátai.

  5–7. hét: Mátrixfaktorizáció alapú algoritmusok
  A CF területen kiemelkedő mátrixfaktorizáció (MF) alapú módszerek ismertetése. Mátrixok felbontása alacsony rangú mátrixok szorzatára. Optimalizálási kritériumok, hibamértékek. A lineáris regresszió és különböző változatai). Az elterjedt MF algoritmusok ismertetése (BRISMF, ALS, SVD, SVD+, SVD++, NSVD1). Probabilisztikus (Bayesiánus) mátrixfaktorizációs eljárások (PMF, BPMF), generatív modellezés. Az MF módszerek korlátai. Egy sorrendezésre optimalizáló MF módszer ismertetése (OrdRec framework).

  8. hét: Implicit feedback alapú ajánlási probléma
  A gyakorlatban elterjedt implicit feedback alapú probléma ismertetése. Az explicit feedback gyűjtésének problémája. Eltérés az explicit és az implicit feedback alapú probléma között. AZ implicit feedback alapú modellezés nehézségei. Modellezési megközelítések. Néhány explicit feedback alapú algoritmus implicit változatának ismertetése (szomszéd módszerek, iALS, iNSVD1).

  9. hét: Ajánlórendszerek validációja
  Offline validáció. Az offline kiértékelés során leggyakrabban használt hibaértékek. Értékelésbecslés validációja. Értékelésbecsléshez kapcsolódó hibamértékek (RMSE, MAE). Termékek sorrendezésének validációja. Sorrendezéshez kapcsolódó hibamértékek (Recall, Precision, ARP, NDCG).
  Online validáció. Elterjedt online mérőszámok (CTR, uplift). A predikciótól a tényleges ajánlásig. Algoritmusok/ajánlók online összehasonlítása. Az A/B tesztelés. Összefüggés az offline és az online mértékek között.

  10. hét: Számonkérés és esettanulmány
  A 10. héten kerül sor az aláíráshoz szükséges zárthelyi megírására az óra időpontjában.
  Esettanulmány: a NetFlix verseny és tanulságai (meghívott vendégelőadó).

  11. hét: Kontextus-vezéreltség (context awareness) ajánlórendszerekben
  A kontextus definíciói. Az ajánlórendszerek és a kontextus. Gyakran használt kontextus típusok. Kontextus-vezérelt algoritmusok csoportosítása a kontextus felhasználása alapján. Kontextus-vezérelt algoritmusok előnyei. A kontextus beépítésének lehetősége az algoritmusokba. Néhány konkrét algoritmus bemutatása.

  12. hét: Csoportajánlási problémák (group recommendation) és kényszerek melletti ajánlás
  A csoportnak ajánlás problémája. Konszenzuskeresés csoportban. Predikciós értékek aggregálása. Aggregálási módszerek (átlagolás, least misery, average without misery). Egyszerű csoport ajánlók bemutatása.
  A kényszerek melletti ajánlás problémájának bemutatása. Kényszerfeltételek eredete és hatása az ajánlásra. Néhány egyszerű kényszereket figyelembe vevő algoritmus ismertetése.

  13. hét: Ajánlók hatékonyságának növelése
  Ajánló algoritmusok kombinálása: hasonló és különböző módszerek kombinálása.
  Aktív tanulás (active learning): jelentőséggel bíró értékelések megtalálása, a cold start probléma fennállásának lerövidítése.
  Online tanulás (online learning): modellek real-time frissítése, alkalmazkodás a felhasználó aktuális ízléséhez.
  Magyarázatgenerálás: jelentősége, felhasználó bizalmának megszerzése, magyarázat generálása MF módszerekhez, magyarázatgenerálás CBF módszerekhez.
  Szociális hálók felhasználása ajánlórendszerekhez.

  14. hét: Kitekintés
  Ajánlórendszerek összetevői az ajánló algoritmuson felül. Éles ajánlórendszerekkel szemben támasztott követelmények a jó modellezési képességen túl. A teljesítményt befolyásoló egyéb tényezők.
  Aktív kutatási területek ismertetése és ízelítő érdekes, megoldatlan problémákból.

  9. A tantárgy oktatásának módja (előadás, gyakorlat, laboratórium) Előadás
  10. Követelmények a. A szorgalmi időszakban: egy zárthelyi.
  b. A vizsgaidőszakban: vizsga (szóbeli)
  c. Az aláírás feltétele a zárthelyi (beleértve a pótló zárthelyiket is: lásd a következő pontban)  legalább elégséges szintre történő megírása.
  11. Pótlási lehetőségek A zárthelyi pótlására a szorgalmi időszakban egy lehetőséget biztosítunk. Azok számára, akiknek nem sikerült sem a zárthelyi, sem a pótzárthelyi: a pótlási időszakban 1 alkalmat biztosítunk egy újabb zárthelyi dolgozatra. Az aláírás feltétele valamelyik zárthelyi (első vagy a pót- vagy a pótpót-zárthelyi) legalább elégséges szintre történő megírása.
  12. Konzultációs lehetőségek A tárgy előadóival személyesen, vagy e-mailben egyeztetett időpontban.
  13. Jegyzet, tankönyv, felhasználható irodalom

  • Francesco Ricci, Lior Rokach, Bracha Shapira, Paul B. Kantor (eds.): Recommender Systems Handbook. Springer 2011, ISBN 978-0-387-85819-7 

  • Dietmar Jannach, Markus Zanker, Alexander Felfernig, Gerhard Friedrich: Recommender systems: An Introduction, Cambridge University Press 2010, ISBN 978-0-521-49336-9

  14. A tantárgy elvégzéséhez átlagosan szükséges tanulmányi munka
  Kontakt óra  56
  Félévközi készülés órákra  10
  Felkészülés zárthelyire  14
  Házi feladat elkészítése   -
  Kijelölt írásos tananyag elsajátítása  20
  Vizsgafelkészülés  20
  Összesen120
  15. A tantárgy tematikáját kidolgozta
   Név: Beosztás: Tanszék, Intézet:
   Dr. Magyar Gábor egy. docens TMIT
   Dr. Tikk Domonkos tud. munkatárs TMIT
   Hidasi Balázs doktorandusz TMIT