Adatalapú rendszerek témalaboratórium

A VIK Wikiből
A lap korábbi változatát látod, amilyen Vasas Mónika (vitalap | szerkesztései) 2022. május 10., 14:37-kor történt szerkesztése után volt. (→‎Követelmények)
Témalaboratórium
Tárgykód
VITMBB04
Általános infók
Szak
üzemmérnök
Kredit
6
Ajánlott félév
4
Keresztfélév
N/A
Követelmények
Elérhetőségek

A témalaboratórium egyrészt bemutatja a specializáció gazdatanszékéhez és esetleges közreműködő tanszékeihez tartozó műhelyeket, amelyek a specializáció tantárgyait oktatják, később pedig a kooperatív képzés keretében zajló Önálló laboratórium, Projektgyakorlat, illetve a Szakdolgozat-készítés tantárgyakban témavezetőket biztosítanak. A hallgatók a témalaboratórium foglalkozásai során megismerkednek a műhely munkájával, és elsajátítják a műhely témáinak műveléséhez szükséges speciális szakmai ismereteket. A tantárgy másik célja a kooperatív képzés előkészítése, a képzésben közreműködő vállalatok profiljának, az általuk művelt, és a képzés számára felkínált témáinak, alkalmazott tipikus technológiáinak megismertetése. A Témalaboratórium tantárgy elvégzésével a hallgatók jártasságot szereznek a kooperatív képzés Önálló laboratórium, Projektgyakorlat és Szakdolgozat-készítés tárgyaiban alkalmazandó eszközök, technológiák és módszerek alkalmazásában, és megalapozottan tudnak kooperatív képzésre jelentkezni.

Követelmények

2022

Összefoglaló:

  • A konzultációs órák nincsenek megtartva, önálló munkavégzés van. (A témavezető általában 4-7 napon belül szokott visszaírni -Teams-en és e-mailben is-, így probléma vagy elakadás esetén hatékonyabb, ha megpróbáljuk egyedül megkeresni a megoldást.)
  • Három témalabor témát kell választanod, ezek 3 data productot jelentenek.
  • Mindegyik data productról bemutató videót kell készíteni.
  • A többi hallgató munkáit és videóit értékelned kell.

(Részletekért kérlek tekintsd meg a fentebb található pdf-t.)

Értékelés

  • Ötlet, feladat komplexitása - 20%
  • Megvalósítás mikéntje, választott technológia bonyolultsága - 50%
  • Változatosság: a három data productod ne legyen ugyanazon a technológiai stacken megvalósítva, ha az a platform túl egyszerű (ez eddig kb. az Excel-re vonatkozott, PowerBI-ra nem. A lényeg, hogy fejlődj.)
  • Elkészült videó minősége, érthetősége - 20%

Elégségest az kaphat, aki legalább három data productot legalább elégséges szintre elkészített.

  • A végső jegyből levon, ha nem értékeltél 9 másik videót
  • A végső jegyhez extra értéket ad hozzá, ha több mint 9 videót értékeltél.

Extra pontok:

  • Első 3 data product ötlet beküldőjének (egy ember maximum egyet szerezhet belőle): 1-1 extra pont
  • Első 3 első data product megvalósításáért (egy ember maximum egyet szerezhet belőle): 1-1 extra pont
  • Első 3 embernek, aki értékelt már 9 megvalósítást (egy ember maximum egyet szerezhet belőle): 1-1 extra pont
  • Legtöbbet véleményezők is extra pontot kapnak (méltányossági alapon több pontot is kiosztanak)

Az extra pontok egy-egy érdemjegy növelést lehet elérni a féléves munkában - feltéve ha legalább három data productot elküld az illető a félév során határidőre (elégséges szint elérést az elsőzés nem biztosíthatja).

Tippek

Bármilyen technológiát lehet választani, annak magadnak érdemes utánanézni. Ha nincs ötleted, kulcsszó, ami segíthet ha nem jut eszedbe semmilyen technológia

  • Power BI, Tableau, QuiqView
  • RapidMiner, KNime, Azure Machine Learning
  • Python Ipython Notebook és kapcsolódó dolgok (matplotlib, bokeh, plotly), R
    • Auto-sklearn
    • Sklearn
    • Pandas
    • NLTK
    • SpaCy
  • crawler technológiák (a PowerBI-ban ez beépített szolgáltatás), OpenRefine adattisztogatásra
  • Azure Cognitive Service, Google Colab (főleg akkor jó, ha inkább GPU-t használnák)
  • Deep learning megoldások
  • Webfejlesztés, JavaScript, D3
  • Neo4j
  • Citoscape
  • Cloudera, Spark, Hive, Impala, HDFS
  • MLOps

Érdemes az első data productot PowerBI-ban csinálni, mert a használata egyszerű és az ismerete az iparban is hasznodra válhat.

A "data product" egy adatalapú projektet akarna jelenteni, néhány ötlet a korábbi évekből:

  • Kriptovaluta árfolyam megjelenítő
  • New York Times Headline Analysis
  • Webkamera kép kiértékelő python szkript
  • Időjárás jelentés összegző
  • Eminem zeneszöveg elemzés
  • Edzésnapló
  • Premier League 2017-18-as szezon összegzése
  • Olimpiai statisztikák elemzése és megjelenítése
  • Méhek pusztulása az USA-ban
  • Geotagging Pictures
  • Chatbot
  • KSH adatvizualizáció
  • Saját bankkártya adataim pénzügyi analízise

Hasznos oldalak:

Határidők

Ilyenek voltak a 2022-es határidők:

  • Legalább egy data product ötlet beküldésének határideje: március 3. csütörtök. déli 12h
  • Első kész data product videó elkészítésének ideje: március 31. déli 12h
  • Második kész data product videó elkészítése ideje: április 28. dél 12h
  • Utolsó data product videó beküldésének határideje: május 5. 12h00
  • Kiosztott videók (nem a saját videóid) megtekintésének és a véleményed beküldésének határideje: május 12 szerda déli 12h00

Érdemes odafigyelni rájuk, mert csúszás esetén jegylevonás jár! Ha készen vagy egy data product-al és feltöltötted a videót, azt mindig le kell jelenteni a tájékoztatóban csatolt google formon. A videók véleményezésére is külön form van.