Deň 1: Úvod do Pythonu a spracovania dát
Základy programovania v Pythone
Práca s dátami v Pandas
Čistenie dát, filtrovanie, transformovanie
Manipulácia s dátumami a strings
Groupby a agregácie, multiindex
Long a wide formát dát
Import a export dát, prepojenie s Excelom
Deň 2: Vizualizácia dát
Základy vizualizácie dát v Pythone
Knižnice Matplotlib, Seaborn, Plotly
Groupby + agregácie a ich vizualizácia
Interaktívne grafy a dashboardové prvky
Geografické vizualizácie
Multivariačné grafy
Princípy dátovej komunikácieti
Deň 3: Štatistika a regresné modelovanie
Základy štatistiky a pravdepodobnosti
Štatistické testovanie hypotéz
Interpretácia výsledkov a p-hodnoty
Lineárna regresia
Logistická regresia
Metriky prediktívnej sily
Korelácia, kauzalita a randomizácia
Prirodzené experimenty
Štatistika vs strojové učenie
Deň 4: Machine Learning
AI od základov: pojmy, typy a využitie
Trénovanie modelov strojového učenia
Klasifikačné a regresné modely
Senzitivita, špecificita, ROC krivka
Interpretácia rozhodovania ML modelov
Neurónové siete a deep learning
Unsupervised learning, t-SNE
Integrácia LLM do Python projektov
Extrakcia štruktúrovaných dát z textu
Deň 5: Dátový hackathon!
V spolupráci s partnermi sme pripravili namakané dátové výzvy so slovenskými dátami z oblasti zdravotníctva a školstva. Cieľom hackathonu je, aby každý účastník aplikoval svoje nové dátové a programátorské skills priamo v praxi, a zároveň sme sa dozvedeli niečo nové o dôležitých spoločenských témach. Viaceré tímy prišli na zaujímavé zistenia v oboch zadaniach, ktoré priniesli nové pohľady pre stakeholderov.