Ak niektoré z týchto pokynov predstavujú pre váš projekt problém, konzultujte možné riešenia s vyučujúcimi.

Ciele projektu

Projekt je kľúčovou časťou predmetu

  • Na rozdiel od zadaní, kde máte presne danú úlohu a často aj rady k postupu, pri projekte si precvičíte samostatnejšiu prácu na analýze dát, kde si budete vymýšľať ciele aj postupy ako ich splniť.
  • Budete ale pracovať v skupinách, takže sa môžete učiť aj jeden od druhého.
  • Precvičíte si aj ďalšie aspekty práce v tímoch, ako komunikácia a koordinácia, tvorba dokumentácie a podobne.
  • Dôležitým aspektom projektu je aj komunikácia výsledkov vo forme prezentácie aj vo forme písomnej správy a technického dokumentu (notebooku), čo sú tiež dôležité zručnosti.
  • Váš pokrok na projekte budú monitorovať cvičiaci, ktorí vám radi poradia v prípade problémov.

Témy projektov

Nižšie ponúkame štyri témy projektov. Môžete si vybrať jednu z nich, alebo navrhnúť vlastnú. K témam sú uvedené otázky, ktoré môžete skúmať, môžete si však vymyslieť aj iné. Spojenie dát z uvedených stránok s ďalšími zdrojmi dát je veľmi vítané, ale zamerajte sa primárne na uvedené tabuľky.

Požiare

Organizácia Spojených národov pre výživu a poľnohospodárstvo (Food and Agriculture Organization, FAO) zdieľa niekoľko datasetov, okrem iného aj údaje o lesných a stepných požiaroch za roky 1992-2022 v jednotlivých krajinách sveta a tiež údaje o typoch porastu. Skúmať môžete rozdiely medzi regiónmi sveta aj časové trendy týchto údajov. Tabuľku o požiaroch nájdete v sekcii Bulk downloads, popis, tabuľka o typoch porastu (land cover).

Voľný čas

Eurostat má niekoľko tabuliek, ktoré porovnávajú prístup k voľnočasovým aktivitám a spoločenským interakciám v rôznych krajinách Európy a vzhľadom na rôzne ukazovatele ako sú vek, pohlavie, vzdelianie, príjem a podobne. Skúste vizualizovať závislosti medzi týmito typmi veličín. Tabuľky nájdete v sekcii Leisure and social interaction.

Vzdelanie

V roku 2021 sa na Slovensku uskutočnilo sčítanie obyvateľov, pričom sumárne dáta sú k dispozícii. Stiahnite si tabuľky uvedené nižšie, ktoré obsahujú údaje o dosiahnutom vzdelaní v kombinácii s inými ukazovateľmi, ako sú vek, pohlavie, obec/okres/kraj a zamestnanie. Vidíte nejaké zaujímavé rozdiely medzi jednotlivými regiónmi Slovenska? Ako sa líši vzdelanie medzi rôznymi vekovými kategóriami alebo na základe pohlavia? Ako vzdelanie súvisí s typom zamestnania? Dá sa prípadne spraviť aj porovnanie s predchádzajúcim sčítaním obyvateľov. Tabuľky: tab10, tab40, tab47, tab67.

Proteíny

Proteíny sú reťazce aminokyselín, ktoré vykonávajú v bunkách veľa kľúčových funkcií. Počas evolúcie sa proteíny menia kvôli mutáciám v DNA, ale napriek tomu vieme ľudským proteínom často nájsť náprotivky v iných organizmoch a skúmať ako sa jednotlivé proteíny menia počas evolúcie. Základné dáta v tomto projekte sú tabuľky, ktoré pre cca 13 tisíc ľudských proteínov udávajú mieru ako veľmi sa líšia od proteínov v 5 iných cicavcoch. Cieľom bude preskúmať trendy v týchto dátach a ich súvislosti s ďalšími zdrojmi dát o proteínoch. Dáta a ďalšie podrobnosti nájdete na zvláštnej stránke. Téma je vhodná pre BIN aj DAV študentov.

Fázy projektu

  • Vytvorenie skupín: Dohodnite sa na skupinách veľkosti 4-5 do pondelka 25.3. 22:00. Jeden člen skupiny uvedie členov skupiny a názov skupiny do tabuľky zverejnenej v Google classroom. Názov by mal byť krátky a ľahko zapamätateľný, môže to byť napríklad skratka obsahujúca prvé písmená vašich krstných mien alebo priezvisk. Nezaradení študenti budú rozdelení do skupín vyučujúcimi.
  • Voľba témy: Každá skupina si zvolí tému najneskôr do pondelka 8.4. 22:00. Jeden člen skupiny zapíše názov témy do príslušného dokumentu v Google classroom. Najviac 3 skupiny môžu robiť tú istú tému, takže ak si už 3 iné skupiny vybrali a zapísali vašu najobľúbenejšiu tému, musíte si zvoliť inú (preto zapisujte tému čím skôr). Ak chcete navrhnúť vlastnú tému, musíte stručný popis témy a dostupných dát poslať emailom B. Brejovej najneskôr do pondelka 25.3., čím skôr vám potom dáme vedieť, či je téma vhodná.
  • Organizácia skupiny: Dohodnite sa, ako budete v skupine komunikovať, rozdeľovať úlohy, zdieľať súbory a podobne. Založte si denník a linku, ktorá umožňuje do denníku vkladať komentáre, zapíšte do príslušnej úlohy v Google Classroom (budeme vám tam zapisovať priebežné hodnotenie). Na stretnutie v rámci skupiny môžete využiť časť cvičení, skupinové zadania už po 26.3. nebudú. Na cvičeniach však máte aj krátke skupinové stretnutie s cvičiacimi a individuálne riešenie úloh s prípadnou radou od cvičiacich.
  • Priebežná kontrola: Na každom cvičení od 16.4. do 7.5. sa uskutoční krátke stretnutie skupiny s vyučujúcimi ohľadom pokroku na projekte. Bližšie detaily viď nižšie.
  • Prvé kroky: Sťahovanie dát, ich úprava do vhodného formátu, zisťovanie základných charakteristík, opravovanie alebo odstraňovanie nesprávnych položiek. Najneskôr na cvičení 9.4. začnete na týchto úlohách pracovať. Ideálne by ste ich dokončili pred ďalším týždňom, ale v niektorých projektoch toto môže byť väčšia časť projektu a trvať dlhšie.
  • Ďalšie etapy: Stanovte si otázku, ktorá by sa vo vašich dátach dala analyzovať a pokúste sa ju odpovedať vhodnými grafmi a tabuľkami. Snažte sa nájsť čo najvhodnejšiu vizualizáciu a preskúmať trendy alebo ich výnimky, ktoré nájdete. Postupne preskúmate niekoľko takých otázok. Jednotliví členovia skupiny alebo podskupinky môžu paralelne pracovať na rôznych otázkach. Postupne zostavujte aj materiály, ktoré budete odovzdávať.
  • Prezentácie projektov: Prezentácie budú v poslednom týždni semestra počas prednášky a cvičení alebo v inom dohodnutom čase.
  • Odovzdanie projektu: Termín je v pondelok 20.5. 22:00 (prvý deň skúškového), ale odporúčame ho dokončiť skôr.

Kontrolné stretnutia

  • Na každom cvičení od 16.4. do 7.5. sa uskutoční stretnutie skupiny s vyučujúcimi ohľadom pokroku na projekte.
  • Skupina má v denníku nachystané stručné poznámky ohľadom aktuálneho stavu (kto čo spravil, aké sú ďalšie plány a či sú prípadne nejaké problémy).
  • Jeden člen skupiny otvorí túto časť denníka a veľmi stručne za cca 2 minúty ju odreferuje. Má prichystané aj ďalšie súbory, takže vie rýchlo v prípade potreby ukázať dokončené alebo rozrobené vizualizácie alebo tabuľky. Každý týždeň by mal referovať iný člen skupiny.
  • Nasleduje diskusia, do ktorej sa podľa potreby zapája celá skupina.
  • Zvyšok cvičenia môžete podľa vlastného uváženia pracovať na projekte (skupinovo alebo individuálne) alebo na individuálnych úlohách k predmetu.

Technické pokyny

  • Projekt by mal byť v jazyku Python, spustiteľný v prostredí Colab a pracujúci prevažne s knižnicami preberanými na prednáške, hoci v menšej miere môžete použiť aj iné.
  • Spravte si svoju kópiu spracovávaných dát, aby vás neohrozilo, ak dáta zo zdrojovej stránky zmiznú alebo sa zmenia. Ak dáta vyžadujú rozsiahle predspracovanie, uložte si aj predspracované dáta.
  • Dáta sa vám budú dobre načítavať, ak si ich dáte na web, napríklad na fakultný server daVinci (návod).
  • Do dát robte čo najmenej manuálnych zásahov.
  • Opakujúce sa časti kódu presuňte do funkcií, ktoré viackrát použijete s rôznymi parametrami. Takisto zložitejšie výpočty je vhodné presunúť do funkcie.
  • Počas práce na projekte priebežne píšte denník a zdieľajte ho s vyučujúcimi (viď nižšie).
  • Ukladajte si použité zdroje a citujte ich vo výslednom projekte. Môžete sa inšpirovať existujúcimi analýzami vašich dát a replikovať prípadne rozšíriť tieto analýzy, je však potrebné priznať zdroje svojej inšpirácie.
  • Na projekte je povolené používať editory podporujúce automatické generovanie kódu pomocou umelej inteligencie. Avšak automaticky generovaný kód musíte podrobne preštudovať, pochopiť, skontrolovať a opraviť v ňom prípadné chyby. Na ústnej skúške budeme overovať, či viete vysvetliť a modifikovať váš kód aj bez použitia umelej inteligencie. Ak využívate nástroje umelej inteligencie, uveďte to v denníku a medzi zdrojmi v notebooku.

Odovzdávanie finálneho projektu

Ako finálny projekt odovzdáva jeden člen skupiny dva súbory uvedené nižšie a naďalej nám dávajte k dispozícii aj denník, ktorý už po dátume odovzdania nemeňte.

Správa

Správa (report) je dokument, ktorý by ste odovzdali “zákazníkovi”, t.j. zadávateľovi projektu, vysvetľujúci vaše výsledky. Mal by obsahovať nasledujúce časti:

  • Hlavičku s názvom projektu, zoznamom autorov a dátumom
  • Obsah so zoznamom kapitol a linkami alebo číslami strán (pokiaľ možno vygenerovaný automaticky)
  • Úvod stručne predstavujúci tému projektu
  • Popis odkiaľ ste získali dáta, ako ste ich spracovali (či ich bolo potrebné nejako filtrovať alebo inak meniť) a základné charakteristiky dát (pre jednotlivé použité tabuľky uveďte význam jednotlivých stĺpcov a počet riadkov, prípadne aj ďalšie sumárne štatistiky).
  • Výsledky ďalších analýz (rozdelené do viacerých kapitol). Ku každej analýze stručne popíšte, čo ste s dátami spravili, uveďte grafy alebo tabuľky s výsledkami, vysvetlite, aké trendy a iné závery na nich vidno. Pri záveroch pozor, aby ste z korelácie automaticky nepredpokladali kauzalitu. Z textu by malo byť jasné, čo sú skutočné pozorovania a čo vaše dohady. Vaše výsledky môžete porovnať s výsledkami z iných zdrojov (nie je to ale nutné).
  • Záver so stručným zhrnutím hlavných výsledkov a možnosťami ďalšej práce.

Po formálne stránke by správa mala byť formálny text bez gramatických chýb, napísaný v slovenskom alebo anglickom jazyku. Obrázky a tabuľky by mali mať popisky vysvetľujúce čo je na grafe alebo v tabuľke zobrazené a mali by byť očíslované (obrázok/figure 1, tabuľka/table 1 atď.) Navyše na každý obrázok a tabuľku sa odvolajte v hlavnom texte (na obrázku 1 vidíme…). Ak ste pri práci využili nejaké zdroje, uveďte ich v zozname literatúry na konci správy (zdroje dát, literatúru k oblasti, v ktorej robíte projekt). V správe neuvádzajte kód ani nepopisujte technické aspekty projektu (ako ste to programovali) a nemusíte tam ani uvádzať odkazy na zdroje, ktoré súvisia priamo s programovaním. Správa sa odovzdáva vo formáte pdf, môžete ju vytvoriť ako Google doc, ale aj v inom systéme (napríklad Latex/Overleaf).

Ak sa chcete inšpirovať, ako vyzerá formálny technický text s číslovanými obrázkami a tabuľkami, môžete si pozrieť zborník zo Študentskej vedeckej konferencie (vaše články asi nebudú mať toľko matematiky a citovať budete asi skôr webstránky než vedecké publikácie, tiež nemusíte správu formátovať do dvoch stĺpcov).

Poskytujeme vám aj ukážkovú kostru správy ako Google doc, z ktorej v prípade záujmu môžete vychádzať.

Text správy by ste mali písať sami, negenerujte text umelou inteligenciou ani neodpisujte z iných zdrojov. Nástroje umelej inteligencie smiete použiť na kontrolu gramatiky a štylistiky. Všetky navrhované úpravy ale starostlivo skontrolujte, či nemenia zamýšľaný význam textu.

Zdrojový kód

K projektu by ste mali odovzdať zdrojový kód vo forme Jupyter notebook, v ktorom bude celá analýza od načítania dát, cez ich úpravu a kontrolu až po vykreslenie finálnych grafov použitých v správe, prípadne aj ďalších, ktoré sa do správy nedostali. Celý kód by mal byť spustiteľný v Colabe. Ak časť predspracovania dát nie je praktické robiť v notebooku, uveďte v notebooku analýzu začínajúcu načítaním už predspracovaných dát a proces predspracovania popíšte v notebooku, prípadne odovzdajte v zvláštnom súbore relevantný kód. Notebook by mal obsahovať nadpisy charakterizujúce jednotlivé časti analýzy a stručné popisy jednotlivých častí kódu. Uveďte aj odkazy (URL) na použité zdroje, najmä ak ste z nich kopírovali kód (vrátane nástrojov umelej inteligencie).

Notebook by mal ťahať dáta z nejakej URL, kam ich uložíte buď v pôvodnom alebo v predspracovanom tvare, viď Technické pokyny. Na ústnej skúške bude potrebné, aby ste vedeli notebook spustiť aj modifikovať na počítači v I-H6.

Denník

Denník vypĺňajte do kostry poskytnutej v Google classroom, z ktorej si spravíte kópiu.

Na začiatku denníka uveďte názov skupiny, zoznam členov a tému projektu.

Denník by mal vznikať priebežne a mal by byť členený na kapitoly, ktoré majú v nadpise uvedený stručný popis cieľa, kto sa na príslušnej časti podieľal a dátumy, kedy ste príslušnú analýzu robili. V tele kapitoly stručne popíšte čo ste robili, ako ste to robili, aké vznikli problémy, či sa ich podarilo vyriešiť. V denníku nechajte aj popis práce, ktorá napokon neviedla k úspešným grafom použitým v správe.

Denník by mal tiež obsahovať prípravu na kontrolné stretnutie s vyučujúcimi, ktoré sa budú konať na cvičeniach a tiež závery z takéhoto stretnutia. Takisto si píšte poznámky z ďalších prípadných skupinových stretnutí - aký ďalší postup a delenie úloh sa dohodlo.

Denník slúži pre vyučujúcich na monitorovanie pokroku. Ale slúži aj pre vás. Pomôže vám udržať sa v obraze, čo sa v skupine deje, čo sa dohodlo na stretnutiach a občerstviť si pamäť pri písaní záverečnej správy.

Pri väčších projektoch analýzy dát je dobré udržiavať si takéto poznámky, lebo na konci projektu si už nemusíte pamätať niektoré detaily zo začiatku. Takisto to pomáha koordinácii v rámci skupiny.

Na záver do denníku dopíšte stručný prehľad pre každého člena skupiny, na ktorých častiach projektu pracoval a dajte nám vedieť, či chcete projekt zdieľať.

Prezentácie

  • Prezentácie budú posledný týždeň semestra počas cvičení a prednášky alebo v inom dohodnutom čase.
  • Každá skupina spraví jednu spoločnú prezentáciu, ktorá má trvať 10-15 minút.
  • V rozprávaní sa vystriedajú všetci členovia skupiny. Každý člen rozpráva aspoň 2 minúty.
  • Vaša prezentácia by mala mať nasledujúce časti:
    • Úvod do témy, popis dát
    • Sumár hlavných výsledkov ako pre zákazníka (ukážky grafov a ich popis)
    • Ukážky zaujímavých technických aspektov projektu ako pre kolegov programátorov, čo ste sa naučili, čo bolo ťažké.
  • Prezentáciu si vopred precvičte, hlavne nadväznosti častí a celkové trvanie.
  • Celá prezentácia má byť v jednom pdf súbore, jeden člen skupiny ju odovzdá do Google Classroom do 9:00 v deň prezentácie, odtiaľ ju vyučujúci nahrajú na prezentovací počítač.
    • Ak by ste veľmi v prezentácii potrebovali animácie a iné prvky, ktoré nefungujú v pdf, môžete prezentovať z vlastného počítača. V tom prípade musíte splniť nasledovné podmienky:
      • Celá skupina musí prezentovať z jedného súboru a počítača, aby sa eliminovali prestoje.
      • Zapojenie počítača do projektora si vopred skontrolujte v príslušnej učebni (F1-328 alebo I-H6).
      • Do Classroom odovzdajte súbor, ktorý budete používať a aj pdf s aspoň čiastočnou funkcionalitou ako zálohu pre prípad technických problémov.
  • Každá skupina sa zúčastní aj ako publikum na aspoň jednej ďalšej prezentácii podľa rozpisu, môžete sa ale prísť pozrieť aj na viac skupín.
  • Po každej prezentácii bude krátka diskusia, uvítame aj vaše otázky.

Rozpis prezentácií

Utorok 14.5. I-H6
14:50   Alge-Bros (publikum JPD)
15:10   JPD (publikum Alge-Bros)

15:30   žáROFKA (publikum mathprofi.net)
15:50   Metóda mathprofi.net (publikum žáROFKA)

Streda 15.5. F1-328
 9:50 Vedci (publikum Vychodňare)
10:10 Vychodňare (publikum Vedci)
  • Aby ste nerušili, prosím prichádzať iba v časoch utorok 14:45-14:50, 15:25-15:30 a streda 9:45-9:50, odchádzať po konci prezentácie.

Hodnotenie

Podľa pravidiel predmetu v súvislosti z projektom získate až 55% známky.

  • Po každom kontrolnom stretnutí sa budú dať získať 3% za priebežnú prácu na projekte, spolu 12%.
    • Každý člen skupiny by sa v priebehu týždňa mal zúčastniť nejakej práce na projekte, aj keď nie je dokončená. V prípade špeciálnych okolností nám dajte vedieť.
  • Finálna prezentácia je za 8%.
  • Finálne hodnotenie odovzdaného projektu je za 25%.
  • Individuálna ústna skúška súvisiaca s projektom je za 10%, treba získať aspoň polovicu bodov.