NPRG036 Datové formáty

KV
Učitel:Jakub Klímek
Odkaz do SISu:NPRG036

Obecné informace

  • Přednáška probíhá pomocí vlastního výkladu a slidy s poznámkami.

  • Starší verze přednášek jsou nahrané na YouTube jak v anglické, tak české verzi. Podle učitele se zatím nezměnily, jsou tedy platné.

  • Slidy v aktuální podobě jsou na webu taky.

  • Hodí se chodit na cvika, minimálně na ty označený písmenkem R, ušetří to spoustu času u úkolů.

  • Pozor, občas cvika nejsou.

  • Na cvika jsou taky slidy s řešením, též k nalezení na webu

Úkoly

  • Celý semestr se pracuje v týmu po 4 lidech.

  • Úkoly jsou 4 na semestr a nejsou vlastně moc těžké, pokud víte jak na to, na internetu se moc pomoc najít nedá, obvzlášť v úkolu s JSON-LD a CSVW. Jediné co vám potom zbývá je číst dokumentaci nebo dojít na cviko na konzultaci.

HW1

Úkolem je vymyslet nějaký netriviální model dat a udělat odpovídající UML diagram. Na to jsou nějaké kvantitativní a kvalitativní požadavky. S tímhle modelem budete pracovat po celý semestr, takže si to nedělejte moc těžký a rozsáhlý.

HW2

V tomto úkolu se předělá model do grafového stylu (RDF), vytvoří se data samotné a udělá se pár SPARQL dotazů. Poté je potřeba data předělat do LPG podoby, nahrát je do databáze, vizualizovat a udělat pár Cypher dotazů.

HW3

Zde zase předěláte model, tentokrát do hierarchického stylu (XML/JSON), napíšete XML Schema a předěláte reprezentaci do XML, které se musí zvalidovat oproti schématu. Potom napíšete XSLT transformace do RDF a HTML a pár XPath dotazů. Následně to uděláte znovu pro JSON, tedy JSON Schema, data do JSON, zvalidovat, vytvořit JSON-LD kontext na transformaci do RDF (pain) a dotazy v jq. Všechny transformace se musí shodovat s RDF daty z HW2.

HW4

Tento úkol je obzváště obtížný, protože na internetu není moc pomoci, ale učitel poradil jak vyřešit problémy.

Nejdřív předěláte model do relačního stylu (CSV), potom samozřejmě reprezentovat data pomocí tabulek, zanotovat přes CSVW deskriptor a pomocí CSVW udělat transformaci do RDF. Ta se zase musí shodovat s daty z HW2.

Zkouška

  • Zkouška trvá 2 hodiny, příklad má učitel na webových stránkách. Pokud to odevzdáte brzy, může to rovnou opravit, trvá to pár minut.

  • Maximum je 100 bodů, od 60 a výš je trojka, většina příkladů je za 5/10 bodů a poslední je za 25.

  • Ve zkoušce jsou otevřené otázky na teorii, chce vysvětlit pojem nebo jak něco funguje, nakreslit obrázek nebo ukazát jak formát vypadá a popsat jeho části. Poslední příklad je UML diagram a popis, co očekáváme a máte rozhodnout jaký formát a hlavně proč ho použít, napsat schéma (pokud má) a nějaký ukázkový data.

Skripta