NPRG036 Datové formáty
Obecné informace
Přednáška probíhá pomocí vlastního výkladu a slidy s poznámkami.
Starší verze přednášek jsou nahrané na YouTube jak v anglické, tak české verzi. Podle učitele se zatím nezměnily, jsou tedy platné.
Slidy v aktuální podobě jsou na webu taky.
Hodí se chodit na cvika, minimálně na ty označený písmenkem R, ušetří to spoustu času u úkolů.
Pozor, občas cvika nejsou.
Na cvika jsou taky slidy s řešením, též k nalezení na webu
Skripta
BlackBlog (WIP) - nekompletní poznámky
Slidy na webu učitele (dohromady asi 800 stránek)
Úkoly
Celý semestr se pracuje v týmu po 4 lidech.
Úkoly jsou 4 na semestr a nejsou vlastně moc těžké, pokud víte jak na to, na internetu se moc pomoc najít nedá, obvzlášť v úkolu s JSON-LD a CSVW. Jediné co vám potom zbývá je číst dokumentaci nebo dojít na cviko na konzultaci.
HW1
Úkolem je vymyslet nějaký netriviální model dat a udělat odpovídající UML diagram. Na to jsou nějaké kvantitativní a kvalitativní požadavky. S tímhle modelem budete pracovat po celý semestr, takže si to nedělejte moc těžký a rozsáhlý.
HW2
V tomto úkolu se předělá model do grafového stylu (RDF), vytvoří se data samotné a udělá se pár SPARQL dotazů. Poté je potřeba data předělat do LPG podoby, nahrát je do databáze, vizualizovat a udělat pár Cypher dotazů.
HW3
Zde zase předěláte model, tentokrát do hierarchického stylu (XML/JSON), napíšete XML Schema a předěláte reprezentaci do XML, které se musí zvalidovat oproti schématu. Potom napíšete XSLT transformace do RDF a HTML a pár XPath dotazů. Následně to uděláte znovu pro JSON, tedy JSON Schema, data do JSON, zvalidovat, vytvořit JSON-LD kontext na transformaci do RDF (pain) a dotazy v jq. Všechny transformace se musí shodovat s RDF daty z HW2.
HW4
Tento úkol je obzváště obtížný, protože na internetu není moc pomoci, ale učitel poradil jak vyřešit problémy.
Nejdřív předěláte model do relačního stylu (CSV), potom samozřejmě reprezentovat data pomocí tabulek, zanotovat přes CSVW deskriptor a pomocí CSVW udělat transformaci do RDF. Ta se zase musí shodovat s daty z HW2.
Zkouška
Zkouška trvá 2 hodiny, příklad má učitel na webových stránkách. Pokud to odevzdáte brzy, může to rovnou opravit, trvá to pár minut.
Maximum je 100 bodů, od 60 a výš je trojka, většina příkladů je za 5/10 bodů a poslední je za 25.
Ve zkoušce jsou otevřené otázky na teorii, chce vysvětlit pojem nebo jak něco funguje, nakreslit obrázek nebo ukazát jak formát vypadá a popsat jeho části. Poslední příklad je UML diagram a popis, co očekáváme a máte rozhodnout jaký formát a hlavně proč ho použít, napsat schéma (pokud má) a nějaký ukázkový data.