Diff for ''
| Deletions are marked like this. | Additions are marked like this. |
| Line 1: | Line 1: |
| {{Předmět|Úvod do počítačové lingvistiky|Vladislav Kuboň|PFL012}} | ## Otázky podle kategorií |
| Line 3: | Line 3: |
| Úvodní přednáška do počítačové lingvistiky. Výklad doktora Kuboně je srozumitelný a v rozumné míře zábavný, poměr teorie a praktických ukázek je vyrovnaný. | ### **RDF** |
| Line 5: | Line 5: |
| == Zkouška == Na zkoušku se lze během jednoho dne v pohodě naučit (tomu, kdo nechodil na přednášky, to může trvat o něco déle). Zkouška je písemná, jedna velká otázka a 7 menších. Na jedničku je třeba umět všechna klíčová slova k dané otázce. |
- RDF:List - Co je to reifikace? - Popište RDF\*. Uveďte příklad. - Jak se liší prefixovaná a relativní IRI v kontextu RDF? - Co je Linked Data Vocabularies? - Co je Open World Assumption? - Co je SERVICE pro SPARQL? - Vysvětlete SKOS:exactMatch a použijte na příkladu. - Jak lze specifikovat RDF zdroj v JSON-LD? |
| Line 8: | Line 15: |
| === Otázky === * Co je wordnet? * Popište systém ASIMUT. * Podrobně popiště systém MOSAIC. * Používá MOSAIC syntaktickou analýzu? Proč? * Co je a na co slouží strukturní index u Chomského gramatiky? * Pražský závislostní korpus (PDT) * Unifikační gramatiky - výhody/nevýhody * Systém Česílko * Kontrola překlepů * Co je morfém a jak ho klasifikujeme? * Nakreslete složkový a závislostní strom pro větu "Ve včerejším závodu startovali výborní skokani." * Převeďte složkový strom na závislostní * Co je překladová paměť? * Co je vyhlazování? * Brownův korpus * Co je ontologie a jak se používá? * Chomskeho teorie * Co je alomorf? * Bickel-Schroderova metoda * PennTreebank * Sestavy rysu a jejich použití. * Co je transfér v automatickém překladu – přenos zanalyzované věty z jednoho jazyka do druhého (slovosled, morfologie) * Jaký je rozdíl mezi interlinguou a pivotním jazykem? * Co je TAG (velmi stručně popište) * Popište model zašuměného kanálu. * Funkční generativní popis stručně * Statistické metody prekladu * co je LFG? * co je Two-Level morphology? * BLEU * rozdil intenze/extenze * transparentní intenzionální logika * co je ATN? (Augmented transition network) * Stručně popište Český národní korpus(složení, velikost, typy značek). * Popište Vauquoisův trojúhelník. (trojúhelník s interlinguou na vrcholu) * Stručně popište systém METEO. * Stručně popište rozdíl mezi hloubkovou a povrchovou rovinou analýzy syntaxe. * rozdil mezi morfologickou analyzou a taggingem * 3 hlavní přístupy k popisu morfologie * Q systemy (k comu sluzia, kde su aplikované, ako funguju) * dělení anafor a jak se řeší algoritmicky * Co je to lemmatizace a kde se používá? * ALPAC * metody kontroly gramatickej spravnosti viet (hlavne javy, specificke javy pre cestinu, implementacia) * Co je to teorie minimalismu, kdo je autorem a co jí předcházelo |
### **JSON/JSON-LD** |
| Line 55: | Line 17: |
| == Poznámky == [[PFL012-poznámky|Nekompletní přepis poznámek]] |
- Co je keyword aliasing v JSON-LD? - Uveďte 3 klíčová slova ze JSON-LD. - Jakými třemi způsoby můžeme na JSON přidat JSON-LD kontext? - Jak pomoci URI zacílit na různé části CSV? - Popište hlavní způsoby validace polí v JSON Schema. - Na příkladu vysvětlete, jak lze v JSON-LD zachovat pořadí hodnot v poli. - Popište 3 validační klíčová slova v JSON Schema. |
| Line 58: | Line 25: |
| ### **XML/XPath/XSLT** | |
| Line 59: | Line 27: |
| == Materiály == Materiály (slajdy a draft skript) posílá přednášející mailem všem, co mají předmět zapsaný. Případně jsou dostupné v SISu na stránce předmětu (po přihlášení). Případně existuje i [http://www.marketa.najevisti.info/dokumenty/Lingvistika-priprava.pdf vypracovaný hangout] od studentů. |
- Co je mode v XSLT? - Uveďte příklad osy v XPath. - Vysvětlete XPath osu attribute::. - Vysvětlete rozdíl mezi jednoduchým a composite typem v XML Schema. - Co je validní XML? - Popište XML DOM. |
| Line 62: | Line 34: |
| == Literatura == * Eva Hajičová, Jarmila Panevová, Petr Sgall: Úvod do teoretické a počítačové lingvistiky, I. svazek – Teoretická lingvistika (Karolinum 2002, ISBN 80-246-0470-1) ** kniha je dostupná ve fakultní knihovně na Malé Straně |
### **Formáty a standardy** |
| Line 66: | Line 36: |
| [[Category:Matematická lingvistika]] | - Popište CSV podle přesného RFC. - Uveďte příklady otevřených a licencovaných formátů videa. - Uveďte formát vhodný pro archivaci dokumentů. Popište jeho vlastnosti. Proč je vhodný pro archivaci? - Co je Well-Known Text? Uveďte příklad. - Uveďte příklad textu v Markdownu. Jaký je hlavní cíl Markdownu? - Popište formát INI a jeho použití. - Co je TOML? Uveďte příklad. - Co je to textový formát? Uveďte příklady. - Co je multimediální formát? Uveďte příklad. ### **Datové modely a databáze** - Co je relační datový model v kontextu CSV on the Web? - Navrhněte datový model, kde zaměstnanec pracuje v budově a může mít jiného zaměstnance jako nadřízeného. ### **Wikidata** - Vlastnosti tvrzení v Wikidatech? - Co je QID ve Wikidatech? ### **Grafika a multimédia** - Co je dithering? - Popište pixel/dot density. Čím je reprezentovaný? - Popište ztrátové a bezeztrátové kompresní metody pro rastrovou grafiku. Uveďte konkrétní formáty. - Popište RGBA barevný model. - Popište CMYK. - Co je diskrétní kosinová transformace? ### **Zvuk** - Popište Pulse-Code Modulation v kontextu digitálního zvuku. ### **Cypher** - Co je set v Cypher? ### **Obecné technologie a koncepty** - Co je CQL? - Co je souřadnicový systém? - Proč vznikl TeX? |