Diff for ''

Revision 29
Author:
black
Time:
2024-07-16 13:59
Revision 4
Author:
smolad
Time:
2026-05-29 17:58
Deletions are marked like this. Additions are marked like this.
Line 1: Line 1:
{{Předmět|Úvod do počítačové lingvistiky|Vladislav Kuboň|PFL012}} ## Otázky podle kategorií
Line 3: Line 3:
Úvodní přednáška do počítačové lingvistiky. Výklad doktora Kuboně je srozumitelný a v rozumné míře zábavný, poměr teorie a praktických ukázek je vyrovnaný. ### **RDF**
Line 5: Line 5:
== Zkouška ==
Na zkoušku se lze během jednoho dne v pohodě naučit (tomu, kdo nechodil na přednášky, to může trvat o něco déle). Zkouška je písemná, jedna velká otázka a 7 menších. Na jedničku je třeba umět všechna klíčová slova k dané otázce.
- RDF:List
- Co je to reifikace?
- Popište RDF\*. Uveďte příklad.
- Jak se liší prefixovaná a relativní IRI v kontextu RDF?
- Co je Linked Data Vocabularies?
- Co je Open World Assumption?
- Co je SERVICE pro SPARQL?
- Vysvětlete SKOS:exactMatch a použijte na příkladu.
- Jak lze specifikovat RDF zdroj v JSON-LD?
Line 8: Line 15:
=== Otázky ===
* Co je wordnet?
* Popište systém ASIMUT.
* Podrobně popiště systém MOSAIC.
* Používá MOSAIC syntaktickou analýzu? Proč?
* Co je a na co slouží strukturní index u Chomského gramatiky?
* Pražský závislostní korpus (PDT)
* Unifikační gramatiky - výhody/nevýhody
* Systém Česílko
* Kontrola překlepů
* Co je morfém a jak ho klasifikujeme?
* Nakreslete složkový a závislostní strom pro větu "Ve včerejším závodu startovali výborní skokani."
* Převeďte složkový strom na závislostní
* Co je překladová paměť?
* Co je vyhlazování?
* Brownův korpus
* Co je ontologie a jak se používá?
* Chomskeho teorie
* Co je alomorf?
* Bickel-Schroderova metoda
* PennTreebank
* Sestavy rysu a jejich použití.
* Co je transfér v automatickém překladu – přenos zanalyzované věty z jednoho jazyka do druhého (slovosled, morfologie)
* Jaký je rozdíl mezi interlinguou a pivotním jazykem?
* Co je TAG (velmi stručně popište)
* Popište model zašuměného kanálu.
* Funkční generativní popis stručně
* Statistické metody prekladu
* co je LFG?
* co je Two-Level morphology?
* BLEU
* rozdil intenze/extenze
* transparentní intenzionální logika
* co je ATN? (Augmented transition network)
* Stručně popište Český národní korpus(složení, velikost, typy značek).
* Popište Vauquoisův trojúhelník. (trojúhelník s interlinguou na vrcholu)
* Stručně popište systém METEO.
* Stručně popište rozdíl mezi hloubkovou a povrchovou rovinou analýzy syntaxe.
* rozdil mezi morfologickou analyzou a taggingem
* 3 hlavní přístupy k popisu morfologie
* Q systemy (k comu sluzia, kde su aplikované, ako funguju)
* dělení anafor a jak se řeší algoritmicky
* Co je to lemmatizace a kde se používá?
* ALPAC
* metody kontroly gramatickej spravnosti viet (hlavne javy, specificke javy pre cestinu, implementacia)
* Co je to teorie minimalismu, kdo je autorem a co jí předcházelo
### **JSON/JSON-LD**
Line 55: Line 17:
== Poznámky ==
[[PFL012-poznámky|Nekompletní přepis poznámek]]
- Co je keyword aliasing v JSON-LD?
- Uveďte 3 klíčová slova ze JSON-LD.
- Jakými třemi způsoby můžeme na JSON přidat JSON-LD kontext?
- Jak pomoci URI zacílit na různé části CSV?
- Popište hlavní způsoby validace polí v JSON Schema.
- Na příkladu vysvětlete, jak lze v JSON-LD zachovat pořadí hodnot v poli.
- Popište 3 validační klíčová slova v JSON Schema.
Line 58: Line 25:
### **XML/XPath/XSLT**
Line 59: Line 27:
== Materiály ==
Materiály (slajdy a draft skript) posílá přednášející mailem všem, co mají předmět zapsaný. Případně jsou dostupné v SISu na stránce předmětu (po přihlášení). Případně existuje i [http://www.marketa.najevisti.info/dokumenty/Lingvistika-priprava.pdf vypracovaný hangout] od studentů.
- Co je mode v XSLT?
- Uveďte příklad osy v XPath.
- Vysvětlete XPath osu attribute::.
- Vysvětlete rozdíl mezi jednoduchým a composite typem v XML Schema.
- Co je validní XML?
- Popište XML DOM.
Line 62: Line 34:
== Literatura ==
* Eva Hajičová, Jarmila Panevová, Petr Sgall: Úvod do teoretické a počítačové lingvistiky, I. svazek – Teoretická lingvistika (Karolinum 2002, ISBN 80-246-0470-1)
** kniha je dostupná ve fakultní knihovně na Malé Straně
### **Formáty a standardy**
Line 66: Line 36:
[[Category:Matematická lingvistika]] - Popište CSV podle přesného RFC.
- Uveďte příklady otevřených a licencovaných formátů videa.
- Uveďte formát vhodný pro archivaci dokumentů. Popište jeho vlastnosti. Proč je vhodný pro archivaci?
- Co je Well-Known Text? Uveďte příklad.
- Uveďte příklad textu v Markdownu. Jaký je hlavní cíl Markdownu?
- Popište formát INI a jeho použití.
- Co je TOML? Uveďte příklad.
- Co je to textový formát? Uveďte příklady.
- Co je multimediální formát? Uveďte příklad.

### **Datové modely a databáze**

- Co je relační datový model v kontextu CSV on the Web?
- Navrhněte datový model, kde zaměstnanec pracuje v budově a může mít jiného zaměstnance jako nadřízeného.

### **Wikidata**

- Vlastnosti tvrzení v Wikidatech?
- Co je QID ve Wikidatech?

### **Grafika a multimédia**

- Co je dithering?
- Popište pixel/dot density. Čím je reprezentovaný?
- Popište ztrátové a bezeztrátové kompresní metody pro rastrovou grafiku. Uveďte konkrétní formáty.
- Popište RGBA barevný model.
- Popište CMYK.
- Co je diskrétní kosinová transformace?

### **Zvuk**

- Popište Pulse-Code Modulation v kontextu digitálního zvuku.

### **Cypher**

- Co je set v Cypher?

### **Obecné technologie a koncepty**

- Co je CQL?
- Co je souřadnicový systém?
- Proč vznikl TeX?