Syntax highlighting of NPFL012

# **NPFL012** Úvod do počítačové lingvistiky

<{Box(infobox)}>
|K    |V    |
|-----|-----|
| **Učitel:** | [	doc. RNDr. Vladislav Kuboň, Ph.D.](https://ufal.mff.cuni.cz/vladislav-kubon) |
| **Odkaz do SISu:** | [NMAI054](https://is.cuni.cz/studium/predmety/index.php?do=predmet&kod=NPFL012) |
<{/Box}>

## Otázky

- Hlavní otázky:
  - Korpusy - základní fakta o tvorbě, reprezentativnosti,... Druhy značkování + ke každému český a zahraniční příklad s dalším popisem, paralelní korpusy. 
  - MOZAIKA - velká otázka 
  - ASIMUT
  - Chomskeho teorie
	
1. korpusy
2. tři základní úlohy se skrytými markovskými modely
3. vlastnosti izolačních jazyků + příklad přirozeného izolačního jazyka
4. teorie valence, valenční rámec
5. kategoriální gramatiky
6. rozdíl mezi významem a pravdivostí
7. ...
8. proč se u statistických metod dělá vyhlazování


1. preklepy, strategie vuci uzivateli, nabizeni reseni
2. two level morphology
3. strukturni index
4. metoda zasumeneho kanalu
5. penn treebank
6. druhy anafory
7. eurowordnet
8. rozdil mezi hloubkovou a povrchovou syntaxi, jejich vztah

- Gramatická správnost, dvě hlavní metody, co se dá kontrolovat obecně, co v češtině a jaké jsou v češtině metody kontroly gramatiky (hlavní otázka, měla být aspoň jedna popsaná stránka)
- Co je to ALPAC
- Kategoriální gramatiky
- Presupozice
- Rozdíly mezi morfologickou analýzou a značkováním (tagging)
- Q-systémy - co to je, jak fungují a využití
- Tři hlavní morfologické přístupy
- Cosi s anaforou (nikoliv její typy)

1. MOZAIKA - velká otázka
2. strukturální index
3. BLEU
4. METEO a jeho historický význam (= ve své dobře jediný komerčně využívaný systém)
5. Vauquoisův trojúhelník
6. ontologie
7. WordNet
8. Český národní korpus

1) ASIMUT (velka)
2) druhy morfemu
3) prevest zavislostni strom vety "Maly chlapec psal dopis na stole" na slozkovy. Je prevod jednoznacny?
4) deleni jazyku z hledika morfologie
5) rozdil mezi interlinguou a pivotnim jazykem
6) druhy anafory
7) strucne popsat princip Tree Adjoining Grammars
8 ) Prazsky zavislostni korpus - velikost, jake znacky 

1) ASIMUT (velka otazka)
2) Two level morphology
3) Jazyky, jejich rozdeleni
4) Prevest zavislostni strom (ze slajdu z prednasky) na slozkovy. Je prevod jednoznacny? (neni)
5) LFG
6) Bleu
7) Alepson 4 vlastnosti, ktere musi splnovat moderni korpusy
8) TIL 


1. Co je to morfem?
2. MOSAIC
3. Na co slouzi strukturni index u Chomskeho gramatiky? (tady bylo dulezite zminit, ze se jedna o REZ STROMEM)
4. Rozdil mezi hloubkovou a povrchovou rovinou. (1. je o vyznamu, 2. je o zapisu vety)
5. Vauquoisuv trojuhelnik (stacilo nakreslit)
6. Ontologie - co to je a jak se pouziva
7. EuroWordNet, WordNet
8. Cesky narodni korpus (slozeni, velikost, typy znacek) - tady jsem se rozepsal o Prazskem zavisl. korpusu, ale to mi uznal, ponevadz CNC stacilo jen strucne, a to uz jsem mel:) 

ASIMUT (hlavní otázka)
co je to strukt. index u transformační gramatiky
co je to ontologie
co je to interlingua a k čemu se používá
rozdíl extenze / intenze v sémantice
hloubková a povrchní syntaxe, vztahy mezi nimi
český národní korpus
Česílko

1, Podrobně popište automatický překlad metodou zašuměného kanálu
2, Lemmatizace - co to je a kde se používá
3, Teorie minimalismu - autor a na které teori navazuje
4, Na čem je založena teorie funkčního generativního popisu
5, Překladová paměť
6, Převeďte složkový strom na závislostní
7, Rozdíly mezi modelově teoretickou a kompozicionální sémantikou
8, 4 typy anaforických vztahů v textu + příklady 

1) korpusy. Charakterizovat korpusy, ktere jsme probirali (zdroje textu, co je v nich znackovano atd.). K cemu jsou korpusy dobre v teoretickem i aplikovanem vyzkumu.
2) druhy morfemu
3) princip ASIMUTu
4) valence
5) co znamena zkratka TAG, strucne vysvetlit princip
6) rozdil mezi interliguou a pivotnim jazykem
7) Fregova koncepce (?)
8) "zasumeny kanal" 

Ja mela velkou otazku ok a ze zbyvajicich ve dvou chybu. Aby to bylo na jednicku, dal mi jeste doplnujici otazku - vysvetlit, co je:
HPSG
LFG
FGD 

1. podrobne popisat ASIMUT
2. co je to EuroWordNet
3. co je to alomorf
4. co je transfer v automatickom preklade
5. co je strukturni index a v akej teorii sa vyuziva
6. ? - nepamatam si
7. co su to n-gramy
8. co je to HPSG

1) Chomskeho teorie
2) alomorf
3) Bickel Schroderova metoda
4) sestava rysu
5) Penn TreeBank
6) transfer
7) zasumeny kanal
8) Ngram 

1. Podrobne popisat ASIMUT
2. co je to morfem a ako ho klasifikujeme
3. strucne popisat Chomskeho gramaticku teoriu
4. vytvorit zavislostny a zlozkovy strom pre vetu "Ve včerejším závodu startovali výborní skokani."
5. co je prekladova pamet
6. co je vyhlazovani
7. popisat Brownov korpus
8. co je ontologie

1) Podrobne popiste statisticke metody v automatickom preklade
2) Co je to WordNet
3) Na com je zalozeny jazykovy modul systemu ASIMUT
4) Pouziva sa u systemu MOSAIC syntakticka analyza? Preco? (preco ano, preco nie)
5) Na co sluzi struktuni index u Chomskeho gramatiky?
6) Co viete o Prazskom zavislostnom korpuse
7) Co su to unifikacne gramatiky, ich vyhody, nevyhody.
8) Popiste system Cesilko 

1. Popiste podrobne system ASIMUT
2. Co je to morfem a jak se deli morfemy
3. Strucne popiste prvni Chomskeho navrh gramatiky popsany v knize Syntactic structures
4. Nakreslete slozkovy a zavistlostni strom pro vetu "Ve vcerejsim zavodu startovali vyborni skokani."
5. Napiste, co vite o Brownove korpusu
6. Co je to vyhlazovani
7. Co je to ontologie
8. Co je to prekladova pamet