NPFL012 Úvod do počítačové lingvistiky
Úvodní přednáška do počítačové lingvistiky. Výklad doktora Kuboně je srozumitelný a v rozumné míře zábavný, poměr teorie a praktických ukázek je vyrovnaný.
Poznámky
blackblog.cz - poznámky z roku 2023
Poznámky Kuby Smolíka - ručně psané
marketa.najevisti.info - vypracované otázky z roku 2011 (pozor na aktuálnost)
Skripta
Eva Hajičová, Jarmila Panevová, Petr Sgall: Úvod do teoretické a počítačové lingvistiky, I. svazek - Teoretická lingvistika (Karolinum 2002, ISBN 80-246-0470-1) - kniha je dostupná ve fakultní knihovně na Malé Straně
Zkouška
Na zkoušku se lze během dvou dnů v pohodě naučit (tomu, kdo nechodil na přednášky, to může trvat o něco déle). Zkouška je písemná, jedna velká otázka a 7 menších. Na jedničku je třeba umět všechna klíčová slova k dané otázce.
Otázky
Hlavní otázky:
Korpusy - základní fakta o tvorbě, reprezentativnosti,... Druhy značkování + ke každému český a zahraniční příklad s dalším popisem, paralelní korpusy.
MOZAIKA - velká otázka
ASIMUT
Chomskeho teorie
korpusy
tři základní úlohy se skrytými markovskými modely
vlastnosti izolačních jazyků + příklad přirozeného izolačního jazyka
teorie valence, valenční rámec
kategoriální gramatiky
rozdíl mezi významem a pravdivostí
...
proč se u statistických metod dělá vyhlazování
preklepy, strategie vuci uzivateli, nabizeni reseni
two level morphology
strukturni index
metoda zasumeneho kanalu
penn treebank
druhy anafory
eurowordnet
rozdil mezi hloubkovou a povrchovou syntaxi, jejich vztah
Gramatická správnost, dvě hlavní metody, co se dá kontrolovat obecně, co v češtině a jaké jsou v češtině metody kontroly gramatiky (hlavní otázka, měla být aspoň jedna popsaná stránka)
Co je to ALPAC
Kategoriální gramatiky
Presupozice
Rozdíly mezi morfologickou analýzou a značkováním (tagging)
Q-systémy - co to je, jak fungují a využití
Tři hlavní morfologické přístupy
Cosi s anaforou (nikoliv její typy)
MOZAIKA - velká otázka
strukturální index
BLEU
METEO a jeho historický význam (= ve své dobře jediný komerčně využívaný systém)
Vauquoisův trojúhelník
ontologie
WordNet
Český národní korpus
ASIMUT (velka)
druhy morfemu
prevest zavislostni strom vety "Maly chlapec psal dopis na stole" na slozkovy. Je prevod jednoznacny?
deleni jazyku z hledika morfologie
rozdil mezi interlinguou a pivotnim jazykem
druhy anafory
strucne popsat princip Tree Adjoining Grammars 8 ) Prazsky zavislostni korpus - velikost, jake znacky
ASIMUT (velka otazka)
Two level morphology
Jazyky, jejich rozdeleni
Prevest zavislostni strom (ze slajdu z prednasky) na slozkovy. Je prevod jednoznacny? (neni)
LFG
Bleu
Alepson 4 vlastnosti, ktere musi splnovat moderni korpusy
TIL
Co je to morfem?
MOSAIC
Na co slouzi strukturni index u Chomskeho gramatiky? (tady bylo dulezite zminit, ze se jedna o REZ STROMEM)
Rozdil mezi hloubkovou a povrchovou rovinou. (1. je o vyznamu, 2. je o zapisu vety)
Vauquoisuv trojuhelnik (stacilo nakreslit)
Ontologie - co to je a jak se pouziva
EuroWordNet, WordNet
Cesky narodni korpus (slozeni, velikost, typy znacek) - tady jsem se rozepsal o Prazskem zavisl. korpusu, ale to mi uznal, ponevadz CNC stacilo jen strucne, a to uz jsem mel:)
ASIMUT (hlavní otázka) co je to strukt. index u transformační gramatiky co je to ontologie co je to interlingua a k čemu se používá rozdíl extenze / intenze v sémantice hloubková a povrchní syntaxe, vztahy mezi nimi český národní korpus Česílko
1, Podrobně popište automatický překlad metodou zašuměného kanálu 2, Lemmatizace - co to je a kde se používá 3, Teorie minimalismu - autor a na které teori navazuje 4, Na čem je založena teorie funkčního generativního popisu 5, Překladová paměť 6, Převeďte složkový strom na závislostní 7, Rozdíly mezi modelově teoretickou a kompozicionální sémantikou 8, 4 typy anaforických vztahů v textu + příklady
korpusy. Charakterizovat korpusy, ktere jsme probirali (zdroje textu, co je v nich znackovano atd.). K cemu jsou korpusy dobre v teoretickem i aplikovanem vyzkumu.
druhy morfemu
princip ASIMUTu
valence
co znamena zkratka TAG, strucne vysvetlit princip
rozdil mezi interliguou a pivotnim jazykem
Fregova koncepce (?)
"zasumeny kanal"
Ja mela velkou otazku ok a ze zbyvajicich ve dvou chybu. Aby to bylo na jednicku, dal mi jeste doplnujici otazku - vysvetlit, co je: HPSG LFG FGD
podrobne popisat ASIMUT
co je to EuroWordNet
co je to alomorf
co je transfer v automatickom preklade
co je strukturni index a v akej teorii sa vyuziva
? - nepamatam si
co su to n-gramy
co je to HPSG
Chomskeho teorie
alomorf
Bickel Schroderova metoda
sestava rysu
Penn TreeBank
transfer
zasumeny kanal
Ngram
Podrobne popisat ASIMUT
co je to morfem a ako ho klasifikujeme
strucne popisat Chomskeho gramaticku teoriu
vytvorit zavislostny a zlozkovy strom pre vetu "Ve včerejším závodu startovali výborní skokani."
co je prekladova pamet
co je vyhlazovani
popisat Brownov korpus
co je ontologie
Podrobne popiste statisticke metody v automatickom preklade
Co je to WordNet
Na com je zalozeny jazykovy modul systemu ASIMUT
Pouziva sa u systemu MOSAIC syntakticka analyza? Preco? (preco ano, preco nie)
Na co sluzi struktuni index u Chomskeho gramatiky?
Co viete o Prazskom zavislostnom korpuse
Co su to unifikacne gramatiky, ich vyhody, nevyhody.
Popiste system Cesilko
Popiste podrobne system ASIMUT
Co je to morfem a jak se deli morfemy
Strucne popiste prvni Chomskeho navrh gramatiky popsany v knize Syntactic structures
Nakreslete slozkovy a zavistlostni strom pro vetu "Ve vcerejsim zavodu startovali vyborni skokani."
Napiste, co vite o Brownove korpusu
Co je to vyhlazovani
Co je to ontologie
Co je to prekladova pamet
Sada otázek ze starších zkoušek
Co je wordnet?
Popište systém ASIMUT.
Podrobně popiště systém MOSAIC.
Používá MOSAIC syntaktickou analýzu? Proč?
Co je a na co slouží strukturní index u Chomského gramatiky?
Pražský závislostní korpus (PDT)
Unifikační gramatiky - výhody/nevýhody
Systém Česílko
Kontrola překlepů
Co je morfém a jak ho klasifikujeme?
Nakreslete složkový a závislostní strom pro větu "Ve včerejším závodu startovali výborní skokani."
Převeďte složkový strom na závislostní
Co je překladová paměť?
Co je vyhlazování?
Brownův korpus
Co je ontologie a jak se používá?
Chomskeho teorie
Co je alomorf?
Bickel-Schroderova metoda
PennTreebank
Sestavy rysu a jejich použití.
Co je transfér v automatickém překladu – přenos zanalyzované věty z jednoho jazyka do druhého (slovosled, morfologie)
Jaký je rozdíl mezi interlinguou a pivotním jazykem?
Co je TAG (velmi stručně popište)
Popište model zašuměného kanálu.
Funkční generativní popis stručně
Statistické metody prekladu
co je LFG?
co je Two-Level morphology?
BLEU
rozdil intenze/extenze
transparentní intenzionální logika
co je ATN? (Augmented transition network)
Stručně popište Český národní korpus(složení, velikost, typy značek).
Popište Vauquoisův trojúhelník. (trojúhelník s interlinguou na vrcholu)
Stručně popište systém METEO.
Stručně popište rozdíl mezi hloubkovou a povrchovou rovinou analýzy syntaxe.
rozdil mezi morfologickou analyzou a taggingem
3 hlavní přístupy k popisu morfologie
Q systemy (k comu sluzia, kde su aplikované, ako funguju)
dělení anafor a jak se řeší algoritmicky
Co je to lemmatizace a kde se používá?
ALPAC
metody kontroly gramatickej spravnosti viet (hlavne javy, specificke javy pre cestinu, implementacia)
Co je to teorie minimalismu, kdo je autorem a co jí předcházelo