Diff for ''

Revision 29
Author:
black
Time:
2024-07-16 13:59
Revision 6
Author:
pacakdav
Time:
2026-06-08 13:00
Deletions are marked like this. Additions are marked like this.
Line 1: Line 1:
{{Předmět|Úvod do počítačové lingvistiky|Vladislav Kuboň|PFL012}} *Bylo nové zadání:*
Line 3: Line 3:
Úvodní přednáška do počítačové lingvistiky. Výklad doktora Kuboně je srozumitelný a v rozumné míře zábavný, poměr teorie a praktických ukázek je vyrovnaný. Máme naprogramovat Salvator (Spasitel), který dostane cestu k souboru se zdrojovým kódem (C#/Python dle výběru) a příznak D(etekovat) nebo K(orektovat).
V souboru najde **hříchy**, tj. číselné konstanty jiné než 0, 1 a 42 a stringové konstatnty jiné než "" (prázdný string).
Line 5: Line 6:
== Zkouška ==
Na zkoušku se lze během jednoho dne v pohodě naučit (tomu, kdo nechodil na přednášky, to může trvat o něco déle). Zkouška je písemná, jedna velká otázka a 7 menších. Na jedničku je třeba umět všechna klíčová slova k dané otázce.
V režimu D je stačí detekovat a vypsat v zadaném formátu (`<radek> <pozice zacatku na radku> <obsah>`), v režimu K je potřeba je i opravit, tzn. převést na konstatní proměnné.
Line 8: Line 8:
=== Otázky ===
* Co je wordnet?
* Popište systém ASIMUT.
* Podrobně popiště systém MOSAIC.
* Používá MOSAIC syntaktickou analýzu? Proč?
* Co je a na co slouží strukturní index u Chomského gramatiky?
* Pražský závislostní korpus (PDT)
* Unifikační gramatiky - výhody/nevýhody
* Systém Česílko
* Kontrola překlepů
* Co je morfém a jak ho klasifikujeme?
* Nakreslete složkový a závislostní strom pro větu "Ve včerejším závodu startovali výborní skokani."
* Převeďte složkový strom na závislostní
* Co je překladová paměť?
* Co je vyhlazování?
* Brownův korpus
* Co je ontologie a jak se používá?
* Chomskeho teorie
* Co je alomorf?
* Bickel-Schroderova metoda
* PennTreebank
* Sestavy rysu a jejich použití.
* Co je transfér v automatickém překladu &ndash; přenos zanalyzované věty z jednoho jazyka do druhého (slovosled, morfologie)
* Jaký je rozdíl mezi interlinguou a pivotním jazykem?
* Co je TAG (velmi stručně popište)
* Popište model zašuměného kanálu.
* Funkční generativní popis stručně
* Statistické metody prekladu
* co je LFG?
* co je Two-Level morphology?
* BLEU
* rozdil intenze/extenze
* transparentní intenzionální logika
* co je ATN? (Augmented transition network)
* Stručně popište Český národní korpus(složení, velikost, typy značek).
* Popište Vauquoisův trojúhelník. (trojúhelník s interlinguou na vrcholu)
* Stručně popište systém METEO.
* Stručně popište rozdíl mezi hloubkovou a povrchovou rovinou analýzy syntaxe.
* rozdil mezi morfologickou analyzou a taggingem
* 3 hlavní přístupy k popisu morfologie
* Q systemy (k comu sluzia, kde su aplikované, ako funguju)
* dělení anafor a jak se řeší algoritmicky
* Co je to lemmatizace a kde se používá?
* ALPAC
* metody kontroly gramatickej spravnosti viet (hlavne javy, specificke javy pre cestinu, implementacia)
* Co je to teorie minimalismu, kdo je autorem a co jí předcházelo
Omezení:
Line 55: Line 10:
== Poznámky ==
[[PFL012-poznámky|Nekompletní přepis poznámek]]


== Materiály ==
Materiály (slajdy a draft skript) posílá přednášející mailem všem, co mají předmět zapsaný. Případně jsou dostupné v SISu na stránce předmětu (po přihlášení). Případně existuje i [http://www.marketa.najevisti.info/dokumenty/Lingvistika-priprava.pdf vypracovaný hangout] od studentů.

== Literatura ==
* Eva Hajičová, Jarmila Panevová, Petr Sgall: Úvod do teoretické a počítačové lingvistiky, I. svazek &ndash; Teoretická lingvistika (Karolinum 2002, ISBN 80-246-0470-1)
** kniha je dostupná ve fakultní knihovně na Malé Straně

[[Category:Matematická lingvistika]]
Soubor má $\leq 100000$ řádků
Paměti máme $1$ GB
Má to doběhnout do nižších jednotek minut