Diff for ''
| Deletions are marked like this. | Additions are marked like this. |
| Line 1: | Line 1: |
| # Hloubka vs. Vyska vs. Hladina | {{Předmět|Úvod do počítačové lingvistiky|Vladislav Kuboň|PFL012}} |
| Line 3: | Line 3: |
| <{ForumPost(poster="_angwin", timestamp=2009-02-04 23:41:55)}> Jak se tak postupne prokousavam Koubkovyma skriptama, tak jsem narazil na tyto tri terminy. Vzdy se jedna o vzdalenosti vrcholu od korene, resp. od listu. Zatim jsem nezavrhnul hypotezu, ze vyska se cisluje od listu a hloubka/hladina se cisluje od korene. Muzete to nekdo prosim potvrdit nebo ty veci v textu pouziva zcela nahodne? Asi jsem prehlidel nejakou definici... <{/ForumPost}> |
Úvodní přednáška do počítačové lingvistiky. Výklad doktora Kuboně je srozumitelný a v rozumné míře zábavný, poměr teorie a praktických ukázek je vyrovnaný. |
| Line 9: | Line 5: |
| <{ForumPost(poster="Myshaak", timestamp=2009-02-05 00:59:24)}> | == Zkouška == Na zkoušku se lze během jednoho dne v pohodě naučit (tomu, kdo nechodil na přednášky, to může trvat o něco déle). Zkouška je písemná, jedna velká otázka a 7 menších. Na jedničku je třeba umět všechna klíčová slova k dané otázce. |
| Line 11: | Line 8: |
| > _angwin wrote:Jak se tak postupne prokousavam Koubkovyma skriptama, tak jsem narazil na tyto tri terminy. Vzdy se jedna o vzdalenosti vrcholu od korene, resp. od listu. > > Zatim jsem nezavrhnul hypotezu, ze vyska se cisluje od listu a hloubka/hladina se cisluje od korene. Muzete to nekdo prosim potvrdit nebo ty veci v textu pouziva zcela nahodne? Asi jsem prehlidel nejakou definici... |
=== Otázky === * Co je wordnet? * Popište systém ASIMUT. * Podrobně popiště systém MOSAIC. * Používá MOSAIC syntaktickou analýzu? Proč? * Co je a na co slouží strukturní index u Chomského gramatiky? * Pražský závislostní korpus (PDT) * Unifikační gramatiky - výhody/nevýhody * Systém Česílko * Kontrola překlepů * Co je morfém a jak ho klasifikujeme? * Nakreslete složkový a závislostní strom pro větu "Ve včerejším závodu startovali výborní skokani." * Převeďte složkový strom na závislostní * Co je překladová paměť? * Co je vyhlazování? * Brownův korpus * Co je ontologie a jak se používá? * Chomskeho teorie * Co je alomorf? * Bickel-Schroderova metoda * PennTreebank * Sestavy rysu a jejich použití. * Co je transfér v automatickém překladu – přenos zanalyzované věty z jednoho jazyka do druhého (slovosled, morfologie) * Jaký je rozdíl mezi interlinguou a pivotním jazykem? * Co je TAG (velmi stručně popište) * Popište model zašuměného kanálu. * Funkční generativní popis stručně * Statistické metody prekladu * co je LFG? * co je Two-Level morphology? * BLEU * rozdil intenze/extenze * transparentní intenzionální logika * co je ATN? (Augmented transition network) * Stručně popište Český národní korpus(složení, velikost, typy značek). * Popište Vauquoisův trojúhelník. (trojúhelník s interlinguou na vrcholu) * Stručně popište systém METEO. * Stručně popište rozdíl mezi hloubkovou a povrchovou rovinou analýzy syntaxe. * rozdil mezi morfologickou analyzou a taggingem * 3 hlavní přístupy k popisu morfologie * Q systemy (k comu sluzia, kde su aplikované, ako funguju) * dělení anafor a jak se řeší algoritmicky * Co je to lemmatizace a kde se používá? * ALPAC * metody kontroly gramatickej spravnosti viet (hlavne javy, specificke javy pre cestinu, implementacia) * Co je to teorie minimalismu, kdo je autorem a co jí předcházelo |
| Line 15: | Line 55: |
| Zdar, je to tak, jak rikas. Teda nerucim za to, ze to je konzistentne v celych skriptech, ale treba v popisu A-sortu je zminena "vyska" a znamena to vzdalenost od listu, zatimco "hloubka" se pocita od korene. <{/ForumPost}> |
== Poznámky == [[PFL012-poznámky|Nekompletní přepis poznámek]] |
| Line 18: | Line 58: |
| <{ForumPost(poster="Schiroo", timestamp=2009-02-09 14:02:16)}> Definice hloubky a hladiny je u (a,b)-stromů: |
|
| Line 21: | Line 59: |
| > Když *v* má * \ro(v)* synů, pak jsou očíslovány od 1 do *\ro(v)*. Řekneme, že vrchol *v* je v **hloubce** h, když cesta z kořene *t* do *v* má délku *h*. Množina všech vrcholů v hloubce h se nazývá **h-tá hladina**. | == Materiály == Materiály (slajdy a draft skript) posílá přednášející mailem všem, co mají předmět zapsaný. Případně jsou dostupné v SISu na stránce předmětu (po přihlášení). Případně existuje i [http://www.marketa.najevisti.info/dokumenty/Lingvistika-priprava.pdf vypracovaný hangout] od studentů. |
| Line 23: | Line 62: |
| Už jsem se dočetl i k výšce (Hladinově propojené (a,b)-stromy s prstem, amortizovaná složitost operací ) :) | == Literatura == * Eva Hajičová, Jarmila Panevová, Petr Sgall: Úvod do teoretické a počítačové lingvistiky, I. svazek – Teoretická lingvistika (Karolinum 2002, ISBN 80-246-0470-1) ** kniha je dostupná ve fakultní knihovně na Malé Straně |
| Line 25: | Line 66: |
| > Připomínáme, že výška vrcholu v kořenovém stromě je maximální délka cesty z tohoto vrcholu do některého listu v jeho podstromu, V (a,b)-stromech nezáleží na tom, který list budeme uvažovat, všechny cesty mají stejnou délku. Tedy Mishaak měl pravdu, nová informace je ta, že je to (snad) ve skriptech konzistentní vzhledem k tomu, že je to tam explicitně definované. <{/ForumPost}> |
[[Category:Matematická lingvistika]] |