Diff for ''

Revision 1
Time:
2024-06-13 22:28
Revision 29
Author:
cernyj27
Time:
2024-07-16 13:59
Deletions are marked like this. Additions are marked like this.
Line 1: Line 1:
# Hloubka vs. Vyska vs. Hladina {{Předmět|Úvod do počítačové lingvistiky|Vladislav Kuboň|PFL012}}
Line 3: Line 3:
<{ForumPost(poster="_angwin", timestamp=2009-02-04 23:41:55)}>
Jak se tak postupne prokousavam Koubkovyma skriptama, tak jsem narazil na tyto tri terminy. Vzdy se jedna o vzdalenosti vrcholu od korene, resp. od listu.
&nbsp;&nbsp;
Zatim jsem nezavrhnul hypotezu, ze vyska se cisluje od listu a hloubka/hladina se cisluje od korene. Muzete to nekdo prosim potvrdit nebo ty veci v textu pouziva zcela nahodne? Asi jsem prehlidel nejakou definici...
<{/ForumPost}>
Úvodní přednáška do počítačové lingvistiky. Výklad doktora Kuboně je srozumitelný a v rozumné míře zábavný, poměr teorie a praktických ukázek je vyrovnaný.
Line 9: Line 5:
<{ForumPost(poster="Myshaak", timestamp=2009-02-05 00:59:24)}> == Zkouška ==
Na zkoušku se lze během jednoho dne v pohodě naučit (tomu, kdo nechodil na přednášky, to může trvat o něco déle). Zkouška je písemná, jedna velká otázka a 7 menších. Na jedničku je třeba umět všechna klíčová slova k dané otázce.
Line 11: Line 8:
&nbsp;> _angwin wrote:Jak se tak postupne prokousavam Koubkovyma skriptama, tak jsem narazil na tyto tri terminy. Vzdy se jedna o vzdalenosti vrcholu od korene, resp. od listu.
&nbsp;>
&nbsp;> Zatim jsem nezavrhnul hypotezu, ze vyska se cisluje od listu a hloubka/hladina se cisluje od korene. Muzete to nekdo prosim potvrdit nebo ty veci v textu pouziva zcela nahodne? Asi jsem prehlidel nejakou definici...
=== Otázky ===
* Co je wordnet?
* Popište systém ASIMUT.
* Podrobně popiště systém MOSAIC.
* Používá MOSAIC syntaktickou analýzu? Proč?
* Co je a na co slouží strukturní index u Chomského gramatiky?
* Pražský závislostní korpus (PDT)
* Unifikační gramatiky - výhody/nevýhody
* Systém Česílko
* Kontrola překlepů
* Co je morfém a jak ho klasifikujeme?
* Nakreslete složkový a závislostní strom pro větu "Ve včerejším závodu startovali výborní skokani."
* Převeďte složkový strom na závislostní
* Co je překladová paměť?
* Co je vyhlazování?
* Brownův korpus
* Co je ontologie a jak se používá?
* Chomskeho teorie
* Co je alomorf?
* Bickel-Schroderova metoda
* PennTreebank
* Sestavy rysu a jejich použití.
* Co je transfér v automatickém překladu &ndash; přenos zanalyzované věty z jednoho jazyka do druhého (slovosled, morfologie)
* Jaký je rozdíl mezi interlinguou a pivotním jazykem?
* Co je TAG (velmi stručně popište)
* Popište model zašuměného kanálu.
* Funkční generativní popis stručně
* Statistické metody prekladu
* co je LFG?
* co je Two-Level morphology?
* BLEU
* rozdil intenze/extenze
* transparentní intenzionální logika
* co je ATN? (Augmented transition network)
* Stručně popište Český národní korpus(složení, velikost, typy značek).
* Popište Vauquoisův trojúhelník. (trojúhelník s interlinguou na vrcholu)
* Stručně popište systém METEO.
* Stručně popište rozdíl mezi hloubkovou a povrchovou rovinou analýzy syntaxe.
* rozdil mezi morfologickou analyzou a taggingem
* 3 hlavní přístupy k popisu morfologie
* Q systemy (k comu sluzia, kde su aplikované, ako funguju)
* dělení anafor a jak se řeší algoritmicky
* Co je to lemmatizace a kde se používá?
* ALPAC
* metody kontroly gramatickej spravnosti viet (hlavne javy, specificke javy pre cestinu, implementacia)
* Co je to teorie minimalismu, kdo je autorem a co jí předcházelo
Line 15: Line 55:
Zdar, je to tak, jak rikas. Teda nerucim za to, ze to je konzistentne v celych skriptech, ale treba v popisu A-sortu je zminena "vyska" a znamena to vzdalenost od listu, zatimco "hloubka" se pocita od korene.
<{/ForumPost}>
== Poznámky ==
[[PFL012-poznámky|Nekompletní přepis poznámek]]
Line 18: Line 58:
<{ForumPost(poster="Schiroo", timestamp=2009-02-09 14:02:16)}>
Definice hloubky a hladiny je u (a,b)-stromů:
Line 21: Line 59:
&nbsp;> Když *v* má * \ro(v)* synů, pak jsou očíslovány od 1 do *\ro(v)*. Řekneme, že vrchol *v* je v **hloubce** h, když cesta z kořene *t* do *v* má délku *h*. Množina všech vrcholů v hloubce h se nazývá **h-tá hladina**. == Materiály ==
Materiály (slajdy a draft skript) posílá přednášející mailem všem, co mají předmět zapsaný. Případně jsou dostupné v SISu na stránce předmětu (po přihlášení). Případně existuje i [http://www.marketa.najevisti.info/dokumenty/Lingvistika-priprava.pdf vypracovaný hangout] od studentů.
Line 23: Line 62:
Už jsem se dočetl i k výšce (Hladinově propojené (a,b)-stromy s prstem, amortizovaná složitost operací ) :) == Literatura ==
* Eva Hajičová, Jarmila Panevová, Petr Sgall: Úvod do teoretické a počítačové lingvistiky, I. svazek &ndash; Teoretická lingvistika (Karolinum 2002, ISBN 80-246-0470-1)
** kniha je dostupná ve fakultní knihovně na Malé Straně
Line 25: Line 66:
&nbsp;> Připomínáme, že výška vrcholu v kořenovém stromě je maximální délka cesty z tohoto vrcholu do některého listu v jeho podstromu, V (a,b)-stromech nezáleží na tom, který list budeme uvažovat, všechny cesty mají stejnou délku.

Tedy Mishaak měl pravdu, nová informace je ta, že je to (snad) ve skriptech konzistentní vzhledem k tomu, že je to tam explicitně definované.
<{/ForumPost}>
[[Category:Matematická lingvistika]]