Syntax highlighting of Archiv/Státnice I3: Závislostní syntax

{{TOC float}}

''Tento stručný výtah vznikl na základě Wikipedie a slajdů, handoutů a zápisků z předmětů [[Úvod do obecné lingvistiky]] [[Jarmila Panevová|Prof. Panevové]] (ZS 2007/8) a [[Vybrané problémy z lingvistiky I]] [[Markéta Lopatková|Dr. Lopatkové]] (ZS 2009/10) -- [[User:Tuetschek|Tuetschek]] 23:57, 22 Aug 2010 (CEST)''

''Další zdroje:''
* '''''Hajičová, Panevová, Sgall: Úvod do teoretické a počítačové lingvistiky I.'''''
* '''''Lopatková, Plátek, Kuboň: Závislostní redukční analýza přirozených jazyků''''' [http://ufal.mff.cuni.cz:8080/bib/servlet/File?id=116583998563677&field=File]

== Úvod ==
Závislostní syntax je způsob popisu větné struktury, vytvořený [[wen:Lucien Tesnièr|L. Tesnièrem]] (dílo ''Eléments de syntaxe structurale'' vydáno 1959 posmrtně) v rámci tradice evropské strukturální lingvistiky (Tesnière spolupracoval i Pražským lingvistickým kroužkem). Na češtinu byla aplikována v knize ''Novočeské skladba'' (1947) [[wcs:Vladimír Šmilauer|V. Šmilauera]] a dále rozvíjena ve většině novějších mluvnic češtiny i v rámci ''[[Státnice I3: Funkční generativní popis|Funkčního generativního popisu]]'' [[wcs:Petr Sgall|P. Sgalla]] a dalších. Závislostní syntax se uplatňuje i v ruské teorii [[wen:Meaning-Text theory|Meaning-Text]].

Základní myšlenkou je vztah ''závislosti'' mezi jednotlivými slovy, přičemž v centru stojí hlavní sloveso a na něm závisí všechny ostatní členy ([[#Valence|valence]]). Subjekt už tedy nemá stejné výsadní postavení jako v tradiční školské gramatice. Závislosti mezi jednotlivými slovy pak větu přirozeně uspořádají do stromové struktury.

Závislostní popis je vhodný i pro jazyky s volným slovosledem, na rozdíl od popisu pomocí [[Státnice I3: Syntax bezprostředních složek a frázové gramatiky|bezprostředních složek]], který na slovosledu do značné míry závisí.

== Závislostní strom ==

[[Image:Dep-trees.png|frame|Závislostní stromy uspořádané podle slovosledného pořadí (nahoře) nebo podle závislostí (dole)]]
Závislostní strom se formálně definuje jako pětice <math>T = \langle N,Q,E,WO,L\rangle</math>, kde:
* <math>(N, E)\,\;</math> je orientovaný graf (strom, tj. souvislý a bez kružnic, každý uzel kromě kořene má právě jednoho otce),
* <math>Q\,\;</math> je množina možných ohodnocení uzlů (gramatické kategorie), 
* <math>WO\subset N\times N\,\;</math> je silné úplné uspořádání (určující pořadí slov)
* <math>L: N\to Q\,\;</math> je ohodnocovací funkce)

Takto vytvořený závislostní strom má přesně tolik vrcholů, kolik je slov ve větě (na rozdíl od složkového stromu, kde slova ve větě představují jen listy). Nedává ale žádnou informaci o tom, jak byla věta vytvořena -- zaměřuje se čistě na vztahy mezi jednotlivými členy.

Topologické (lineární) uspořádání uzlů může být řešeno tak, jak naznačeno ve formální definici, ale může být provedeno jen čistě na základě struktury, jak to bylo v původním Tesnièrově popisu (viz obrázek).

== Vztahy v závislostní syntaxi ==

Mezi slovy ve větě můžou existovat dva základní vztahy:
* ''Závislost'' (determinace) -- jedno slovo nějakým způsobem (významově) určuje druhé.
* Slova jsou na stejné úrovni, pak se jedná o ''koordinaci'' (několikanásobný větný člen), ''apozici'' (přístavek) nebo ''parentezi'' (vsuvku).
Základní závislostní strom zachycuje pouze první z nich, pro ostatní je třeba vytvořit speciální formalismus.

Závislost se typicky vyjadřuje ''hypotaxí'' (podřadností) a koordinační a podobné vztahy ''parataxí'' (souřadností). Existují ale i příklady, kde je to naopak:
:<tt>Nechoď ven, nastydneš.</tt> (determinace paratakticky), <tt>Otec s matkou šli</tt> (koordinace hypotakticky)

=== Závislost ===

Vztahy závislosti mezi slovy ve větě se formálně vyjadřují:
* ''kongruencí'' -- shodou gramatických kategorií
* ''rekcí'' -- určení gramatických kategorií nadřízeným členem (např. sloveso vyžaduje urč. pád svých [[#Valence|doplnění]])
* ''juxtapozicí'' -- přimykáním (tj. závislý člen se prostě nachází poblíž nadřízeného ve slovosledu)

Závislosti mezi slovy ve větě je možné analyzovat na základě ''principu redukce'': postupně se snažíme větu redukovat a vypouštíme slova, jejichž vynecháním zachováme gramatickou korektnost věty. Slova, která mohou být vypuštěna v libovolném pořadí, na sobě nezávisí. Rozlišujeme dva druhy závislostí:
* ''exocentrická'' -- je jednoznačné, co závisí na čem, pořadí možného vypouštění je jasně dáno
* ''endocentrická'' -- nelze jednoznačně určit, co závisí na čem (např. v rámci předložkových skupin)
Funkci a nutnost výskytu jednotlivých závislostí blíže popisuje teorie [[#Valence|valence]].

Některé závislosti se ve větě nedají analyzovat jednoznačně, věta má pak více interpretací. Jde zejména o tyto situace:
* tzv. "PP-attachment" (platí i pro složkové stromy, kde existuje více stromů odpovídajícíh stejné větě) a nejednoznačná doplnění adjektivem:
:Př. <tt>Ředitel banky roku</tt>
* vyjádření užšího nebo volnějšího vztahu v některých konstrukcích (což nelze závislostním stromem, na rozdíl od složkového, popsat):
:Př. <tt>Profesor zjistil, že je jeho (hladový algoritmus) nefunkční</tt>, <tt>(Zítřejší noviny) ze včerejška</tt>

=== Koordinace ===

[[Image:Koordinace.png|frame|Formalizace koordinace]]
Sémantický vztah '''koordinace'''(přiřaďování) je "zmnožení", obsazení jedné větné pozice více členy. Členy označují ''různé'' entity (větné členy nebo věty, i spojení větného členu s větou), které zastávají stejnou sémantickou roli. Jsou rovnocenné a samostatné, mají stejnou syntaktickou platnos. Do závislostí jdou jako celek, mají stejný řídící člen.

Podřadné a souřadné spojky se rozlišují podle pozice a přízvuku:
:<tt>neboť</tt> a <tt>protože</tt> se svojí souřadností / podřadností liší podle různých, spíš historicky daných kritérií (syntakticky jediný rozdíl: <tt>neboť</tt> nestojí nikdy na zač. souvětí)

Mezi členy koordinace nastává některý z následujících vztahů:
* ''kopulativní'' (CONJ -- <tt>a</tt>)
* ''adverzativní'' (ADVS -- <tt>ale</tt>)
* ''disjunktivní'' (DISJ -- <tt>nebo</tt>)
* ''gradační'': stoupá důležitost (GRAD -- <tt>nejen, ale i</tt>) -- v některých jiných lingv. tradicích se nerozlišuje
* ''příčiný'' (REAS -- <tt>neboť</tt>), ''důsledkový'' (CSQ -- <tt>a tak</tt>)
* oprava (<tt>spíše, lépe</tt>), zahrnutí (<tt>a to i</tt>)

Formalizace koordinace je složitá, je nutné přidat do závislostního stromu "další dimenzi". Petkevič (1995) navrhl pro Funkční generativní popis použití dvou různých typů stromových hran pro každý ze vztahů, popř. v lineárním zápisu dva typy závorek. Všechny hrany jedné koordinace jsou navázány na jeden závislostní uzel (viz obrázek).

=== Apozice ===
Zmnožení (více členů téže synt. platnosti, přičemž všechny pojmenovávají 1 referent, stejný větný člen. Jsou zaměnitelné, kongruentní.
* Různé pojetí, např. Šmilauer považuje za apozici i <tt>Pan Novák</tt>, <tt>Prezident Klaus</tt>, v PDT je to přívlastek
* Oddělení čárkou nebo věci v závorkách: <tt>"''Obč. dem. strana'' (''ODS'') ..."</tt>.
* Někdy je problém ji odlišit od koordinace (<tt>"Naši sousedé, Marie a Milan, ..."</tt>)

=== Parenteze ===
Vsuvka -- syntakticky nesouvisí s okolím, ale snaží se upřesnit, o čem se mluví
* Něco v závorkách, příp. odd. čárkou: <tt>Mohl byste, prosím, přijít?</tt> (Lze psát i bez čárek, ale pak se to v PDT považuje za částici.)
** <tt>prosím, řekl bych</tt> -- ''ustálená parenteze'', de facto částice, frazémy
* ''Větná parenteze'' -- např. věta v závorce
* ''Větný člen jako parenteze'' -- <tt>Přišel pozdě (včera).</tt>

== Projektivita ==
{{TODO|}}

* Neprojektivita:
:<tt>Soubor se nepodařilo otevřít. Vánoční nadešel čas. </tt>
Jejich závislostní stromy mají v projekci křížící se hrany.

== Valence ==
{{TODO|}}

{{Statnice I3}}