Syntax highlighting of Archiv/Lingvistické aspekty umělé inteligence

== Reprezentace znalostí jako jeden ze zákl. problémů AI ==

Historicky vyvíjeny soustavy rep. znalostí jako podklad pro systémy členění problémů, hledání informací, rozbor dotazů. 

V 60. letech vznikají '''databázové systémy'''. Rozdíly od databáze:
# Repr. znalostí má mít víc možností ''inference'' (odvozování), to v DB nejde
# Tehdy DB chápány jako "úplný popis světa", RZ ne
# Systém musí sám vědět, k čemu je, co dělá

Výchozí teze: "AI bez přir. jazyka neexistuje." Spojení AI s přir jazykem -- uplatnění:
* Univerzálnost (+): je možné mluvit o všem
* Víceznačnost (-)
## např. ''bank'' = břeh, banka, existují kontexty, kde i člověk těžko rozezná
## ještě horší -- slovní spojení, struktura: ''řízení našeho ústavu'' (ústav řídí nebo je řízen?)
* Pragmatická vágnost (-): ''Chce se oženit s američnakou'' (jednou určitou?, čistě kvůli získání 
pasu?)
* Reference (-): ''Děti měly radost. Dostaly vláček'' (kdo dostal?)
* Bohatství jazyka (+): korpusová lingvistika, slovníky nabízí materiál k řešení, čím víc ho je, tím líp.

'''Nilsson''' (Stanford, US 1980) v definici AI zahrnuje jazyk (ač sám nebyl lingvista), dává porozumění jazyku na 1. místo. Jeho definice ukazuje vztah lingvistiky a AI -- v aplikacích, v zachycení světa (pamatovat si podobně jako člověk).

== Taxonomie reprezentačních schémat ==

Jaké jsou typy reprezentací znalostí? Co může být využito v systémech komunikace s AI?

'''Ivan Havel''' (1977) rozlišuje 2 typy:
# S použitím predikátové logiky
# Relační struktury (grafy, sítě, rámce). Řadí rámce a sítě dohromady, ač se v lecčems liší.

'''Mylopoulos''' (1980) -- teoretičtější, představuje si reprezentaci jako ''individiua'', vztahy mezi nimi; stav systému konstituuje soubor individuí a vztahů. Změny stavu jsou transformace vztahů.

=== Sémantické sítě ===

Hlavní -- '''individua a vztahy''', tj. uzly a ohodnocené hrany. Vztahy -- různé typy: ''abstraktum x konkrétum, část x celek, typ x instance''. Můžu podle toho definovat různé organizační principy.

=== Logická schémata ===

Soubor logických pravdivýh formulí o stavech. Nejsou uzly a hrany, ale formule. To je výhoda, první systémy na tom stály, pro logiku máme odvozovací pravidla, takže nemusíme vymýšlet vlastní. Problém: chybí org. princip (to v sítích je), těžko se zachycují procedurální znalosti (znalosti postupu práce).

Příklad -- PROLOG.

=== Procedurální schémata ===

Svého času velmi populární. '''Stavové transformace''', zásoba znalostí jako '''soubor procedur v programovacím jazyce''' (např. LISP). Proti logice výhoda -- reprezentace procedur ("vědět jak"), efektivita sytému. ''Default reasoning'' -- na základě "default" situací se může samo aktualizovat (?). 

Nevýhody -- chybí nějaký univerzální podklad (to v logice je), chybí konzistence při default reasoning, obtíže při změnách: když se někde něco změní, změna se propaguje všude, nekontrolovatelně.

=== Rámcová schémata ===

Kombinace předchozích 3, využití i logiky, i procedur, i sítí.

== Porozumění a počítače, ELIZA ==

'''A. M. Turing''' (1947, 50): Tvrdí, že překlad pomocí počítačů je možný, chce odpovědět na otázku, zda je možné porozumění, definuje ''Turingův test'' na základě lidského poznání, zda reaguje člověk nebo počítač. Test byl sporný, vyvrátil ho '''Weizenbaum'''(1966) s programem ELIZA (název podle Pygmalionu -- reakce na úrovni společenské konverzace). ELIZA prošla testem, i když inteligentní vůbec není, jen simuluje inteligenci různými triky. Pracuje v omezeném prostředí (psychiatr). Zahrnuje:
* Soubor klíč. slov, usp. podle důležitosti -- reaguje se na 1 prioritní klíč. slovo
* Pro každé klíč. slovo -- reakce, uspořádaný, co se už použilo, jde na konec (a cyklí se)
** Pro obecné reakce (neurčitá slova) výzva, aby jmenoval zvláštní případ
** Otázky na "rozpovídání se", typu "In what way?"
** Pro popisy špatné duševního stavu se ptá, jak může pomoct
** Pokud se vyčerpají možnosti, použije se "Go on.", nebo "Say me more about ...", příp. "That is interesting."
* Není-li v reakci klíčové slovo, vrací se k poslednímu požitému, případně opět neurčitá reakce, zopakování pacientovy výpovědi.

Trvá to, než si člověk uvědomí, že se počítač opakuje a neví, o čem mluví.

== Winogradův systém ovládání robota (SHRDLU) ==

'''Terry Winograd''' (Stanford 1972, pozd. Edinbourgh) -- první opravdu vážný pokus o komunikaci s počítačem. Na omezeném prostoru zkoušel vlastnosti porozumění: simulace robota v omezeném světě s několika objekty, které mohl přesouvat (nešlo o fyzicky existujícího robota, jen počítačovou simulaci jeho akcí). 

=== Složení systému ====

* Obsahuje ''autoreference'' -- robot ví, v jakém je stavu, co zrovna dělá.
* Procedurální reprezentace znalosti (jazyk PLANNER)
* Rozložil systém na několik modelů, ale šlo mu i o celek
** Hlavní ovládání: MONITOR
** Pod ním INPUT (pro čtení vstupu), GRAMMAR (zpracování vstupu), SEMANTICS (interpretace), ANSWER (zajištění výstupu: vytvoření odpovědi a její provedení, tj posouvání beden)
** Pro čtení vstupu používán DICTIONARY, PROGRAMMAR (pomoc gramatice -- syntaktické stromy), SEMANTIC FEATURES, jazyk PLANNER, BLOCKS (v PLANNERU napsaná robotova znalost světa) + DATA, MOVER (visualizace)

=== Výsledek pokusu ===
Winogradovi se pokus zdařil, založil celé odvětví '''box systems'''. Nešlo ale o vyspělý systém, dost profitoval z omezení světa -- např. lexiklní analýza měla hodně malou slovní zásobu, v syntaxi šlo větš. o jednoduchý imperativ apod. Systém navíc neformuloval moc odpovědi (negeneroval vlastní), v ANSWER měl zabudované matice, kam vkládal slova od operátora (tj. nebylo to moc daleko od ELIZY ;-)). 

Název SHRDLU byl libovolně vybrán Winogradem, aby se nepletl s žádným existujícím slovem (není to zkratka). Winogradův systém museli mít hned na všech univerzitách -- i na MFF 1980 systém  NALCOM (Natural Language Communicator, autor Hajič).

== Sémantické sítě, Quillianův model paměti, rozčlenění sítí (Hendrix) ==


== Rámce, systém GUS, konceptuální závislosti ==


== Lingvistická koncepce, závislostní stromy ==


== Problémy syntaktické analýzy ==


== Problémy sémantické interpretace, reference ==


== Generování vět v přirozeném jazyce ==


== Strojový překlad ==


== Vybrané další metody ==