okruhy 14/15: Typy dotazovacích jazyku (procedurální, neprocedurální, jazyky pro výber dokumentu), SQL a jeho standardy. Algoritmy implementace relacních operací. Vyhodnocování a optimalizace dotazu. Algoritmy vyhodnocení dotazu v Datalogu a Datalogu s negací. Objektové rozšírení relacního modelu dat. Databáze textu - modely (Booleovský, vektorový). Vyhledávání vzorku v textech (sousmerné, protismerné). XML data v relacích, indexace XML dat, podobnost XML dat, XML a webové služby. Datový model RDF, dotazovací jazyk SPARQL, podobnostní dotazy v multimediálních databázích, metrické indexacní metody.

Typy dotazovacích jazyků (procedurální, neprocedurální, jazyky pro výběr dokumentů)

Procedurální

popisují jak se dostaneme k hledanému výsledku (jednotlivé příkazy)

dotaz jako posloupnost operací nad relacemi, jsou založeny na relační algebře

:💡 RA: neprocedurální, nicméně struktura výrazu navádí na pořadí a způsob vyhodnocení *SQL server: Transact SQL (T-SQL)

*Oracle: PL/SQL (také navigační, algebraické)

Neprocedurální

popisují co chceme zjistit (specifikujeme jak má vypadat výsledek) a je na DB systému, aby řekl, jak se k výsledku dostat

dotaz se zadává jako predikát charakterizující výslednou relaci, výsledkem výběru dat je relace, která splňuje podmínky formule. Jsou založeny na relačním kalkulu.

:💡 Relacniho kalkul: „více neprocedurální“ než relační algebra. Specifikuje se pouze „co má výsledek splňovat“.

  • SQL (ISO standard, dotazovací jazyk pro relační DB)

  • XQuery (standard W3C, dotazovací jazyk pro XML)

(také specifikační, deskriptivní, deklarativní)

Jazyky pro výběr dokumentů

dokumentografické informační systémy (hledám dokumenty, které obsahují určité termy) *boolský model

*vektorový model

SQL

{{:Databázové_modely_a_jazyky/SQL}}

[[Formální_základy_databázové_technologie#Algoritmy_vyhodnocen.C3.AD_dotaz.C5.AF_v_Datalogu_a_Datalogu_s_negac.C3.AD|Algoritmy vyhodnocení dotazů v Datalogu a Datalogu s negací]] (🎓🎓)

přesunuto do Datalogu v "Formální základy databázové technologie"

DIS

{{Zkazky|

  • DMJ - Booleovský a vektorový model (2012) - Slovy jsem popsal oba modely. U Booleovského jsem popsal, jak se indexuje, jak se vybírají termy a jak vypadají dotazy. Zmínil jsem se o složitosti počítání relevance. Dále jsem popsal vektorový model, jak vypadají dotazy apod. Zmínil jsem se, jak se počítá TF a ITF. Zkoušející se jen zeptal na pár otázek a byl spokojen.

  • DMJ - Indexace v DIS (2009, Kopecky) - Boolske systemy - reprezentace matici - moc velke, signatury, zbytek ze mne musel pan Kopecky dost pacit (invertovany soubor, jak ho ziskame - setridim dvojice (term, dokument) vnejsim tridenim a pak k nim sestrojim ten invertovany index). Vektorove systemy - formulovat vsechny vzorecky na TF, ITF, NTF, normalizovany vektor pro dokument. Takze tam jsem uz dalsi otazku nedostal..

  • DMJ - Vekt. a boolsky model (2009, Kopecky) - Zrejme oblubena otazka pana Kopeckeho. Uz som bol unaveny ale dal som boolsky model vcelku obstojne a pri vektorovom iba zaklad. Pan Kopecky ale skusa prijemnym sposobom a ak ste to nikedy vedeli tak to z vas dostane seriou lahkych otazok. Nepotrpi si na formalizmoch - staci mu to porozpravat po lopate a vediet princip :)

  • DMJ - Indexace dokumentů (2009, Skopal) - mám invertovaný soubor, index obsahuje jednotlivé termy, které pak mají seznam dokumentů, ve kterých se vyskytují - co ze mě doc. Skopal doloval bylo říct, že tyhle dokumenty jsou v tom seznamu setřízené, aby bylo urychlené vyhodnocování (problém byl v tom, že obrázek, kterej jsem k tomu nakreslil nebyl úplně jednoznačnej a každej jsme ho pochopili jinak, takže jsem za vůbec nechápal, co po mě chce, ale moh jsem si za to sám

  • DMJ - Vektorový model (2008, Pokorný) - chápal som to len intuitívne (vôbec som nevedel žiadne vzorce ITF a podobne), čo mu trochu vadilo, nakoniec to pochopil a netrápil ma

  • IDS - Vektorovy a boolovsky model (2009, Kopecky) - princip, tvar dotazu a odpovede, implementacia

}} {{:Databázové_modely_a_jazyky/DIS}}

Odborné

{{:Databázové_modely_a_jazyky/Odborne}}

{{Statnice_I2}}