{{TOC float}}

{{Sources| Tento popis byl původně vytvořen podle Koubkových skript, skript Vidner-Kotal a Popisu K. Mehlhorna v knize Algorithms and Complexity vol. 1 J. Van Leeuwena (viz Google Books). -- User:Tuetschek 00:16, 21 Aug 2010 (CEST). Martin Mares ma k tomu hezke PDFko http://mj.ucw.cz/vyuka/1516/ds2/06-trans.pdf

}}

Úvod

Mnoho datových struktur podporuje velice efektivní operaci MEMBER, ale nemá operace INSERT a DELETE (např. uspořádané pole). Úkolem dynamizace je právě tyto operace do jakékoliv obecné struktury co nejefektivněji doplnit.

Zobecněný vyhledávací problém

Zobecněný vyhledávací problém je libovolná funkce f:U1×2U2U3 ⁣f:U_1\times 2^{U_2} \to U_3\,\! -- pro prvek a nějakou množinu vrací nějakou hodnotu (níže nazýváme VYCIS).

Struktura S ⁣\mathcal{S}\,\! je statická struktura řešící vyhledávací problém (neboli S-struktura) f ⁣f\,\!, je-li dán algoritmus, který pro AU2 ⁣A\subseteq U_2\,\! zkonstruuje datovou strukturu S(A) ⁣\mathcal{S}(A)\,\! a algoritmus, který pro xU1 ⁣x\in U_1\,\! a S(A) ⁣\mathcal{S}(A)\,\! spočte f(x,A) ⁣f(x,A)\,\!. V praxi naši S-strukturu postavíme pro dané A, provádíme nad ní VYCIS, celou smažeme, postavíme pro nové A, pořád dokola. Nic jiného s ní dělat nelze.

Struktura je semidynamická, pokud navíc existuje algoritmus, který pro xU2 ⁣x\in U_2\,\! a S(A) ⁣\mathcal{S}(A)\,\! zkonstruuje S-strukturu S(A{x}) ⁣\mathcal{S}(A\cup\{x\})\,\!.

Struktura je dynamická, pokud navíc existuje algoritmus, který pro xA ⁣x\in A\,\! a S(A) ⁣\mathcal{S}(A)\,\! zkonstruuje S-strukturu S(A\{x}) ⁣\mathcal{S}(A\backslash\{x\})\,\!.

Ve všech následujících operacích budeme uvažovat jen rozložitelný vyhledávací problém:

  • Vyhledávací problém je rozložitelný, pokud existuje binární operace  ⁣\circ\,\! na univerzu U3 ⁣U_3\,\! taková, že pro disjunktní A,BU2 ⁣A,B\subseteq U_2\,\! a xU1 ⁣x\in U_1\,\! platí f(x,A)f(x,B)=f(x,AB) ⁣f(x,A)\circ f(x,B) = f(x,A\cup B)\,\!.

To platí pro situaci, která nás nejvíc zajímá -- pokud funkce f ⁣f\,\! provádí operaci MEMBER nad nějakou datovou strukturou. Jiné problémy (patří x ⁣x\,\! do konvexního obalu množiny?) ale rozložitelné nejsou.

Navíc budeme předpokládat, že funkce  ⁣\circ\,\! lze spočítat v konstantním čase. Označme

  • QS(n) ⁣Q_{\mathcal{S}}(n)\,\! čas na vyčíslení f(x,A) ⁣f(x,A)\,\!, pokud A=n ⁣|A|=n\,\!

  • SS(n) ⁣S_{\mathcal{S}}(n)\,\! paměťový prostor potřebný k reprezentaci n ⁣n\,\!-prvkové množiny

  • PS(n) ⁣P_{\mathcal{S}}(n)\,\! čas na vytvoření struktury S(A) ⁣\mathcal{S}(A)\,\! pro A=n ⁣|A|=n\,\!

Pro asymptotické odhady budeme předpokládat, že funkce QS(n) ⁣Q_{\mathcal{S}}(n)\,\!, SS(n)n ⁣\frac{S_{\mathcal{S}}(n)}{n}\,\! a PS(n)n ⁣\frac{P_{\mathcal{S}}(n)}{n}\,\! jsou neklesající.

Semidynamizace

Vytvoříme semidynamickou strukturu, jejíž čas operace INSERT bude velmi rychlý a navíc se nám moc nepokazí doba pro provedení operace VYCIS. Základní idea je podobná jako v binomiálních haldách -- roztrháme reprezentovanou množinu A ⁣A\,\! na sadu disjunktních podmnožin AiA_i o velikosti 2i ⁣2^i\,\! (takové množiny jsou neprázdné pro i ⁣i\,\! odpovídající jedničkám v binárním zápisu čísla A ⁣|A|\,\!.

Formálně budeme mít seznam S-struktur S(Ai) ⁣\mathcal{S}(A_i)\,\! odpovídajících množinám Ai ⁣A_i\,\!, potom seznam spojových seznamů s(Ai) ⁣s(A_i)\,\!, které obsahují prvky jednotlivých množin (z S-struktury nemusíme umět číst prvky, proto je radši evidujeme "vedle" ve spojáku), a nakonec pomocnou dynamickou strukturu T ⁣T\,\! (např. binární vyhledávací strom). To všechno dohromady zjevně vyžaduje jen O(SS(n)) ⁣O(S_{\mathcal{S}}(n))\,\! paměti (celkem reprezentujeme pořád stejně prvků a vyhledávací stromy i spojáky jsou O(n) ⁣O(n)\,\!).

Struktura T ⁣T\,\! se používá k "rychlému" testování před INSERTem, zda nechceme vkládat prvek, který už v množině máme, případně před DELETEM, jestli nechceme mazat neexistující prvek. Pro jednoduchost to v popisech operací vynecháme.

Pokud by náš vyhledávací problém f(x,A)f(x,A) realizoval problém MEMBER (náležení prvku do množiny), již pro něj existují efektivnější řešení, než semidynamizace. Představme si raději složitější vyhledávací problém, např. eukleidovská vzdálenost prvku od množiny.

Operace VYCIS

Operace VYCIS potom projde všechny neprázdné množiny Ai ⁣A_i\,\! a zavolá VYCIS na nich. Výsledeky spojí za pomoci funkce  ⁣\circ\,\!.

To celkem dává složitost VYCISu O(QS(n)log(n)) ⁣O(Q_{\mathcal{S}}(n)\log(n))\,\!, protože hledáme v max. log2 ⁣\log_2\,\! dílčích množinách.

Protože jakékoliv mocniny rostou rychleji než logaritmus, platí, že pokud QS=nϵ ⁣Q_{\mathcal{S}} = n^{\epsilon}\,\! pro nějaké ϵ>0 ⁣\epsilon > 0\,\!, pak je operace VYCIS O(nϵ) ⁣O(n^{\epsilon})\,\!.

Operace INSERT

Operace INSERT najde nejmenší i ⁣i\,\! takové, že Ai= ⁣A_i=\emptyset\,\!. Potom vezme všechny Aj,j<i ⁣A_j, j<i\,\! (ty jsou neprázdné) a spolu s vkládaným prvkem je slije do jedné množiny Ai ⁣A_i\,\! (zahodí S-struktury pro všechna Aj,j<i ⁣A_j, j<i\,\!, zkonkatenuje spojáky s(Aj) ⁣s(A_j)\,\! a z prvků výsledného spojáku zkonstruuje novou S-strukturu S(Ai) ⁣\mathcal{S}(A_i)\,\!). Nová množina má správný počet prvků, protože j=0i12j+1=2i ⁣\sum_{j=0}^{i-1} 2^j + 1 = 2^i\,\!. Zároveň se prvek přidá do T.

V odhadu amortizované složitosti využijeme fakt, že S-struktura pro Ai ⁣A_i\,\! se tvoří jen tehdy, když existují S-struktury pro všechny Aj,j<i ⁣A_j, j<i\,\!. Tj. S-struktura o velikosti 2i ⁣2^i\,\! prvků se konstruuje znovu až po dalších 2i+11 ⁣2^{i+1}-1\,\! INSERTech. Amortizovaně tak vychází{{ref|1}}:

:i=0lognPS(2i)2ii=0lognPS(n)n=PS(n)nlogn=O(PS(n)nlogn) ⁣\sum_{i=0}^{\log n}\frac{P_{\mathcal{S}}(2^i)}{2^i} \leq \sum_{i=0}^{\log n}\frac{P_{\mathcal{S}}(n)}{n} = \frac{P_{\mathcal{S}}(n)}{n}\log n = O(\frac{P_{\mathcal{S}}(n)}{n}\log n)\,\!.

Podobně jako pro VYCIS platí, že pokud PS=nϵ ⁣P_{\mathcal{S}} = n^{\epsilon}\,\! pro nějaké ϵ>1 ⁣\epsilon > 1\,\!, pak je složitost operace INSERT O(nϵ1) ⁣O(n^{\epsilon-1})\,\!.

Operace INSERT se zaručeným nejhorším časem

Protože někdy nestačí mít INSERT rychlý amortizovaně, byla vytvořena jeho varianta, která zaručuje rozumnou rychlost i v nejhorším případě. Dělá se to prostým rozložením potřebných operací do všech volání. Musíme ale povolit i požadavky na naši strukturu -- místo max. jedné množiny pro každou velikost odpovídající mocnině dvou budeme mít max. 4 takové množiny Ai,0,Ai,3 ⁣A_{i,0},\dots A_{i,3}\,\!, z nichž poslední navíc bývá zkonstruovaná jen částečně ("rozpracovaná").

Označme počet množin Ai ⁣A_i\,\! jako ki ⁣k_i\,\!, přičemž ki=1 ⁣k_i = -1\,\!, pokud neexistuje žádná množina velikosti 2i ⁣2^i\,\!. Algoritmus potom vypadá následovně:

  1. Vytvoří se jednoprvková A0,k0+1={x}A_{0,k_0+1} = \{x\} a zvýší k0 ⁣k_0\,\! (tj. i odpovídající S-struktura)

  2. Pro první souvislý úsek, kde ki0k_i\geq 0:

    1. Provedeme dalších PS(2i)2i ⁣\frac{P_{\mathcal{S}}(2^i)}{2^i}\,\! konstrukce S-struktury S(Ai,ki) ⁣\mathcal{S}(A_i,k_i)\,\!

    2. Pokud jsme tím tuto S-strukturu dotvořili, vezmeme první dvě struktury "o patro níž" (Ai1,0 ⁣A_{i-1,0}\,\! a Ai1,1 ⁣A_{i-1,1}\,\!) a připravíme je prvním krokem k sloučení. Zároveň je odtud odebereme a přečíslujeme zbylé. Jejich započaté sloučení přidáme na úroveň i ⁣i\,\!.

  3. Pokud jsme v posledním kroku (i ⁣i\,\!, t.ž. ki+1=0 ⁣k_{i+1} = 0\,\!) vytvořili druhou strukturu stejné velikosti na nejvyšším dosaženém "patře", připravíme první krok sloučení těchto dvou největších struktur, přemístíme jejich započaté sloučení "o patro výš" a odebereme původní struktury.

Díky tomu, že počet kroků volíme tak šikovně, vždycky dotvoříme strukturu právě včas na to, abychom mohli vytvářet další stejné velikosti. Navíc, protože se provede jen O(PS(2i)2i) ⁣O(\frac{P_{S}(2^i)}{2^i})\,\! kroků pro každé i ⁣i\,\!, odpovídá složitost v nejhorším případě amortizované složitosti původní operace INSERT.

Dynamizace

Při úplné dynamizaci navíc požadujeme efektivní algoritmus DELETE. Přidáme další předpoklad, a to, že na naší původní S-struktuře existuje operace FAKE-DELETE (ta spočívá v označení nějakého prvku jako "smazaného", aniž by se smazal skutečně -- dál tedy zabírá místo a prodlužuje operace).

Základní ideou oproti semidynamizaci navíc je, že se budeme snažit za každou cenu zajistit, aby všechny naše pomocné S-struktury stále obsahovaly alespoň osminu "nesmazaných" prvků a přestavovat je až poté, co počet "smazaných" překročí tuto mez. Formálně naše S-struktury reprezentují vlastně množiny Bi ⁣B_i\,\!, kde Bi=Ai\{xi;i=1,2k} ⁣B_i = A_i \backslash \{x_i; i=1,2\dots k\}\,\! (a 2i3<Ai2j ⁣2^{i-3} <|A_i| \leq 2^j\,\!).

Asymptoticky tak zaručíme, že množin (a pomocných S-struktur) bude stále jen logaritmicky mnoho a paměťové nároky taky zůstávají asymptoticky stejné. Struktura je tedy stejná jako pro (základní) dynamizaci. Navíc jsou nyní spojové seznamy prvků přímo provázané s S-strukturami (protože už nepoznáme podle velikosti seznamu, ke které S-struktuře vlastně patří).

Operace MEMBER pak pracuje úplně stejně, jen nakonec zkontroluje, zda nalezený prvek nebyl označen jako "smazaný" (a případně ho pak nevrátí).

Operace INSERT

Algoritmus operace INSERT(x ⁣x\,\!) je následující:

  1. Najdi nejmenší j ⁣j\,\! takové, že ijAi<2j ⁣|\cup_{i\leq j} A_i|<2^j\,\!.

  2. Vytvoříme Aj=ijAi{x} ⁣A_j = \cup_{i\leq j} A_i \cup \{x\}\,\! (včetně S-struktury a spojáku). To splňuje požadavky na velikost 2j1<Aj2j ⁣2^{j-1} <|A_j|\leq 2^j\,\!, jinak by pro j ⁣j\,\! nebylo nejmenší.

  3. Položíme Ai= ⁣A_i = \emptyset\,\! pro i<j ⁣i<j\,\!.

Díky zachovávané minimální velikosti vytvářené množiny máme složitost amortizovaně stejnou jako v případě semidynamizace.

Operace DELETE

Odebrání prvku x ⁣x\,\! z naší dynamické struktury vypadá následovně:

  1. Odstraníme x ⁣x\,\! ze spojáku{{ref|2}}

  2. Vyřešíme čtyři různé případy podle velikosti množiny Ai ⁣A_i\,\!, která obsahuje prvek x ⁣x\,\!:

    1. Je-li Ai ⁣A_i\,\! jen jednoprvková, prostě zahodím struktury s ní spojené.

    2. Je-li Ai>2i3 ⁣|A_i| > 2^{i-3}\,\! (tj. ještě mám víc než osminu prvků "platných"), provedeme pouze FAKE-DELETE.

    3. Je-li Ai1 ⁣A_{i-1}\,\! buď prázdná, nebo dost velká (Ai1>2i2 ⁣|A_{i-1}| > 2^{i-2}\,\!), můžeme ji s Ai ⁣A_i\,\! prohodit. Pro "nové" Ai1 ⁣A_{i-1}\,\! pak vytvoříme novou S-strukturu.

    4. Je-li Ai1 ⁣A_{i-1}\,\! neprázdná, ale moc malá na prohození s Ai ⁣A_{i}\,\!, potom je určitě můžeme sloučit a získáme novou množinu, která splňuje velikostní omezení pro Ai ⁣A_i\,\!. Pro ni vyrobíme novou S-strukturu.

Amortizovaná složitost celé operace DELETE je O(DS(n)+logn+PS(n)n)O(D_{\mathcal{S}}(n) + \log n + \frac{P_{\mathcal{S}}(n)}{n}), kde DS(n) ⁣D_{\mathcal{S}}(n)\,\! je čas potřebný na operaci FAKE-DELETE a logn ⁣\log n\,\! je potřeba na vyhledání prvku. Odhadneme, kolikrát se dělá skutečné přestavění S-struktur. Pokud xAi ⁣x\in A_i\,\!, pak DELETE může nově vytvořit jen S(Ai) ⁣S(A_i)\,\! nebo S(Ai1) ⁣S(A_{i-1})\,\!. Z jejich podmínek velikosti (v algoritmu) vidíme, že mezi dvěma DELETE pro stejné Aj ⁣A_j\,\! (přičemž Aj2i2 ⁣|A_j|\leq 2^{i-2}\,\!) se musí provést aspoň 2j3 ⁣2^{j-3}\,\!-krát FAKE-DELETE (a libovolný počet DELETE na jiných množinách). Amortizovaná složitost vytváření S-struktur tak vychází:

:PS(2j2)2j3=O(PS(n)n) ⁣\frac{P_{\mathcal{S}}(2^{j-2})}{2^{j-3}} = O(\frac{P_{\mathcal{S}}(n)}{n})\,\!

I se současně prováděnými operacemi DELETE se amortizovaná složitost operací INSERT zachovává. Aby INSERT vytvořil podruhé strukturu pro Ai ⁣A_i\,\!, musí opět nastat 1+jiAj>2j1 ⁣1+\sum_{j\leq i}|A_j| > 2^{j-1}\,\!. Protože DELETE nikdy nevytvoří strukturu s víc než polovinou skutečně zaplněnou, musí se do té doby provést aspoň 2i2 ⁣2^{i-2}\,\! INSERTů, čímž získáme stejnou situaci jako u semidynamizace.


{{note|1|Protože čas vyhledání prvku ve struktuře T ⁣T\,\! je logaritmický a tady pracujeme s většími čísly, můžeme ho tu zanedbat.}}

{{note|2|Díky pomocné datové struktuře T ⁣T\,\!to lze udělat rychle -- rychle zjistíme, kde se x ⁣x\,\! nachází.}}

{{Statnice I3}}