{{Předmět|Dobývání znalostí|Doc. RNDr. Mrázová Iveta, CSc.|NDBI023}}
Požadavky 12/13
výsledná známka = 40% body ze zkoušky, 20% body z dvou písemek, 40% body z úkolů ze cvičení a projektu (včetně bodů ze cvičení, všechny úkoly jsou povinné)
vypracovat projekt
celkem je potreba splnit aspon 56%
terminy v září budou jeden až dva
Zdroje k předmětu
<NDBI023%20Shrnutí>
Wikipedia:Datamining
Fisherův test
http://en.wikipedia.org/wiki/Fisher%27s_exact_test#Example - odvození, příklad jednostranného
http://oldweb.izip.cz/ds3/hypertext/JZAAA.htm - příklad česky
http://www.quantpsy.org/fisher/fisher.htm - hezké vysvětlení jednostranných a oboustranných testů, kalkulačka
http://graphpad.com/quickcalcs/contingency2/ - ještě jedna kalkulačka pro kontrolu :)
http://www.stahroun.me.cz/interstat/kategorialni/asociace/fisher/index.htm - spousta zdrojů
chi-kvadrát test
http://mathhelpforum.com/advanced-statistics/44800-two-tailed-chi-squared-tests.html - trošku světla na oboustranné testy
http://stats.stackexchange.com/questions/22347/chi-squared-always-a-one-sided-test - a jeste jednou oboustranné testy
http://itl.nist.gov/div898/handbook/eda/section3/eda3674.htm - tabulky
Písemky
Příklady ze cvičení
Algoritmus TDIDT/ID3
http://ksvi.mff.cuni.cz/~mraz/datamining/Cvicenie_DT.pdf
Zvol jeden atribut jako kořen podstromu
Kořen
Vitamín
B (2+, 3-)
C (4+, 0-)
(z "definície"...)
D (3+, 2-)
Entropia: (vážený priemer)
Velikost rodiny
veľká (2+, 2-)
stredná (4+, 2-)
malá (3+, 1-)
Entropia:
Cvičil
pravidelně (3+, 4-)
málo (6+, 1-)
Entropia:
Bypass
Entropia:
... budeme teda pokračovať podľa atribútu Vitamín (najmenšia entropia).
Množinu rozdelíme na 3 skupiny (B,C,D). C-čko všetci prežili, máme dve skupiny pre Bcomplex a D - spočítame znovu strednú entropiu (aby sme vedeli, podľa čoho ďalej štiepiť).
B
vyberieme riadky s Bcomplex a robíme to isté :)
Velikost rodiny
veľká (0, 2-)
(z "definice"...)
stredná (1+, 1-)
malá (1+, 0)
(z "definice"...)
Entropia:
Cvicil
Bypass
C
...je jasné, tam nik nezomrel... :)
D
...ďalej sa teda bude štiepiť v Bčku podľa "Cvicil" a v Dčku podľa "Bypass"
Vitamin / | \ B/ C| \D Cviceni + Bypassprav./ m.| a| n\ - + - +
Perceptron
uloha: naucit perceptron rozoznavat body v 2D na 2 skupiny...
popis perceptronu v matlabe:
ParseError: KaTeX parse error: Undefined control sequence: \[ at position 3: p=\̲[̲ \begin{matrix}…
vyhodnoti sa potom...
ParseError: KaTeX parse error: Undefined control sequence: \[ at position 3: x=\̲[̲\begin{matrix} …
=>...rozsireny vstupny vektor
ParseError: KaTeX parse error: Undefined control sequence: \[ at position 6: x_1'=\̲[̲\begin{matrix} …
(hardlim1(<=0)=0; hardlim1(>0)=1)
inicializacia :
ParseError: KaTeX parse error: Undefined control sequence: \[ at position 3: p=\̲[̲ \begin{matrix}…
vstup:
ParseError: KaTeX parse error: Undefined control sequence: \[ at position 8: A=\left\̲[̲ \begin{matrix}…
vystup (chceme):
ParseError: KaTeX parse error: Undefined control sequence: \[ at position 6: c = \̲[̲ \begin{matrix}…
uciaca konstanta
ucenie prebieha takto:
vezme sa vzor, ak sedi, nic nerobime
ak najdeme chybu - pricitame/odcitame (pozadovany-skutocny vystup - napr. v priklade ) dany vektor k vaham...
dostavam novy perceptron
ParseError: KaTeX parse error: Undefined control sequence: \[ at position 22: …dlim1(p1*AA) = \̲[̲ \begin{matrix}…
to je zla matica (ma byt samozrejme [1 1 0 0])- znovu zopakujeme postup...
****
ParseError: KaTeX parse error: Undefined control sequence: \[ at position 5: p1=\̲[̲ \begin{matrix}…
****ParseError: KaTeX parse error: Undefined control sequence: \[ at position 5: p2=\̲[̲ \begin{matrix}…
*****teraz budeme skusat prvy vektor (ktory je nespravny) ****
ParseError: KaTeX parse error: Undefined control sequence: \[ at position 5: p3=\̲[̲ \begin{matrix}…
... N iteracii (N=?)
Category:Informatika