Prediktívne dolovanie v dátach 1.
|
|
- Κῆρες Λύτρας
- 5 χρόνια πριν
- Προβολές:
Transcript
1 Prediktívne dolovanie v dátach 1. OBSAH PREDNÁŠKY Základné pojmy, dve fázy klasifikácie Výber príznakov pre klasifikáciu Vybrané základné typy klasifikačných modelov: 1. Rozhodovacie stromy 2. Pravidlové klasifikátory 3. Pravdepodobnostná klasifikácia Bayesovská klasifikácia a logistická regresia 4. Klasifikátory na princípe k-najbližších susedov 1
2 Základné pojmy Prediktívne dolovanie v dátach v sebe zahŕňa dve pravdepodobne najčastejšie sa objavujúce úlohy DM: Klasifikácia (modeluje a predpovedá nominálne atribúty, t.j. cieľové triedy) Predikcia (modeluje a predpovedá numerické hodnoty) Príklady aplikácií: cielený marketing, medicínska diagnostika, kategorizácia a filtrovanie dokumentov Klasifikácia a predikcia = kontrolované učenie Zhlukovanie = nekontrolované učenie Základný prístup je však u oboch typov DM rovnaký: V prvej fáze (trénovanie) snaží vybudovať (naučiť sa) model správania dát na základe trénovacej množiny. Zostavený (naučený) model správania sa dát je potom v druhej fáze (testovanie) používaný na predpovedanie (predikciu) hodnoty cieľového atribútu u nových objektov (záznamov). 2 2
3 Klasifikácia fáza trénovania 1. Konštrukcia modelu: popisujúceho množinu preddefinovaných tried. Predpokladá sa, že každý príklad patrí do jednej z preddefinovaných tried tak, ako to určuje hodnota klasifikačného atribútu. Množina príkladov použitá pre konštrukciu klasifikačného modelu: trénovacia množina Model môže byť reprezentovaný vo forme: Rozhodovacie stromy (ID3, C4.5, CART...) Rozhodovacie pravidlá (AQ, CN2, RISE, RIPPER...) Pravdepodobnostný popis (Naivný Bayes, Bayesovské siete...) SVM, neurónové siete, inštančné metódy (k-nn) Optimalizácia parametrov modelu s použitím validačnej množiny príkladov. 3 3
4 Klasifikácia fáza testovania 2. Použitie modelu: pre klasifikáciu budúcich (neznámych) prípadov => Odhad presnosti modelu (ešte pred jeho nasadením) 1. Holdout: rozdelenie na trénovaciu, validačnú a testovaciu, známe zatriedenie testovacích príkladov je porovnávané s klasifikáciou na základe vygenerovaného modelu 2. Krížová validácia: rozdelenie množiny na m podmnožín, v každej iterácii jedna z nich slúži na testovanie, ostatné na tvorbu modelu Leave-one-out: keď m = n (počtu príkladov) Rozvrstvená krížová validácia (proporcionálne zastúpenie tried) 3. Bootstrap: viackrát (b - krát) vytvorené vzorky s nahradením veľkosti datasetu, testované na celej pôvodnej množine Leave-one-out bootstrap: 1 príklad na testovanie, nie je vo vzorke 0,632 bootstrap: vážený priemer oboch Objavovanie znalostí (prediktívne dolovanie v dátach) Ján Paralič (people.tuke.sk/jan.paralic) 4
5 Výber príznakov pre klasifikáciu Nerelevantné atribúty spravidla poškodzujú výslednú presnosť modelu a okrem toho sú zdrojom výpočtovej neefektívnosti. Tri prístupy k výberu atribútov: 1. Filtračné modely (filter models): používajú presné matematické kritérium pre výber atribútu, alebo skupiny atribútov. 2. Obálkové modely (wrapper models): Algoritmus na výber atribútov tvorí obálku nejakého klasifikačného algoritmu. 3. Vložené modely (embedded models): využívajú informáciu o význame atribútov obsiahnutú priamo v klasifikačnom modeli. Objavovanie znalostí (prediktívne dolovanie v dátach) Ján Paralič (people.tuke.sk/jan.paralic) 5
6 1. Filtračné modely (1) 1. Gini index: pre kategorické atribúty (resp. numerické po ich diskretizácii) Nech v 1 až v r sú možné hodnoty atribútu a p j je percentuálna časť príkladov s hodnotou atribútu v i ktoré patria do triedy j (k je počet tried): Celkový Gini index G (ak n i je počet príkladov ktorých hodnota atribútu je v i a r je počet rôznych hodnôt atribútu): Nižšie hodnoty G implikujú lepšiu diskriminačnú schopnosť daného atribútu. Maximálna hodnota Gini indexu je 0,5. Objavovanie znalostí (prediktívne dolovanie v dátach) Ján Paralič (people.tuke.sk/jan.paralic) 6
7 1. Filtračné modely (2) 2. Entrópia: na triede založená entrópia Pre hodnotu v i daného atribútu je definovaná nasledovne: Analogicky celková entrópia atribútu: Vyššie hodnoty E indikujú miešanie rôznych tried. Hodnota 0 znamená perfektné rozdelenie do tried. 3. Fisherovo skóre: Pre numerické atribúty: pomer priemernej separácie medzi triedami a vnútri triedy μ a σ je priemer a št. odchýlka hodnôt určitého atribútu v celom datasete, μ j a σ j dtto, ale iba pre dáta z triedy j p j je podiel príkladov v datasete z triedy j Čím väčšia hodnota F, tým lepšia diskriminačná schopnosť Objavovanie znalostí (prediktívne dolovanie v dátach) Ján Paralič (people.tuke.sk/jan.paralic) 7
8 2. Obálkové modely Rôzne klasifikačné algoritmy sú presnejšie pre inú skupinu atribútov. Filtračné modely to ale neberú do úvahy. Obálkové metódy pracujú s klasifikačným algoritmom A, pričom iteratívne rozširujú množinu atribútov F. Na začiatku F = {}. Postup (Forward Stepwise Selection): 1. Rozšír množinu atribútov F pridaním 1 alebo viac atribútov (napr. s najväčším filtračným skóre) k aktuálnej množine. 2. Použi klasifikačný algoritmus A a vyhodnoť dosiahnutú presnosť modelu pre F. Použi túto presnosť na akceptovanie, alebo zamietnutie navrhovaného rozšírenia F. Výsledná množina atribútov F bude citlivá na voľbu použitého algoritmu A. Objavovanie znalostí (prediktívne dolovanie v dátach) Ján Paralič (people.tuke.sk/jan.paralic) 8
9 3. Vložené modely Základná myšlienka je, že samotné klasifikačné modely obsahujú veľmi užitočné informácie o relevancii jednotlivých atribútov, t.j. táto vedomosť je tam vložená. Napr. klasifikátor vo forme regresného modelu obsahuje koeficienty pri jednotlivých atribútoch -> čím väčšia hodnota koeficientu, tým významnejší atribút Regularizačné metódy Ridge a Lasso pri regresii Rekurzívna eliminácia atribútov: 1. Vytvorí sa model s aktuálnou množinou atribútov F (na začiatku F obsahuje všetky atribúty). 2. Malý počet atribútov sa odstráni a opätovne sa trénuje model, kým sa zlepšuje jeho presnosť. 9
10 Rozhodovacie stromy Rozhodovacie stromy sú najpopulárnejšou formou reprezentácie klasifikátorov najmä pre svoju ľahko pochopiteľnú reprezentáciu získaných znalostí. Rozhodovací strom je strom s nasledujúcimi vlastnosťami: Medziľahlý uzol reprezentuje vybraný atribút (popisný atribút, nie cieľový). Hrana reprezentuje test na atribút z nadradeného uzla (výstupné hrany daného uzla musia pokrývať všetky možné hodnoty atribútu a jednotlivé vetvy navzájom obsahujú disjunktné testovacie podmienky). Listový uzol reprezentuje niektorú z tried (hodnotu cieľového atribútu). Objavovanie znalostí (prediktívne dolovanie v dátach) Ján Paralič (people.tuke.sk/jan.paralic) 10
11 Spôsoby vetvenia podľa typu atribútu 1. Binárne atribúty 2 vetvy (pre každú hodnotu jedna). 2. Kategorické atribúty existujú 3 možnosti: a) každej z r možných hodnôt zodpovedá jedna vetva b) binárne rozdelenie (2 r -1 možností (zoskupení)) c) binarizácia atribútu na r binárnych atribútov. 3. Numerické atribúty a) každej z r možných hodnôt jedna vetva (pre malé r), alebo b) binárne rozdelenie podľa najlepšej možnej hranice vetvenia (preskúmať všetky možné hranice, alebo len niekoľko, napr. podľa rozdelenia na rovnanú hĺbku intervalu). Objavovanie znalostí (prediktívne dolovanie v dátach) Ján Paralič (people.tuke.sk/jan.paralic) 11
12 Vetvenie numerických atribútov Testovacia podmienka pre spojité atribúty pozostáva z prahovej hodnoty, ktorá rozdeľuje usporiadanú množinu čísel na dve podmnožiny. Algoritmus C4.5 vyberá prahovú hodnotu nasledovne: Trénovacie príklady sú najprv usporiadané vzostupne podľa daného spojitého atribútu {v 1, v 2,, v r }. Prahová hodnota ležiaca medzi dvoma hodnotami v i a v i+1, rozdelí množinu príkladov na množiny {v 1, v 2,, v i } a {v i+1, v i+2,, v r }. Takýchto možných rozdelení je r-1. Prahová hodnota medzi dvoma hodnotami spojitého atribútu v i a v i+1 sa určí ako ich priemerná hodnota, t.j. Pre všetky rozdelenia sa vypočíta hodnotiaca funkcia a vyberie sa rozdelenie s maximálnym ohodnotením. Hodnotiacou funkciou môže byť informačný zisk alebo pomerový informačný zisk. Objavovanie znalostí (prediktívne dolovanie v dátach) Ján Paralič (people.tuke.sk/jan.paralic) 12
13 Všeobecný algoritmus pre generovanie rozhodovacieho stromu KonštruujRozhodovacíStrom (TrénovaciaMnožina T, Float min_conf) if minimálne min_conf objektov z T patrí do triedy C then vytvor listový uzol zaradzujúci do C; return; else for each atribút A do for each možné rozdelenie hodnôt A do ohodnoť kvalitu rozdelenia, ktoré by takýmto spôsobom vzniklo; vykonaj najlepšie zo všetkých možných rozdelení; nech T 1, T 2,, T m sú množiny ktoré vzniknú týmto rozdelením; KonštruujRozhodovacíStrom(T 1, min_conf);... KonštruujRozhodovacíStrom(T m, min_conf); return; 13
14 Výber testovacieho atribútu Pre výber testovacieho atribútu potrebujeme vhodné kritérium pre porovnanie kvality alternatívnych vetvení. Môže to byť napr.: 1. Chybovosť (error rate): Vážený priemer chybovosti poduzlov ktoré vzniknú navrhovaným vetvením. Pričom chybovosť daného uzla sa určí takto: Nech p je pomer príkladov z majoritnej triedy v danej vetve. Potom chybovosť pre danú vetvu bude 1-p. Nech sa daným vetvením rozdelí množina T na podmnožiny (zodpovedajúce jednotlivým vetvám) T 1... T m. Potom váha chybovosti podmnožiny T i bude T i. Výsledná chybovosť T = vážený priemer chybovostí T i 2. Gini-index (algoritmus CART) 3. Entrópia a od nej odvodené mierky (ID3, C4.5) Objavovanie znalostí (prediktívne dolovanie v dátach) Ján Paralič (people.tuke.sk/jan.paralic) 14
15 Gini-index (algoritmus CART) Iným kritériom pre výber testovacej podmienky je tzv. Gini-index (používa ho algoritmus CART) Gini-index pre množinu trénovacích príkladov T označovaný G(T) možno vypočítať nasledovne: kde p i je relatívna početnosť triedy c i Gini-index pre rozdelenie množiny T na podmnožiny T 1, T 2,..., T m označovaný G(T 1, T 2,..., T m ) sa vypočíta nasledovne: m G(T 1, T 2,, T m ) = i=1 Ti T G(T i) Objavovanie znalostí (prediktívne dolovanie v dátach) Ján Paralič (people.tuke.sk/jan.paralic) 15
16 Na entrópii založené kritériá (ID3, C4.5) Ak klasifikačné triedy príkladov sú c 1, c 2,, c n, potom entrópia v uzle S je E(S): V rozhodovacom strome: v koreňovom uzle je entrópia maximálna v listových uzloch minimálna (ideálne nulová) Ak použitím atribútu A i sa uzol rozvetví na m vetiev s 1, s 2,, s m, tak celková entrópia v uzle S použitím atribútu A i na jeho rozdelenie bude: Algoritmus ID3 používa ako kritérium pre výber testovacieho atribútu tzv. informačný zisk I(S, A i ): 16
17 Na entrópii založené kritériá (ID3, C4.5) Kritérium informačný zisk má závažný nedostatok v uprednostňovaní výberu testovacích podmienok s mnohými výstupmi. Preto napr. algoritmus C4.5 používa normalizovaný informačný zisk, tzv. pomerový informačný zisk I p (S,A i ): kde E p (S,A i ) je tzv. pomerová entrópia: Objavovanie znalostí (prediktívne dolovanie v dátach) Ján Paralič (people.tuke.sk/jan.paralic) 17
18 Orezávanie rozhodovacích stromov Používa sa na predchádzanie preučeniu (overfitting). Vo všeobecnosti jednoduchšie modely (plytšie RS) sú lepšie ako zložitejšie (hlboké RS). Pre-prunning včasné zastavenie vetvenia, napr. ukončovacím kritériom (nepožadovať 100% z majoritnej triedy, ale menej). Post-prunning po vygenerovaní rozhodovacieho stromu. Toto orezávanie odstraňuje vetvy z už vygenerovaného stromu takým spôsobom, že nahrádza medziľahlé uzly listovými, napr. takto: Porovnáva veľkosť očakávanej chyby klasifikácie pre daný podstrom a jeho náhradu listovým uzlom. Ak sa chyba (na validačnej množine) po náhrade listovým uzlom zmenší, daný podstrom je možné odrezať. Minimálna popisná dĺžka (Minimum description length - MDL): kombinácia (vážený súčet) miery komplexnosti stromu (napr. počet uzlov) a presnosti klasifikácie na trénovacej množine. Objavovanie znalostí (prediktívne dolovanie v dátach) Ján Paralič (people.tuke.sk/jan.paralic) 18
19 Pravidlové klasifikátory (1) (rule-based classifiers) Jeden z hlavných problémov RS je počet trénovacích príkladov. Trénovacia množiny musí byť dostatočne veľká, aby bolo možné nájsť RS zodpovedajúci dobrej deliacej funkcii medzi príkladmi z rôznych tried. Preto sú RS náchylné na preučenie pri malých dátových množinách. Túto náchylnosť trocha zmierňujú pravidlové klasifikátory, ktoré sú podobné RS, ale na rozdiel od RS nie sú obmedzené hierarchickou štruktúrou. Objavovanie znalostí (prediktívne dolovanie v dátach) Ján Paralič (people.tuke.sk/jan.paralic) 19
20 Pravidlové klasifikátory (2) Pravidlové klasifikátory používajú množinu pravidiel R = {R 1 R m } typu ak potom, t.j.: IF Podmienka THEN Záver Pritom Podmienka môže obsahovať logické operátory ako,, =,, alebo, ktoré sú aplikované na popisné atribúty (feature attributes). Záver obsahuje priradenie do triedy (class attribute). Rozhodovací strom možno chápať ako špeciálny prípad pravidlového klasifikátora, pre ktorý každá cesta v RS zodpovedá jednému pravidlu. Trénovacia fáza pravidlového algoritmu vytvorí množinu klasifikačných pravidiel. Objavovanie znalostí (prediktívne dolovanie v dátach) Ján Paralič (people.tuke.sk/jan.paralic) 20
21 Pravidlové klasifikátory (3) Klasifikačná fáza nájde pravidlá, ktoré daný testovací príklad spustí (t.j. spĺňa podmienkovú časť pravidla). V tomto procese môžu byť spustené pravidlá s odporujúcimi si závermi (rôzne triedy). Tieto konflikty je potrebné riešiť. Množina pravidiel R môže spĺňať jednu alebo obe tieto vlastnosti: 1. Vzájomne sa vylučujúce pravidlá: pokrývajú navzájom disjunktné množiny príkladov. Pravidlá generované z RS spĺňajú túto vlastnosť, avšak nie v prípade, že RS bol spracovaný postprunningom (napr. C4.5rules). 2. Úplný súbor pravidiel: ak celý dátový priestor je pokrytý aspoň jedným pravidlom. To znamená že ľubovoľný testovací príklad spustí aspoň jedno pravidlo. Objavovanie znalostí (prediktívne dolovanie v dátach) Ján Paralič (people.tuke.sk/jan.paralic) 21
22 Pravidlové klasifikátory (4) Ak množina pravidiel R spĺňa obe vlastnosti, potom klasifikačná fáza je jednoduchá, testovací príklad totiž vždy spustí práve jedno pravidlo a nedochádza tak ku konfliktom. V prípadoch kedy klasifikačné pravidlá nie sú vzájomne sa vylučujúce, je potrebné riešiť konflikty medzi spustenými pravidlami: 1. Usporiadaním pravidiel: pravidlá sú usporiadané podľa priority. Populárne algoritmy ako C4.5rules a RIPPER používajú usporiadanie založené na triedach (pravidlá určitej triedy sú preferované voči inej triede). Ak nebolo spustené žiadne pravidlo, použije sa preddefinovaná (default) trieda. 2. Neusporiadané pravidlá: v tomto prípade sa vyberie trieda, ktorá dominuje medzi spustenými pravidlami. Objavovanie znalostí (prediktívne dolovanie v dátach) Ján Paralič (people.tuke.sk/jan.paralic) 22
23 Pravidlové klasifikátory (5) Algoritmus C4.5rules extrahuje klasifikačné pravidlá z rozhodovacieho stromu získaného algoritmom C4.5. Avšak po extrakcii pravidiel nasleduje fáza ich orezávania, v ktorej sa odstraňujú konjunktívne časti podmienok pravidiel podobným mechanizmom ako u RS, ale už tu nie je obmedzenie, že sa ide od najhlbších častí stromu. Sekvenčné algoritmy pokrytia (AQ, CN2, RIPPER) iteratívne aplikujú 2 kroky: 1. Naučenie jedného pravidla: pre vybranú triedu najlepšie pravidlo sa vloží na koniec aktuálneho (usporiadaného) zoznamu pravidiel. 2. Orezanie trénovacej množiny: odstránenie príkladov pokrytých nájdeným pravidlom. Objavovanie znalostí (prediktívne dolovanie v dátach) Ján Paralič (people.tuke.sk/jan.paralic) 23
24 Pravdepodobnostné klasifikátory Tieto typy klasifikátorov konštruujú model, ktorý kvantifikuje vzťah medzi popisnými premennými a cieľovou triedou ako pravdepodobnosť. Dva najpopulárnejšie modely tohto typu sú: 1. Bayesovská klasifikácia (generative classifier): Používa Bayesovskú teorému o podmienenej pravdepodobnosti na modelovanie každej hodnoty cieľovej premennej pre dané popisné atribúty (v prípade Naivného Bayesa sa predpokladá ich nezávislosť). 2. Logistická regresia (discriminative classifier): predpokladá sa binomické (Bernoulliho) rozdelenie pravdepodobností cieľovej premennej, ktorej stred je definovaný logit funkciou popisných premenných. Výsledkom toho je popis distribúcie pravdepodobnosti cieľovej premennej ako parametrickej funkcie popisných premenných. Objavovanie znalostí (prediktívne dolovanie v dátach) Ján Paralič (people.tuke.sk/jan.paralic) 24
25 Bayesovská klasifikácia Bayesovské klasifikátory predikujú pravdepodobnosti, s ktorými daný príklad patrí do tej - ktorej triedy. Vychádzajú pritom z určenia podmienených pravdepodobností jednotlivých hodnôt atribútov pre rôzne triedy. Bayesovská teoréma hovorí ako možno vypočítať podmienenú pravdepodobnosť P(H X): X je objekt (napr. ovocie, ktoré je červené a guľaté) C je trieda (napr. typ ovocia, c 1 - jablká, c 2 - hrušky...) H je hypotéza (napr. že X patrí do triedy c 1, t.j. jablká) P(H) je pravdepodobnosť že ide o jablko P(X) je pravdepodobnosť že ovocie je červené a guľaté P(H X) je pravdepodobnosť toho, že ak je ovocie červené guľaté, potom je to jablko (nevieme ju priamo vypočítať z dát) P(X H) je pravdepodobnosť, že jablko je červené a guľaté 25
26 Naivný Bayesovský klasifikátor (1) Vychádza z predpokladu, že efekt, ktorý má hodnota (každého) atribútu na danú triedu, nie je ovplyvnený hodnotami ostatných atribútov O je množina objektov o = (o 1,..., o m ) Pre každý objekt o sú známe jeho hodnoty atribútov A i, 1 i d, ako aj trieda c j, c j C = {c 1,..., c n } Neznámy príklad X = (x 1,..., x d ) bude klasifikovaný do triedy c i s najväčšou posteriórnou pravdepodobnosťou P(c i X)>P(c k X), i k. Keďže P(X) je konštantná pre všetky triedy c i, teda stačí nájsť také c i, kedy hodnota výrazu P(X c i ). P(c i ) je maximálna Pravdepodobnosť zaradenia ľubovoľného objektu do triedy c i je N o i je počet tých príkladov z O, ktoré patria do triedy c i N o je počet všetkých príkladov z trénovacej množiny O 26
27 Naivný Bayesovský klasifikátor (2) Pravdepodobnosti P(X c i ) možno pri predpoklade nezávislosti jednotlivých atribútov A i vypočítať nasledovne: Pre kategorické atribúty A k : N o i,k je počet tých príkladov z O, ktoré patria do triedy c i a u ktorých hodnota atribútu A k = x k Pre spojité atribúty A k sa obvykle predpokladá Gaussovo normálne rozdelenie hodnôt, a potom: je stredná hodnota je rozptyl hodnôt atribútu A k z tých príkladov trénovacej množiny, ktoré Objavovanie znalostí (prediktívne dolovanie v dátach) patria do triedy c i Ján Paralič (people.tuke.sk/jan.paralic) 27
28 Príklad Je potrebné navrhnúť naivný Bayesovský klasifikátor a klasifikovať ním nového zákazníka Nový zákazník X má tieto hodnoty atribútov: vek = 30 príjem = stredný študent = áno kreditné ohodnotenie = priemerné Takže potrebuje vypočítať a následne porovnať dve podmienené pravdepodobnosti: P(X si kúpi počítač vek X = 30 príjem X = stredný X je študent kreditné ohodnotenie X = priemerné ) =? P(X si nekúpi počítač vek X = 30 príjem X = stredný X je študent kreditné ohodnotenie X = priemerné ) =? Objavovanie znalostí (prediktívne dolovanie v dátach) Ján Paralič (people.tuke.sk/jan.paralic) 28
29 ID vek príjem študent kreditné hodnotenie 1 30 vysoký nie priemerné nie 2 30 vysoký nie výborné nie vysoký nie priemerné áno 4 > 40 stredný nie priemerné áno 5 > 40 nízky áno priemerné áno 6 > 40 nízky áno výborné nie nízky áno výborné áno 8 30 stredný nie priemerné nie 9 30 nízky áno priemerné áno 10 > 40 stredný áno priemerné áno stredný áno výborné áno stredný nie výborné áno vysoký áno priemerné áno 14 > 40 stredný nie výborné nie trieda (kúpi si počítač) 29
30 Postup výpočtu (1) Apriórne pravdepodobnosti jednotlivých tried P(c i ) možno jednoducho určiť z trénovacej množiny: P(kúpi si počítač) = 9/14 = P(nekúpi si počítač) = 5/14 = Pre výpočet posteriórnych pravdepodobností P(X c i ) je potrebné najskôr vypočítať nasledovné podmienené pravdepodobnosti P(x k c i ) pre jednotlivé hodnoty atribútov A k zadaného nového zákazníka X: P(vek = 30 kúpi si počítač) = 2/9 = P(vek = 30 nekúpi si počítač) = 3/5 = P(príjem = stredný kúpi si počítač) = 4/9 = P(príjem = stredný nekúpi si počítač) = 2/5 = P(študent = áno kúpi si počítač) = 6/9 = P(študent = áno nekúpi si počítač) = 1/5 = Objavovanie znalostí (prediktívne dolovanie v dátach) Ján Paralič (people.tuke.sk/jan.paralic) 30
31 Postup výpočtu (2) P(kreditné ohodnotenie = priemerné kúpi si počítač) = 6/9 = P(kreditné ohodnotenie = priemerné nekúpi si počítač) = 2/5 = Použitím týchto pravdepodobností možno vypočítať hodnoty P(X c i ) pre jednotlivé triedy: P(X kúpi si počítač) = x x x = P(X nekúpi si počítač) = x x x = A následne aj hodnoty súčinov P(X c i ). P(c i ): pre jednotlivé triedy: P(X kúpi si počítač) x P(kúpi si počítač) = x = P(X nekúpi si počítač) x P(nekúpi si počítač) = x = To znamená, že naivný Bayesovský klasifikátor bude klasifikovať daný objekt do triedy c 1 = kúpi si počítač Objavovanie znalostí (prediktívne dolovanie v dátach) Ján Paralič (people.tuke.sk/jan.paralic) 31
32 Bayesovské siete Family History Smoker (FH, S) (FH, ~S) (~FH, S) (~FH, ~S) LC LungCancer Emphysema ~LC PositiveXRay Dyspnea Tabuľka podmienených pravdepodobností pre premennú LC (LungCancer) Objavovanie znalostí (prediktívne dolovanie v dátach) Ján Paralič (people.tuke.sk/jan.paralic) 32
33 Logistická regresia (1) Ak je cieľová premenná binárna, používa sa na jej predikciu v praxi najčastejšie logistická regresia Logistická regresia sa líši od lineárnej regresie v tom, že predikuje pravdepodobnosť, či daná udalosť (y) nastane alebo nenastane Vypočítaná pravdepodobnosť p(y) je teda rovná 0, ak udalosť určite nenastala a 1 ak určite nastala Logistická regresia využíva nasledovnú transformáciu: p logit( p) ln( ) p x x Výraz v zátvorke (pomer pravdepodobností) sa nazýva šanca (anglicky odds ) Táto transformácia vedie na sigmoidálny vzťah medzi závisle premennou y a vektorom nezávislých premenných x i (i=1..n) viď. nasledujúci slide. n x n Objavovanie znalostí (prediktívne dolovanie v dátach) Ján Paralič (people.tuke.sk/jan.paralic) 33
34 Logistická regresia (2) )... ( n n x x x p e p n x n x x e p p )... ( n x n x x e p n x n x x p p... ) 1 ln( Objavovanie znalostí (prediktívne dolovanie v dátach) Ján Paralič (people.tuke.sk/jan.paralic) 34
35 Logistická regresia (3) Priebeh funkcie p( Z) 1 1 e Objavovanie znalostí (prediktívne dolovanie v dátach) Ján Paralič (people.tuke.sk/jan.paralic) 35 Z
36 Klasifikátory na princípe k-nn (1) Založené na princípe učenia sa na základe analógie. Spravidla sa predpokladá, že trénovacie príklady sú popísané n numerickými atribútmi, a teda predstavujú vlastne body v n-dimenzionálnom priestore príkladov. Ak príde nový príklad q s ešte neznámou hodnotou cieľového atribútu (triedy), klasifikátor na princípe k-najbližších susedov hľadá v priestore príkladov takých k trénovacích príkladov, ktoré sú k novému príkladu najbližšie (napr. v zmysle euklidovskej vzdialenosti). Neznámy príklad je potom klasifikovaný do tej triedy, ktorá sa najčastejšie vyskytuje medzi k jemu najbližšími trénovacími príkladmi. Objavovanie znalostí (prediktívne dolovanie v dátach) Ján Paralič (people.tuke.sk/jan.paralic) 36
37 Klasifikátory na princípe k-nn (2) Doteraz diskutované algoritmy sa nazývajú aj eager learners (horlivé, dychtivé), nakoľko konštruujú klasifikačný model. k-nn však nekonštruuje žiaden klasifikačný model, t.j. odpadá vlastne prvá fáza klasifikácie, konštrukcia modelu. Ku klasifikácii tu dochádza až v momente, keď je potrebné klasifikovať nejaký nový, dovtedy neznámy príklad. Takéto klasifikátory sa zvyknú v literatúre nazývať aj klasifikátory založené na inštanciách (instance-based), resp. hovorí sa o lenivom učení (lazy learners) Nevýhodou takýchto prístupov je skutočnosť, že potrebujú dlhší čas na klasifikáciu. Tu sa zvyknú používať rôzne efektívne indexovacie techniky. Objavovanie znalostí (prediktívne dolovanie v dátach) Ján Paralič (people.tuke.sk/jan.paralic) 37
38 Klasifikátory na princípe k-nn (3) Jednotlivé varianty klasifikátorov na princípe k-najbližších susedov sa môžu líšiť: a) Akým spôsobom vyberajú najbližších susedov (t.j. meranie vzdialenosti, napr. Euclidovská alebo Mahalanobisova vzdialenosť). b) Koľko susedov vyberú do úvahy pre klasifikáciu nového príkladu (k). c) Ako vplývajú jednotliví susedia na rozhodnutie o výslednej triede nového príkladu (váhy jednotlivých susedov). Niektoré z používaných klasifikátorov na princípe k-najbližších susedov pracujú nasledovne: a) Ako trénovacie príklady sa používajú len vektory stredných hodnôt pre jednotlivé triedy (príklad priradí najbližšej triede). b) Pre rozhodnutie o zaradení nového príkladu do triedy sa berie do úvahy len jeho najbližší sused (t.j. k = 1). c) Vplyv jednotlivých susedov na rozhodnutie o klasifikačnej triede závisí od ich vzdialenosti (nepriamo úmerne). 38
39 Príklad algoritmu k-nn Klasifikátor_k-NajbližšíchSusedov (TrénovaciePríklady O, Objekt q, Integer k) Vyber ako rozhodovaciu množinu E k-najbližších susedov objektu q z množiny O; return Trieda; Trieda(o) označuje triedu trénovacieho príkladu o C je klasifikačný (cieľový) atribút c j sú jednotlivé klasifikačné triedy (hodnoty cieľového atribútu) d(x,y) je funkcia vzdialenosti, napr. euklidovská w(x) je váhová funkcia, napr.: 39
40 Vplyv hodnoty k na výsledok E pre k = 1 E pre k = 7 E pre k = 17 Príliš malé k vedie k prílišnej citlivosti na príklady, ktoré predstavujú šumy. Príliš veľké k zase zvyšuje riziko prekročenia hraníc zhluku príkladov reprezentujúcich určitú triedu a zahrnutie mnohých príkladov z inej triedy. Stredná hodnota k preto vo všeobecnosti poskytuje najlepšie výsledky klasifikácie. Často platí pre hodnotu najlepšieho k : 1 << k < 10. Objavovanie znalostí (prediktívne dolovanie v dátach) Ján Paralič (people.tuke.sk/jan.paralic) 40
Matematika Funkcia viac premenných, Parciálne derivácie
Matematika 2-01 Funkcia viac premenných, Parciálne derivácie Euklidovská metrika na množine R n všetkých usporiadaných n-íc reálnych čísel je reálna funkcia ρ: R n R n R definovaná nasledovne: Ak X = x
Διαβάστε περισσότεραEkvačná a kvantifikačná logika
a kvantifikačná 3. prednáška (6. 10. 004) Prehľad 1 1 (dokončenie) ekvačných tabliel Formula A je ekvačne dokázateľná z množiny axióm T (T i A) práve vtedy, keď existuje uzavreté tablo pre cieľ A ekvačných
Διαβάστε περισσότερα7. FUNKCIE POJEM FUNKCIE
7. FUNKCIE POJEM FUNKCIE Funkcia f reálnej premennej je : - každé zobrazenie f v množine všetkých reálnych čísel; - množina f všetkých usporiadaných dvojíc[,y] R R pre ktorú platí: ku každému R eistuje
Διαβάστε περισσότεραMetódy vol nej optimalizácie
Metódy vol nej optimalizácie Metódy vol nej optimalizácie p. 1/28 Motivácia k metódam vol nej optimalizácie APLIKÁCIE p. 2/28 II 1. PRÍKLAD: Lineárna regresia - metóda najmenších štvorcov Na základe dostupných
Διαβάστε περισσότεραObvod a obsah štvoruholníka
Obvod a štvoruholníka D. Štyri body roviny z ktorých žiadne tri nie sú kolineárne (neležia na jednej priamke) tvoria jeden štvoruholník. Tie body (A, B, C, D) sú vrcholy štvoruholníka. strany štvoruholníka
Διαβάστε περισσότεραMatematika prednáška 4 Postupnosti a rady 4.5 Funkcionálne rady - mocninové rady - Taylorov rad, MacLaurinov rad
Matematika 3-13. prednáška 4 Postupnosti a rady 4.5 Funkcionálne rady - mocninové rady - Taylorov rad, MacLaurinov rad Erika Škrabul áková F BERG, TU Košice 15. 12. 2015 Erika Škrabul áková (TUKE) Taylorov
Διαβάστε περισσότεραGoniometrické rovnice a nerovnice. Základné goniometrické rovnice
Goniometrické rovnice a nerovnice Definícia: Rovnice (nerovnice) obsahujúce neznámu x alebo výrazy s neznámou x ako argumenty jednej alebo niekoľkých goniometrických funkcií nazývame goniometrickými rovnicami
Διαβάστε περισσότεραCvičenie č. 4,5 Limita funkcie
Cvičenie č. 4,5 Limita funkcie Definícia ity Limita funkcie (vlastná vo vlastnom bode) Nech funkcia f je definovaná na nejakom okolí U( ) bodu. Hovoríme, že funkcia f má v bode itu rovnú A, ak ( ε > )(
Διαβάστε περισσότεραJednotkový koreň (unit root), diferencovanie časového radu, unit root testy
Jednotkový koreň (unit root), diferencovanie časového radu, unit root testy Beáta Stehlíková Časové rady, FMFI UK, 2012/2013 Jednotkový koreň(unit root),diferencovanie časového radu, unit root testy p.1/18
Διαβάστε περισσότερα1. Limita, spojitost a diferenciálny počet funkcie jednej premennej
. Limita, spojitost a diferenciálny počet funkcie jednej premennej Definícia.: Hromadný bod a R množiny A R: v každom jeho okolí leží aspoň jeden bod z množiny A, ktorý je rôzny od bodu a Zadanie množiny
Διαβάστε περισσότεραDatamining, princípy a metódy (Bakalárska práca)
Katedra Informatiky Fakulta Matematiky, Fyziky a Informatiky Univerzita Komenského, Bratislava Datamining, princípy a metódy (Bakalárska práca) Marek Mardiak 9.2.1 Informatika Vedúci: Mgr. Tibor Hegedüs
Διαβάστε περισσότεραStart. Vstup r. O = 2*π*r S = π*r*r. Vystup O, S. Stop. Start. Vstup P, C V = P*C*1,19. Vystup V. Stop
1) Vytvorte algoritmus (vývojový diagram) na výpočet obvodu kruhu. O=2xπxr ; S=πxrxr Vstup r O = 2*π*r S = π*r*r Vystup O, S 2) Vytvorte algoritmus (vývojový diagram) na výpočet celkovej ceny výrobku s
Διαβάστε περισσότεραARMA modely čast 2: moving average modely (MA)
ARMA modely čast 2: moving average modely (MA) Beáta Stehlíková Časové rady, FMFI UK, 2014/2015 ARMA modely časť 2: moving average modely(ma) p.1/24 V. Moving average proces prvého rádu - MA(1) ARMA modely
Διαβάστε περισσότεραKATEDRA DOPRAVNEJ A MANIPULAČNEJ TECHNIKY Strojnícka fakulta, Žilinská Univerzita
132 1 Absolútna chyba: ) = - skut absolútna ochýlka: ) ' = - spr. relatívna chyba: alebo Chyby (ochýlky): M systematické, M náhoné, M hrubé. Korekcia: k = spr - = - Î' pomerná korekcia: Správna honota:
Διαβάστε περισσότερα1. písomná práca z matematiky Skupina A
1. písomná práca z matematiky Skupina A 1. Vypočítajte : a) 84º 56 + 32º 38 = b) 140º 53º 24 = c) 55º 12 : 2 = 2. Vypočítajte zvyšné uhly na obrázku : β γ α = 35 12 δ a b 3. Znázornite na číselnej osi
Διαβάστε περισσότεραKompilátory. Cvičenie 6: LLVM. Peter Kostolányi. 21. novembra 2017
Kompilátory Cvičenie 6: LLVM Peter Kostolányi 21. novembra 2017 LLVM V podstate sada nástrojov pre tvorbu kompilátorov LLVM V podstate sada nástrojov pre tvorbu kompilátorov Pôvodne Low Level Virtual Machine
Διαβάστε περισσότεραARMA modely čast 2: moving average modely (MA)
ARMA modely čast 2: moving average modely (MA) Beáta Stehlíková Časové rady, FMFI UK, 2011/2012 ARMA modely časť 2: moving average modely(ma) p.1/25 V. Moving average proces prvého rádu - MA(1) ARMA modely
Διαβάστε περισσότερα3. Striedavé prúdy. Sínusoida
. Striedavé prúdy VZNIK: Striedavý elektrický prúd prechádza obvodom, ktorý je pripojený na zdroj striedavého napätia. Striedavé napätie vyrába synchrónny generátor, kde na koncoch rotorového vinutia sa
Διαβάστε περισσότεραJednotkový koreň (unit root), diferencovanie časového radu, unit root testy
Jednotkový koreň (unit root), diferencovanie časového radu, unit root testy Beáta Stehlíková Časové rady, FMFI UK, 2013/2014 Jednotkový koreň(unit root),diferencovanie časového radu, unit root testy p.1/27
Διαβάστε περισσότεραKomplexné čísla, Diskrétna Fourierova transformácia 1
Komplexné čísla, Diskrétna Fourierova transformácia Komplexné čísla C - množina všetkých komplexných čísel komplexné číslo: z = a + bi, kde a, b R, i - imaginárna jednotka i =, t.j. i =. komplexne združené
Διαβάστε περισσότεραMotivácia Denícia determinantu Výpo et determinantov Determinant sú inu matíc Vyuºitie determinantov. Determinanty. 14. decembra 2010.
14. decembra 2010 Rie²enie sústav Plocha rovnobeºníka Objem rovnobeºnostena Rie²enie sústav Príklad a 11 x 1 + a 12 x 2 = c 1 a 21 x 1 + a 22 x 2 = c 2 Dostaneme: x 1 = c 1a 22 c 2 a 12 a 11 a 22 a 12
Διαβάστε περισσότεραGramatická indukcia a jej využitie
a jej využitie KAI FMFI UK 29. Marec 2010 a jej využitie Prehľad Teória formálnych jazykov 1 Teória formálnych jazykov 2 3 a jej využitie Na počiatku bolo slovo. A slovo... a jej využitie Definícia (Slovo)
Διαβάστε περισσότεραTomáš Madaras Prvočísla
Prvočísla Tomáš Madaras 2011 Definícia Nech a Z. Čísla 1, 1, a, a sa nazývajú triviálne delitele čísla a. Cele číslo a / {0, 1, 1} sa nazýva prvočíslo, ak má iba triviálne delitele; ak má aj iné delitele,
Διαβάστε περισσότερα,Zohrievanie vody indukčným varičom bez pokrievky,
Farba skupiny: zelená Označenie úlohy:,zohrievanie vody indukčným varičom bez pokrievky, Úloha: Zistiť, ako závisí účinnosť zohrievania vody na indukčnom variči od priemeru použitého hrnca. Hypotéza: Účinnosť
Διαβάστε περισσότερα6 Limita funkcie. 6.1 Myšlienka limity, interval bez bodu
6 Limita funkcie 6 Myšlienka ity, interval bez bodu Intuitívna myšlienka ity je prirodzená, ale definovať presne pojem ity je značne obtiažne Nech f je funkcia a nech a je reálne číslo Čo znamená zápis
Διαβάστε περισσότεραMatematika 2. časť: Analytická geometria
Matematika 2 časť: Analytická geometria RNDr. Jana Pócsová, PhD. Ústav riadenia a informatizácie výrobných procesov Fakulta BERG Technická univerzita v Košiciach e-mail: jana.pocsova@tuke.sk Súradnicové
Διαβάστε περισσότεραPrechod z 2D do 3D. Martin Florek 3. marca 2009
Počítačová grafika 2 Prechod z 2D do 3D Martin Florek florek@sccg.sk FMFI UK 3. marca 2009 Prechod z 2D do 3D Čo to znamená? Ako zobraziť? Súradnicové systémy Čo to znamená? Ako zobraziť? tretia súradnica
Διαβάστε περισσότερα4. Výrokové funkcie (formy), ich definičný obor a obor pravdivosti
4. Výrokové funkcie (formy), ich definičný obor a obor pravdivosti Výroková funkcia (forma) ϕ ( x) je formálny výraz (formula), ktorý obsahuje znak x, pričom x berieme z nejakej množiny M. Ak za x zvolíme
Διαβάστε περισσότεραDefinícia parciálna derivácia funkcie podľa premennej x. Definícia parciálna derivácia funkcie podľa premennej y. Ak existuje limita.
Teória prednáška č. 9 Deinícia parciálna deriácia nkcie podľa premennej Nech nkcia Ak eistje limita je deinoaná okolí bod [ ] lim. tak túto limit nazýame parciálno deriácio nkcie podľa premennej bode [
Διαβάστε περισσότεραUČEBNÉ TEXTY. Pracovný zošit č.2. Moderné vzdelávanie pre vedomostnú spoločnosť Elektrotechnické merania. Ing. Alžbeta Kršňáková
Stredná priemyselná škola dopravná, Sokolská 911/94, 960 01 Zvolen Kód ITMS projektu: 26110130667 Názov projektu: Zvyšovanie flexibility absolventov v oblasti dopravy UČEBNÉ TEXTY Pracovný zošit č.2 Vzdelávacia
Διαβάστε περισσότεραNávrh vzduchotesnosti pre detaily napojení
Výpočet lineárneho stratového súčiniteľa tepelného mosta vzťahujúceho sa k vonkajším rozmerom: Ψ e podľa STN EN ISO 10211 Návrh vzduchotesnosti pre detaily napojení Objednávateľ: Ing. Natália Voltmannová
Διαβάστε περισσότεραNumerické metódy matematiky I
Prednáška č. 7 Numerické metódy matematiky I Riešenie sústav lineárnych rovníc ( pokračovanie ) Prednáška č. 7 OBSAH 1. Metóda singulárneho rozkladu (SVD) Úvod SVD štvorcovej matice SVD pre menej rovníc
Διαβάστε περισσότεραHľadanie, skúmanie a hodnotenie súvislosti medzi znakmi
Hľadanie, skúmanie a hodnotenie súvislosti medzi znakmi Typy súvislostí javov a vecí: nepodstatné - vonkajšia súvislosť nevyplýva z vnútornej potreby (javy spoločne vznikajú, majú zhodný priebeh, alebo
Διαβάστε περισσότεραZáklady metodológie vedy I. 9. prednáška
Základy metodológie vedy I. 9. prednáška Triedenie dát: Triedny znak - x i Absolútna početnosť n i (súčet všetkých absolútnych početností sa rovná rozsahu súboru n) ni fi = Relatívna početnosť fi n (relatívna
Διαβάστε περισσότεραSpojité rozdelenia pravdepodobnosti. Pomôcka k predmetu PaŠ. RNDr. Aleš Kozubík, PhD. 26. marca Domovská stránka. Titulná strana.
Spojité rozdelenia pravdepodobnosti Pomôcka k predmetu PaŠ Strana z 7 RNDr. Aleš Kozubík, PhD. 6. marca 3 Zoznam obrázkov Rovnomerné rozdelenie Ro (a, b). Definícia.........................................
Διαβάστε περισσότεραMotivácia pojmu derivácia
Derivácia funkcie Motivácia pojmu derivácia Zaujíma nás priemerná intenzita zmeny nejakej veličiny (dráhy, rastu populácie, veľkosti elektrického náboja, hmotnosti), vzhľadom na inú veličinu (čas, dĺžka)
Διαβάστε περισσότεραM6: Model Hydraulický systém dvoch zásobníkov kvapaliny s interakciou
M6: Model Hydraulický ytém dvoch záobníkov kvapaliny interakciou Úlohy:. Zotavte matematický popi modelu Hydraulický ytém. Vytvorte imulačný model v jazyku: a. Matlab b. imulink 3. Linearizujte nelineárny
Διαβάστε περισσότεραPlanárne a rovinné grafy
Planárne a rovinné grafy Definícia Graf G sa nazýva planárny, ak existuje jeho nakreslenie D, v ktorom sa žiadne dve hrany nepretínajú. D sa potom nazýva rovinný graf. Planárne a rovinné grafy Definícia
Διαβάστε περισσότεραMIDTERM (A) riešenia a bodovanie
MIDTERM (A) riešenia a bodovanie 1. (7b) Nech vzhl adom na štandardnú karteziánsku sústavu súradníc S 1 := O, e 1, e 2 majú bod P a vektory u, v súradnice P = [0, 1], u = e 1, v = 2 e 2. Aký predpis bude
Διαβάστε περισσότερα1 Prevod miestneho stredného slnečného času LMT 1 na iný miestny stredný slnečný čas LMT 2
1 Prevod miestneho stredného slnečného času LMT 1 na iný miestny stredný slnečný čas LMT 2 Rozdiel LMT medzi dvoma miestami sa rovná rozdielu ich zemepisných dĺžok. Pre prevod miestnych časov platí, že
Διαβάστε περισσότεραVektorový priestor V : Množina prvkov (vektory), na ktorej je definované ich sčítanie a ich
Tuesday 15 th January, 2013, 19:53 Základy tenzorového počtu M.Gintner Vektorový priestor V : Množina prvkov (vektory), na ktorej je definované ich sčítanie a ich násobenie reálnym číslom tak, že platí:
Διαβάστε περισσότεραModelovanie dynamickej podmienenej korelácie kurzov V4
Modelovanie dynamickej podmienenej korelácie menových kurzov V4 Podnikovohospodárska fakulta so sídlom v Košiciach Ekonomická univerzita v Bratislave Cieľ a motivácia Východiská Cieľ a motivácia Cieľ Kvantifikovať
Διαβάστε περισσότεραZáklady matematickej štatistiky
1. Náhodný výber, výberové momenty a odhad parametrov Katedra Matematických metód Fakulta Riadenia a Informatiky Žilinská Univerzita v Žiline 6. mája 2015 1 Náhodný výber 2 Výberové momenty 3 Odhady parametrov
Διαβάστε περισσότεραPriamkové plochy. Ak každým bodom plochy Φ prechádza aspoň jedna priamka, ktorá (celá) na nej leží potom plocha Φ je priamková. Santiago Calatrava
Priamkové plochy Priamkové plochy Ak každým bodom plochy Φ prechádza aspoň jedna priamka, ktorá (celá) na nej leží potom plocha Φ je priamková. Santiago Calatrava Priamkové plochy rozdeľujeme na: Rozvinuteľné
Διαβάστε περισσότεραChí kvadrát test dobrej zhody. Metódy riešenia úloh z pravdepodobnosti a štatistiky
Chí kvadrát test dobrej zhody Metódy riešenia úloh z pravdepodobnosti a štatistiky www.iam.fmph.uniba.sk/institute/stehlikova Test dobrej zhody I. Chceme overiť, či naše dáta pochádzajú z konkrétneho pravdep.
Διαβάστε περισσότεραFunkcie - základné pojmy
Funkcie - základné pojmy DEFINÍCIA FUNKCIE Nech A, B sú dve neprázdne číselné množiny. Ak každému prvku x A je priradený najviac jeden prvok y B, tak hovoríme, že je daná funkcia z množiny A do množiny
Διαβάστε περισσότεραRIEŠENIE WHEATSONOVHO MOSTÍKA
SNÁ PMYSLNÁ ŠKOL LKONKÁ V PŠŤNO KOMPLXNÁ PÁ Č. / ŠN WSONOVO MOSÍK Piešťany, október 00 utor : Marek eteš. Komplexná práca č. / Strana č. / Obsah:. eoretický rozbor Wheatsonovho mostíka. eoretický rozbor
Διαβάστε περισσότεραPRIEMER DROTU d = 0,4-6,3 mm
PRUŽINY PRUŽINY SKRUTNÉ PRUŽINY VIAC AKO 200 RUHOV SKRUTNÝCH PRUŽÍN PRIEMER ROTU d = 0,4-6,3 mm èíslo 3.0 22.8.2008 8:28:57 22.8.2008 8:28:58 PRUŽINY SKRUTNÉ PRUŽINY TECHNICKÉ PARAMETRE h d L S Legenda
Διαβάστε περισσότεραModerné vzdelávanie pre vedomostnú spoločnosť Projekt je spolufinancovaný zo zdrojov EÚ M A T E M A T I K A
M A T E M A T I K A PRACOVNÝ ZOŠIT II. ROČNÍK Mgr. Agnesa Balážová Obchodná akadémia, Akademika Hronca 8, Rožňava PRACOVNÝ LIST 1 Urč typ kvadratickej rovnice : 1. x 2 3x = 0... 2. 3x 2 = - 2... 3. -4x
Διαβάστε περισσότερα1.1 Min-max normalizácia na interval < A, B >
1 Normalizácia dát Máme vstupné dáta X = {x 1, x 2,..., x N }. 1.1 Min-max normalizácia na interval < A, B > Napíšte funkciu mmscale(x), ktorá transformuje vektor x tak, že jeho zložky lineárne namapuje
Διαβάστε περισσότερα24. Základné spôsoby zobrazovania priestoru do roviny
24. Základné spôsoby zobrazovania priestoru do roviny Voľné rovnobežné premietanie Presné metódy zobrazenia trojrozmerného priestoru do dvojrozmernej roviny skúma samostatná matematická disciplína, ktorá
Διαβάστε περισσότεραLineárna algebra I - pole skalárov, lineárny priestor, lineárna závislosť, dimenzia, podpriestor, suma podpriestorov, izomorfizmus
1. prednáška Lineárna algebra I - pole skalárov, lineárny priestor, lineárna závislosť, dimenzia, podpriestor, suma podpriestorov, izomorfizmus Matematickým základom kvantovej mechaniky je teória Hilbertových
Διαβάστε περισσότερα3. kapitola. Axiomatická formulácia modálnej logiky Vzťah medzi syntaxou a sémantikou. priesvitka 1
3. kapitola Axiomatická formulácia modálnej logiky Vzťah medzi syntaxou a sémantikou priesvitka 1 Axiomatická výstavba modálnej logiky Cieľom tejto prednášky je ukázať axiomatickú výstavbu rôznych verzií
Διαβάστε περισσότερα6 APLIKÁCIE FUNKCIE DVOCH PREMENNÝCH
6 APLIKÁCIE FUNKCIE DVOCH PREMENNÝCH 6. Otázky Definujte pojem produkčná funkcia. Definujte pojem marginálny produkt. 6. Produkčná funkcia a marginálny produkt Definícia 6. Ak v ekonomickom procese počet
Διαβάστε περισσότεραRiešenie rovníc s aplikáciou na elektrické obvody
Zadanie č.1 Riešenie rovníc s aplikáciou na elektrické obvody Nasledujúce uvedené poznatky z oblasti riešenia elektrických obvodov pomocou metódy slučkových prúdov a uzlových napätí je potrebné využiť
Διαβάστε περισσότεραÚvod do lineárnej algebry. Monika Molnárová Prednášky
Úvod do lineárnej algebry Monika Molnárová Prednášky 2006 Prednášky: 3 17 marca 2006 4 24 marca 2006 c RNDr Monika Molnárová, PhD Obsah 2 Sústavy lineárnych rovníc 25 21 Riešenie sústavy lineárnych rovníc
Διαβάστε περισσότεραMetódy numerickej matematiky I
Úvodná prednáška Metódy numerickej matematiky I Prednášky: Doc. Mgr. Jozef Kristek, PhD. F1-207 Úvodná prednáška OBSAH 1. Úvod, sylabus, priebeh, hodnotenie 2. Zdroje a typy chýb 3. Definície chýb 4. Zaokrúhľovanie,
Διαβάστε περισσότεραAerobTec Altis Micro
AerobTec Altis Micro Záznamový / súťažný výškomer s telemetriou Výrobca: AerobTec, s.r.o. Pionierska 15 831 02 Bratislava www.aerobtec.com info@aerobtec.com Obsah 1.Vlastnosti... 3 2.Úvod... 3 3.Princíp
Διαβάστε περισσότεραAsociačné pravidlá. Úvod. Aplikácie. Základné pojmy (1) Príklad transakčnej databázy D. Základné pojmy (2)
1 Asociačné pravidlá OBSAH PREDNÁŠKY Základné pojmy Asociačné pravidlá a ich zaujímavosť Princíp dolovania asociačných pravidiel Algoritmy používané na hľadanie frekventovaných vzorov a asociačných pravidiel
Διαβάστε περισσότεραPevné ložiská. Voľné ložiská
SUPPORTS D EXTREMITES DE PRECISION - SUPPORT UNIT FOR BALLSCREWS LOŽISKA PRE GULIČKOVÉ SKRUTKY A TRAPÉZOVÉ SKRUTKY Výber správnej podpory konca uličkovej skrutky či trapézovej skrutky je dôležité pre správnu
Διαβάστε περισσότεραKontrolné otázky na kvíz z jednotiek fyzikálnych veličín. Upozornenie: Umiestnenie správnej a nesprávnych odpovedí sa môže v teste meniť.
Kontrolné otázky na kvíz z jednotiek fyzikálnych veličín Upozornenie: Umiestnenie správnej a nesprávnych odpovedí sa môže v teste meniť. Ktoré fyzikálne jednotky zodpovedajú sústave SI: a) Dĺžka, čas,
Διαβάστε περισσότεραOdporníky. 1. Príklad1. TESLA TR
Odporníky Úloha cvičenia: 1.Zistite technické údaje odporníkov pomocou katalógov 2.Zistite menovitú hodnotu odporníkov označených farebným kódom Schématická značka: 1. Príklad1. TESLA TR 163 200 ±1% L
Διαβάστε περισσότεραZADANIE 1_ ÚLOHA 3_Všeobecná rovinná silová sústava ZADANIE 1 _ ÚLOHA 3
ZDNIE _ ÚLOH 3_Všeobecná rovinná silová sústv ZDNIE _ ÚLOH 3 ÚLOH 3.: Vypočítjte veľkosti rekcií vo väzbách nosník zťženého podľ obrázku 3.. Veľkosti známych síl, momentov dĺžkové rozmery sú uvedené v
Διαβάστε περισσότεραObsah. 1.1 Reálne čísla a ich základné vlastnosti... 7 1.1.1 Komplexné čísla... 8
Obsah 1 Číselné obory 7 1.1 Reálne čísla a ich základné vlastnosti............................ 7 1.1.1 Komplexné čísla................................... 8 1.2 Číselné množiny.......................................
Διαβάστε περισσότεραDeliteľnosť a znaky deliteľnosti
Deliteľnosť a znaky deliteľnosti Medzi základné pojmy v aritmetike celých čísel patrí aj pojem deliteľnosť. Najprv si povieme, čo znamená, že celé číslo a delí celé číslo b a ako to zapisujeme. Nech a
Διαβάστε περισσότεραGoniometrické substitúcie
Goniometrické substitúcie Marta Kossaczká S goniometrickými funkciami ste sa už určite stretli, pravdepodobne predovšetkým v geometrii. Ich použitie tam ale zďaleka nekončí. Nazačiatoksizhrňme,čoonichvieme.Funkciesínusakosínussadajúdefinovať
Διαβάστε περισσότεραStaromlynská 29, Bratislava tel: , fax: http: //www.ecssluzby.sk SLUŽBY s. r. o.
SLUŽBY s. r. o. Staromlynská 9, 81 06 Bratislava tel: 0 456 431 49 7, fax: 0 45 596 06 http: //www.ecssluzby.sk e-mail: ecs@ecssluzby.sk Asynchrónne elektromotory TECHNICKÁ CHARAKTERISTIKA. Nominálne výkony
Διαβάστε περισσότερα2. prednáška. Teória množín I. množina operácie nad množinami množinová algebra mohutnosť a enumerácia karteziánsky súčin
2. prednáška Teória množín I množina operácie nad množinami množinová algebra mohutnosť a enumerácia karteziánsky súčin Verzia: 27. 9. 2009 Priesvtika: 1 Definícia množiny Koncepcia množiny patrí medzi
Διαβάστε περισσότεραMetodicko pedagogické centrum. Národný projekt VZDELÁVANÍM PEDAGOGICKÝCH ZAMESTNANCOV K INKLÚZII MARGINALIZOVANÝCH RÓMSKYCH KOMUNÍT
Moderné vzdelávanie pre vedomostnú spoločnosť / Projekt je spolufinancovaný zo zdrojov EÚ Kód ITMS: 26130130051 číslo zmluvy: OPV/24/2011 Metodicko pedagogické centrum Národný projekt VZDELÁVANÍM PEDAGOGICKÝCH
Διαβάστε περισσότεραKATALÓG KRUHOVÉ POTRUBIE
H KATALÓG KRUHOVÉ POTRUBIE 0 Základné požiadavky zadávania VZT potrubia pre výrobu 1. Zadávanie do výroby v spoločnosti APIAGRA s.r.o. V digitálnej forme na tlačive F05-8.0_Rozpis_potrubia, zaslané mailom
Διαβάστε περισσότεραELEKTRICKÉ POLE. Elektrický náboj je základná vlastnosť častíc, je viazaný na častice látky a vyjadruje stav elektricky nabitých telies.
ELEKTRICKÉ POLE 1. ELEKTRICKÝ NÁBOJ, COULOMBOV ZÁKON Skúmajme napr. trenie celuloidového pravítka látkou, hrebeň suché vlasy, mikrotén slabý prúd vody... Príčinou spomenutých javov je elektrický náboj,
Διαβάστε περισσότερα2 Chyby a neistoty merania, zápis výsledku merania
2 Chyby a neistoty merania, zápis výsledku merania Akej chyby sa môžeme dopustiť pri meraní na stopkách? Ako určíme ich presnosť? Základné pojmy: chyba merania, hrubé chyby, systematické chyby, náhodné
Διαβάστε περισσότεραTeória pravdepodobnosti
2. Podmienená pravdepodobnosť Katedra Matematických metód Fakulta Riadenia a Informatiky Žilinská Univerzita v Žiline 23. februára 2015 1 Pojem podmienenej pravdepodobnosti 2 Nezávislosť náhodných udalostí
Διαβάστε περισσότεραKódovanie a dekódovanie
Kódovanie a deovanie 1 Je daná množina B={0,1,2} Zostrojte množinu B* všetkých možných slov dĺžky dva 2 Je daná zdrojová abeceda A={α,β,ϕ,τ} Navrhnite príklady aspoň dvoch prostých ovaní týchto zdrojových
Διαβάστε περισσότεραModul pružnosti betónu
f cm tan α = E cm 0,4f cm ε cl E = σ ε ε cul Modul pružnosti betónu α Autori: Stanislav Unčík Patrik Ševčík Modul pružnosti betónu Autori: Stanislav Unčík Patrik Ševčík Trnava 2008 Obsah 1 Úvod...7 2 Deformácie
Διαβάστε περισσότεραMatematika 2. časť: Funkcia viac premenných Letný semester 2013/2014
Matematika 2 časť: Funkcia viac premenných Letný semester 2013/2014 RNDr. Jana Pócsová, PhD. Ústav riadenia a informatizácie výrobných procesov Fakulta BERG Technická univerzita v Košiciach e-mail: jana.pocsova@tuke.sk
Διαβάστε περισσότεραObsah. Motivácia a definícia. Metódy výpočtu. Problémy a kritika. Spätné testovanie. Prípadová štúdia využitie v NBS. pre 1 aktívum pre portfólio
Value at Risk Obsah Motivácia a definícia Metódy výpočtu pre 1 aktívum pre portfólio Problémy a kritika Spätné testovanie Prípadová štúdia využitie v NBS Motivácia Ako kvantifikovať riziko? Nakúpil som
Διαβάστε περισσότεραmnožiny F G = {t1, t2,, tn} T a pre ľubovoľný valec C so základňou B1, B2,, Bn v bodoch t1, t2,, tn, takou, že pre t G - F je Bt = E, platí PF(C) = PG
STOCHASTICKÝ PROCES Definícia stochastického procesu Definícia 1 Nech (Ω, F, P) je pravdepodobnostný priestor a nech T je podmnožina R. Pre každé t T nech X(t, ω) je náhodná premenná definovaná na pravdepodobnostnom
Διαβάστε περισσότεραRozsah akreditácie 1/5. Príloha zo dňa k osvedčeniu o akreditácii č. K-003
Rozsah akreditácie 1/5 Názov akreditovaného subjektu: U. S. Steel Košice, s.r.o. Oddelenie Metrológia a, Vstupný areál U. S. Steel, 044 54 Košice Rozsah akreditácie Oddelenia Metrológia a : Laboratórium
Διαβάστε περισσότεραRozdiely vo vnútornej štruktúre údajov = tvarové charakteristiky
Veľkosť Varablta Rozdelene 0 00 80 n 60 40 0 0 0 4 6 8 Tredy 0 Rozdely vo vnútornej štruktúre údajov = tvarové charakterstky I CHARAKTERISTIKY PREMELIVOSTI Artmetcký premer Vzťahy pre výpočet artmetckého
Διαβάστε περισσότεραNARIADENIE KOMISIE (EÚ)
30.11.2011 Úradný vestník Európskej únie L 317/17 NARIADENIE KOMISIE (EÚ) č. 1235/2011 z 29. novembra 2011, ktorým sa mení a dopĺňa nariadenie Európskeho parlamentu a Rady (ES) č. 1222/2009, pokiaľ ide
Διαβάστε περισσότεραAlgoritmy teórie grafov
Algoritmy teórie grafov Hľadanie minimálnej kostry grafu Kostra grafu taký strom grafu G = [U, H], pre ktorého podrgaf G = [U, H ] platí U = U a H H (faktor grafu). Kostra grafu každý súvislý graf má kostru.
Διαβάστε περισσότεραMožnosti rozhodovacích agentov hrajúcich hracie karty. Bakalárska práca. Juraj Barič. Univerzita FMFI KI Informatika. Vedúci bc.
Možnosti rozhodovacích agentov hrajúcich hracie karty Bakalárska práca Juraj Barič Univerzita FMFI KI 9.2.1 Informatika Vedúci bc. práce: doc. RNDr. Mária Markošová, PhD. Bratislava 2009 Čestne prehlasujem,
Διαβάστε περισσότεραReálna funkcia reálnej premennej
(ÚMV/MAN3a/10) RNDr. Ivan Mojsej, PhD ivan.mojsej@upjs.sk 18.10.2012 Úvod V každodennom živote, hlavne pri skúmaní prírodných javov, procesov sa stretávame so závislosťou veľkosti niektorých veličín od
Διαβάστε περισσότεραNumerická lineárna algebra. Zobrazenie
Numerická lineárna algebra. Zobrazenie reálnych čísiel v počítači Ing. Gabriel Okša, CSc. Matematický ústav Slovenská akadémia vied Bratislava Stavebná fakulta STU G. Okša: Reálne čísla v počítači 1/16
Διαβάστε περισσότεραRandomized Algorithms
Randomized Algorithms 7 a 9.3.2017 RA 2016/17 1 / 26 Modely podľa umiestnenia pravdepodobnosti I. modelom pravdepodobnostného algoritmu je pravdepodobnostné rozdelenie nad množinou deterministických stratégií
Διαβάστε περισσότεραŽivot vedca krajší od vysnívaného... s prírodou na hladine α R-P-R
Život vedca krajší od vysnívaného... s prírodou na hladine α R-P-R Ako nadprirodzené stretnutie s murárikom červenokrídlym naformátovalo môj profesijný i súkromný život... Osudové stretnutie s murárikom
Διαβάστε περισσότεραx x x2 n
Reálne symetrické matice Skalárny súčin v R n. Pripomeniem, že pre vektory u = u, u, u, v = v, v, v R platí. dĺžka vektora u je u = u + u + u,. ak sú oba vektory nenulové a zvierajú neorientovaný uhol
Διαβάστε περισσότεραTEXT MINING 4 11/17/2015. Objavovanie znalostí v textoch. Úlohy dolovania z textov. Extrahovanie tém (1) Extrahovanie tém (2)
Úlohy dolovania z textov TEXT MINING Objavovanie znalostí v textoch Klasifikácia Zaradenie dokumentu do preddefinovaných kategórií Zhlukovanie Nájdenie a popis zhlukov podobných dokumentov Extrahovanie
Διαβάστε περισσότεραMeranie na jednofázovom transformátore
Fakulta elektrotechniky a informatiky TU v Košiciach Katedra elektrotechniky a mechatroniky Meranie na jednofázovom transformátore Návod na cvičenia z predmetu Elektrotechnika Meno a priezvisko :..........................
Διαβάστε περισσότεραREZISTORY. Rezistory (súčiastky) sú pasívne prvky. Používajú sa vo všetkých elektrických
REZISTORY Rezistory (súčiastky) sú pasívne prvky. Používajú sa vo všetkých elektrických obvodoch. Základnou vlastnosťou rezistora je jeho odpor. Odpor je fyzikálna vlastnosť, ktorá je daná štruktúrou materiálu
Διαβάστε περισσότερα7. Dokážte, že z každej nekonečnej množiny môžeme vydeliť spočítateľnú podmnožinu.
Teória množín To, že medzi množinami A, B existuje bijektívne zobrazenie, budeme symbolicky označovať A B alebo A B. Vtedy hovoríme, že množiny A, B sú ekvivalentné. Hovoríme tiež, že také množiny A, B
Διαβάστε περισσότερα16. Základne rovinné útvary kružnica a kruh
16. Základne rovinné útvary kružnica a kruh Kružnica k so stredom S a polomerom r nazývame množinou všetkých bodov X v rovine, ktoré majú od pevného bodu S konštantnú vzdialenosť /SX/ = r, kde r (patri)
Διαβάστε περισσότεραObyčajné diferenciálne rovnice
(ÚMV/MAN3b/10) RNDr. Ivan Mojsej, PhD ivan.mojsej@upjs.sk 14.3.2013 Úvod patria k najdôležitejším a najviac prepracovaným matematickým disciplínam. Nielen v minulosti, ale aj v súčastnosti predstavujú
Διαβάστε περισσότερα4. domáca úloha. distribučnú funkciu náhodnej premennej X.
4. domáca úloha 1. (rovnomerné rozdelenie) Električky idú v 20-minútových intervaloch. Cestujúci príde náhodne na zastávku. Určte funkciu hustoty rozdelenia pravdepodobnosti a distribučnú funkciu náhodnej
Διαβάστε περισσότεραHarmonizované technické špecifikácie Trieda GP - CS lv EN Pevnosť v tlaku 6 N/mm² EN Prídržnosť
Baumit Prednástrek / Vorspritzer Vyhlásenie o parametroch č.: 01-BSK- Prednástrek / Vorspritzer 1. Jedinečný identifikačný kód typu a výrobku: Baumit Prednástrek / Vorspritzer 2. Typ, číslo výrobnej dávky
Διαβάστε περισσότεραLR(0) syntaktické analyzátory. doc. RNDr. Ľubomír Dedera
LR0) syntaktické analyzátory doc. RNDr. Ľubomír Dedera Učebné otázky LR0) automat a jeho konštrukcia Konštrukcia tabuliek ACION a GOO LR0) syntaktického analyzátora LR0) syntaktický analyzátor Sám osebe
Διαβάστε περισσότεραPríklady na precvičovanie Fourierove rady
Príklady na precvičovanie Fourierove rady Ďalším významným typom funkcionálnych radov sú trigonometrické rady, pri ktorých sú jednotlivé členy trigonometrickými funkciami. Konkrétne, jedná sa o rady tvaru
Διαβάστε περισσότεραMetódy vol nej optimalizácie
Metódy vol nej optimalizácie Metódy vol nej optimalizácie p. 1/52 Metódy minimalizácie funkcie jednej premennej Metódy minimalizácie funkcie jednej premennej p. 2/52 Metódy minimalizácie funkcie jednej
Διαβάστε περισσότεραC. Kontaktný fasádny zatepľovací systém
C. Kontaktný fasádny zatepľovací systém C.1. Tepelná izolácia penový polystyrén C.2. Tepelná izolácia minerálne dosky alebo lamely C.3. Tepelná izolácia extrudovaný polystyrén C.4. Tepelná izolácia penový
Διαβάστε περισσότερα