Contents. Preface. 4 Support Vector Machines Linearclassification SVMs separablecase... 64

Σχετικά έγγραφα
Chapter 1 Introduction to Observational Studies Part 2 Cross-Sectional Selection Bias Adjustment

The Nature of Mathematical Modeling. Neil Gershenfeld

Statistics 104: Quantitative Methods for Economics Formula and Theorem Review

Fundamentals of Probability: A First Course. Anirban DasGupta

Επιβλεπόμενη Μηχανική Εκμάθηση ΙI

ΠΡΟΣΚΛΗΣΗ ΕΚΔΗΛΩΣΗΣ ΕΝΔΙΑΦΕΡΟΝΤΟΣ

A Hierarchy of Theta Bodies for Polynomial Systems

TÜV MANAGEMENT SERVICE ISO

Congruence Classes of Invertible Matrices of Order 3 over F 2

HMY 795: Αναγνώριση Προτύπων

Contents QR Decomposition: An Annotated Bibliography Introduction to Adaptive Filters

ΨΗΦΙΑΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΕΙΚΟΝΑΣ

Homomorphism in Intuitionistic Fuzzy Automata

and algorithms CONTENTS Process for Design and Analysis of Algorithms Understanding the Problem

ΕΛΤΙΟ ΤΥΠΟΥ. ΕΙΚΤΗΣ ΤΙΜΩΝ ΥΛΙΚΩΝ ΚΑΤΑΣΚΕΥΗΣ ΝΕΩΝ ΚΤΙΡΙΩΝ ΚΑΤΟΙΚΙΩΝ: εκέµβριος 2015 (2010=100,0)

Coefficient Inequalities for a New Subclass of K-uniformly Convex Functions

ΠΤΥΧΙΑΚΗ/ ΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ

Abstract Storage Devices

General 2 2 PT -Symmetric Matrices and Jordan Blocks 1

Takeaki Yamazaki (Toyo Univ.) 山崎丈明 ( 東洋大学 ) Oct. 24, RIMS

ΚΑΝΟΝΙΣΜΟΣ (EE) 2019/1238 ΤΟΥ ΕΥΡΩΠΑΪΚΟΥ ΚΟΙΝΟΒΟΥΛΙΟΥ ΚΑΙ ΤΟΥ ΣΥΜΒΟΥΛΙΟΥ

Βασίλειος Μαχαιράς Πολιτικός Μηχανικός Ph.D.

Τεχνητή Νοημοσύνη. 18η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

Reminders: linear functions

ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΝΟΣΗΛΕΥΤΙΚΗΣ

A Bonus-Malus System as a Markov Set-Chain. Małgorzata Niemiec Warsaw School of Economics Institute of Econometrics

Jordan Form of a Square Matrix

Contents Introduction to Filter Concepts All-Pole Approximations

Μέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων

ΕΛΤΙΟ ΤΥΠΟΥ. Η εξέλιξη του είκτη Τιµών Καταναλωτή, µε έτος αναφοράς 2009=100,0 του µηνός Φεβρουαρίου 2015, έχει ως εξής:

New bounds for spherical two-distance sets and equiangular lines

ΕΚΠ 413 / ΕΚΠ 606 Αυτόνοµοι (Ροµ οτικοί) Πράκτορες

SOME PROPERTIES OF FUZZY REAL NUMBERS

Measurement and Control of Charged Particle Beams

Μάρω Ευαγγελίδου, Αμαλιάδος 17, Τηλ

HMY 795: Αναγνώριση Προτύπων. Διαλέξεις 15-16

The ε-pseudospectrum of a Matrix

ΕΛΤΙΟ ΤΥΠΟΥ ΕΛΛΗΝΙΚΗ ΗΜΟΚΡΑΤΙΑ. ΕΙΚΤΗΣ ΤΙΜΩΝ ΚΑΤΑΝΑΛΩΤΗ : Ιανουάριος 2013 ΕΛΛΗΝΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΡΧΗ. Πειραιάς, 8 Φεβρουαρίου 2013

Ταξινόμηση. Εισαγωγή. Ορισμός. Ορισμός. Τεχνικές Ταξινόμησης. Εισαγωγή

SYLLABUS. Algorithm Specification, Performance Analysis and Measurement. Binary Trees, Threaded Binary Trees, Heaps, Binary Search Trees.

Jesse Maassen and Mark Lundstrom Purdue University November 25, 2013

Τεχνητή Νοημοσύνη ΙΙ. Ενότητα : Μηχανική Μάθηση. Σγάρμπας Κυριάκος Πολυτεχνική Σχολή Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών

ΕΛΤΙΟ ΤΥΠΟΥ ΕΛΛΗΝΙΚΗ ΗΜΟΚΡΑΤΙΑ. ΕΙΚΤΗΣ ΤΙΜΩΝ ΚΑΤΑΝΑΛΩΤΗ : Μάιος 2013 ΕΛΛΗΝΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΡΧΗ. Πειραιάς, 10 Ιουνίου 2013

Lecture 2: Dirac notation and a review of linear algebra Read Sakurai chapter 1, Baym chatper 3

: Active Learning 2017/11/12

t = (iv) A B (viii) (B Γ) A

Wavelet based matrix compression for boundary integral equations on complex geometries

Biostatistics for Health Sciences Review Sheet

ΔΕΛΤΙΟ ΤΥΠΟΥ. Ο Γενικός Δείκτης Τιμών Καταναλωτή αυξήθηκε κατά 5,5 % τον Ιούλιο 2010,σε σύγκριση με τον Ιούλιο 2009.

Quick algorithm f or computing core attribute

ΔΙΑΚΡΙΤΟΣ ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΣ FOURIER - Discrete Fourier Transform - DFT -

ΓΡΑΜΜΙΚΟΣ & ΔΙΚΤΥΑΚΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ

Kernel Methods and their Application for Image Understanding

Problem Set 3: Solutions

ΠΕΡΙΛΗΨΕΙΣ ΕΡΓΑΣΙΩΝ 4 Ο ΦΟΙΤΗΤΙΚΟ ΣΥΝΕΔΡΙΟ ΕΕΕE ΕΠΙΧΕΙΡΗΣΙΑΚΗ ΕΡΕΥΝΑ: ΕΥΚΑΙΡΙΕΣ ΚΑΙ ΠΡΟΚΛΗΣΕΙΣ ΜΕΣΑ ΣΤΗΝ ΚΡΙΣΗ ΔΙΟΡΓΑΝΩΣΗ

Big Data/Business Intelligence

Διακριτικές Συναρτήσεις

Lecture 21: Properties and robustness of LSE

ΚΑΝΟΝΙΣΜΟΣ (ΕΕ) 2019/1243 ΤΟΥ ΕΥΡΩΠΑΪΚΟΥ ΚΟΙΝΟΒΟΥΛΙΟΥ ΚΑΙ ΤΟΥ ΣΥΜΒΟΥΛΙΟΥ

FORMULAS FOR STATISTICS 1

Nondifferentiable Convex Functions

Meta-Learning and Universality

ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΗΛΕΚΤΡΟΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΚΑΙ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ, ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ

Πανεπιστήµιο Κύπρου Πολυτεχνική Σχολή

Stabilization of stock price prediction by cross entropy optimization

Ταξινόμηση ανεπιθύμητης αλληλογραφίας εφαρμόζοντας στατιστικές τεχνικές ταξινόμησης με την γλώσσα προγραμματισμού R

Αναγνώριση Προσώπου Με Χρήση Πυρήνων. Παπαχαρίση Μαρίας

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Data Mining - Classification

Random Forests Leo. Hitoshi Habe 1

Incorporating ecological considerations into industrial design practice

: Volterra. Volterra 3. (i.i.d.) Volterra cross-correlation. 2.1 Volterra f[ ] y(t) = f[t, u( )] y(t) = h 0 +

Discrete scan statistics with windows of arbitrary shape

"#$%$$ &* '#( "#$%$$,$*- ') % %$$. '#-) -& $$ #)**-% -"*! :6 -#0! :888 -! #;/$-

Στοιχεία και έγγραφα που απαιτούνται για την εγγραφή στο ΓΕΜΗ

Α Π Ο Φ Α Σ Ι Ζ Ο Υ Μ Ε. A. Ορίζουµε αναπληρωτές Προϊσταµένους των νεοσύστατων Τµηµάτων, τους παρακάτω υπαλλήλους:

SOLUTIONS TO MATH38181 EXTREME VALUES AND FINANCIAL RISK EXAM

Nowhere-zero flows Let be a digraph, Abelian group. A Γ-circulation in is a mapping : such that, where, and : tail in X, head in

Αλγόριθμοι και πολυπλοκότητα NP-Completeness

- International Scientific Electronic Journal, Issue 1, 2004 Department of Cultural Technology and Communication University of the Aegean

HMY 795: Αναγνώριση Προτύπων

Durbin-Levinson recursive method

H Εξωτερική Αξιολόγηση στο ΑΠΘ

Διάλεξη 07: Αλγόριθμοι εκμάθησης ΜέροςΓ Συναρτήσεις & μετα-μαθησιακοί Αλγόριθμοι



Αθήνα, Α.Π. Φ80000/οικ.59819/1961

ΚΕΝΤΡΟ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΥ ΚΑΙ ΟΙΚΟΝΟΜΙΚΩΝ ΕΡΕΥΝΩΝ ΑΜΕΡΙΚΗΣ 11, ΑΘΗΝΑ Τ.Κ , Τηλ Fax

Αξιολόγηση των Φασματικού Διαχωρισμού στην Διάκριση Διαφορετικών Τύπων Εδάφους ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ. Σπίγγος Γεώργιος

Global nonlinear stability of steady solutions of the 3-D incompressible Euler equations with helical symmetry and with no swirl

HMY 795: Αναγνώριση Προτύπων

Μεταϖτυχιακή Εργασία. Εκτίµηση εϖικινδυνότητας της ϖοιότητας του νερού του δικτύου ύδρευσης του ήµου Ηρακλείου του Νοµού Ηρακλείου Κρήτης

6.1. Dirac Equation. Hamiltonian. Dirac Eq.

Ε.Σ.Π.Α και Τοπική Αυτοδιοίκηση. Οι δυνατότητες ένταξης έργων και δράσεων της Τ.Α. στα Επιχειρησιακά Προγράμματα

Multilevel models for analyzing people s daily moving behaviour

Table 1. morphism U P 1 dominant (MMP) 2. dim = 3 (MMP) 3. (cf. [Ii77], [Miy01]) (Table 1) 3.

Κατηγοριοποίηση. 3 ο Φροντιστήριο. Ε Ξ Ό Ρ Υ Ξ Η Δ Ε Δ Ο Μ Έ Ν Ω Ν Κ Α Ι Α Λ Γ Ό Ρ Ι Θ Μ Ο Ι Μ Ά Θ Η Σ Η ς. Σκούρα Αγγελική

Gap Safe Screening Rules for Sparse-Group Lasso

Οργάωνση του Περιφερικού Νευρικού Συστήµατος λκλλκλκλλκκκκ

ΠΑΡΑΡΤΗΜΑ ΠΡΩΤΟ ΤΗΣ ΕΠΙΣΗΜΗΣ ΕΦΗΜΕΡΙΔΑΣ ΤΗΣ ΔΗΜΟΚΡΑΤΙΑΣ Αρ της 6ης ΑΠΡΙΑΙΟΥ 1998 ΝΟΜΟΘΕΣΙΑ ΜΕΡΟΣ Ι

SYLLABUS CHAPTER - 1 : INTRODUCTION TO ALGORITHMS CHAPTER - 2 : DIVIDE AND CONQUER CHAPTER - 3 : GREEDY METHOD

Transcript:

Contents Preface xi 1 Introduction 1 1.1 Applicationsandproblems... 1 1.2 Definitionsandterminology... 3 1.3 Cross-validation... 5 1.4 Learningscenarios... 7 1.5 Outline... 8 2 The PAC Learning Framework 11 2.1 ThePAClearningmodel... 11 2.2 Guaranteesforfinitehypothesissets consistentcase... 17 2.3 Guarantees for finite hypothesis sets inconsistent case....... 21 2.4 Generalities... 24 2.4.1 Deterministicversusstochasticscenarios... 24 2.4.2 Bayeserrorandnoise... 25 2.4.3 Estimationandapproximationerrors... 26 2.4.4 Modelselection... 27 2.5 Chapternotes... 28 2.6 Exercises... 29 3 Rademacher Complexity and VC-Dimension 33 3.1 Rademachercomplexity... 34 3.2 Growthfunction... 38 3.3 VC-dimension... 41 3.4 Lowerbounds... 48 3.5 Chapternotes... 54 3.6 Exercises... 55 4 Support Vector Machines 63 4.1 Linearclassification... 63 4.2 SVMs separablecase... 64

vi 4.2.1 Primaloptimizationproblem... 64 4.2.2 Supportvectors... 66 4.2.3 Dualoptimizationproblem... 67 4.2.4 Leave-one-outanalysis... 69 4.3 SVMs non-separablecase... 71 4.3.1 Primaloptimizationproblem... 72 4.3.2 Supportvectors... 73 4.3.3 Dualoptimizationproblem... 74 4.4 Margintheory... 75 4.5 Chapternotes... 83 4.6 Exercises... 84 5 Kernel Methods 89 5.1 Introduction... 89 5.2 Positivedefinitesymmetrickernels... 92 5.2.1 Definitions... 92 5.2.2 ReproducingkernelHilbertspace... 94 5.2.3 Properties... 96 5.3 Kernel-basedalgorithms... 100 5.3.1 SVMswithPDSkernels... 100 5.3.2 Representertheorem... 101 5.3.3 Learningguarantees... 102 5.4 Negativedefinitesymmetrickernels... 103 5.5 Sequencekernels... 106 5.5.1 Weightedtransducers... 106 5.5.2 Rationalkernels... 111 5.6 Chapternotes... 115 5.7 Exercises... 116 6 Boosting 121 6.1 Introduction... 121 6.2 AdaBoost... 122 6.2.1 Boundontheempiricalerror... 124 6.2.2 Relationshipwithcoordinatedescent... 126 6.2.3 Relationshipwithlogisticregression... 129 6.2.4 Standarduseinpractice... 129 6.3 Theoreticalresults... 130 6.3.1 VC-dimension-basedanalysis... 131 6.3.2 Margin-basedanalysis... 131 6.3.3 Marginmaximization... 136 6.3.4 Game-theoreticinterpretation... 137

vii 6.4 Discussion... 140 6.5 Chapternotes... 141 6.6 Exercises... 142 7 On-Line Learning 147 7.1 Introduction... 147 7.2 Predictionwithexpertadvice... 148 7.2.1 MistakeboundsandHalvingalgorithm... 148 7.2.2 Weightedmajorityalgorithm... 150 7.2.3 Randomizedweightedmajorityalgorithm... 152 7.2.4 Exponentialweightedaveragealgorithm... 156 7.3 Linearclassification... 159 7.3.1 Perceptronalgorithm... 160 7.3.2 Winnowalgorithm... 168 7.4 On-linetobatchconversion... 171 7.5 Game-theoreticconnection... 174 7.6 Chapternotes... 175 7.7 Exercises... 176 8 Multi-Class Classification 183 8.1 Multi-classclassificationproblem... 183 8.2 Generalizationbounds... 185 8.3 Uncombinedmulti-classalgorithms... 191 8.3.1 Multi-classSVMs... 191 8.3.2 Multi-classboostingalgorithms... 192 8.3.3 Decisiontrees... 194 8.4 Aggregated multi-class algorithms... 198 8.4.1 One-versus-all... 198 8.4.2 One-versus-one... 199 8.4.3 Error-correctioncodes... 201 8.5 Structuredpredictionalgorithms... 203 8.6 Chapternotes... 206 8.7 Exercises... 207 9 Ranking 209 9.1 Theproblemofranking... 209 9.2 Generalizationbound... 211 9.3 RankingwithSVMs... 213 9.4 RankBoost... 214 9.4.1 Boundontheempiricalerror... 216 9.4.2 Relationshipwithcoordinatedescent... 218

viii 9.4.3 Margin bound for ensemble methods in ranking....... 220 9.5 Bipartiteranking... 221 9.5.1 Boostinginbipartiteranking... 222 9.5.2 AreaundertheROCcurve... 224 9.6 Preference-basedsetting... 226 9.6.1 Second-stagerankingproblem... 227 9.6.2 Deterministicalgorithm... 229 9.6.3 Randomizedalgorithm... 230 9.6.4 Extensiontootherlossfunctions... 231 9.7 Discussion... 232 9.8 Chapternotes... 233 9.9 Exercises... 234 10 Regression 237 10.1Theproblemofregression... 237 10.2Generalizationbounds... 238 10.2.1 Finitehypothesissets... 238 10.2.2 Rademachercomplexitybounds... 239 10.2.3 Pseudo-dimensionbounds... 241 10.3Regressionalgorithms... 245 10.3.1 Linearregression... 245 10.3.2 Kernelridgeregression... 247 10.3.3 Supportvectorregression... 252 10.3.4 Lasso... 257 10.3.5 Groupnormregressionalgorithms... 260 10.3.6 On-lineregressionalgorithms... 261 10.4Chapternotes... 262 10.5Exercises... 263 11 Algorithmic Stability 267 11.1Definitions... 267 11.2Stability-basedgeneralizationguarantee... 268 11.3Stabilityofkernel-basedregularizationalgorithms... 270 11.3.1 Application to regression algorithms: SVR and KRR..... 274 11.3.2 Applicationtoclassificationalgorithms:SVMs... 276 11.3.3 Discussion... 276 11.4Chapternotes... 277 11.5Exercises... 277 12 Dimensionality Reduction 281 12.1PrincipalComponentAnalysis... 282

ix 12.2KernelPrincipalComponentAnalysis(KPCA)... 283 12.3 KPCAandmanifoldlearning... 285 12.3.1 Isomap... 285 12.3.2 Laplacianeigenmaps... 286 12.3.3 Locallylinearembedding(LLE)... 287 12.4Johnson-Lindenstrausslemma... 288 12.5Chapternotes... 290 12.6Exercises... 290 13 Learning Automata and Languages 293 13.1Introduction... 293 13.2Finiteautomata... 294 13.3Efficientexactlearning... 295 13.3.1 Passivelearning... 296 13.3.2 Learningwithqueries... 297 13.3.3 Learningautomatawithqueries... 298 13.4Identificationinthelimit... 303 13.4.1 Learningreversibleautomata... 304 13.5Chapternotes... 309 13.6Exercises... 310 14 Reinforcement Learning 313 14.1Learningscenario... 313 14.2Markovdecisionprocessmodel... 314 14.3Policy... 315 14.3.1 Definition... 315 14.3.2 Policyvalue... 316 14.3.3 Policyevaluation... 316 14.3.4 Optimalpolicy... 318 14.4Planningalgorithms... 319 14.4.1 Valueiteration... 319 14.4.2 Policyiteration... 322 14.4.3 Linearprogramming... 324 14.5Learningalgorithms... 325 14.5.1 Stochasticapproximation... 326 14.5.2 TD(0)algorithm... 330 14.5.3 Q-learningalgorithm... 331 14.5.4 SARSA... 334 14.5.5 TD(λ) algorithm... 335 14.5.6 Largestatespace... 336 14.6Chapternotes... 337

x Conclusion 339 A Linear Algebra Review 341 A.1 Vectorsandnorms... 341 A.1.1 Norms... 341 A.1.2 Dualnorms... 342 A.2 Matrices... 344 A.2.1 Matrixnorms... 344 A.2.2 Singularvaluedecomposition... 345 A.2.3 Symmetric positive semidefinite (SPSD) matrices....... 346 B Convex Optimization 349 B.1 Differentiationandunconstrainedoptimization... 349 B.2 Convexity... 350 B.3 Constrainedoptimization... 353 B.4 Chapternotes... 357 C Probability Review 359 C.1 Probability... 359 C.2 Randomvariables... 359 C.3 Conditionalprobabilityandindependence... 361 C.4 Expectation, Markov s inequality, and moment-generating function. 363 C.5 VarianceandChebyshev sinequality... 365 D Concentration inequalities 369 D.1 Hoeffding sinequality... 369 D.2 McDiarmid sinequality... 371 D.3 Otherinequalities... 373 D.3.1 Binomialdistribution:Slud sinequality... 374 D.3.2 Normaldistribution:tailbound... 374 D.3.3 Khintchine-Kahaneinequality... 374 D.4 Chapternotes... 376 D.5 Exercises... 377 E Notation 379 References 381 Index 397