Μεγίστου Σφάλµατος. Παναγιώτης Καρράς. Αθήνα, 26 Αυγούστου 2005



Σχετικά έγγραφα
Μία Γρήγορη Προσεγγιστική Μέθοδος για Πιθανοτικές Wavelet Συνόψεις

ΗΥ562 Προχωρημένα Θέματα Βάσεων Δεδομένων Efficient Query Evaluation over Temporally Correlated Probabilistic Streams

Αρχές κωδικοποίησης. Τεχνολογία Πολυµέσων 08-1

Ενότητα 7 Ουρές Προτεραιότητας

Αλγόριθμοι και Πολυπλοκότητα

Μοντελοποίηση προβληµάτων

Συστήµατα και Αλγόριθµοι Πολυµέσων

Εισαγωγή στα Προσαρµοστικά Συστήµατα

ΚΕΦΑΛΑΙΟ Μηχανική Μάθηση

ΕΝΟΤΗΤΑ 4 ΣΥΝΟΛΑ - ΛΕΞΙΚΑ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ

Αλγόριθμοι και Δομές Δεδομένων (IΙ) (γράφοι και δένδρα)

Κεφάλαιο 5. Αλγόριθµοι Αναζήτησης σε Παίγνια ύο Αντιπάλων. Τεχνητή Νοηµοσύνη - Β' Έκδοση

Αλγόριθµοι και Πολυπλοκότητα

Επίλυση Προβλημάτων 1

Το µαθηµατικό µοντέλο του Υδρονοµέα

Τεχνητή Νοημοσύνη. 3η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

Ανάπτυξη και δηµιουργία µοντέλων προσοµοίωσης ροής και µεταφοράς µάζας υπογείων υδάτων σε καρστικούς υδροφορείς µε χρήση θεωρίας νευρωνικών δικτύων

Αριθμητική Ανάλυση & Εφαρμογές

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ. Δοµές Δεδοµένων

Περιεχόμενα. Περιεχόμενα

ΕΠΙΧΕΙΡΗΣΙΑΚΗ ΕΡΕΥΝΑ ΠΕΡΣΕΦΟΝΗ ΠΟΛΥΧΡΟΝΙΔΟΥ ΤΜΗΜΑ ΛΟΓΙΣΤΙΚΗΣ ΤΕ

Q 12. c 3 Q 23. h 12 + h 23 + h 31 = 0 (6)

Τεχνικές Αναπαράστασης αλγορίθµων Ψευδοκώδικας Διάγραµµα Ροής Αλγοριθµικές δοµές (Ακολουθία Επιλογή Επανάληψη)

4.3. Γραµµικοί ταξινοµητές

Είδη Μεταβλητών. κλίµακα µέτρησης

MBR Ελάχιστο Περιβάλλον Ορθογώνιο (Minimum Bounding Rectangle) Το µικρότερο ορθογώνιο που περιβάλλει πλήρως το αντικείµενο 7 Παραδείγµατα MBR 8 6.

Κεφάλαιο 5 Ανάλυση Αλγορίθμων

viii 20 Δένδρα van Emde Boas 543

Ε ανάληψη. Παιχνίδια παιχνίδια ως αναζήτηση. Βέλτιστες στρατηγικές στρατηγική minimax. Βελτιώσεις κλάδεµα α-β

Οργάνωση αρχείων: πως είναι τοποθετηµένες οι εγγραφές ενός αρχείου όταν αποθηκεύονται στο δίσκο

Διάλεξη 22: Δυαδικά Δέντρα. Διδάσκων: Παναγιώτης Ανδρέου

Insert(K,I,S) Delete(K,S)

Heapsort Using Multiple Heaps

Θεωρία Δυαδικότητας ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ. Η παρουσίαση προετοιμάστηκε από τον Ν.Α. Παναγιώτου. Επιχειρησιακή Έρευνα

Επιµέλεια Θοδωρής Πιερράτος

ΑΛΓΟΡΙΘΜΟΙ ΚΑΙ ΠΟΛΥΠΛΟΚΟΤΗΤΑ Φεβρουάριος 2005 Σύνολο μονάδων: 91

Αποθήκες εδομένων και Εξόρυξη εδομένων:

Εισαγωγή Αλγόριθµοι Αποτελέσµατα Επίλογος Ορισµός του Προβλήµατος Ευθυγράµµιση : Εύρεση ενός γεωµετρικού µετασχηµατισµού που ϕέρνει κοντά δύο τρισδιάσ

Διαχείριση Εφοδιαστικής Αλυσίδας ΙΙ

Ουρά Προτεραιότητας: Heap

Πρόβληµα (ADT) Λεξικού. Αλγόριθµοι & Πολυπλοκότητα (Χειµώνας 2011) Λεξικό, Union - Find 2

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος

Λεξικό, Union Find. ιδάσκοντες: Σ. Ζάχος,. Φωτάκης Επιμέλεια διαφανειών:. Φωτάκης. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών

Προσεγγιστικοί Αλγόριθμοι

Λεξικό, Union Find. ιδάσκοντες: Σ. Ζάχος,. Φωτάκης Επιμέλεια διαφανειών:. Φωτάκης. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών

Outline. 6 Edit Distance

Αναγνώριση Προτύπων Ι

Κεφάλαιο 14. οµές Ευρετηρίων για Αρχεία. ιαφάνεια 14-1

Αλγόριθµοι και Πολυπλοκότητα

ιαφορική εντροπία Σεραφείµ Καραµπογιάς

Αλγόριθµοι Εκτίµησης Καθυστέρησης και

Υπολογιστική Πολυπλοκότητα

Αλγόριθµοι και Πολυπλοκότητα

ΠΛΗ 405 Τεχνητή Νοηµοσύνη Ε ανάληψη. πεπερασµένα χρονικά περιθώρια ανά κίνηση. απευθείας αξιολόγηση σε ενδιάµεσους κόµβους

Βραχύτερα Μονοπάτια σε Γράφους (CLR, κεφάλαιο 25)

Τεχνητή Νοημοσύνη. 2η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

Διπλωματική Εργασία: «Συγκριτική Μελέτη Μηχανισμών Εκτίμησης Ελλιπούς Πληροφορίας σε Ασύρματα Δίκτυα Αισθητήρων»

Ουρά Προτεραιότητας: Heap

Μέγιστη ροή. Κατευθυνόμενο γράφημα. Συνάρτηση χωρητικότητας. αφετηρίακός κόμβος. τερματικός κόμβος. Ροή δικτύου. με τις ακόλουθες ιδιότητες

Πανεπιστήµιο Πειραιώς Τµήµα Πληροφορικής. Εξόρυξη Γνώσης από εδοµένα (Data Mining) Συσταδοποίηση. Γιάννης Θεοδωρίδης

Συνόψεις για Δεδομένα XML με Ετερογενές Περιεχόμενο

Πληροφοριακά Συστήματα Διοίκησης. Επισκόπηση μοντέλων λήψης αποφάσεων Τεχνικές Μαθηματικού Προγραμματισμού

Τεχνολογίες Υλοποίησης Αλγορίθµων

Cuckoo Hashing. Αλγόριθμοι και Πολυπλοκότητα. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών Εθνικό Μετσόβιο Πολυτεχνείο

Ανάλυση και Σχεδιασμός Μεταφορών Ι Εισαγωγή

Τι είναι το JPEG2000?

ΔΟΜΕΣ ΔΕΔΟΜΕΝΩΝ. Αρχές Ανάλυσης Αλγορίθµων Κεφάλαιο 2. Ε. Μαρκάκης Επικ. Καθηγητής

ΕΠΛ 231 οµές εδοµένων και Αλγόριθµοι Άννα Φιλίππου,

ΜΕΡΟΣ Ι: ΓΕΩΓΡΑΦΙΚΑ Ε ΟΜΕΝΑ ΚΑΙ ΣΥΣΤΗΜΑΤΑ ΓΕΩΓΡΑΦΙΚΩΝ ΠΛΗΡΟΦΟΡΙΩΝ Η ΦΥΣΗ ΤΩΝ ΓΕΩΓΡΑΦΙΚΩΝ Ε ΟΜΕΝΩΝ...

Ειδικά θέµατα δικτύων διανοµής

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 5: Εύρεση σημείων ισορροπίας σε παίγνια μηδενικού αθροίσματος. Ε. Μαρκάκης. Επικ. Καθηγητής

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ

Για παράδειγμα η αρχική και η τελική κατάσταση αναπαριστώνται ως εξής: (ένα λίτρο)

ΣΤΟΧΑΣΤΙΚΕΣ ΔΙΕΡΓΑΣΙΕΣ & ΒΕΛΤΙΣΤΟΠΟΙΗΣΗ Αίθουσα Νέα Κτίρια ΣΗΜΜΥ Ε.Μ.Π.

Λεξικό, Union Find. ιδάσκοντες: Σ. Ζάχος,. Φωτάκης Επιμέλεια διαφανειών:. Φωτάκης. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ

Ουρά Προτεραιότητας (priority queue)

Λεξικό, Union Find. ημήτρης Φωτάκης. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Εθνικό Μετσόβιο Πολυτεχνείο

Περίληψη ιπλωµατικής Εργασίας

Κινητά Δίκτυα Επικοινωνιών. Συμπληρωματικό υλικό. Προσαρμοστική Ισοστάθμιση Καναλιού

ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 3 ΔΕΣΜΕΥΜΕΝΗ ΠΙΘΑΝΟΤΗΤΑ, ΟΛΙΚΗ ΠΙΘΑΝΟΤΗΤΑ ΘΕΩΡΗΜΑ BAYES, ΑΝΕΞΑΡΤΗΣΙΑ ΚΑΙ ΣΥΝΑΦΕΙΣ ΕΝΝΟΙΕΣ 71

Ανάλυση αλγορίθμων. Χρόνος εκτέλεσης: Αναμενόμενη περίπτωση. - απαιτεί γνώση της κατανομής εισόδου

Ουρά Προτεραιότητας (priority queue)

Διδάσκων: Παναγιώτης Ανδρέου

Υπολογιστικό Πρόβληµα

Ενότητα 9 Ξένα Σύνολα που υποστηρίζουν τη λειτουργία της Ένωσης (Union-Find)

Λεξικό, Union Find. ιδάσκοντες: Σ. Ζάχος,. Φωτάκης Επιμέλεια διαφανειών:. Φωτάκης. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών

Προσεγγιστικοί Αλγόριθμοι βασισμένοι σε Γραμμικό Προγραμματισμό

Ουρές προτεραιότητας

Άσκηση 1 (ανακοινώθηκε στις 20 Μαρτίου 2017, προθεσμία παράδοσης: 24 Απριλίου 2017, 12 τα μεσάνυχτα).

γένεση των µετακινήσεων

Αξιολόγηση Ευριστικών Αλγορίθµων

ΥΠΟΠΡΟΓΡΑΜΜΑΤΑ. Κάθε υποπρόγραμμα έχει μόνο μία είσοδο και μία έξοδο. Κάθε υποπρόγραμμα πρέπει να είναι ανεξάρτητο από τα άλλα.

Το εσωτερικό ενός Σ Β

ΑΛΓΟΡΙΘΜΟΙ. Τι είναι αλγόριθμος

Πελάτες φθάνουν στο ταμείο μιας τράπεζας Eνα μόνο ταμείο είναι ανοικτό Κάθε πελάτης παρουσιάζεται με ένα νούμερο - αριθμός προτεραιότητας Όσο ο

Διάλεξη 17: O Αλγόριθμος Ταξινόμησης HeapSort

Ανάκτηση πολυμεσικού περιεχομένου

Περιεχόμενα. Δομές δεδομένων. Τεχνικές σχεδίασης αλγορίθμων. Εισαγωγή στον προγραμματισμό. Υποπρογράμματα. Επαναληπτικά κριτήρια αξιολόγησης

Transcript:

Μ ένα Σµπάρο υο Τρυγώνια: Εισάπαξ Κυµατιδιακές Συνόψεις για Μέτρα Μεγίστου Σφάλµατος Παναγιώτης Καρράς Αθήνα, 6 Αυγούστου 005 Έρευνα στο HKU µε τον Νίκο Μαµουλή Περίληψη Προκαταρκτικά & Κίνητρα Χρησιµότητα Συνόψεων εδοµένων Μετασχηµατισµός κυµατιδίων Haar, συµβατικές κυµατιδιακές συνόψεις Το πρόβληµα µε την εγγύηση σφάλµατος Προηγούµενη Προσέγγιση: Κυµατιδιακές Συνόψεις µε Βέλτιστη Εγγύηση Σφάλµατος Μη πρακτικότητα αυτής της προσέγγισης Λύση: Πρακτικές Κυµατιδιακές Συνόψεις µε Εγγυήσεις Σφάλµατος Αλγόριθµοι Χαµηλής Πολυπλοκότητας που παρέχουν σχεδόν βέλτιστη εγγυήση σφάλµατος Επέκταση σε Ρέοντα εδοµένα Εισάπαξ Προσαρµογές των προταθέντων αλγορίθµων Συµπεράσµατα & Μελλοντικές Κατευθύνσεις 1

Συµπαγείς Συνόψεις εδοµένων χρήσιµες για: Προσεγγιστική Επεξεργασία Επερωτήσεων (ακριβείς απαντήσεις δεν απαιτούνται όσο ταχύτητα) Μάθηση, Ταξινόµηση, Εντοπισµό Γεγονότων Εξόρυξη εδοµένων, Εκτίµηση Επιλεκτικότητας Συνθήκες όπου µαζικά δεδοµένααφίκνυνταιενῥοῄ Κυµατιδιακός Μετασχηµατισµός Haar Κυµατίδια: µαθηµατικό εργαλείο για την ιεραρχική αποσύνθεση συναρτήσεων/σηµάτων Κυµατίδια Haar: απλούστερη κυµατιδιακή βάση, εύκολη στην σύλληψη και υλοποίηση Αναδροµική κατά ζεύγος εξαγωγή διαφοράς από µέσο σε διαφορετικές αναλύσεις Ανάλυση Μέσοι Συντελεστές ιαφοράς 3 D = [,, 0,, 3, 5, 4, 4] ---- 1 0 [, 1, 4, 4] [0, -1, -1, 0] [1.5, 4] [0.5, 0] [.75] [-1.5] Κυµατιδιακός µετ/σµός Haar: [.75, -1.5, 0.5, 0, 0, -1, -1, 0] Κατ αναλογία επάκταση σε πολλαπλές διαστάσεις

Συντελεστές Κυµατιδίων Haar ένδρο Σφάλµατος : Ιεραρχική δοµή αποσύνθεσης Εργαλείο για την αναπαράσταση του µετασχηµατισµού και της ανακατασκευής Ανακατασκευή τιµής d(i) d(i) = (/-1) * (συντελεστής στο µονοπάτι) Άθροισµα εύρουςd(l:h) d(l:h) = γραµµικός συνδυασµός συντελεστών στα µονοπάτια των l, h.75-1.5-0.5 0 - - Μόνο O(logN) όροι Αρχικά δεδοµένα 0-1 -1 0 - - - - 0 3 5 4 4 3 =.75 - (-1.5) 0 (-1) 6 = 4*.75 4*(-1.5) Κυµατιδιακές Συνόψεις Υπολογίζουµε µετασχηµατισµό Haar του D Περικοπή συντελεστών : κρατάµε B<< D συντελεστές Το B καθορίζεται από τον διαθέσιµο χώρο Μηχανή προσεγγιστικών επερωτήσεων µπορεί να λειτουργήσει µε τέτοιες συµπαγείς συνόψεις [MVW, SIGMOD 98]; [VW, SIGMOD 99]; [CGRS, VLDB 00] Συµβατική περικοπή: Επιλογή B µεγαλύτερων συντελεστών κατ απόλυτη κανονικοποιηµένη τιµή j Κανονικοποίηση: διαίρεση συντελεστών ανάλυσης jµε Αποδεδειγµένα βέλτιστη για το Ολικό Τετραγωνικό Σφάλµα (L ) υστυχώς, αυτή η µέθοδος δεν παρέχει εγγυήσεις ποιότητας της προσέγγισης για: Ατοµικές ανακατασκευές τιµών Ατοµικά αθροίσµατα εύρους 3

Το Πρόβληµα µε τις Συµβατικές Συνόψεις Παράδειγµα δεδοµένων και συνόψεως ( D =16, B=8) Πάνω από,000% σχετικό σφάλµα! Ακριβές! Αρχικές Τιµές 17 71 87 31 59 3 43 99 100 4 0 58 30 88 7 130 Προσεγγίσεις 65 65 65 65 65 65 65 65 100 4 0 58 30 88 7 130 Προσέγγιση = 195, αληθείς τιµές: d(0:)=85, d(3:5)=93! Μεγάλη διακύµανση στην ποιότητα των προσεγγίσεων Αιτία: Ελαχιστοποίηση Ολικού Μέτρου Σφάλµατος L Απουσία εγγυήσεων για ατοµικά σφάλµατα Λύση: Περικοπή για Μέτρα Μεγίστου Σφάλµατος Μέτρα Σφάλµατος παρέχοντα εγγυήσεις για όλες τις ανακατασκευασµένες τιµές: Μέγιστο Απόλυτο Σφάλµα max i { dˆ d } i Μέγιστο Σχετικό Σφάλµα µε όριο(για την αποφυή κυριαρχήσεως των µικρών τιµών) dˆ i di max i max{ di, s} i Στόχευση στην ελαχιστοποίηση αυτών των µέτρων 4

Προηγούµενη Πρόταση: Βέλτιστη Περικοπή για Μέτρα Μεγίστου Σφάλµατος [GK, PODS 04] Βασισµένη σε υναµικό Προγραµµατισµό Αναδροµική συνάρτηση που υπολογίζει ελάχιστο δυνατό µέγιστο σφάλµα για τα υποδένδρα ενός συντελεστή δεδοµένου του διαθέσιµου χώρου Βέλτιστη κατανοµή διαθέσιµου χώρου b µεταξύ των υποδένδρων ενός κόµβουκαιτουκόµβου του ίδιου. Όµως: Απαγορευτική Πολυπλοκότητα: ( BN log N ) ( BN ) O στον χρόνο O στον χώρο Μη εφαρµόσιµη για τον σκοπό της Αδύνατη σε Περιβάλλον Ροής εδοµένων Πρόκληση: Σχεδίαση αποδοτικών σχηµάτων περικοπής, χαµηλής πολυπλοκότητας, που επιτυγχάνουν ανταγωνιστικά αποτελέσµατα σε σχέση µε την βέλτιστη λύση. 5

Λύση: Άπληστη Περικοπή για Μέτρα Μεγίστου Σφάλµατος Ιδέα: Άπληστη λύση που διαλέγει τον καλύτερο επόµενο συντελεστή που θα διαγράψει βήµα προςβήµα Κάθε κόµβος του δένδρου σφάλµατος αποθηκεύει το Μέγιστο υνάµει Σφάλµα που θα δηµιουργηθεί αν ο συντελεστής διαγραφεί: Για Απόλυτο Σφάλµα: Για Σχετικό Σφάλµα: MA MR = = max d j leaves max d j leaves { err δ c } Σωρός επιστρέφει κόµβο Ελάχιστου Μεγίστου υνάµει Σφάλµατος Για Απόλυτο Σφάλµα: 4 τιµές Max και Min του Συσσωρευµένου Σφάλµατος στους κόµβους Για Σχετικό Σφάλµα: Συσσωρευµένο Σφάλµα στα φύλλα Σωροί επιστρέφοντες φύλλο Μεγίστου υνάµει Σφάλµατος για κάθε κόµβο j j { err δ c max ( d, S )} j j j Λύση: Άπληστη Περικοπή για Μέτρα Μεγίστου Σφάλµατος Μετά από κάθε διαγραφή: Αλλαγές στο Συσσωρευµένο Σφάλµα διαδίδονται στο δένδρο Για κάθε επηρεαζόµενο κόµβο: Για Απόλυτο Σφάλµα: Ενηµέρωση 4 τιµών Max, Min Συσσωρευµένου Σφάλµατος Υπολογισµός Νέου Μεγίστου υνάµει Απολύτου Σφάλµατος ως: MA max = max max l r c c,, l min c, r min c Για Σχετικό Σφάλµα: Ενηµέρωση Σωρού Απογόνων Επιστροφή Νέου Μεγίστου υνάµει Σχετικού Σφάλµατος από Σωρό Ενηµέρωση Ολικού Σωρού συντελεστών 6

Παράδειγµα (απόλυτο σφάλµα) Πρώτα διώχνουµε τον συντελεστή -1 ιάδοση σφάλµατος Έπειτα φεύγει το συντελεστής µε δυνάµει µέγιστο σφάλµα 3 Κ.ο.κ. 4-1 - -3 - - 6-7 -4 - - - - - 11-1 -6 8-6 6 10 1-1 -11-3 1-31 -1-1 -11-1 -3 Ανάλυση Πολυπλοκότητας Αλγόριθµος για Απόλυτο Σφάλµα : Χρόνος: O(Nlog N) Χώρος: O(N) Αλγόριθµος για Σχετικό Σφάλµα : Χρόνος: O(Nlog 3 N) Χώρος: O(NlogN) 7

Επέκταση σε Ρέοντα εδοµένα Κύρια Περιοχή Εφαρµογών Προταθείσες µέθοδοι µη εφαρµόσιµες Παραδοχή: O(B ) διαθέσιµη µνήµη Επιπλέον Πρόβληµα Πρόβληµα: Επέκταση προταθεισών µεθόδων Εισάπαξ ολική διαδικασία Κατασκευή και Περικοπή του δένδρου ταυτόχρονα Λύση για το Απόλυτο Σφάλµα Μετά τα πρώτα B τιµές, ένα ζεύγος συντελεστών αποβάλλεται για κάθε νέο ζεύγος δεδοµένων Σκοπιά στο µέχρι τούδε κατασκευαµένο δένδρο Ανώτερο επίπεδο δένδρου για κάθε δύναµη του #δεδοµένων οµή Μέτωπο αποθηκεύει: Κρεµόµενους συντελεστές Μέση τιµή για το κρεµόµενο υποδένδρο Πληροφορία Σφάλµατος από διαγεγραµµένα ορφανά ιάδοση Σφάλµατος όπως στην στατική περίπτωση, µε παραπάνω λεπτοµέρειες για την προς τα πάνω διάδοση λόγω αραιότητας του δένδρου 8

Παράδειγµα: Κλασικό ένδρο Σφάλµατος ένδρο Σφάλµατος Μέτωπο -4-8 -3 - - -1-7 3 7-4 - 8 1 5 9 3 9-5 5 13 13 17 14-9 7 7 3... Ροή εδοµένων Παράδειγµα: ένδρο Αδελφιών ένδρο Σφάλµατος Μέτωπο -4 8-3 -1 7 3 7-4 - 8 1 5 9 3 9-5 5 13 13 17 14-9 7 7 3... Ροή εδοµένων 9

Παράδειγµα : B = 6, µετά από 6 τιµές ένδρο Σφάλµατος Μέτωπο 4 3 7-4 9 9 3 9-5 5 13... Ροή εδοµένων Παράδειγµα : B = 6, µετά από 8 τιµές ένδρο Σφάλµατος Μέτωπο -4 8-3 4 3 7-4 - 9 9 3 9-5 5 13 13 17... Ροή εδοµένων 10

Παράδειγµα : B = 6, µετά από 10 τιµές ένδρο Σφάλµατος Μέτωπο -4 8-3 - 7 8 6 9 3 9-5 5 13 13 17 14 -... Ροή εδοµένων Παράδειγµα : B = 6, µετά από 1 τιµές ένδρο Σφάλµατος Μέτωπο -4 8-3 7 7 8-9 3 9-5 5 13 13 17 14-9 7... Ροή εδοµένων 11

Παράδειγµα : B = 6, µετά από 14 τιµές ένδρο Σφάλµατος Μέτωπο -4 8 7 7 8 5 9 3 9-5 5 13 13 17 14-9 7 7 3 Ροή εδοµένων Παράδειγµα: B = 6, µετά το συµπλήρωµα 7 ένδρο Σφάλµατος 1-4 1 7 8 4 4 11-3 1 1 1 1 15-1 7 7 5 5 Ανακατασκευή 1

Λύση για το Σχετικό Σφάλµα Ανάλογη Επέκταση αδύνατη Λύση: Ευρετικές Τεχνικές Εκτιµήτρια του MR βασιµένη σε: 4 ποσότητες όπως για Απόλυτο Σφάλµα (µε παρονοµαστές) Ελάχιστες Απόλυτες Τιµές σε κάθε υποδένδρο (µε σφάλµατα) Μια τιµή δείγµα (µε σφάλµα) για κάθε υποδένδρο, αρχικοποιούµενηωςελάχιστηαπόλυτητιµή, µεταβαλλόµενη από της διαδικασίες διάδοσης σφάλµατος όταν άλλη τιµή δώσει µεγαλύτερο σχετικό σφάλµα Ευρετική Εκτίµηση ως το Μέγιστο Σχετικό Σφάλµα µεταξύ των 8 παραπάνω θέσεων Πειραµατικά Αποτελέσµατα Χρόνος, B = N / 16, Σχετικό Σφάλµα 10000000 1000000 100000 OPT GSTA GSTR CON GSTA- time(msec) 10000 1000 100 10 3 18 51 048 819 3768 13107 N 13

Πειραµατικά Αποτελέσµατα Ποιότητα, Απόλυτο Σφάλµα (µετρητές συχνότητας), N = 360 Maximum Absolute Error 1400 100 1000 800 600 400 00 OPT GSTA GSTR CON 0 0 30 40 50 60 70 80 90 B Πειραµατικά Αποτελέσµατα Ποιότητα, Σχετικό Σφάλµα (µετρητές συχνότητας), N = 360 Maximum Relative Error 1. 1 0.8 0.6 0.4 0. OPT GSTA GSTR CON GSTA- 0 0 30 40 50 60 70 80 90 B 14

Πειραµατικά Αποτελέσµατα Κλιµακωσιµότητα, Απόλυτο Σφάλµα (µετρητές φωτονίων), N = 16K Maximum Absolute Error 14 1 10 8 6 4 GSTA GSTR CON 0 300 400 500 600 700 800 900 1000 1100 100 1300 1400 1500 B Πειραµατικά Αποτελέσµατα Κλιµακωσιµότητα, Σχετικό Σφάλµα (µετρητές φωτονίων), N = 16K Maximum Relative Error 1.8 1.6 1.4 1. 1 0.8 0.6 0.4 0. 0 GSTA GSTR CON GSTA- 100 300 500 700 900 1100 1300 1500 B 15

Πειραµατικά Αποτελέσµατα Κλιµακωσιµότητα, Απόλυτο Σφάλµα (θερµοκρασίες), B = N / 16 Maximum Absolute Error.5 1.5 1 0.5 GSTA GSTR CON 0 104 048 4096 819 16384 3768 65536 13107 N Πειραµατικά Αποτελέσµατα Κλιµακωσιµότητα, Σχετικό Σφάλµα (θερµοκρασίες), B = N / 16 Maximum Relative Error 0.09 0.08 0.07 0.06 0.05 0.04 GSTA GSTR CON GSTA- 0.03 0.0 104 048 4096 819 16384 3768 65536 13107 N 16

Συµπεράσµατα & Μελλοντικές Κατευθύνσεις Επιτευξιµότητα Κυµατιδιακών Συνόψεων µε σχεδόν βέλτιστες Εγγυήσεις Μεγίστου Σφάλµατος και σχεδόν γραµµικό κόστος για Στατικά και Ρέοντα εδοµένα Επέκταση σε Πολυδιάστατα Κυµατίδια; Εναλλακτικές Ευρετικές για το Σχετικό Σφάλµα; Μεταβλητές Τιµές Συντελεστών; Θεωρητική Τεκµηρίωση; Αναφορές Y. Matias, J. S. Vitter, and M. Wang. Wavelet-based histograms for selectivity estimation. SIGMOD 1998 J. S. Vitter and M. Wang. Approximate computation of multidimensional aggregates of sparse data using wavelets. SIGMOD 1999 K. Charabarti, M. Garofalais, R. Rastogi, and K. Shim. Approximate query processing using wavelets. VLDB Journal 001 M. Garofalais and A. Kumar. Deterministic wavelet thresholding for maximum-error metrics. PODS 004 A. Gilbert, Y. Kotidis, S. Muthurishnan and Martin Strauss. Surfing Wavelets on Streams: One-Pass Summaries for Approximate Aggregate Queries. VLDB 001 17

Ευχαριστώ! Ερωτήσεις; 18