Εισαγωγή Εξόρυξη από Γραφήματα Γράφημα G(V, E) u i V, (u i, u j ) E Ετικέτα l(u i ), l(u i, u j ) Επέκταση της εξόρυξης κανόνων συσχέτισης για τον εντοπισμό συχνών υπο-γραφημάτων s t t Γράφημα με ετικέτες Οι διαφάνειες στηρίζονται στο P.-N. Tn, M.Stinh, V. Kum, «Intoution to Dt Mining», Aison Wsly, 26 Εξόρυξη Δεδομένων: Ακ. Έτος 26-27 ΓΡΑΦΗΜΑΤΑ ΚΑΙ ΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 2 Εισαγωγή Εισαγωγή Εφαρμογές: W Mining: Γράφος (w owsing ttns) Κόμβοι (w gs) Ακμές (hylinks) Υπολογιστική Χημεία Γράφος (stutu o hmil omouns) Κόμβοι (toms, ions) Ακμές (ons) Rsh Homg Εφαρμογές: ίκτυα Υπολογιστών: Γράφος (omut ntwok) Κόμβοι (omuts, svs) Ακμές (intonntions) Smnti W Γράφος (olltions o XML oumnts) Κόμβοι (XML lmnts) Ακμές (nthil) Bioinomtis Γράφος (otin stutus) Κόμβοι (mino is) Ακμές (ontt siu) Atiiil Intllign Dtss Dt Mining Εξόρυξη Δεδομένων: Ακ. Έτος 26-27 ΓΡΑΦΗΜΑΤΑ ΚΑΙ ΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 3 Εξόρυξη Δεδομένων: Ακ. Έτος 26-27 ΓΡΑΦΗΜΑΤΑ ΚΑΙ ΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 4 Εισαγωγή Γραφήματα: Ορισμοί Asiin Yst otin inttion ntwok om H. Jong t l Ntu 4, 4 (2) Υπο-γράφημα G (V, E ) υπογράφημα του G(V, E): V' V E E G S G s t t s t Γράφημα Υπογράφημα Intnt Co-utho ntwok Εξόρυξη Δεδομένων: Ακ. Έτος 26-27 ΓΡΑΦΗΜΑΤΑ ΚΑΙ ΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 5 Εξόρυξη Δεδομένων: Ακ. Έτος 26-27 ΓΡΑΦΗΜΑΤΑ ΚΑΙ ΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 6
Εξόρυξη Δεδομένων: Ακ. Έτος 26-27 ΓΡΑΦΗΜΑΤΑ ΚΑΙ ΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 7 Γραφήματα: Ορισμοί Εξόρυξη Συχνών Υπογραφημάτων Έστω μια συλλογή από γραφήματα SG, η υποστήριξη ενός υπογραφήματος g είναι το ποσοστό όλων των γραφημάτων του SG που περιέχουν το g ως υπογράφημά τους { Gi g SGi, Gi SG} s( g) SG Εξόρυξη Συχνών Υπογραφημάτων Έστω ένα σύνολο γραφημάτων SG και ένα κατώφλι υποστήριξης minsu Βρεςόλαταυπογραφήματαg τέτοια ώστε s(g) minsu Εξόρυξη Δεδομένων: Ακ. Έτος 26-27 ΓΡΑΦΗΜΑΤΑ ΚΑΙ ΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 8 Εξόρυξη Συχνών Υπογραφημάτων Εξόρυξη Συχνών Υπογραφημάτων Θα εστιάσουμε σε μη κατευθυνόμενα, συνδεδεμένα γραφήματα Μπορούμε να ακολουθήσουμε τη ut-o μέθοδο, ηλαδή παρήγαγε όλ τ πιθανά υπογραφήματα Υπολόγισε την υποστήριξη του καθενός Κράτησε μόνο όσους έχουν υποστήριξη minsu Μέγεθος του sh s; i ( )2 i i( i ) / 2 Επιλογή i από κόμβους ιαφορετικές συνδέσεις, μέγιστος αριθμός για μη κατευθυνόμενο είναι i(i-)/2 (πλήρως συνδεδεμένος) Πολύ μεγάλος αριθμός, πχ για 7, αριθμός στοιχειοσυνόλων, 2 28, αριθμός γραφημάτων 2,35.62! Κάποια βέβαια, μη συνδεδεμένα άρα (σχετικά) μικρότερος αριθμός Εξόρυξη Δεδομένων: Ακ. Έτος 26-27 ΓΡΑΦΗΜΑΤΑ ΚΑΙ ΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 9 Εξόρυξη Δεδομένων: Ακ. Έτος 26-27 ΓΡΑΦΗΜΑΤΑ ΚΑΙ ΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ Εξόρυξη Συχνών Υπογραφημάτων Εξόρυξη Συχνών Υπογραφημάτων Παράδειγμα Ετικέτες για τις ακμές {, } Ένα στοιχείο μόνο μια φορά σε ένα στοιχειοσύνολο, ενώ η ετικέτα ενός κόμβου πολλές φορές σε ένα γράφημα Για το ίδιο ζευγάρι κόμβων, έχουμε διαφορετικές επιλογές για την ετικέτα των ακμών τους Εξόρυξη Δεδομένων: Ακ. Έτος 26-27 ΓΡΑΦΗΜΑΤΑ ΚΑΙ ΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ Εξόρυξη Δεδομένων: Ακ. Έτος 26-27 ΓΡΑΦΗΜΑΤΑ ΚΑΙ ΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 2
Εξόρυξη Δεδομένων: Ακ. Έτος 26-27 ΓΡΑΦΗΜΑΤΑ ΚΑΙ ΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 3 Αλγόριθμος βασισμένος στον ioi Αλγόριθμος βασισμένος στον ioi Παράδειγμα: οσοληψίες ως Γραφήματα Μπορούμε να χρησιμοποιήσουμε έναν αλγόριθμο βασισμένο στον ioi όπως στα συχνά στοιχειοσύνολα; Ηαρχήioi ισχύει: γράφημα συχνό > υπογραφήματα του συχνά Γραφήματα ως δοσοληψίες, πως; G G2 G3 Στοιχείο: τριάδα (κόμβος, κόμβος2, ακμή) (l(u), l(u2), l()) Πλάτος δοσοληψίας: αριθμός των ακμών ουλεύει μόνο αν οι τριάδες είναι μοναδικές (,,) (,,) (,,) (,,) (,,) (,,) (,,) G G2 G3 G3 Εξόρυξη Δεδομένων: Ακ. Έτος 26-27 ΓΡΑΦΗΜΑΤΑ ΚΑΙ ΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 4 Αλγόριθμος βασισμένος στον ioi Αλγόριθμος βασισμένος στον ioi Επίσης, Βήμα : Βρες τα συχνά -υπογραφήματα Βήμα 2: Επανέλαβε μέχρι να μην παράγονται νέα συχνά υπογραφήματα - Cnit Gntion: Χρησιμοποίησε τα k- υπογραφήματα για τη δημιουργία k-υπογραφημάτων Ψαλίδισμα Υποψηφίων - Cnit Puning: Ψαλίδισε τα k-υπογραφήματα που περιέχουν μη συχνά (k-)-γραφήματα Υπολογισμός Υποστήριξης - Suot Counting: Υπολόγισε την υποστήριξη των k-υπογραφημάτων που απομένουν Υπολογισμός Υποψηφίων - Cnit Elimintion: ιώξε τα υποψήφια k-υπογραφήματα που δεν είναι συχνά Aitionl onstints imos y ttn stutu Suot n onin not th only onstints Assumtion: unt sughs must onnt Στην πραγματικότητα δεν είναι τόσο απλό, πολλά περισσότερα θέματα Εξόρυξη Δεδομένων: Ακ. Έτος 26-27 ΓΡΑΦΗΜΑΤΑ ΚΑΙ ΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 5 Εξόρυξη Δεδομένων: Ακ. Έτος 26-27 ΓΡΑΦΗΜΑΤΑ ΚΑΙ ΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 6 Αλγόριθμος βασισμένος στον ioi Αλγόριθμος βασισμένος στον ioi Παράδειγμα: Σύνολο Γραφημάτων (,,) (,,) (,,) (,,) (,,) (,,) (,,) G G2 G3 G4 Παράδειγμα (συνέχεια) (,,) (,,) (,,) (,,) (,,) (,,) (,,) G G2 G3 G4 Εξόρυξη Δεδομένων: Ακ. Έτος 26-27 ΓΡΑΦΗΜΑΤΑ ΚΑΙ ΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 7 Εξόρυξη Δεδομένων: Ακ. Έτος 26-27 ΓΡΑΦΗΜΑΤΑ ΚΑΙ ΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 8
Εξόρυξη Δεδομένων: Ακ. Έτος 26-27 ΓΡΑΦΗΜΑΤΑ ΚΑΙ ΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 9 Υπο-γραφημάτων Υπο-γραφημάτων Από k- υπογραφήματα σε k-υπογραφήματα Αποφυγή δημιουργίας του ίδιου υπο-γραφήματος Τι είναι το k; Αριθμός κόμβων; Ανάπτυξη Κόμβων (Vtx Gowing) Αριθμός Ακμών; Ανάπτυξη Ακμών (Eg Gowing) Τα δύο k- υπογραφήματα που συγχωνεύουμε πρέπει να έχουν ένα κοινό k-2 υπογράφημα Το κοινό υπο-γράφημα ονομάζεται ο τους (o) Εξόρυξη Δεδομένων: Ακ. Έτος 26-27 ΓΡΑΦΗΜΑΤΑ ΚΑΙ ΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 2 ΣτονAioi: Η συγχώνευση δυο συχνών (k-)-στοιχειοσυνόλων δημιουργεί ένα υποψήφιο k-στοχιειοσύνολο Ανάπτυξη Κόμβων Συγχώνευση δύο υπογραφημάτων με k- κόμβους Οι οποίοι έχουν ένα κοινό υπο-γράφημα (πυρήνα) με k-2 κόμβους Στην εξόρθξη συχνών υπογραφημάτων (unt sugh mining): -> νέο υπογράφημα με k κόμβους Η συγχώνευση δυο συχνών (k-)-υπογραφημάτων μπορεί να δημιουργήσει παραπάνω από ένα υποψήφιο k-υπογράφημα Εξόρυξη Δεδομένων: Ακ. Έτος 26-27 ΓΡΑΦΗΜΑΤΑ ΚΑΙ ΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 2 Εξόρυξη Δεδομένων: Ακ. Έτος 26-27 ΓΡΑΦΗΜΑΤΑ ΚΑΙ ΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 22 Αναπαράσταση Γραφημάτων Ανάπτυξη Κόμβων 2 υπογραφήματα με 4 κόμβους και ένα κοινό 3-υπογράφημα G G2 G3 join(g,g2) G Πίνακας Γειτνίασης (Ajny Mtix) Εξόρυξη Δεδομένων: Ακ. Έτος 26-27 ΓΡΑΦΗΜΑΤΑ ΚΑΙ ΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 23 Εξόρυξη Δεδομένων: Ακ. Έτος 26-27 ΓΡΑΦΗΜΑΤΑ ΚΑΙ ΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 24
Εξόρυξη Δεδομένων: Ακ. Έτος 26-27 ΓΡΑΦΗΜΑΤΑ ΚΑΙ ΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 25 G G2 2 Ανάπτυξη Κόμβων Ο πίνακας γειτνίασης M συγχωνεύεται με τον πίνακα γειτνίαση Μ2 αν οι υπο-πίνακες που προκύπτουν σβήνοντας τη τελευταία γραμμή και στήλη του Μ και Μ2 είναι ίδιοι Εξόρυξη Δεδομένων: Ακ. Έτος 26-27 ΓΡΑΦΗΜΑΤΑ ΚΑΙ ΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 26 G G2 2 3 G3 join(g,g2) Ανάπτυξη Κόμβων Εξόρυξη Δεδομένων: Ακ. Έτος 26-27 ΓΡΑΦΗΜΑΤΑ ΚΑΙ ΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 27 Ανάπτυξη Κόμβων Ο πίνακας γειτνίασης M συγχωνεύεται με τον πίνακα γειτνίαση Μ2 αν και μόνο αν οι υπο-πίνακες που προκύπτουν σβήνοντας τη τελευταία γραμμή και στήλη του Μ και Μ2 είναι ίδιοι Το αποτέλεσμα είναι ο πίνακας γειτνίασης Μ3 που έχει τον ίδιο υπο-πίνακα επεκταμένος με τις τελευταίες γραμμές των Μ και Μ2 Αρκεί; Εξόρυξη Δεδομένων: Ακ. Έτος 26-27 ΓΡΑΦΗΜΑΤΑ ΚΑΙ ΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 28 2?? 3 Ανάπτυξη Κόμβων: Πολλαπλοί Υποψήφιοι Πρέπει να θεωρήσουμε όλες τις πιθανές ετικέτες για την ακμή (, ) > παραπάνω από ένα υποψήφιο υπογράφημα Εξόρυξη Δεδομένων: Ακ. Έτος 26-27 ΓΡΑΦΗΜΑΤΑ ΚΑΙ ΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 29 Συγχώνευση δύο υπογραφημάτων με k- ακμές Οι οποίοι έχουν ένα κοινό υπο-γράφημα -> νέο υπογράφημα με k ακμές Το νέο υπογράφημα μπορεί να μην έχει περισσότερους κόμβους από τα αρχικά Εξόρυξη Δεδομένων: Ακ. Έτος 26-27 ΓΡΑΦΗΜΑΤΑ ΚΑΙ ΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 3 Ενας συχνό k- υπογράφημα g συγχωνεύεται με ένα συχνό k- υπογράφημα g2 αν και μόνο όταν αφαιρέσουμε μια ακμή από το g προκύπτει ένα k-2 υπογράφημα που είναι τοπολογικά ισοδύναμο ή ισομορφικό (isomohi) με ένα k-2 υπογράφημα που προκύπτει αν αφαιρέσουμε μια ακμή από τον g2 Το αποτέλεσμα είναι ένα k υπογράφημα που προκύπτει αν προσθέσουμε την ακμή που αφαιρέσαμε από το g2 στο g Θα δούμε είναι η «τοπολογική ισοδυναμία»
Εξόρυξη Δεδομένων: Ακ. Έτος 26-27 ΓΡΑΦΗΜΑΤΑ ΚΑΙ ΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 3 (παράδειγμα) (παράδειγμα) G G2 G3 join(g,g2) G G2 G3 join(g,g2) Εξόρυξη Δεδομένων: Ακ. Έτος 26-27 ΓΡΑΦΗΜΑΤΑ ΚΑΙ ΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 32 (παράδειγμα) (παράδειγμα) Εξόρυξη Δεδομένων: Ακ. Έτος 26-27 ΓΡΑΦΗΜΑΤΑ ΚΑΙ ΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 33 Εξόρυξη Δεδομένων: Ακ. Έτος 26-27 ΓΡΑΦΗΜΑΤΑ ΚΑΙ ΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 34 Ενας συχνό k- υπογράφημα g συγχωνεύεται με ένα συχνό k- υπογράφημα g2 αν και μόνο όταν αφαιρέσουμε μια ακμή από το g προκύπτει ένα k-2 υπογράφημα που είναι τοπολογικά ισοδύναμο ή ισομορφικό (isomohi) με ένα k-2 υπογράφημα που προκύπτει αν αφαιρέσουμε μια ακμή από τον g2 υο γράφοι είναι τοπολογικά ισοδύναμοι αν υπάρχει μια - απεικόνιση μεταξύ των κόμβων τους Το αποτέλεσμα είναι ένα k υπογράφημα που προκύπτει αν προσθέσουμε την ακμή που αφαιρέσαμε από το g2 στο g Παρατήρηση: πολλά διαφορετικά υπογραφήματα όταν υπάρχουν στον πυρήνα «ισοδύναμες» διαφορετικές θέσεις για να τοποθετήσουμε την ακμή - δηλαδή, τοπολογικά ισοδύναμοι κόμβοι Εξόρυξη Δεδομένων: Ακ. Έτος 26-27 ΓΡΑΦΗΜΑΤΑ ΚΑΙ ΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 35 Εξόρυξη Δεδομένων: Ακ. Έτος 26-27 ΓΡΑΦΗΜΑΤΑ ΚΑΙ ΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 36
Εξόρυξη Δεδομένων: Ακ. Έτος 26-27 ΓΡΑΦΗΜΑΤΑ ΚΑΙ ΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 37 v v Εξόρυξη Δεδομένων: Ακ. Έτος 26-27 ΓΡΑΦΗΜΑΤΑ ΚΑΙ ΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 38 v v Εξόρυξη Δεδομένων: Ακ. Έτος 26-27 ΓΡΑΦΗΜΑΤΑ ΚΑΙ ΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 39 Εξόρυξη Δεδομένων: Ακ. Έτος 26-27 ΓΡΑΦΗΜΑΤΑ ΚΑΙ ΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 4 v v Όπου και να προστεθεί το ίδιο v,,, τοπολογικά ισοδύναμα (4 δυνατές θέσεις) Εξόρυξη Δεδομένων: Ακ. Έτος 26-27 ΓΡΑΦΗΜΑΤΑ ΚΑΙ ΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 4 Εξόρυξη Δεδομένων: Ακ. Έτος 26-27 ΓΡΑΦΗΜΑΤΑ ΚΑΙ ΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 42
Εξόρυξη Δεδομένων: Ακ. Έτος 26-27 ΓΡΑΦΗΜΑΤΑ ΚΑΙ ΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 43 v v v εν είναι ισοδύναμα Εξόρυξη Δεδομένων: Ακ. Έτος 26-27 ΓΡΑΦΗΜΑΤΑ ΚΑΙ ΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 44 v v v v Είναι ισοδύναμα Είναι ισοδύναμα Εξόρυξη Δεδομένων: Ακ. Έτος 26-27 ΓΡΑΦΗΜΑΤΑ ΚΑΙ ΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 45 Εξόρυξη Δεδομένων: Ακ. Έτος 26-27 ΓΡΑΦΗΜΑΤΑ ΚΑΙ ΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 46 v v v v5 Άρα, δυο δυνατές θέσεις Εξόρυξη Δεδομένων: Ακ. Έτος 26-27 ΓΡΑΦΗΜΑΤΑ ΚΑΙ ΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 47 Εξόρυξη Δεδομένων: Ακ. Έτος 26-27 ΓΡΑΦΗΜΑΤΑ ΚΑΙ ΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 48
Εξόρυξη Δεδομένων: Ακ. Έτος 26-27 ΓΡΑΦΗΜΑΤΑ ΚΑΙ ΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 49 v v v5 v5 Εξόρυξη Δεδομένων: Ακ. Έτος 26-27 ΓΡΑΦΗΜΑΤΑ ΚΑΙ ΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 5 Γενική Περίπτωση v v v5 εν είναι ισοδύναμα v5 Είναι τα και τοπολογικά ισοδύναμα; Εξόρυξη Δεδομένων: Ακ. Έτος 26-27 ΓΡΑΦΗΜΑΤΑ ΚΑΙ ΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 5 Εξόρυξη Δεδομένων: Ακ. Έτος 26-27 ΓΡΑΦΗΜΑΤΑ ΚΑΙ ΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 52 Περίπτωση, Συμβολισμός, αν τοπολογικά ισοδύναμα αν ίδιες ετικέτες Εξόρυξη Δεδομένων: Ακ. Έτος 26-27 ΓΡΑΦΗΜΑΤΑ ΚΑΙ ΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 53 Εξόρυξη Δεδομένων: Ακ. Έτος 26-27 ΓΡΑΦΗΜΑΤΑ ΚΑΙ ΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 54
Εξόρυξη Δεδομένων: Ακ. Έτος 26-27 ΓΡΑΦΗΜΑΤΑ ΚΑΙ ΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 55 Περίπτωση, Περίπτωση, Εξόρυξη Δεδομένων: Ακ. Έτος 26-27 ΓΡΑΦΗΜΑΤΑ ΚΑΙ ΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 56 Περίπτωση, Τέλος, μπορεί να έχουμε Πολλαπλούς Πυρήνες Εξόρυξη Δεδομένων: Ακ. Έτος 26-27 ΓΡΑΦΗΜΑΤΑ ΚΑΙ ΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 57 Εξόρυξη Δεδομένων: Ακ. Έτος 26-27 ΓΡΑΦΗΜΑΤΑ ΚΑΙ ΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 58 Αλγόριθμος βασισμένος στον ioi Ανάπτυξη Κόμβων και Ακμών Παρόλου που η ανάπτυξη ακμών παράγει πολλαπλούς υποψηφίους, γενικά τείνει να παράγει λιγότερα υπογραφήματα Βήμα : Βρες τα συχνά -υπογραφήματα Βήμα 2: Επανέλαβε μέχρι να μην παράγονται νέα συχνά υπογραφήματα - Cnit Gntion: Χρησιμοποίησε τα k- υπογραφήματα για τη δημιουργία k-υπογραφημάτων Ψαλίδισμα Υποψηφίων - Cnit Puning: Ψαλίδισε τα k-υπογραφήματα που περιέχουν μη συχνά (k-)-γραφήματα Υπολογισμός Υποστήριξης - Suot Counting: Υπολόγισε την υποστήριξη των k-υπογραφημάτων που απομένουν Υπολογισμός Υποψηφίων - Cnit Elimintion: ιώξε τα υποψήφια k-υπογραφήματα που δεν είναι συχνά Στην πραγματικότητα δεν είναι τόσο απλό, πολλά περισσότερα θέματα Εξόρυξη Δεδομένων: Ακ. Έτος 26-27 ΓΡΑΦΗΜΑΤΑ ΚΑΙ ΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 59 Εξόρυξη Δεδομένων: Ακ. Έτος 26-27 ΓΡΑΦΗΜΑΤΑ ΚΑΙ ΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 6
Εξόρυξη Δεδομένων: Ακ. Έτος 26-27 ΓΡΑΦΗΜΑΤΑ ΚΑΙ ΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 6 Ψαλίδισμα Υποψηφίων Ψαλίδισμα Υποψηφίων Ψαλίδισμα Υποψηφίων Μετά τη δημιουργία των k-υπογραφημάτων, ψαλλιδίζονται (un) τα υπογραφήματα που έxουν ένα k- υπογράφημα που δεν είναι συχνό Πως; Αφαίρεσε μια ακμή και έλεγξε αν το υπογράφημα που προκύπτει είναι συνδεδεμένο και συχνό Αν όχι, ψαλίδισε το k-υπογράφημα Ψαλίδισμα Υποψηφίων Έλεγξε αν το υπογράφημα που προκύπτει είναι συχνό Πως; Ταίριαξε το με τα συχνά k- υπογραφήματα Ισότητα μεταξύ γραφημάτων με βάση τοπολογική ισοδυναμία Εξόρυξη Δεδομένων: Ακ. Έτος 26-27 ΓΡΑΦΗΜΑΤΑ ΚΑΙ ΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 62 Παράδειγμα υο γράφοι είναι τοπολογικά ισοδύναμοι ή ισομορφικοί αν υπάρχει μια - απεικόνιση μεταξύ των κόμβων τους Εξόρυξη Δεδομένων: Ακ. Έτος 26-27 ΓΡΑΦΗΜΑΤΑ ΚΑΙ ΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 63 Εξόρυξη Δεδομένων: Ακ. Έτος 26-27 ΓΡΑΦΗΜΑΤΑ ΚΑΙ ΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 64 Έλεγχος για ισομορφισμό μεταξύ γραφημάτων γίνεται:. Duing nit gntion st, to tmin whth nit hs n gnt 2. Duing nit uning st, to hk whth its (k-)-sughs unt 3. Duing nit ounting, to hk whth nit is ontin within noth gh Κανονική Ετικέτα Ο τυπικός τρόπος αντιμετώπισης του ισομορφισμού είναι η απεικόνιση ενός γραφήματος σε μια μοναδική αναπαράσταση με μια διατεταγμένη συμβολοσειράς που ονομάζεται κώδικας (o) ή κανονική ετικέτα (nonil ll) Με την ιδιότητα: Αν δύο γραφήματα είναι ισομορφικά > ίδιοι κώδικες Εξόρυξη Δεδομένων: Ακ. Έτος 26-27 ΓΡΑΦΗΜΑΤΑ ΚΑΙ ΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 65 Εξόρυξη Δεδομένων: Ακ. Έτος 26-27 ΓΡΑΦΗΜΑΤΑ ΚΑΙ ΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 66
Εξόρυξη Δεδομένων: Ακ. Έτος 26-27 ΓΡΑΦΗΜΑΤΑ ΚΑΙ ΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 67 Κανονική Ετικέτα Κατασκευή του πίνακα γειτνίασης Κανονική Ετικέτα Οι διαφορετικές διατάξεις αντιστοιχούν στον πολλαπλασιασμό του πίνακα γειτνίασης με έναν κατάλληλο πίνακα διάταξης G Ενα γράφημα μπορεί να έχει παραπάνω από μια αναπαράσταση βασισμένη σε πίνακα γειτνίασης γιατί υπάρχουν διαφορετικοί τρόποι να διαταχθούν οι κόμβοι του (άρα και οι στήλες και οι γραμμές του πίνακα) Άρα κατασκευή όλων Πχ αλλαγή γραμμής (στήλης) με 3 γραμμή (στήλη) P3 Μ x P3 αλλαγή και 3 στήλης Μοναδιαίο αλλαγή <->3 γραμμής Εξόρυξη Δεδομένων: Ακ. Έτος 26-27 ΓΡΑΦΗΜΑΤΑ ΚΑΙ ΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 68 Κανονική Ετικέτα Κανονική Ετικέτα Πχ αλλαγή γραμμής (στήλης) με 3 γραμμή (στήλη) Στη συνέχεια κατασκευάζουμε την ετικέτα P T 3 Μοναδιαίο αλλαγή <->3 στήλης P T 3 x M αλλαγή και 3 γραμμής Εξόρυξη Δεδομένων: Ακ. Έτος 26-27 ΓΡΑΦΗΜΑΤΑ ΚΑΙ ΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 69 Εξόρυξη Δεδομένων: Ακ. Έτος 26-27 ΓΡΑΦΗΜΑΤΑ ΚΑΙ ΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 7 Στη συνέχεια κατασκευάζουμε την ετικέτα Sting: Cnonil: Παραγωγή όλων και επιλογή του λεξικογραφικά μεγαλύτερης συμβολοσειράς Επειδή ο πίνακας είναι συμμετρικός, μπορεί να κρατήσουμε μόνο το πάνω δεξιά τμήμα του A() A(2) B (5) B (7) B (6) B (8) A(3) A(4) A(2) A() B (7) B (6) B (5) B (8) A(3) A(4) A() A(2) A(3) A(4) B(5) B(6) B(7) B(8) A() A(2) A(3) A(4) B(5) B(6) B(7) B(8) A() A(2) A(3) A(4) B(5) B(6) B(7) B(8) A() A(2) A(3) A(4) B(5) B(6) B(7) B(8) Εξόρυξη Δεδομένων: Ακ. Έτος 26-27 ΓΡΑΦΗΜΑΤΑ ΚΑΙ ΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 7 Εξόρυξη Δεδομένων: Ακ. Έτος 26-27 ΓΡΑΦΗΜΑΤΑ ΚΑΙ ΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 72
Εξόρυξη Δεδομένων: Ακ. Έτος 26-27 ΓΡΑΦΗΜΑΤΑ ΚΑΙ ΠΑΓΚΟΣΜΙΟΣ ΙΣΤΟΣ 73 Υπολογισμός Υποστήριξης Πολύ ακριβή Για κάθε (k-) υπογράφημα λίστα με τα is των γραφημάτων στα οποία ανήκουν Τομή των λιστών, κάθε φορά που δημιουργείται κάποιο k- υπογράφημα