ΔΟΜΕΣ ΔΕΔΟΜΕΝΩΝ. Αλγόριθµοι Ένωσης-Εύρεσης (Union-Find) Κεφάλαιο 1. Ε. Μαρκάκης Επικ. Καθηγητής

Σχετικά έγγραφα
Δοµές Δεδοµένων. 2η Διάλεξη Αλγόριθµοι Ένωσης-Εύρεσης (Union-Find) Ε. Μαρκάκης. Βασίζεται στις διαφάνειες των R. Sedgewick K.

Πανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων ομές εδομένων

Δοµές Δεδοµένων. 3η Διάλεξη Στοιχειώδεις Δοµές Δεδοµένων: Πίνακες. Ε. Μαρκάκης

Δοµές Δεδοµένων. 7η Διάλεξη Αφηρηµένοι Τύποι Δεδοµένων. Ε. Μαρκάκης

Συνδετικότητα γραφήματος (graph connectivity)

ΔΟΜΕΣ ΔΕΔΟΜΕΝΩΝ. Στοιχειώδεις Δοµές Δεδοµένων Λίστες Κεφάλαιο 3 (3.3, 3.4, 3.7) Ε. Μαρκάκης Επικ. Καθηγητής

Βασικές Έννοιες Δοµών Δεδοµένων

ΔΟΜΕΣ ΔΕΔΟΜΕΝΩΝ. Στοιχειώδεις Δοµές Δεδοµένων Λίστες Κεφάλαιο 3 (3.3, 3.4, 3.7) Ε. Μαρκάκης Επικ. Καθηγητής

Δοµές Δεδοµένων. 5η Διάλεξη Λίστες και αρχές ανάλυσης αλγορίθµων. Ε. Μαρκάκης

ΔΟΜΕΣ ΔΕΔΟΜΕΝΩΝ. Στοιχειώδεις Δοµές Δεδοµένων Δοµικά Στοιχεία και Πίνακες Κεφάλαιο 3 (3.1 και 3.2) Ε. Μαρκάκης Επικ. Καθηγητής

Initialize each person to be free. while (some man is free and hasn't proposed to every woman) { Choose such a man m w = 1 st woman on m's list to

Κεφάλαιο 11 Ένωση Ξένων Συνόλων

Δοµές Δεδοµένων. 11η Διάλεξη Ταξινόµηση Quicksort και Ιδιότητες Δέντρων. Ε. Μαρκάκης

ΕΝΟΤΗΤΑ 9 ΕΝΩΣΗ ΞΕΝΩΝ ΣΥΝΟΛΩΝ ( ΟΜΕΣ UNION-FIND)

Δοµές Δεδοµένων. 4η Διάλεξη Στοιχειώδεις Δοµές Δεδοµένων: Πίνακες και Λίστες. Ε. Μαρκάκης

Δοµές Δεδοµένων. 9η Διάλεξη Ταξινόµηση - Στοιχειώδεις µέθοδοι. Ε. Μαρκάκης

ΔΟΜΕΣ ΔΕΔΟΜΕΝΩΝ. Εξωτερική Αναζήτηση και Β-δέντρα Κεφάλαιο 16. Ε. Μαρκάκης Επίκουρος Καθηγητής

Απλές Δοµές Δεδοµένων Στην ενότητα αυτή θα γνωρίσουµε ορισµένες απλές Δοµές Δεδοµένων και θα τις χρησιµοποιήσουµε για την αποδοτική επίλυση του προβλή

ΔΟΜΕΣ ΔΕΔΟΜΕΝΩΝ. Βασικές Ιδιότητες και Διάσχιση Κεφάλαιο 5 ( και ) Ε. Μαρκάκης Επίκουρος Καθηγητής

ΔΟΜΕΣ ΔΕΔΟΜΕΝΩΝ. Ταξινόµηση Mergesort Κεφάλαιο 8. Ε. Μαρκάκης Επίκουρος Καθηγητής

Δοµές Δεδοµένων. 18η Διάλεξη Ισορροπηµένα δέντρα. Ε. Μαρκάκης

Γράφημα. Συνδυαστικό αντικείμενο που αποτελείται από 2 σύνολα: Σύνολο κορυφών (vertex set) Σύνολο ακμών (edge set) 4 5 πλήθος κορυφών πλήθος ακμών

ΔΟΜΕΣ ΔΕΔΟΜΕΝΩΝ. Ουρές προτεραιότητας Κεφάλαιο 9. Ε. Μαρκάκης Επίκουρος Καθηγητής

Πρόβληµα : Πώς θα λύναµε αυτό το πρόβληµα αν είχαµε µόνο χαρτί και µολύβι, και κάποιος µας έλεγε τους αριθµούς προφορικά?

Heapsort Using Multiple Heaps

Ν!=1*2*3* *(N-1) * N => N! = (Ν-1)! * N έτσι 55! = 54! * 55

Τύποι Δεδομένων και Απλές Δομές Δεδομένων. Παύλος Εφραιμίδης V1.0 ( )

Δοµές Δεδοµένων. 14η Διάλεξη Δέντρα Δυαδικής Αναζήτησης. Ε. Μαρκάκης

ΠΛΗ111. Ανοιξη Μάθηµα 7 ο. έντρο. Τµήµα Ηλεκτρονικών Μηχανικών και Μηχανικών Υπολογιστών Πολυτεχνείο Κρήτης

ΔΟΜΕΣ ΔΕΔΟΜΕΝΩΝ. Ουρές προτεραιότητας Κεφάλαιο 9. Ε. Μαρκάκης Επίκουρος Καθηγητής

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ. Δοµές Δεδοµένων

Δοµές Δεδοµένων. 8η Διάλεξη: Ταξινόµηση. Ε. Μαρκάκης

Πανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων ομές εδομένων

ΠΛΗΡΟΦΟΡΙΚΗ Ι JAVA Τμήμα θεωρίας με Α.Μ. σε 3, 7, 8 & 9 22/11/07

Δοµές Δεδοµένων. 6η Διάλεξη Αναδροµικές Εξισώσεις και Αφηρηµένοι Τύποι Δεδοµένων. Ε. Μαρκάκης

ΔΟΜΕΣ ΔΕΔΟΜΕΝΩΝ. Πίνακες Συµβόλων Κεφάλαιο 12 ( ) Ε. Μαρκάκης Επίκουρος Καθηγητής

Δοµές Δεδοµένων. 16η Διάλεξη Κατακερµατισµός. Ε. Μαρκάκης

Δοµές Δεδοµένων. 13η Διάλεξη Πίνακες Συµβόλων. Ε. Μαρκάκης

5. Απλή Ταξινόμηση. ομές εδομένων. Χρήστος ουλκερίδης. Πανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων

Ενότητα 9 Ξένα Σύνολα που υποστηρίζουν τη λειτουργία της Ένωσης (Union-Find)

Οργάνωση αρχείων: πως είναι τοποθετηµένες οι εγγραφές ενός αρχείου όταν αποθηκεύονται στο δίσκο

Δοµές Δεδοµένων. 10η Διάλεξη Ταξινόµηση. E. Μαρκάκης

Δοµές Δεδοµένων. 17η Διάλεξη Ισορροπηµένα δέντρα. Ε. Μαρκάκης

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ. Δοµές Δεδοµένων

Ειδικά θέματα Αλγορίθμων και Δομών Δεδομένων (ΠΛΕ073) Απαντήσεις 1 ου Σετ Ασκήσεων

Διδάσκων: Παναγιώτης Ανδρέου

ΔΟΜΕΣ ΔΕΔΟΜΕΝΩΝ. Αρχές Ανάλυσης Αλγορίθµων Κεφάλαιο 2. Ε. Μαρκάκης Επικ. Καθηγητής

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ. ΑΣΚΗΣΗ 4 Σωροί, Γράφοι

Ελάχιστα Γεννητορικά ένδρα

Ενότητα 9 Ξένα Σύνολα που υποστηρίζουν τη λειτουργία της Ένωσης (Union-Find)

Επαναληπτικό ιαγώνισµα Πληροφορικής Γ Γυµνασίου Γιώργος Λιακέας Σχολικός Σύµβουλος Πληροφορικής Ερωτήσεις

Μία Μελέτη Περίπτωσης: Διήθηση

Ισορροπημένα Δένδρα. για κάθε λειτουργία; Ισορροπημένο δένδρο : Διατηρεί ύψος κάθε εισαγωγή ή διαγραφή

Διάλεξη 21η: Απλά Συνδεδεμένες Λίστες

Συλλογές, Στοίβες και Ουρές

Ουρά Προτεραιότητας (priority queue)

Δοµές Δεδοµένων. 15η Διάλεξη Δέντρα Δυαδικής Αναζήτησης και Κατακερµατισµός. Ε. Μαρκάκης

ΠΛΕ075: Προηγμένη Σχεδίαση Αλγορίθμων και Δομών Δεδομένων. Λουκάς Γεωργιάδης

Διάλεξη 12: Δέντρα ΙΙ Δυαδικά Δέντρα

Επίλυση Προβληµάτων µε Greedy Αλγόριθµους

ΚΕΦΑΛΑΙΟ Μηχανική Μάθηση

Κεφ.11: Ευρετήρια και Κατακερματισμός

Θεώρηµα: Z ( Απόδειξη: Περ. #1: Περ. #2: *1, *2: αποδεικνύονται εύκολα, διερευνώντας τις περιπτώσεις ο k να είναι άρτιος ή περιττός

HY118- ιακριτά Μαθηµατικά. Παράδειγµα. Από τα συµπεράσµατα στις υποθέσεις Αποδείξεις - Θεωρία συνόλων. Από τις υποθέσεις στα συµπεράσµατα...

Εισαγωγή. Γενική Εικόνα του Μαθήµατος. Το εσωτερικό ενός Σ Β. Εισαγωγή. Εισαγωγή Σ Β Σ Β. Αρχεία ευρετηρίου Κατάλογος συστήµατος Αρχεία δεδοµένων

2 Αποδείξεις. 2.1 Εξαντλητική µέθοδος. Εκδοση 2005/03/22. Υπάρχουν πολλών ειδών αποδείξεις. Εδώ ϑα δούµε τις πιο κοινές:

Δομές ελέγχου ροής προγράμματος

Αλγόριθμοι Ταξινόμησης Μέρος 2

Κεφάλαιο 10 Ψηφιακά Λεξικά

2.1. Εντολές Σχόλια Τύποι Δεδομένων

ΔΟΜΕΣ ΔΕΔΟΜΕΝΩΝ. Ταξινόµηση Quicksort Κεφάλαιο 7. Ε. Μαρκάκης Επίκουρος Καθηγητής

for for for for( . */

Δομές Δεδομένων. Καθηγήτρια Μαρία Σατρατζέμη. Τμήμα Εφαρμοσμένης Πληροφορικής. Δομές Δεδομένων. Τμήμα Εφαρμοσμένης Πληροφορικής

Εισαγωγή στους Αλγόριθµους. Αλγόριθµοι. Ιστορικά Στοιχεία. Ο πρώτος Αλγόριθµος. Παραδείγµατα Αλγορίθµων. Τι είναι Αλγόριθµος

Το εσωτερικό ενός Σ Β

Αναδροµή. Σε αυτήν την (βοηθητική) ενότητα θα µελετηθούν τα εξής : Η έννοια της αναδροµής Υλοποίηση και αποδοτικότητα Αφαίρεση της αναδροµής

Δομές Δεδομένων & Αλγόριθμοι

διεύθυνση πρώτου στοιχείου διεύθυνση i-οστού στοιχείου T t[n]; &t[0] είναι t &t[i] είναι t + i*sizeof(t)

ΠΛΗ111. Ανοιξη Μάθηµα 10 ο. Γράφοι. Τµήµα Ηλεκτρονικών Μηχανικών και Μηχανικών Υπολογιστών Πολυτεχνείο Κρήτης

υαδικά δέντρα αναζήτησης

Επεξεργασία Ερωτήσεων

ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ

Προγραµµατισµός 1 Ταξινόµηση - Αναζήτηση

ΕΠΛ131 Αρχές Προγραμματισμού

Στοιχεία Θεωρίας Γραφηµάτων (4) - έντρα

Μη γράφετε στο πίσω μέρος της σελίδας

Προγραµµατισµός Ι (ΗΥ120)

Αλγόριθμοι Ταξινόμησης Μέρος 4

HY118- ιακριτά Μαθηµατικά

HY118- ιακριτά Μαθηµατικά. Θεωρία γράφων / γραφήµατα. Τι έχουµε δει µέχρι τώρα. Υπογράφηµα Γράφοι

Δομές δεδομένων (2) Αλγόριθμοι

Αναδροµή (Recursion) ύο παρεξηγήσεις. Σκέψου Αναδροµικά. Τρίγωνο Sierpinski Μη αναδροµικός ορισµός;

Μονοπάτια και Κυκλώµατα Euler. Στοιχεία Θεωρίας Γραφηµάτων (3,4) Παραδείγµατα. Κριτήρια Υπαρξης.

Εισαγωγή στην επιστήµη των υπολογιστών. Υπολογιστές και Δεδοµένα Κεφάλαιο 3ο Αναπαράσταση Αριθµών

Στοιχειώδεις Δομές Δεδομένων

Αλγόριθµοι Τύπου Μείωσης Προβλήµατος

Διάλεξη 08: Λίστες ΙΙ Κυκλικές Λίστες

Αλγόριθµοι και Πολυπλοκότητα

Εισαγωγή στην επιστήµη των υπολογιστών. Αναπαράσταση Αριθµών

Αλγόριθµοι και Πολυπλοκότητα

Transcript:

ΔΟΜΕΣ ΔΕΔΟΜΕΝΩΝ Αλγόριθµοι Ένωσης-Εύρεσης (Union-Find) Κεφάλαιο 1 Ε. Μαρκάκης Επικ. Καθηγητής

Περίληψη Συνδετικότητα δικτύου Αφαιρέσεις (abstractions) Αφηρηµένη ένωση-εύρεση 1. Γρήγορη εύρεση 2. Γρήγορη ένωση 3. Σταθµισµένη γρήγορη ένωση 4. Σταθµισµένη γρήγορη ένωση µε συµπίεση µονοπατιών Σύνοψη 1 ου κεφαλαίου Δοµές Δεδοµένων 02-2

Προβλήµατα Συνδετικότητας Γράφος (graph): Ένα σύνολο από αντικείµενα (κόµβοι ή κορυφές) Πλευρές (σύνδεσµοι µεταξύ αντικειµένων) Αν έχουµε Ν αντικείµενα, τα ονοµατίζουµε συνήθως από 0 ως Ν-1 1 6 5 9 2 3 4 0 7 8 Δοµές Δεδοµένων 02-3

Προβλήµατα Συνδετικότητας Τα αντικείµενα µπορεί να απεικονίζουν: Κόµβους σε ένα δίκτυο υπολογιστών - δροµολογητές, πάροχοι δικτύου, κτλ (Internet graph) Ιστοσελίδες (web graph) Τρανζίστορ ενός µικροτσιπ Χρήστες του facebook (κοινωνικά δίκτυα) Πρωτείνες (βιολογικά δίκτυα για την αλληλεπίδραση πρωτεϊνών) Δοµές Δεδοµένων 02-4

Συνδετικότητα δικτύου Είσοδος: µία ακολουθία από ζεύγη ακεραίων Κάθε ακέραιος αντιστοιχεί σε κάποιο αντικείµενο Κάθε ζεύγος αντιπροσωπεύει µία υποψήφια σύνδεση που ίσως χρειάζεται να εγκαταστήσουµε Υποθέτουµε ότι αρχικά έχουµε ένα κενό γράφο όταν ξεκινάµε να διαβάζουµε τα ζεύγη Η συνδετικότητα είναι µεταβατική σχέση: Αν συνδέεται(p,q) και συνδέεται(q,r) τότε συνδέεται(p,r) Πρόβληµα: εντοπισµός των περιττών ζευγών (δλδ: τελικά ποιες συνδέσεις χρειάζεται να εγκαταστήσουµε) Ένα ζεύγος (p, q) είναι περιττό αν από τα ζεύγη που έχουν εξεταστεί πριν το (p, q), συνεπάγεται ότι συνδέεται(p,q). Δοµές Δεδοµένων 02-5

Συνδετικότητα δικτύου Έξοδος: Να τυπώνονται µόνο τα µη περιττά ζεύγη Προσοχή στο τι ακριβώς ζητάει το πρόβληµα! Δεν ζητάει το µονοπάτι ανάµεσα στα αντικείµενα Η εύρεση του µονοπατιού µπορεί να είναι πιο δύσκολη Δοµές Δεδοµένων 02-6

Παράδειγµα Είσοδος Έξοδος 3 4 3 4 4 9 4 9 8 0 8 0 2 3 2 3 5 6 5 6 2 9 5 9 5 9 7 3 7 3 7 5 5 6 1 6 5 9 2 3 4 7 0 8 Δοµές Δεδοµένων 02-7

Πιο µεγάλο παράδειγµα u v Συνδέεται το u µε το v? Δοµές Δεδοµένων 02-8

Αφαιρέσεις (Abstractions) Ποιες είναι οι βασικές λειτουργίες που χρειαζόµαστε? Απλό µοντέλο της φύσης της συνδεσιµότητας Χρειάζεται να αναπαραστήσουµε τα αντικείµενα 0 1 2 3 4 5 6 7 8 9 κόµβοι του γράφου Χρειάζεται να αναπαραστήσουµε σύνολα από αντικείµενα που συνδέονται µεταξύ τους (ανανεώνονται κατά τη διάρκεια του αλγορίθµου) 0 1 { 2 3 9 } { 5 6 } 7 { 4 8 } συνδεδεµένα υποσύνολα π.χ. το {2, 3, 9} αναπαριστά ένα συνδεδεµένο υποσύνολο (θα πρέπει να συνδέεται κάθε στοιχείο µε όλα τα υπόλοιπα στοιχεία του υποσυνόλου) Δοµές Δεδοµένων 02-9

Αφαιρέσεις (Abstractions) Ποιες είναι οι βασικές λειτουργίες που χρειαζόµαστε? Χρειάζεται να εκτελούµε: Ερωτήσεις εύρεσης: π.χ. τα 2 και 9 ανήκουν στο ίδιο σύνολο? Έτσι θα αποφασίζουµε αν ένα ζεύγος είναι περιττό Εντολές ένωσης: π.χ. συγχώνευσε τα υποσύνολα µε το 3 και το 8 (αν π.χ. το ζεύγος 3 8 δεν είναι περιττό) 0 1 { 2 3 9 } { 5 6 } 7 { 4 8 } (εγκατάσταση σύνδεσης µεταξύ 3 και 8) 0 1 { 2 3 4 8 9 } { 5 6 } 7 Δοµές Δεδοµένων 02-10

Αφαιρέσεις (Abstractions) Οι αλγόριθµοι ένωσης-εύρεσης (union-find) διαχειρίζονται αντικείµενα στα οποία αντιστοιχίζουµε τους ακεραίους 0 έως N-1 Αποκρύπτονται λεπτοµέρειες άσχετες µε την ένωση-εύρεση Οι ακέραιοι επιτρέπουν γρήγορη προσπέλαση στα αντικείµενα Χρήση ως δείκτες σε πίνακες 1 6 5 9 2 3 4 0 7 8 Δοµές Δεδοµένων 02-11

Συνδεδεµένα συστατικά Συνδεδεµένο συστατικό (connected component) = ένα σύνολο συνδεδεµένων σηµείων Κάθε εντολή ένωσης µειώνει τα συστατικά κατά ένα Είσοδος Έξοδος 3 4 3 4 4 9 4 9 8 0 8 0 2 3 2 3 5 6 5 6 2 9 5 9 5 9 7 3 7 3 Έχουµε 10 7 = 3 συστατικά 1 6 5 9 2 0 3 4 7 8 Δοµές Δεδοµένων 02-12

Αφηρηµένη ένωση-εύρεση Ιδέα της λύσης του προβλήµατός µας: Για κάθε νέο ζεύγος (p, q) που διαβάζουµε: Κάνε µία ερώτηση εύρεσης για να δούµε αν ήδη συνδέεται το p µε το q Αν ναι, τότε το (p, q) είναι περιττό ζεύγος (δεν τυπώνουµε, πάµε στο επόµενο) Αν όχι, το (p, q) δεν είναι περιττό: εκτέλεσε µία εντολή ένωσης για να ενώσουµε τα σύνολα που περιέχουν το p και το q Στόχος: Σχεδιασµός αποδοτικής δοµής δεδοµένων Παρατηρήσεις: Οι ευρέσεις και οι ενώσεις µπορούν να αναµειγνύονται Το πλήθος των εντολών ένωσης M µπορεί να είναι τεράστιο Το πλήθος των αντικειµένων N µπορεί να είναι τεράστιο Δοµές Δεδοµένων 02-13

Γρήγορη εύρεση (Quick Find) Δοµή δεδοµένων Χρήση πίνακα ακεραίων id[] µεγέθους N Ερµηνεία: τα p και q συνδέονται αν έχουν το ίδιο id Π.χ. i 0 1 2 3 4 5 6 7 8 9 id[i] 0 1 9 9 9 6 6 7 8 9 Συνδεδεµένα υποσύνολα: {0}, {1}, {2, 3, 4, 9}, {5, 6}, {7}, {8} Δοµές Δεδοµένων 02-14

Γρήγορη εύρεση (Quick Find) Υλοποίηση Εύρεσης: Προφανές! έλεγξε αν τα p και q έχουν το ίδιο id Π.χ. Αν (p,q) = (3,6), id[3]=9 και id[6]=6 άρα τα 3 και 6 δεν συνδέονται Υλοποίηση Ένωσης: Συγχώνευση των συστατικών των p και q Αλλαγή των καταχωρήσεων µε id[p] σε id[q] Π.χ. η ένωση των συστατικών που περιέχουν τα 3 και 6 αλλάζει τα id s σε: i 0 1 2 3 4 5 6 7 8 9 id[i] 0 1 9 9 9 6 6 7 8 9 i 0 1 2 3 4 5 6 7 8 9 id[i] 0 1 6 6 6 6 6 7 8 6 Δοµές Δεδοµένων 02-15

Γρήγορη εύρεση public class QuickF { public static void main(string[] args) { int N = Integer.parseInt(args[0]); int id[] = new int[n]; for (int i = 0; i < N ; i++) id[i] = i; // αρχικά καµία σύνδεση for( In.init();!In.empty(); ) { //όσο υπάρχει input int p = In.getInt(), q = In.getInt(); int t = id[p]; if (t == id[q]) continue; //περιττό ζεύγος for (int i = 0;i<N;i++) if (id[i] == t) id[i] = id[q]; Out.println(" " +p+""+q); } } } Δοµές Δεδοµένων 02-16

Γρήγορη εύρεση Πρόβληµα: η ένωση δεν είναι πολύ γρήγορη, µπορεί να αλλάζουν πολλά στοιχεία του πίνακα id[] πολύ συχνά Δοµές Δεδοµένων 02-17

Γρήγορη εύρεση Πόσο γρήγορη είναι η γρήγορη εύρεση; Μπορεί να πάρει MN βήµατα για M ενώσεις µε N αντικείµενα Αριθµητικό παράδειγµα Δίνονται 10 10 ζεύγη που συνδέουν Ν =10 9 αντικείµενα Με πρόχειρους υπολογισµούς για ένα σύγχρονο υπολογιστή η γρήγορη εύρεση µπορεί να χρειαστεί περίπου 300 χρόνια (λόγω των ενώσεων που απαιτούνται) Δοµές Δεδοµένων 02-18

Γρήγορη ένωση (Quick Union) Ιδέα: Απεικόνιση κάθε συνδεδεµένου συνόλου ως δέντρο Κάνει πολύ γρήγορη την ένωση µε αντίτιµο στην εύρεση Δοµή δεδοµένων Πίνακας ακεραίων id[] µεγέθους N Ερµηνεία: το id[i] είναι ο πατέρας του i (και όχι ένα απλό id όπως πριν) Η ρίζα στο δέντρο που βρίσκεται ο i είναι το id[id[ id[i] ]]] Σταµατάµε όταν id[j]=j (µόνο η ρίζα έχει πατέρα τον εαυτό της) i 0 1 2 3 4 5 6 7 8 9 id[i] 0 1 9 4 4 6 6 7 8 9 Δοµές Δεδοµένων 02-19

Γρήγορη ένωση (Quick Union) Υλοποίηση Εύρεσης: Έλεγξε αν τα p και q έχουν την ίδια ρίζα έστω π.χ. το (4, 9) Υλοποίηση Ένωσης: Συγχώνευση των συστατικών των p και q «Κρεµάµε» το δέντρο του p στη ρίζα του q i 0 1 2 3 4 5 6 7 8 9 id[i] 0 1 9 4 4 6 6 7 8 9 i 0 1 2 3 4 5 6 7 8 9 id[i] 0 1 9 4 9 6 6 7 8 9 Δοµές Δεδοµένων 02-20

Γρήγορη ένωση public class QuickU { public static void main(string[] args) { int N = Integer.parseInt(args[0]); int id[] = new int[n]; for (int i = 0; i < N ; i++) id[i] = i; for( In.init();!In.empty(); ) { int i, j, p = In.getInt(), q = In.getInt(); for (i = p; i!= id[i]; i = id[i]);// βρες ρίζα του p for (j = q; j!= id[j]; j = id[j]);// βρες ρίζα του q if (i == j) continue;//µε ίδια ρίζα συνδέονται id[i] = j; //αλλιώς, εντολή ένωσης Out.println(" " + p + " " + q); } } } Δοµές Δεδοµένων 02-21

Γρήγορη ένωση Πρόβληµα: µπορεί να διατρέξουµε πολλούς συνδέσµους Δοµές Δεδοµένων 02-22

Γρήγορη Ένωση Το πόσο ρηχά θα είναι τα δέντρα εξαρτάται από την είσοδο Είσοδος Έξοδος 7 6 7 6 6 5 6 5 5 4 5 4 4 3 4 3 3 2 3 2 2 1 2 1 1 0 1 0 7 5 Εδώ σε κάθε βήµα πρέπει να διατρέξουµε όλο το δέντρο για να βρούµε τη ρίζα (Ο(Ν) βήµατα για τις τελευταίες συνδέσεις) Δοµές Δεδοµένων 02-23

Γρήγορη ένωση Πόσο γρήγορη είναι η γρήγορη ένωση; Δεν είναι πολύ πιο γρήγορη από τη γρήγορη εύρεση Παρόµοια τάξη µεγέθους (εξαρτάται και από τη φύση της εισόδου) Μειονέκτηµα γρήγορης εύρεσης Η ένωση είναι αργή (διατρέχουµε όλο τον πίνακα) Τα δέντρα είναι ρηχά αλλά το κόστος της ένωσης είναι µεγάλο Μειονέκτηµα γρήγορης ένωσης Τα δέντρα µπορεί να έχουν βάθος. Χειρότερη περίπτωση: όταν το δέντρο που σχηµατίζεται είναι µία ευθεία γραµµή µε βάθος Ν-1 Η εύρεση είναι αργή (µπορεί να διατρέξουµε τον πίνακα) Για να γίνει η ένωση πρέπει πρώτα να κάνουµε την εύρεση Στόχος: ρηχά δέντρα αλλά µε µικρό κόστος! Δοµές Δεδοµένων 02-24

Σταθµισµένη γρήγορη ένωση Παραλλαγή της γρήγορης ένωσης Τροποποιούµε την ένωση για να κρατάµε τα δέντρα σχετικά ρηχά Παρακολουθούµε το µέγεθος κάθε δέντρου Χρήση ενός πρόσθετου πίνακα για να κρατάµε το µέγεθος Το µικρότερο δέντρο τοποθετείται κάτω από το µεγαλύτερο Το µέγεθος αναφέρεται στο σύνολο των κόµβων Παράδειγµα: αν διαβάσουµε το ζεύγος (3, 5) Η σταθµισµένη ένωση τοποθετεί το 6 κάτω από το 9 και όχι ανάποδα 0 1 9 6 7 8 2 4 5 3 Δοµές Δεδοµένων 02-25

Σταθµισµένη γρήγορη ένωση Τα δέντρα παραµένουν ρηχά Δοµές Δεδοµένων 02-26

Σταθµισµένη γρήγορη ένωση Υλοποίηση σε Java Σχεδόν ίδια µε τη γρήγορη ένωση Χρήση πρόσθετου πίνακα sz[] για το πλήθος κόµβων κάθε δέντρου Έχει νόηµα µόνο για τις ρίζες των δέντρων Υλοποίηση Εύρεσης: ίδια µε αυτή στη γρήγορη ένωση Υλοποίηση Ένωσης: παραλλαγή της γρήγορης ένωσης Συγχώνευση του µικρότερου δέντρου κάτω από το µεγαλύτερο Αρχικοποίηση όλων των δέντρων σε µέγεθος 1 Ενηµέρωση του πίνακα sz[] if (sz[i] < sz[j]) { id[i] = j; sz[j] += sz[i]; } else { } id[j] = i; sz[i] += sz[j]; Δοµές Δεδοµένων 02-27

Σταθµισµένη γρήγορη ένωση Απόδοση της σταθµισµένης γρήγορης ένωσης Εύρεση: χρόνος ανάλογος µε το βάθος των p και q Ένωση: σταθερός χρόνος αφού βρεθούν οι ρίζες Αποδεικνύεται ότι το βάθος είναι µέχρι logn (= log 2 N) Άρα εύρεση-ένωση είναι ανάλογες του logn Πολύ καλύτερη από τις προηγούµενες µεθόδους! (logn << N) Σταµατάµε εδώ ή µπορούµε να κάνουµε κάτι ακόµα καλύτερο; Μπορούµε: συµπίεση µονοπατιών! Για να βρούµε τη ρίζα διατρέχουµε ένα δέντρο Από τον κόµβο εκκίνησης ως τη ρίζα Σε κάθε βήµα συµπιέζουµε το δέντρο Τοποθετούµε τον τρέχοντα κόµβο κάτω από τη ρίζα Το δέντρο συµπιέζεται σε κάθε εύρεση Δοµές Δεδοµένων 02-28

Ένωση µε συµπίεση µονοπατιών Βασική υλοποίηση συµπίεσης µονοπατιών Προσθήκη δεύτερου βρόχου Κάνει τον πατέρα κάθε κόµβου ίσο µε τη ρίζα Απαιτεί δεύτερο πέρασµα της διαδροµής Απλούστερη υλοποίηση συµπίεσης µονοπατιών Κατά τη διάσχιση κάνουµε κάθε δεύτερο κόµβο να δείχνει στον πατέρα του πατέρα του Το δέντρο συµπιέζεται κατά το ήµισυ Στην πράξη η διαφορά είναι µικρή for (i = p; i!= id[i]; i = id[i]) id[i] = id[id[i]]; for (j = q; j!= id[j]; j = id[j]) id[j] = id[id[j]]; Δοµές Δεδοµένων 02-29

Ένωση µε συµπίεση µονοπατιών 1) 3) 2) Παραδείγµατα Παράδειγµα 1: σχετικά ρηχά δέντρα, προσθήκη του (1 6) Παράδειγµα 2: λίγο βαθιά δέντρα, προσθήκη του (6 8) Παράδειγµα 3: πολύ βαθιά δέντρα, µειώνεται το βάθος στο µισό περίπου Δοµές Δεδοµένων 02-30

Ένωση µε συµπίεση µονοπατιών Σύγκριση των αλγορίθµων F: γρήγορη εύρεση, U: γρήγορη ένωση W: σταθµισµένη γρήγορη ένωση P: µε πλήρη συµπίεση, H: µε ηµιδιπλασιασµό N M F U W P H 1000 3819 63 53 17 18 15 2500 12263 185 159 22 19 24 5000 21591 698 697 34 33 35 10000 41140 2891 3987 85 101 74 25000 162748 237 267 267 50000 279279 447 533 473 100000 676113 1382 1238 1174 Δοµές Δεδοµένων 02-31

Άλλες Εφαρµογές των µεθόδων Ένωσης- Εύρεσης Το παιχνίδι Hex [Piet Hein 1942, John Nash 1948, Parker Brothers 1962] Επεξεργασία Εικόνων Δοµές Δεδοµένων 02-32

Ανακεφαλαίωση των αλγορίθµων ένωσης - εύρεσης Τι κρατάµε από το 1 ο κεφάλαιο: Για κάθε πρόβληµα, αποσαφηνίζουµε πρώτα ποιες ακριβώς είναι οι απαιτήσεις (δεδοµένα εισόδου, έξοδος, κτλ) Σκεφτόµαστε ποιες είναι οι βασικές αφηρηµένες λειτουργίες που πρέπει να υποστηρίζει το πρόγραµµα που θα φτιάξουµε (στο παράδειγµα: εύρεση, ένωση) Φτιάχνουµε αρχικά µία απλή, έστω και µη αποδοτική, αργή υλοποίηση (όπως η QuickFind) Προσπαθούµε να βελτιώσουµε το χρόνο ή τη µνήµη βλέποντας πού υστερεί η αρχική µας υλοποίηση (stepwise refinement) 02-33

Ανακεφαλαίωση των αλγορίθµων ένωσης - εύρεσης Τελικά συµπεράσµατα για το παράδειγµα που είδαµε: Για Ν αντικείµενα και Μ ζεύγη στην είσοδο, Η γρήγορη εύρεση και η γρήγορη ένωση χρειάζονται χρόνο ανάλογο του ΜΝ στη χειρότερη περίπτωση η σταθµισµένη γρήγορη ένωση χρειάζεται χρόνο ανάλογο του ΜlogΝ στη χειρότερη περίπτωση η σταθµισµένη γρήγορη ένωση µε συµπίεση µονοπατιών τρέχει σε χρόνο «σχεδόν» ανάλογο του (Μ + Ν) Ο αλγόριθµος της σταθµισµένης γρήγορης ένωσης µε συµπίεση µονοπατιών τρέχει πιο γρήγορα σε ένα κινητό που υποστηρίζει Java από ότι ο αλγόριθµος της γρήγορης εύρεσης σε ένα supercomputer 02-34