Μια συνάρτηση κατακερματισμού (hash function) h απεικονίζει κλειδιά ενός δοσμένου τύπου σεακεραίουςενόςσταθερούδιαστήματος [0,N 1]όπουΝτομέγεθοςτουπίνακα. Πχ: Συναρτήσεις Κατακερματισμού και Πίνακες Κατακερματισμού h(x) = x% N είναι μια συνάρτηση κατακερματισμού για ακέραια κλειδιά με σκοπό την ομοιόμορφη διασποράτωνκλειδιώνxστοπεδίο[0,n 1]. Ο ακέραιος h(x) ονομάζεται τιμή κατακερματισμού (hash value) του κλειδιού x. h(13)=13%10->3 h(23)=23%20->3 Μια σύγκρουση (collision) συμβαίνει όταν δύο κλειδιά του λεξικού έχουν την ίδια τιμή κατακερματισμού(3). Σχήματα χειρισμού συγκρούσεων: Chaining: τα συγκρουόμενα αντικείμενα αποθηκεύονται σε ακολουθία. Open addressing: τα συγκρουόμενα αντικείμενα τοποθετούνται σε διαφορετικά κελιά του πίνακα. VK 38
Open addressing Linear Probing Γραμμική διερεύνηση Το Linear probing χειρίζεται τις συγκρούσεις τοποθετώντας το συγκρουόμενο αντικείμενο στο επόμενο (κυκλικά) διαθέσιμο κελί του πίνακα. Κάθε κελί του πίνακα που επιθεωρείται αναφέρεται ως probe. Συγκρουόμενα αντικείμενα συσσωρεύονται, με συνέπεια μελλοντικές συγκρούσεις να προκαλούν μεγαλύτερες ακολουθίες από probes. Πχ: h(x)=x%13 Εισαγωγήτων8κλειδιών18,41,22, 44, 59, 32, 31,73σεαυτήτηνσειρά hashvalues 5, 2, 9, (5), 7, (6),(5),(8) 6, 7, (6), 8, 10,11 A[18%13]=5 0 1 2 3 4 5 6 7 8 9 10 11 41 18 44 59 32 22 31 73 11 12 To διάστημα μεταξύ των θέσεων είναι σταθερό (συνήθως 1). VK 39
Open addressing Double Hashing Διπλός Κατακερματισμός Το Double hashing χρησιμοποιεί μια δευτερεύουσα συνάρτηση κατακερματισμού d(k) και χειρίζεται τις συγκρούσεις τοποθετώντας το αντικείμενο στο πρώτο διαθέσιμο κελί από τις σειρές (i+ jd(k)) % N για j = 0, 1,, N 1 Σε ένα πίνακα κατακερματισμού που χειρίζεται συγκρούσεις με double hashing, συγκρουόμενα αντικείμενα συσσωρεύονται, με συνέπεια μελλοντικές συγκρούσεις να προκαλούν μεγαλύτερες ακολουθίες από probes. Πχ: Ν=13 (πρώτος αριθµός) h(x) = x % 13 d(x) = 7 - x % 7 VK 40
JAVA & Hashing To πακέτο java.utilπεριέχει την κλάση Hashtableη οποία υλοποιεί γενικέςτεχνικές κατακερματισμού αντιστοιχίζοντας κλειδιά σε τιμές. Ένα αντικείμενο Hashtable έχει δύο παραμέτρους που επηρεάζουν την λειτουργία του: αρχική χωρητικότητα (initialcapacity) παράγοντα φόρτου (load factor). Η αρχική χωρητικότητα ορίζει το πλήθος των στοιχείων που μπορεί να αποθηκευτεί στον πίνακα κατά την στιγμή της δημιουργίας του. Ο παράγοντας φόρτου είναι ένα μέτρο που δείχνει πόσο επιτρέπεται να γεμίσει ο πίνακας πριν αυξηθεί αυτόματα η χωρητικότητά του. Όταν οι εισαγωγές στον πίνακα κατακερματισμού ξεπεράσουν το γινόμενο της τρέχουσας χωρητικότητας επί τον παράγοντα φόρτου, η χωρητικότητα αυξάνεται καλώντας της μέθοδο rehash. Η δημόσια (public) κλάση Hashtable διαθέτει τους δομητές: public Hashtable() public Hashtable(int size) public Hashtable(int size, float load) throws IllegalArgumentException που δημιουργούν ένα πίνακα κατακερματισμού, θέτοντας την αρχική του χωρητικότητα (ή αφήνοντας το προκαθορισμένο μέγεθος που είναι 101) και ένα παράγοντα φόρτου (προκαθορισμένο 0.75). Στην πράξη, το hashing είναι πολύ γρήγορο αν ο παράγοντας φόρτου(load factor) δεν είναι κοντά στο 100%. LF=Keys/N ( 0<= LF <1) VK 41
Chaining Σε κάθε θέση του πίνακα αντιστοιχεί μια συνδεδεμένη λίστα. Eστω πίνακας Ν=10θέσεων: ΗΤ[10] και έστω έχω και 10 κλειδιά. Συνάρτηση h(x) = x% 10 33, 41, 53, 74, 87, 127, 144, 154, 178, 199 3 1 3 4 7 7 4 4 8 9 insert (53) if ( isfull() ) rehash() HT [53%10].insertLast(53) boolean contains (53) return HT[53%10].contains(53) remove (53) if (! contains(53) ) return; tmpl= HT [53%10] for (int i=0; i<s; i++){ tmp=tmpl.removefirst(); if (! tmp.equals(53) ) tmplist.insertlast(tmp); } VK 42
HT Rehashing Μεταβάλλει το µέγεθος του πίνακα κατακερµατισµού. Καλείται αυτόµαταόταν το πλήθος των κλειδιών ξεπεράσει την χωρητικότητα και τον παράγοντα φόρτου. int size() = 10 // κλειδιά return sum(ητ[i].size()) boolean isfull () return ((double) ( size() /HT.length ) > maxlf) maxlf=0.7 7/10,στο 8 ο κλειδί γίνεται rehash rehash () nsize=2* HT.length OldHT=HT HT = new SimpleLinkedList[ nextprime(s*2) ]; for (int i = 0; i< HT.length; i++) { //buildνέο HT HT[ i] = new SimpleLinkedList( ); while(! oldht[i].isempty() ) { //για κάθε λίστα Object obj = oldarray[i].removelast(); HT[ obj.hashcode()%ht.length].insertlast(obj); } } VK 43