privacy preserving data publishing - gr

Σχετικά έγγραφα
Εργαστήριο Ασφάλειας Πληροφοριακών και Επικοινωνιακών Συστημάτων Πανεπιστήμιο Αιγαίου. Μέτρα ανωνυμίας και τεχνικές διασφάλισης της Ιδιωτικότητας

Privacy - k-anonymity. Πιλαλίδου Αλίκη

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ

Ανωνυμοποίηση και ψευδωνυμοποίηση δεδομένων προσωπικού χαρακτήρα

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ

Εισαγωγικά στοιχεία Η σημασία της ανωνυμοποίησης

Εργαστήριο Ασφάλειας Πληροφοριακών και Επικοινωνιακών Συστημάτων Πανεπιστήμιο Αιγαίου

H ψευδωνυμοποίηση στον Γενικό Κανονισμό Προστασίας Δεδομένων

ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ. Κατηγοριοποίηση. Αριστείδης Γ. Βραχάτης, Dipl-Ing, M.Sc, PhD

Περιγραφική Στατιστική. Ακαδ. Έτος ο εξάμηνο. Κ. Πολίτης

ΔΙΑΣΦΑΛΙΣΗ ΜΗ-ΔΙΑΚΡΙΣΗΣ ΜΕΣΩ ΕΞΟΡΥΞΗΣ ΔΕΔΟΜΕΝΩΝ.

ΜΑΘΗΜΑ: Εισαγωγή στις Αρχές της Επιστήμης των Η/Υ. 1 η ΘΕΜΑΤΙΚΗ ΕΝΟΤΗΤΑ: ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ

Α Typing System for Privacy

... c 2015 All rights reserved

Άδεια Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό υλικό, όπως εικόνες, που υπόκειται σε άδεια

1.2 Βάσεις και υποβάσεις.

Πελάτες φθάνουν στο ταμείο μιας τράπεζας Eνα μόνο ταμείο είναι ανοικτό Κάθε πελάτης παρουσιάζεται με ένα νούμερο - αριθμός προτεραιότητας Όσο ο

Security & Privacy. Overview

Εισαγωγή στις Βάσεις Δεδομζνων II

Proprotein convertase subtilisin / kexin type 9 interaction with plasma lipoproteins in subjects with high Lipoprotein (a) levels

Σηματοδότηση σηματοδοτήσουν

ΜΑΘΗΜΑΤΙΚΑ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ Γ ΛΥΚΕΙΟΥ - ΠΑΠΑΔΟΠΟΥΛΟΣ ΜΑΡΙΝΟΣ ΠΕΡΙΕΧΟΜΕΝΑ. Τίτλος Θεματικές Ενότητες Σελίδες. Δυο λόγια προς τους μαθητές.

ΑΣΦΑΛΕΙΑ ΔΕΔΟΜΕΝΩΝ ΣΤΗΝ ΚΟΙΝΩΝΙΑ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ (Ιδιωτικότητα)

Βάσεις εδομένων ΘΕΜΑ ΕΡΓΑΣΙΑΣ. Μέρμηγκας Αλέξανδρος Α.Μ ιαχείρηση Πληροφοριακών Συστηματών

ΜΑΘΑΙΝΟΝΤΑΣ ΤΑ GIS ΣΤΗ ΠΡΑΞΗ ΤΟ ARCGIS 9.3. Α. Τσουχλαράκη, Γ. Αχιλλέως ΚΕΦΑΛΑΙΟ 4 ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΓΡΑΦΙΚΩΝ ΔΕΔΟΜΕΝΩΝ ΠΙΝΑΚΕΣ

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ

Κεφάλαιο 20. Ανακάλυψη Γνώσης σε Βάσεις δεδοµένων. Τεχνητή Νοηµοσύνη - Β' Έκδοση Ι. Βλαχάβας, Π. Κεφαλάς, Ν. Βασιλειάδης, Φ. Κόκκορας, Η.

ΤΥΠΟΛΟΓΙΟ ΣΤΑΤΙΣΤΙΚΗΣ

Μεθοδολογία Εκπαιδευτικής Έρευνας

Ενότητα 5 η : Επαγωγική Στατιστική ΙΙ Ανάλυση ποσοτικών δεδομένων. Δημήτριος Σταμοβλάσης Φιλοσοφίας Παιδαγωγικής

Το Σχεσιακό Μοντέλο. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1

Βάσεις εδοµένων. Βασίλειος Βεσκούκης, Εµµ. Στεφανάκης ΜΟΝΤΕΛΟΠΟΙΗΣΗ Ε ΟΜΕΝΩΝ, ΚΛΑΣΙΚΑ ΜΟΝΤΕΛΑ Ε ΟΜΕΝΩΝ

Τι είναι πραγματική συνάρτηση πραγματικής μεταβλητής ;

ΕΡΓΟ: Συγκριτική Μελέτη Λογισμικού Βιβλιοθηκών, Λογισμικού Εφαρμογών Ανοικτού Κώδικα και Βιομηχανικού Λογισμικού MIS:

Διάλεξη 17: Δυαδικά Δέντρα. Διδάσκων: Κωνσταντίνος Κώστα Διαφάνειες: Δημήτρης Ζεϊναλιπούρ

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Σχεσιακό Μοντέλο. Σχεδιασμός Βάσεων Δεδομένων Μάθημα 2 ο Μαρία Χαλκίδη

Εφαρμογές της Θεωρίας της Πληροφορίας σε διαδικασίες ανάκτησης εικόνας

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ. Λογική. Δημήτρης Πλεξουσάκης

Σχεδίαση Βάσεων Δεδομένων

Διασφάλιση απορρήτου σε δεδομένα γράφων και σχεσιακών βάσεων δεδομένων

Δομές Δεδομένων (Εργ.) Ακ. Έτος Διδάσκων: Ευάγγελος Σπύρου. Εργαστήριο 10 Δυαδικά Δένδρα Αναζήτησης

Μπιτσάκη Αντωνία-Χρυσάνθη Ταουσάκος Θανάσης

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Data Mining - Classification

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS)

ΗΥ360 Αρχεία και Βάσεις εδοµένων

Κεφάλαιο 14. Δομές Ευρετηρίων για Αρχεία. Copyright 2007 Ramez Elmasri and Shamkant B. Navathe Ελληνική Έκδοση,

ΠΡΟΣΤΑΣΙΑ ΙΔΙΩΤΙΚΟΤΗΤΑΣ ΕΥΑΙΣΘΗΤΩΝ ΔΕΔΟΜΕΝΩΝ: ΤΟ ΜΟΝΤΕΛΟ ΤΗΣ K-ΑΝΩΝΥΜΙΑΣ PRIVACY PROTECTION OF SENSITIVE DATA: THE K-ANONYMITY MODEL

ΤΕΙ ΣΕΡΡΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΩΝ ΕΞΕΤΑΣΗ ΣΤΟ ΜΑΘΗΜΑ «ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ ΝΕΥΡΩΝΙΚΑ ΔΙΚΤΥΑ» ΠΑ. 7 ΣΕΠΤΕΜΒΡΙΟΥ 2012

Εισαγωγή στην Ανάλυση Αλγορίθμων

Table1 Subjectcharacteristics

Βάσεις Δεδομένων και Ευφυή Πληροφοριακά Συστήματα Επιχειρηματικότητας. 2 ο Μάθημα: Βασικά Θέματα Βάσεων Δεδομένων. Δρ. Κωνσταντίνος Χ.

ΟΜΑΔΟΠΟΙΗΣΗ ΤΩΝ ΠΑΡΑΤΗΡΗΣΕΩΝ

Κεφάλαιο 15 Έλεγχοι χ-τετράγωνο

IV. Συνέχεια Συνάρτησης. math-gr

ΤΥΠΟΛΟΓΙΟ ΣΤΑΤΙΣΤΙΚΗΣ

Υπάρχουν τρεις εναλλακτικές τεχνικές για την ανάλυση της απόδοσης ενός συστήµατος:

Αξιολόγηση µεθόδων σύνθεσης εικόνων. Β. Τσαγκάρης και Β. Αναστασόπουλος

ΠΡΟΣΤΑΣΙΑ ΠΡΟΣΩΠΙΚΩΝ ΔΕΔΟΜΕΝΩΝ ΣΤΙΣ ΤΕΧΝΟΛΟΓΙΕΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΩΝ ΚΑΘΩΣ ΚΑΙ ΣΤΟ ΔΙΑΔΙΚΤΥΟ

8. ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΣ ΔΕΔΟΜΕΝΩΝ

Η προστασία των ευαίσθητων δεδομένων υγείας στην ηλεκτρονική υγεία

Κεφάλαιο 5: ΜΕΝΔΕΛΙΚΗ ΚΛΗΡΟΝΟΜΙΚΟΤΗΤΑ

Ένας απλός τρόπος αναπαράστασης δεδομένων: ένας διδιάστατος πίνακας που λέγεται σχέση Γνωρίσματα

Τεχνητή Νοημοσύνη (ΥΠ23) 6 ο εξάμηνο Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο Ουρανία Χατζή

Θεωρία Υπολογισμού και Πολυπλοκότητα Ασυμφραστικές Γλώσσες (3)

1991 US Social Survey.sav

Ένας απλός τρόπος αναπαράστασης δεδομένων: ένας διδιάστατος πίνακας που λέγεται σχέση Γνωρίσματα

ΤΕΙ ΣΕΡΡΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΩΝ ΕΞΕΤΑΣΗ ΣΤΟ ΜΑΘΗΜΑ «ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ ΝΕΥΡΩΝΙΚΑ ΔΙΚΤΥΑ» ΔΕ. 11 ΙΟΥΝΙΟΥ 2012

GDPR για επιχειρήσεις με λόγια απλά

13/5/2015 ΟΥΡΕΣ ΠΡΟΤΕΡΑΙΟΤΗΤΑΣ. Δομές Δεδομένων. Ουρές Προτεραιότητας

Δουλεύοντας με εικόνες σε έναν κόσμο λέξεων. Μέρος 2 ο

Γενικός Κανονισμός Προστασίας Προσωπικών Δεδομένων (GDPR)

ΜΕΘΟΔΟΣ ΠΕΠΕΡΑΣΜΕΝΩΝ ΣΤΟΙΧΕΙΩΝ

- ΟΡΙΟ - ΣΥΝΕΧΕΙΑ ΣΥΝΑΡΤΗΣΗΣ ΕΝΟΤΗΤΑ 5: ΚΡΙΤΗΡΙΟ ΠΑΡΕΜΒΟΛΗΣ - ΤΡΙΓΩΝΟΜΕΤΡΙΚΑ ΟΡΙΑ - ΟΡΙΟ ΣΥΝΘΕΤΗΣ ΣΥΝΑΡΤΗΣΗΣ

1. ΣΤΑΤΙΚΗ ΑΡΙΣΤΟΠΟΙΗΣΗ

Η συγκατάθεση στον GDPR:

Δεδομένα υγείας & υπολογιστικό νέφος νέες εξελίξεις υπό το πρίσμα της Πρότασης Κανονισμού. Χαρίκλεια Ζ. Λάτσιου, ΔΝ Δικηγόρος

Κατευθυνόμενα γραφήματα. Μαθηματικά Πληροφορικής 6ο Μάθημα. Βρόχοι. Μη κατευθυνόμενα γραφήματα. Ορισμός

9. Κόκκινα-Μαύρα Δέντρα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ

ΕΡΕΥΝΗΤΙΚΟ ΚΕΝΤΡΟ ΚΑΙΝΟΤΟΜΙΑΣ ΣΤΙΣ ΤΕΧΝΟΛΟΓΙΕΣ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΤΩΝ ΕΠΙΚΟΙΝΩΝΙΩΝ & ΤΗΣ ΓΝΩΣΗΣ «ΑΘΗΝΑ» ΙΝΣΤΙΤΟΥΤΟ ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ LODGOV

ΑΣΦΑΛΗΣ ΔΙΑΧΕΙΡΙΣΗ ΤΗΣ ΠΟΛΥΦΑΡΜΑΚΙΑΣ. Παρασκευή Παπαϊωαννίδου Καθηγήτρια Φαρμακολογίας Τμήμα Ιατρικής ΑΠΘ

Βάσεις Δεδομένων : Σχεσιακό Μοντέλο 1. Ένας απλός τρόπος αναπαράστασης δεδομένων: ένας διδιάστατος πίνακας που λέγεται σχέση.

ΙΔΙΩΤΙΚΟΤΗΤΑΣ ΕΥΑΙΣΘΗΤΩΝ ΔΕΔΟΜΕΝΩΝ

Σχεδιασμός Βάσεων Δεδομένων

Μεταδεδομένα στο Ψηφιακό περιβάλλον

OΡΙΟ - ΣΥΝΕΧΕΙΑ ΣΥΝΑΡΤΗΣΗΣ

1. Απαιτήσεις εργασίας

Κεφάλαιο 14. οµές Ευρετηρίων για Αρχεία. ιαφάνεια 14-1

ΑΝΑΛΥΣΗ ΕΠΙΒΙΩΣΗΣ ΜΕ ΜΟΝΤΕΛΑ ΑΝΑΛΟΓΙΚΏΝ ΚΙΝΔΥΝΩΝ COX

c All rights reserved

ΚΕΦΑΛΑΙΟ 4. Τεχνική Ανίχνευσης του. Πτυχιακή Εργασία Σελίδα 95

Copyright 2007 Ramez Elmasri and Shamkant B. Navathe, Ελληνική Έκδοση, Δίαβλος, Επιμέλεια Μ.Χατζόπουλος Διαφάνεια 14-1

ΟΥΡΕΣ ΠΡΟΤΕΡΑΙΟΤΗΤΑΣ

Συναρτησιακές Εξαρτήσεις και Κανονικοποίηση

«ΠΡΟΣΤΑΣΙΑ ΠΡΟΣΩΠΙΚΩΝ ΔΕΔΟΜΕΝΩΝ GDPR

Δεσμευμένη (ή υπο-συνθήκη) Πιθανότητα (Conditional Probability)

math-gr Παντελής Μπουμπούλης, M.Sc., Ph.D. σελ. 2 math-gr.blogspot.com, bouboulis.mysch.gr

Κατευθυνόμενα γραφήματα. Μαθηματικά Πληροφορικής 6ο Μάθημα. Βρόχοι. Μη κατευθυνόμενα γραφήματα. Ορισμός

Transcript:

privacy preserving data publishing - gr Digital security and privacy Georgios Spathoulas Msc in Informatics and computational bio-medicine University of Thessaly

data format Στην βασική μορφή του PPPDP ο εκδότης του πίνακα έχει έναν πίνακα της μορφής: D(Explicit Identifier, Quasi Identifier, Sensitive Attributes, Non-Sensitive Attributes), όπου : Explicit Identifier Το σύνολο των πεδίων, όπως όνομα ή αριθμός κοινωνικής ασφάλισης που περιέχουν πληροφορίες μέσω των οποίων μπορεί να αναγνωριστεί το άτομο που σχετίζεται με την εγγραφή του πίνακα Quasi Identifier (QID) Το σύνολο των πεδίων που ενδεχομένως μπορεί να αποκαλύψουν το άτομο που σχετίζεται με τα δεδομένα Sensitive Attributes Τα πεδία που περιέχουν ευαίσθητα προσωπικά δεδομένα, όπως ασθένεια, μισθός ή αναπηρία και Non-Sensitive Attributes Όλα τα υπόλοιπα πεδία που δεν σχετίζονται με τις παραπάνω κατηγορίες 1

αποτροπή linking attacks Για να αποτραπούν πιθανά linking attacks, ο εκδότης εκδίδει ένα ανωνυμοποιημένο πίνακα T (QID, Sensitive Attributes, Non-Sensitive Attributes) QID πρόκειται για μία ανωνυμοποιημένη μορφή του αρχικού QID που παράγεται εκτελώντας εργασίες ανωνυμοποιήσης στα πεδία του QID στον αρχικό πίνακα D Οι εργασίες αυτές έχουν ως στόχο να αποκρύψουν μέρος της πληροφορίας, ώστε αρκετές εγγραφές να μην είναι δυνατό να διαχωριστούν μεταξύ τους Συνεπώς εάν κάποιος συνδεθεί με μία εγγραφή του πίνακα, συνδέεται επίσης και με όλες τις άλλες εγγραφές που έχουν ίδιες τιμές στο QID 2

examples Παραδείγματα επιθέσεων 3

example Υποτίθεται ότι ένα νοσοκομείο πρόκειται να δημοσιοποιήσει τα αρχεία των ασθενών του Table (a) σε ένα ερευνητικό κέντρο Υποτίθεται ότι το ερευνητικό κέντρο έχει πρόσβαση και σε έναν άλλο πίνακα Table (b) και γνωρίζει ότι για κάθε άνθρωπο για τον οποίο υπάρχει εγγραφή στο Table (b), υπάρχει εγγραφή και στο Table (a) Ενώνοντας τα δύο tables στα κοινά πεδία Job, Sex, και Age μπορεί κανείς να συνδέσει το όνομα κάποιου με την ασθένειά του Για παράδειγμα ο Doug, male, lawyer και 38 ετών, αναγνωρίζεται ως ασθενής HIV από το qid = Lawyer, Male, 38 4

k-anonymity Για την προστασία από το record linkage μέσω QID, χρησιμοποιούμε την έννοια k-anonymity: k-anonymity για κάθε εγγραφή του πίνακα υπάρχουν επιπλέον k-1 εγγραφές με τον ίδιο συνδυασμό τιμών στα qid πεδία Με άλλα λόγια το ελάχιστο μέγεθος ενός QID group είναι k Ενας πίνακας που ικανοποιεί το παραπάνω κριτήριο λέγεται k-anonymous Σε έναν k-anonymous πίνακα, κάθε εγγραφή είναι μη διαχωρίσιμη από τουλάχιστον k 1 άλλες εγγραφές, σε σχέση με το QID Συνεπώς η πιθανότητα να συνδεθεί το θύμα με μία εγγραφή είναι μέσω του QID είναι το πολύ 1/k 5

παράδειγµα Το Table (c) δείχνει έναν 3-anonymous πίνακα γενικεύοντας το QID = Job, Sex, Age του Table (a) χρησιμοποιώντας τα δένδρα της επόμενης διαφάνειας Παρατηρούμε δύο διαφορετικά group βάσει του QID: Professional, Male, [35 40) and Artist, Female, [30 35) Αφού κάθε group περιέχει τουλάχιστον 3 εγγραφές, ο πίνακας είναι 3-anonymous Εάν συνδεθούν το Table (b) με το Table (c) μέσω του QID, κάθε εγγραφή του b συνδέεται με καμία ή με τουλάχιστον 3 εγγραφές του c 6

δέντρα Taxonomy trees 7

attribute linkage Σε μία attribute linkage επιθεση, ο επιτιθέμενος μπορεί να μην εντοπίσει την εγγραφή του στόχου αλλά να συμπεράνει την τιμή των πεδίων Sensitive Attributes του πίνακα T, βασιζόμενος στο σετ των τιμών αυτών των πεδίων που προκύπτουν από τις εγγραφές του QID group στο οποίο ανήκει Σε πολλές περιπτώσεις μία τιμή στα Sensitive Attributes είναι κυρίαρχη σε ένα group, ακόμα και αν ικανοποιείται το κριτήριο του k-anonymity Για να αντιμετωπίσουμε αυτές τις επιθέσεις προσπαθούμε να ελαττώσουμε την συσχέτιση των τιμών στο QID με τα Sensitive Attributes 8

παράδειγµα attribute linkage Από το Table (a), ο επιτιθέμενος μπορεί να συμπεράνει ότι όλες οι γυναίκες dancers ετών 30 πάσχουν από HIV Dancer, Female, 30 HIV with 100% confidence Χρησιμοποιώντας αυτό το συμπέρασμα στο Table (b), βρίσκουμε ότι η Emily πάσχει από HIV με 100% confidence, υπό την προϋπόθεση ότι υπάρχει μία εγγραφή για αυτήν στο Table (a) 9

l-diversity Η αρχή του l-diversity χρησιμοποιείται για την αποφυγή του attribute linkage Απαιτεί κάθε qid group να περιέχει τουλάχιστον l διαφορετικές τιμές στα sensitive attributes Το μοντέλο l-diversity αυτομάτως ικανοποιεί και το k-anonymity, με k = l, αφού κάθε qid group περιέχει τουλάχιστον l εγγραφές Κάποιες τιμές στα sensitive attributes είναι συχνότερες από τις άλλες σε ένα group, επιτρέποντας έτσι στον επιτιθέμενο να υποθέσει με μεγάλο ποσοστό επιτυχίας ότι μία εγγραφή που ταιριάζει με αυτό το group έχει και την επικρατούσα τιμή στα sensitive attributes Για αυτό τον λόγο προτείνεται μία ισχυρότερη έννοια το entropy l-diversity 10

entropy l-diversity Ένας πίνακας είναι entropy l-diverse αν για κάθε qid group : s P(qid, s)log(p(qid, s)) log(l) (1) όπου S είναι sensitive attribute, και P(qid, s) είναι το ποσοστό των εγγραφών του qid group που έχουν μία συγκεκριμένη τιμή s Το αριστερό μέρος της ανίσωσης, ονομάζεται entropy του sensitive attribute, και έχει μεγαλύτερες τιμές για πεδία των οποίων οι τιμές είναι ομοιόμορφα κατανεμημένες Οπότε μία μεγαλύτερη οριακή τιμή l σημαίνει μικρότερη βεβαιότητα του επιτιθέμενου για την επιλογή μίας τιμής για το θύμα 11

παράδειγµα entropy l-diversity Γα το Table (c) Για το πρώτο group Professional, Male, [35 40), 2 3 log 2 3 1 3 log 1 3 = log(1.9) και για το δεύτερο group Artist, Female, [30 35), 3 4 log 3 4 1 4 log 1 4 = log(1.8) Οπότε ο πίνακας ικανοποεί το entropy l-diversity με l 1.8 12

µετρώντας information loss ILoss είναι ένα metric για την μέτρηση του information loss όταν γενικοποιούμε μία τιμή σε μία γενικότερη Εάν για ένα πεδίο Α, μία ειδική τιμή v γενικοποιείται σε μία πιο γενική τιμή v g, τότε το information loss υπολογίζεται ως ο παρακάτω λόγος ILoss(v g ) = v g 1 D A (2) Το v g είναι το πλήθος των τιμώς που γενικοποιούνται σε v g και D A είναι το πλήθος όλων των δυνατών τιμών του πεδίου Α 13

µετρώντας το information loss Για να υπολογισθεί το information loss για μία εγγραφή τα losses των πεδίων της προσθέτονται (πιθανώς με την χρήση βαρών w) ILoss(r) = u g r w i ILoss(v g ) (3) Για να υπολογιστεί το information loss για όλο τον πίνακα τα losses των εγγραφών του προστίθενται ILoss(T) = r T ILoss(r) (4) 14