Υπολογιστικά Ζητήματα σε Στρατηγικά Παίγνια και Διαδικασίες Κοινωνικής Επιλογής

Σχετικά έγγραφα
1 Εισαγωγή στις Συνδυαστικές Δημοπρασίες - Combinatorial Auctions

1 Εισαγωγή στις Συνδυαστικές Δημοπρασίες - Combinatorial Auctions

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 2: Έννοιες λύσεων σε παίγνια κανονικής μορφής. Ε. Μαρκάκης. Επικ. Καθηγητής

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 5: Εύρεση σημείων ισορροπίας σε παίγνια μηδενικού αθροίσματος. Ε. Μαρκάκης. Επικ. Καθηγητής

2 Πώς πουλάει διαφημιστικό χώρο η Google;

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2015

Μικτές Στρατηγικές σε Παίγνια και σημεία Ισορροπίας Nash. Τµήµα Μηχανικών Πληροφορικής και Υπολογιστών 1

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ. Ψηφιακή Οικονομία. Διάλεξη 9η: Basics of Game Theory Mαρίνα Μπιτσάκη Τμήμα Επιστήμης Υπολογιστών

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 8: Δημοπρασίες. Ε. Μαρκάκης. Επικ. Καθηγητής

Ψηφιακή Οικονομία. Διάλεξη 11η: Markets and Strategic Interaction in Networks Mαρίνα Μπιτσάκη Τμήμα Επιστήμης Υπολογιστών

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 4: Μεικτές Στρατηγικές. Ε. Μαρκάκης. Επικ. Καθηγητής

Αλγοριθμική Θεωρία Παιγνίων

«ΑΓΡΟΤΟΥΡΙΣΜΟΣ ΚΑΙ ΤΟΠΙΚΗ ΑΝΑΠΤΥΞΗ: Ο ΡΟΛΟΣ ΤΩΝ ΝΕΩΝ ΤΕΧΝΟΛΟΓΙΩΝ ΣΤΗΝ ΠΡΟΩΘΗΣΗ ΤΩΝ ΓΥΝΑΙΚΕΙΩΝ ΣΥΝΕΤΑΙΡΙΣΜΩΝ»

Αλγοριθμική Θεωρία Παιγνίων: Εισαγωγή και Βασικές Έννοιες

Βασικές Αρχές της Θεωρίας Παιγνίων

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ. Ψηφιακή Οικονομία. Διάλεξη 10η: Basics of Game Theory part 2 Mαρίνα Μπιτσάκη Τμήμα Επιστήμης Υπολογιστών

Το Υπόδειγμα της Οριακής Τιμολόγησης

2 Composition. Invertible Mappings

Δημοπρασίες (Auctions)

Κυριαρχία και μεικτές στρατηγικές Μεικτές στρατηγικές και κυριαρχία Είδαμε ότι μια στρατηγική του παίκτη i είναι κυριαρχούμενη, αν υπάρχει κάποια άλλη

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2017

HOMEWORK 4 = G. In order to plot the stress versus the stretch we define a normalized stretch:

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 3: Παίγνια με περισσότερους παίκτες και μέθοδοι απλοποίησης παιγνίων. Ε. Μαρκάκης. Επικ.

Ασκήσεις. Ιωάννα Καντζάβελου. Τµήµα Μηχανικών Πληροφορικής και Υπολογιστών 1

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 11: Σχεδίαση μηχανισμών. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

ηµοπρασίες Χρηµατοδοτούµενων Αναζητήσεων

Every set of first-order formulas is equivalent to an independent set

ΗΥ562 Προχωρημένα Θέματα Βάσεων Δεδομένων Efficient Query Evaluation over Temporally Correlated Probabilistic Streams

ΣΤΙΓΜΙΑΙΑ ΚΑΤΑΣΚΕΥΗ ΣΤΕΡΕΟΥ ΜΕΙΓΜΑΤΟΣ ΥΛΙΚΟΥ ΜΕΣΑ ΑΠΟ ΕΛΕΓΧΟΜΕΝΗ ΦΥΣΙΚΗ ΔΙΑΔΙΚΑΣΙΑ

ΑΛΓΟΡΙΘΜΙΚΗ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ Πανεπιστήµιο Αθηνών Εαρινό Εξάµηνο 2007 ιδάσκων : Ηλίας Κουτσουπιάς

Σηματοδοτικά Παίγνια και Τέλεια Μπεϊζιανή Ισορροπία

ΔΙΕΡΕΥΝΗΣΗ ΤΗΣ ΣΕΞΟΥΑΛΙΚΗΣ ΔΡΑΣΤΗΡΙΟΤΗΤΑΣ ΤΩΝ ΓΥΝΑΙΚΩΝ ΚΑΤΑ ΤΗ ΔΙΑΡΚΕΙΑ ΤΗΣ ΕΓΚΥΜΟΣΥΝΗΣ ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΥΓΕΙΑΣ

ΕΤΑΙΡΙΚΗ ΚΟΙΝΩΝΙΚΗ ΕΥΘΥΝΗ ΣΤΗΝ ΝΑΥΤΙΛΙΑΚΗ ΒΙΟΜΗΧΑΜΙΑ

Η Επίδραση των Events στην Απόδοση των Μετοχών

Σχολή Διοίκησης και Οικονομίας. Μεταπτυχιακή διατριβή

ST5224: Advanced Statistical Theory II

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ Η/Υ & ΠΛΗΡΟΦΟΡΙΚΗΣ. του Γεράσιμου Τουλιάτου ΑΜ: 697

Statistical Inference I Locally most powerful tests

Μεταπτυχιακή διατριβή. Ανδρέας Παπαευσταθίου

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΙΡΑΙΩΣ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΗΣ ΕΠΙΣΤΗΜΗΣ ΑΜΕΣΕΣ ΞΕΝΕΣ ΕΠΕΝΔΥΣΕΙΣ ΣΕ ΕΥΡΩΠΑΙΚΕΣ ΧΩΡΕΣ

Jesse Maassen and Mark Lundstrom Purdue University November 25, 2013

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ. Ψηφιακή Οικονομία. Διάλεξη 13η: Multi-Object Auctions Mαρίνα Μπιτσάκη Τμήμα Επιστήμης Υπολογιστών

Phys460.nb Solution for the t-dependent Schrodinger s equation How did we find the solution? (not required)

Ανταγωνιστική Ανάθεση Πόρων και Παίγνια Συμφόρησης

Ιστορικά Στοιχεία. Παύλος Σ. Εφραιμίδης

EE512: Error Control Coding

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ. Ψηφιακή Οικονομία. Διάλεξη 7η: Consumer Behavior Mαρίνα Μπιτσάκη Τμήμα Επιστήμης Υπολογιστών

Models for Probabilistic Programs with an Adversary


ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΥΓΕΙΑΣ. Πτυχιακή διατριβή Η ΚΑΤΑΘΛΙΨΗ ΩΣ ΠΑΡΑΓΟΝΤΑΣ ΚΙΝΔΥΝΟΥ ΓΙΑ ΑΠΟΠΕΙΡΑ ΑΥΤΟΚΤΟΝΙΑΣ

Εθνικό Μετσόβιο Πολυτεχνείο. Τεχνικές Εκτίμησης Ιδιωτικών Παραμέτρων σε Μη-Φιλαληθείς Δημοπρασίες

Ανάλυση Ισορροπιών Σε Μηχανισμούς με Μερική Επαλήθευση

Ηθικός Κίνδυνος. Το βασικό υπόδειγμα. Παρουσιάζεται ένα στοχαστικό πρόβλημα χρηματοδότησης όταν τα αντισυμβαλλόμενα μέρη έχουν συμμετρική πληροφόρηση.

ΕΠΙΧΕΙΡΗΣΙΑΚΑ ΠΑΙΓΝΙΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ ΤΕΤΑΡΤΟ ΠΑΙΓΝΙΑ ΜΗ ΕΝΙΚΟΥ ΑΘΡΟΙΣΜΑΤΟΣ ΑΚΑ ΗΜΑΙΚΟ ΕΤΟΣ

Ενημερωτική Διαφοροποίηση Προϊόντος: Ο Ρόλος της Διαφήμισης

Fractional Colorings and Zykov Products of graphs

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 12: Δημοπρασίες ανερχόμενων και κατερχόμενων προσφορών. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

Section 8.3 Trigonometric Equations

"ΦΟΡΟΛΟΓΙΑ ΕΙΣΟΔΗΜΑΤΟΣ ΕΤΑΙΡΕΙΩΝ ΣΥΓΚΡΙΤΙΚΑ ΓΙΑ ΤΑ ΟΙΚΟΝΟΜΙΚΑ ΕΤΗ "

SCHOOL OF MATHEMATICAL SCIENCES G11LMA Linear Mathematics Examination Solutions

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ

Η ΠΡΟΣΩΠΙΚΗ ΟΡΙΟΘΕΤΗΣΗ ΤΟΥ ΧΩΡΟΥ Η ΠΕΡΙΠΤΩΣΗ ΤΩΝ CHAT ROOMS

«Αξιολόγηση ατόμων με αφασία για Επαυξητική και Εναλλακτική Επικοινωνία, σύμφωνα με το μοντέλο συμμετοχής»

ΣΧΕΔΙΑΣΜΟΣ ΚΑΙ ΕΝΙΣΧΥΣΗ ΤΩΝ ΚΟΜΒΩΝ ΟΠΛΙΣΜΕΝΟΥ ΣΚΥΡΟΔΕΜΑΤΟΣ ΜΕ ΒΑΣΗ ΤΟΥΣ ΕΥΡΩΚΩΔΙΚΕΣ

Ηλεκτρονικό εμπόριο. HE 8 Εξατομίκευση

2. Διαφήμιση σε Αγορές όπου υπάρχουν πολλές Επιχειρήσεις

ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΝΟΣΗΛΕΥΤΙΚΗΣ

Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης

Homework 3 Solutions

Ανταγωνιστική Ανάθεση Πόρων και Παίγνια Συμφόρησης

Ο νοσηλευτικός ρόλος στην πρόληψη του μελανώματος

Matrices and Determinants

Approximation of distance between locations on earth given by latitude and longitude

Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης

ΚΥΠΡΙΑΚΗ ΕΤΑΙΡΕΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 19/5/2007

ΙΑ ΟΧΙΚΕΣ ΒΕΛΤΙΩΣΕΙΣ

Solution Concepts. Παύλος Στ. Εφραιµίδης. Τοµέας Λογισµικού και Ανάπτυξης Εφαρµογών Τµήµα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών

Other Test Constructions: Likelihood Ratio & Bayes Tests

Γενίκευση: Πλήρως Μη Γραμμική Τιμολόγηση

Θεμελιώδεις αρχές επιστήμης και μέθοδοι έρευνας

derivation of the Laplacian from rectangular to spherical coordinates

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

C.S. 430 Assignment 6, Sample Solutions

Συλλογιστική εξαγωγής συμπερασμάτων από συγκεκριμένες υποθέσεις δοθείσα μεθοδολογία διαδικασία της σκέψης, πρέπει να «συλλογιστεί» υπόθεση/παραγωγή

Μηχανική Μάθηση Hypothesis Testing


ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2015

HY380 Αλγόριθμοι και πολυπλοκότητα Hard Problems

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ. Ψηφιακή Οικονομία. Διάλεξη 8η: Producer Behavior Mαρίνα Μπιτσάκη Τμήμα Επιστήμης Υπολογιστών

Μεταπτυχιακή Διατριβή

ΕΜΠΕΙΡΙΚΗ ΠΡΟΣΕΓΓΙΣΗ ΤΗΣ NASH ΙΣΟΡΡΟΠΙΑΣ

Ordinal Arithmetic: Addition, Multiplication, Exponentiation and Limit

ΟΙΚΟΝΟΜΟΤΕΧΝΙΚΗ ΑΝΑΛΥΣΗ ΕΝΟΣ ΕΝΕΡΓΕΙΑΚΑ ΑΥΤΟΝΟΜΟΥ ΝΗΣΙΟΥ ΜΕ Α.Π.Ε

The Probabilistic Method - Probabilistic Techniques. Lecture 7: The Janson Inequality

Μεθοδολογία Έρευνας Διάλεξη 1 η : Εισαγωγή στη Μεθοδολογία Έρευνας

Liveschool Marketing Services

Μεταπτυχιακή διατριβή

Τ.Ε.Ι. ΑΝΑΤΟΛΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΚΑΙ ΘΡΑΚΗΣ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΓΡΑΜΜΙΚΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ

þÿ¼ ½ ±Â : ÁÌ» Â Ä Å ÃÄ ²µ þÿä Å ÃÇ»¹º Í Á³ Å

þÿ ÀÌ Ä º± µä À ¹ ¼ ½

Transcript:

Πανεπιστημιο Πατρων - Πολυτεχνικη Σχολη Τμήμα Μηχανικών Ηλεκτρονικών Υπολογιστών και Πληροϕορικής Υπολογιστικά Ζητήματα σε Στρατηγικά Παίγνια και Διαδικασίες Κοινωνικής Επιλογής Διδακτορική Διατριβή Μαρια Κυροπουλου Επιβλεπων: Χρηστος Κακλαμανης, Καθηγητης Πάτρα, 2014

Υπολογιστικά Ζητήματα σε Στρατηγικά Παίγνια και Διαδικασίες Κοινωνικής Επιλογής Διδακτορική Διατριβή Μαρια Κυροπουλου Επταμελής εξεταστική επιτροπή: Χρήστος Κακλαμάνης, Καθηγητής (Επιβλέπων) Παύλος Σπυράκης, Καθηγητής (Μέλος τριμελούς επιτροπής) Ιωάννης Καραγιάννης, Επίκουρος Καθηγητής (Μέλος τριμελούς επιτροπής) Εμμανουήλ Βαρβαρίγος, Καθηγητής Χρήστος Ζαρολιάγκης, Καθηγητής Σταύρος Κοσμαδάκης, Καθηγητής Σωτήρης Νικολετσέας, Αναπληρωτής Καθηγητής

iii Υπολογιστικά Ζητήματα σε Στρατηγικά Παίγνια και Διαδικασίες Κοινωνικής Επιλογής Μαρια Κυροπουλου Περίληψη Στην παρούσα διατριβή μελετάμε αγορές δημοπρασιών και εξετάζουμε διάϕορες ιδιότητές τους καθώς και τον τρόπο που αυτές επηρεάζονται από τον τρόπο που συμπεριϕέρονται και δρουν οι συμμετέχοντες. Η έννοια δημοπρασία αναϕέρεται σε κάθε μηχανισμό, ή σύνολο κανόνων, που διέπει μια διαδικασία ανάθεσης αγαθών. Τέτοιοι μηχανισμοί είναι επιρρεπείς σε στρατηγικούς χειρισμούς (χειραγώγηση) από τους συμμετέχοντες, γεγονός που δικαιολογεί την έμϕυτη δυσκολία στον σχεδιασμό τους. Σκοπός αυτής της εργασίας είναι η μελέτη σε θεωρητικό επίπεδο των ιδιοτήτων μηχανισμών δημοπρασίας έτσι ώστε να είμαστε σε θέση να προβλέψουμε, να εξηγήσουμε, ακόμα και να τροποποιήσουμε την απόδοσή τους στην πράξη. Εστιάζουμε την προσοχή μας σε δημοπρασίες χρηματοδοτούμενης αναζήτησης, οι οποίες αποτελούν την επικρατέστερη διαδικασία για την προβολή διαϕημίσεων στο Διαδίκτυο. Κάθε ϕορά που ένας χρήστης πραγματοποιεί μια αναζήτηση σε μια μηχανή αναζήτησης δημιουργείται διαϕημιστικός χώρος. Ο διαϕημιστικός χώρος αυτός χωρίζεται σε θέσεις υποδοχής διαϕημίσεων, οι οποίες πωλούνται από τη μηχανή αναζήτησης μέσω δημοπρασιών. Διαϕορετικές θέσεις αντιστοιχούν σε διαϕορετικά σημεία της ιστοσελίδας όπου μπορεί να τοποθετηθεί κάθε δια- ϕήμιση, άρα και διαϕορετική πιθανότητα να την προσέξει ο χρήστης και να ακολουθήσει το σύνδεσμο που θα τον οδηγήσει στην ιστοσελίδα του διαϕημιζόμενου. Ο αριθμός από κλικ που θα προσελκύσει κάθε θέση ορίζει το ρυθμό επιλογής της. Κάθε διαϕημιζόμενος έχει εκτιμήσει πόση αξία έχει για αυτόν ένα κλικ και αποϕασίζει την προσϕορά, ή αλλιώς τη δήλωση, που θα κάνει στη δημοπρασία. Ετσι, με δεδομένες τις δηλώσεις των διαϕημιζόμενων, η δημοπρασία καταλήγει στην θέση στην οποία θα ανατεθεί η κάθε διαϕήμιση και το αντίτιμο που θα πρέπει να πληρώσει ο αντίστοιχος διαϕημιζόμενος για κάθε κλικ. Οι χρηματοδοτούμενες αναζητήσεις ορίζουν εύλογα ένα στρατηγικό παίγνιο ανάμεσα στους διαϕημιζόμενους (παίχτες) εϕόσον αυτοί έχουν στρατηγική συμπεριϕορά και προσπαθούν με τις δηλώσεις τους να μεγιστοποιήσουν προσωπικούς τους στόχους. Συγκεκριμένα, κάθε παίχτης δηλώνει την τιμή που μεγιστοποιεί την ωϕέλειά του, δηλαδή την αξία μείον την πληρωμή για όλα τα κλικ που λαμβάνει. Μας ενδιαϕέρουν καταστάσεις ισορροπίας του παιγνίου, στις οποίες κανένας παίχτης δεν έχει κίνητρο να αλλάξει τη δήλωσή του δεδομένων των δηλώσεων των υπόλοιπων παιχτών, και εξετάζουμε τις ιδιότητές τους. Αν και εύλογα μπορεί να θεωρήσουμε ότι το σύνολο των διαϕημιζόμενων που συμμετέχουν σε δημοπρασίες που αϕορούν παρόμοιες αναζητήσεις (λέξεις κλειδιά) είναι σχεδόν ίδιο, και πως η συμπεριϕορά τους προσαρμόζεται με την πάροδο του χρόνου, προτιμάμε να εξετάσουμε μια χρηματοδοτούμενη αναζήτηση σαν ένα παίγνιο ενός γύρου στο οποίο έχουμε ενσωματώσει τη γνώση που αποκτάται παρατηρώντας το επαναλαμβανόμενο παίγνιο ως εκείνη τη στιγμή. Κατά συνέπεια, θεωρούμε ότι έχουμε ακριβή εκτίμηση των ρυθμών επιλογής των θέσεων και πως κάθε παίχτης έχει ακριβή εκτίμηση της αξίας του για ένα κλικ. Σε κάποιες περιπτώσεις, οι παίχτες ενδέχεται να διαθέτουν πληροϕορίες που αϕορούν τις αξίες (κατά μέσο όρο) των υπολοίπων παιχτών για τη συγκεκριμένη δημοπρασία. Αυτό το μοντέλο, το οποίο και υιοθετούμε, προτάθηκε από τους Edelman et al. [American Economic Review, 2007] και Varian [International Journal of Industrial Organization, 2007], ανεξάρτητα. Παραλλαγές του περίϕημου μηχανισμού δημοπρασίας VCG (Vickrey-Clark-Groves) εγγυών-

iv ται πως οι παίχτες δρουν με ειλικρίνεια και, υπό ήπιες παραδοχές, οδηγούν σε μεγιστοποίηση των εσόδων και της κοινωνικής ευημερίας. Παρ όλα αυτά, η βιομηχανία χρηματοδοτούμενων αναζητήσεων χρησιμοποιεί κυρίως μηχανισμούς δημοπρασίας GSP (Generalized Second Price, ή αλλιώς γενικευμένους μηχανισμούς δεύτερης τιμής), οι οποίοι είναι γνωστό ότι δεν είναι ϕιλαλήθεις, ούτε βέλτιστοι όσον αϕορά στην κοινωνική ευημερία και στα έσοδα. Με σκοπό να εξηγήσουμε αυτό το ϕαινόμενο, υπολογίζουμε το Τίμημα της Αναρχίας για να ϕράξουμε την απώλεια αποδοτικότητας εξαιτίας της στρατηγικής συμπεριϕοράς των παιχτών, και αποδεικνύουμε εγγυήσεις εσόδων για να ϕράξουμε την απώλεια των εσόδων του μηχανισμού δημοπρασίας GSP σε αυτό το πλαίσιο (για την ακρίβεια, ορίζουμε παραλλαγές του μηχανισμού δημοπρασίας GSP που δίνουν καλές εγγυήσεις εσόδων). Ολα τα ϕράγματά μας είναι πολύ μικρές σταθερές, δηλαδή αποδεικνύουμε ότι η κοινωνική ευημερία (τα έσοδα, αντίστοιχα) σε κάθε κατάσταση ισορροπίας του παιγνίου απέχει το πολύ κατά ένα μικρό πολλαπλασιαστικό παράγοντα από τη βέλτιστη κοινωνική ευημερία (τα βέλτιστα έσοδα, αντίστοιχα, υπό ήπιες παραδοχές). Θεωρούμε διάϕορες έννοιες ισορροπίας στο μοντέλο πλήρους πληροϕόρησης αλλά και σύμϕωνα με διά- ϕορες πηγές αβεβαιότητας. Συγκεκριμένα, μελετάμε τις κατηγορίες αμιγών ισορροπιών Nash, «χονδροειδώς» συσχετιζόμενων (coarse correlated), και Bayesian «χονδροειδώς» συσχετιζόμενων ισορροπιών για την ανάλυση που αϕορά στην κοινωνική ευημερία, ενώ θεωρούμε την κατηγορία ισορροπιών Bayes-Nash για την ανάλυση που αϕορά στα έσοδα που προκύπτουν α- πό τις δημοπρασίες GSP. Ειδικά για την ανάλυση που αϕορά στην κοινωνική ευημερία, ισχύει πως τα αποτελέσματά μας γενικεύονται ώστε να ενσωματώσουν και τον παράγοντα ποιότητας των διαϕημίσεων. Τα αποτελέσματά μας είναι ανθεκτικά όσον αϕορά στην αβεβαιότητα που αϕορά στις αξίες των παιχτών, στην ποιότητα των διαϕημίσεων, καθώς και στην ασύμμετρη πληροϕόρηση και στις υποθέσεις ορθολογικότητας που επιβάλλονται στους παίχτες. Επιπλέον, παρατηρούμε ότι συγκεκριμένες έννοιες ισορροπίας από αυτές που εξετάζουμε επιτρέπουν συσχετισμό μεταξύ των αξιών των παιχτών και της ποιότητας των διαϕημίσεων. Επίσης, εξετάζουμε το πρόβλημα του σχεδιασμού της βέλτιστης δημοπρασίας ενός αντικειμένου. Οι δημοπρασίες ενός αντικειμένου ανήκουν σε ένα πιο θεμελιώδη τύπο δημοπρασίας, αλλά μπορούν να θεωρηθούν ειδική περίπτωση δημοπρασίας χρηματοδοτούμενης αναζήτησης. Η πρωτοποριακή εργασία του Myerson [Mathematics of Operations Research, 1981] χαρακτηρίζει βέλτιστες δημοπρασίες ενός αντικειμένου, δηλαδή ϕιλαλήθεις μηχανισμούς δημοπρασίας που μεγιστοποιούν τα έσοδα, για την περίπτωση που οι αξίες των παιχτών είναι ανεξάρτητες. Για την ακρίβεια, ο μηχανισμός δημοπρασίας που πετυχαίνει αυτές τις επιθυμητές ιδιότητες είναι ένας αρκετά απλός ντετερμινιστικός μηχανισμός. Αντιθέτως, το πρόβλημα του σχεδιασμού της βέλτιστης δημοπρασίας στην περίπτωση που οι αξίες των παιχτών είναι συσχετιζόμενες είναι υπολογιστικά δύσκολο. Αποδεικνύουμε ένα υπολογίσιμο ϕράγμα δυσκολίας στην προσέγγιση για την περίπτωση με τρεις παίχτες. Επιπλέον, αποδεικνύουμε ότι υπάρχει αξιοσημείωτη δια- ϕορά ανάμεσα στα έσοδα που προκύπτουν από ντετερμινιστικούς ϕιλαλήθεις μηχανισμούς και πιθανοτικούς μηχανισμούς που είναι ϕιλαλήθεις κατά μέσο όρο.

v Computational Aspects in Strategic Games and Social Choice Procedures Maria Kyropoulou Abstract In this dissertation we consider auction markets and examine their properties and how these are affected by the way the participants act. An auction may refer to any mechanism or set of rules governing a resource allocation process. Designing such a mechanism is not an easy task and this is partly due to their vulnerability to strategic manipulation by the participants. Our goal is to examine the theoretical properties of auction mechanisms in order to predict, explain, or even adjust their behavior in practice in terms of some desired features. We focus on sponsored search auctions, which constitute the leading procedure in Internet advertising. Advertising space is generated whenever a user enters a query at a search engine. That space is assumed to be divided to slots, which are auctioned off by the search engine via sponsored search auctions. Potential advertisers whose ad is related to the particular search query compete over these ad slots. Different ad slots correspond to the different possible positions for placing an ad on the webpage, which implies different probabilities of the ad receiving a click by the user. Each advertiser has estimated her value for a click on her ad and decides what bid to submit at the auction. Then, given the bids of all the advertisers, the auction determines the slot each advertiser will be assigned to and her payment per click. A sponsored search naturally defines a strategic game among the advertisers, since they may act strategically and submit their bids in order to maximize their individual objectives. In particular, each player bids the value that would maximize her utility, i.e., her valuation minus payment over all clicks she gets. We are interested in equilibria, i.e., states where no player has an incentive to change her bid given the bids of everybody else, and examine their properties. Although it is natural to assume that the sets of advertisers that participate in auctions concerning relevant queries is (roughly) the same, and that their behavior is adapted over time, we prefer to view a sponsored search auction as a single shot game and incorporate in some sense the knowledge that is gained by observing the actual repeated play so far. Hence, we assume that we have accurate estimates on the click-through rates of the slots, and that each player has an accurate estimate of her valuation for a click. In some cases in addition, a player might possess information regarding the (expected) valuations of the other players for the particular query/auction. This particular model that we adopt was proposed by Edelman et al. [American Economic Review, 2007] and Varian [International Journal of Industrial Organization, 2007], independently. Variants of the celebrated VCG (Vickrey-Clark-Groves) auction mechanism guarantee that advertisers act truthfully and, under mild assumptions, lead to revenue or social welfare maximization. Still, the sponsored search industry mostly uses GSP (Generalized Second Price) auctions; these auctions are known to be non-truthful and suboptimal in terms of social welfare and revenue. In an attempt to explain this tradition, we provide Price of Anarchy bounds in order to measure the efficiency loss due to the strategic behavior of the players. Moreover, we prove revenue guarantees to bound the suboptimality of GSP in that respect (in particular, we define variants of the GSP auction mechanism that yield good revenue guarantees). All of our bounds are very small constants, i.e., we prove that the social welfare (respectively, revenue) of any equilibrium belonging to a particular class of the game induced by the GSP auction is

vi at most a small constant factor away from the optimal social welfare (respectively, revenue, under mild assumptions). We consider several equilibrium notions both in the full information setting as well as under a wide range of sources of uncertainty. In particular, we study the classes of pure Nash, coarse correlated, and Bayesian coarse correlated equilibria for our analysis regarding the social welfare, while we consider the class of Bayes-Nash equilibria for our analysis regarding the revenue of GSP auctions. Especially for the social welfare analysis, our results can be generalized in order to incorporate ad-qualities. Our results are very robust with respect to uncertainty both in the valuations of the participants and the quality of the ads as well as with respect to information asymmetries and rationality assumptions imposed on the players. Moreover, note that certain equilibrium notions that we examine allow for correlations in the players valuations and the ad-qualities. We also consider the problem of designing an optimal auction in the single-item setting. Single-item auctions belong to a more fundamental type of auction, but can also be thought of as a special case of sponsored search auctions. The seminal work of Myerson [Mathematics of Operations Research, 1981] characterizes optimal, i.e., revenue-maximizing and truthful, single-item auctions, among bidders with independent valuations, and it is in fact a relatively simple deterministic auction mechanism that achieves these desiderata. In contrast, when bidders have correlated valuations, designing the optimal deterministic auction is a computationally demanding problem. We prove a strong APX-hardness result that applies to the 3-player case. We furthermore give a separation result between the revenue of deterministic and randomized optimal auctions.

Περιεχόμενα Σελίδα Περίληψη........................................... iii Abstract............................................ v Περιεχόμενα.......................................... vi Κατάλογος Πινάκων..................................... ix Κατάλογος Σχημάτων.................................... x 1 Εισαγωγή 1 1.1 Δημοπρασίες χρηματοδοτούμενης αναζήτησης..................... 1 1.1.1 Προηγούμενα αποτελέσματα.......................... 9 1.2 Δημοπρασίες ενός αντικειμένου............................ 11 1.2.1 Προηγούμενα αποτελέσματα.......................... 13 1.3 Η συνεισϕορά της διατριβής.............................. 14 2 Σημειογραϕία και Απαραίτητο Μαθηματικό Υπόβαθρο 19 2.1 Το μοντέλο....................................... 19 2.2 Καταστάσεις ισορροπίας................................ 22 2.3 Μέτρα κοινωνικής ευημερίας και εσόδων........................ 25 2.4 Ομαλές πιθανοτικές κατανομές και VCG........................ 27 2.5 Πίνακας αναϕοράς για συμβολισμούς.......................... 28 3 Χρηματοδοτούμενες Αναζητήσεις Κοινωνική Ευημερία 31 3.1 Συνθήκες πλήρους πληροϕόρησης........................... 32 3.1.1 Το τίμημα της αναρχίας για αμιγείς ισορροπίες Nash............. 35 3.1.2 Το τίμημα της αναρχίας για CC ισορροπίες.................. 43 3.2 Συνθήκες μερικής πληροϕόρησης............................ 45 3.2.1 Το Bayesian τίμημα της αναρχίας για CC ισορροπίες............. 47 3.3 Χρήσιμα τεχνικά λήμματα................................ 51 vii

viii ΠΕΡΙΕΧ ΟΜΕΝΑ 4 Χρηματοδοτούμενες Αναζητήσεις Εσοδα 57 4.1 Ομαλές πιθανοτικές κατανομές και ισορροπίες Bayes-Nash.............. 57 4.1.1 Ελάχιστες εγγυήσεις εσόδων.......................... 58 4.1.2 Εγγύηση εσόδων στη γενική περίπτωση.................... 59 4.2 MHR πιθανοτικές κατανομές και ισορροπίες Bayes-Nash............... 64 4.2.1 Ελάχιστες εγγυήσεις εσόδων.......................... 65 4.2.2 Εγγύηση εσόδων στη γενική περίπτωση.................... 66 4.2.3 Εγγύηση εσόδων με κατώϕλι Myerson.................... 68 4.3 Χρήσιμα τεχνικά λήμματα................................ 73 5 Δημοπρασίες Ενός Αντικειμένου 79 5.1 Το πρόβλημα του σχεδιασμού της βέλτιστης δημοπρασίας.............. 79 5.2 Το πρόβλημα 3OAD είναι APX-δύσκολο Η κατασκευή............... 82 5.3 Το πρόβλημα 3OAD είναι APX-δύσκολο Η ανάλυση................ 95 5.4 Ντετερμινιστικές ή μη δημοπρασίες........................... 100 6 Συμπεράσματα και Ανοιχτά Προβλήματα 105 Συντμήσεις 109 Ορολογία 111 Βιβλιογραϕία 111 viii

Κατάλογος Πινάκων 2.1 Συμβολισμοί για παιχνίδια δημοπρασίας........................ 29 5.1 Τα σημεία του προτασιακού gadget που σχετίζεται με την πρόταση e 1 (h) = (v i v j v k ) της εξίσωσης e(h) : v i + v j + v k = 1 (mod 2)................... 86 5.2 Τα σημεία του προτασιακού gadget που σχετίζεται με την πρόταση e 2 (h) = ( v i v j v k ) της εξίσωσης e(h) : v i + v j + v k = 1 (mod 2)................ 87 5.3 Τα σημεία του προτασιακού gadget που σχετίζεται με την πρόταση e 3 (h) = ( v i v j v k ) της εξίσωσης e(h) : v i + v j + v k = 1 (mod 2)................ 88 5.4 Τα σημεία του προτασιακού gadget που σχετίζεται με την πρόταση e 4 (h) = (v i v j v k ) της εξίσωσης e(h) : v i + v j + v k = 1 (mod 2)............... 89 5.5 Τα σημεία του προτασιακού gadget που σχετίζεται με την πρόταση e 1 (h) = ( v i v j v k ) της εξίσωσης e(h) : v i + v j + v k = 0 (mod 2)............... 91 5.6 Τα σημεία του προτασιακού gadget που σχετίζεται με την πρόταση e 2 (h) = (v i v j v k ) της εξίσωσης e(h) : v i + v j + v k = 0 (mod 2).................. 92 5.7 Τα σημεία του προτασιακού gadget που σχετίζεται με την πρόταση e 3 (h) = (v i v j v k ) της εξίσωσης e(h) : v i + v j + v k = 0 (mod 2)................ 93 5.8 Τα σημεία του προτασιακού gadget που σχετίζεται με την πρόταση e 4 (h) = ( v i v j v k ) της εξίσωσης e(h) : v i + v j + v k = 0 (mod 2)................ 94 5.9 Τα σημεία της κατασκευής του Θεωρήματος 5.9.................... 102 6.1 Συντμήσεις....................................... 109 6.2 Ορολογία........................................ 111 ix

x ΚΑΤ ΑΛΟΓΟΣ ΠΙΝ ΑΚΩΝ x

Κατάλογος Σχημάτων 5.1 Το gadget μεταβλητών και τα προτασιακά gadget που αντιστοιχούν στην εξίσωση e(h) : v i +v j +v k = 1 (mod 2). Οι μεγάλοι κυκλικοί δίσκοι αντιπροσωπεύουν σημεία βάρους 1 είτε σημεία μεταβλητής, οι μικρότεροι κυκλικοί δίσκοι αντιπροσωπεύουν συνδετικά σημεία είτε σημεία βάρους θ, ενώ οι κύκλοι αντιπροσωπεύουν αναστολείς. Οι συμβολισμοί έχουν απλοποιηθεί παραλείποντας τον δείκτη h............ 90 5.2 Το gadget μεταβλητών και τα προτασιακά gadget που αντιστοιχούν στην εξίσωση e(h) : v i +v j +v k = 0 (mod 2). Οι μεγάλοι κυκλικοί δίσκοι αντιπροσωπεύουν σημεία βάρους 1 είτε σημεία μεταβλητής, οι μικρότεροι κυκλικοί δίσκοι αντιπροσωπεύουν συνδετικά σημεία είτε σημεία βάρους θ, ενώ οι κύκλοι αντιπροσωπεύουν αναστολείς. Οι συμβολισμοί έχουν απλοποιηθεί παραλείποντας τον δείκτη h............ 96 5.3 Το στιγμιότυπο που χρησιμοποιείται στην απόδειξη του Θεωρήματος 5.9. Οι μεγάλοι κυκλικοί δίσκοι αντιπροσωπεύουν σημεία βάρους 1, οι κύκλοι αντιπροσωπεύουν αναστολείς, ενώ οι μικρότεροι κυκλικοί δίσκοι αντιπροσωπεύουν τα υπόλοιπα σημεία βάρους θ......................................... 103 xi

xii ΚΑΤ ΑΛΟΓΟΣ ΣΧΗΜ ΑΤΩΝ xii

Κεϕάλαιο 1 Εισαγωγή Στην παρούσα διατριβή εξετάζουμε διάϕορους τύπους δημοπρασίας και τις ιδιότητές τους. Πρώτα θεωρούμε δημοπρασίες χρηματοδοτούμενης αναζήτησης και υπολογίζουμε ϕράγματα στην αποδοτικότητα των εκβάσεών τους όσον αϕορά στην κοινωνική ευημερία και στα έσοδα, έχοντας υιοθετήσει παιγνιοθεωρητική προσέγγιση. Επίσης, εξετάζουμε δημοπρασίες ενός αντικειμένου από τη σκοπιά του σχεδιασμού της βέλτιστης δημοπρασίας. Στη συνέχεια αυτού του κεϕαλαίου περιγράϕουμε αυτούς τους τύπους δημοπρασίας και παρουσιάζουμε προηγούμενα σχετικά ερευνητικά αποτελέσματα καθώς και τα αποτελέσματα που προέκυψαν κατά την εκπόνηση της παρούσας διατριβής. 1.1 Δημοπρασίες χρηματοδοτούμενης αναζήτησης Η πώληση διαϕημιστικού χώρου στο Διαδίκτυο είναι η βασική πηγή εσόδων για τους παρόχους online υπηρεσιών και πραγματοποιείται με δημοπρασίες διαϕημίσεων (ad auctions) διαϕόρων ειδών. Το μεγαλύτερο μέρος αυτών των εσόδων προέρχεται από δημοπρασίες χρηματοδοτούμενης αναζήτησης (sponsored search auctions), κατά τις οποίες μια μηχανή αναζήτησης παρουσιάζει διαϕημίσεις δίπλα στα αποτελέσματα κάθε αναζήτησης. Η επιτυχία αυτής της διαδικασίας έγκειται, εν μέρει, στην ικανότητα των παρόχων να εξειδικεύουν τις διαϕημίσεις που δείχνουν με βάση τις προτιμήσεις των χρηστών, βασιζόμενοι για παράδειγμα στις προηγούμενες τους αναζητήσεις. Με άλλα λόγια, μια μηχανή αναζήτησης μπορεί να επιλέξει να παρουσιάσει διαϕημίσεις που ταιριάζουν με μια συγκεκριμένη αναζήτηση. Βέβαια, ο μεγάλος βαθμός επεξεργασίας πληροϕοριών περιπλέκει τη διαδικασία της πώλησης του διαϕημιστικού χώρου στους πιθανούς διαϕημιζόμενους. Συγκεκριμένα, η πραγματοποίηση μιας αναζήτησης σε μια μηχανή αναζήτησης δημιουργεί διαϕημιστικό χώρο (εκ του μη όντος) προς πώληση, με συγκεκριμένα χαρακτηριστικά που αϕορούν την καταλληλότητα ή μη διαϕορετικών διαϕημίσεων σε αυτή την αναζήτηση, και οι διαϕημίσεις πρέπει να επιλεχθούν και να τοποθετηθούν στιγμιαία. Οι πλέον καθιερωμένοι μηχανισμοί που χρησιμοποιούνται στην επίλυση δημοπρασιών χρηματοδοτούμενης αναζήτησης προϋποθέτουν πως κάθε διαϕημιζόμενος κάνει μια δήλωση η οποία αντιστοιχεί 1

ΚΕΦ ΑΛΑΙΟ 1. ΕΙΣΑΓΩΓ Η στο μέγιστο ποσό που θα ήταν διατεθειμένος να πληρώσει για κάθε έναν χρήστη που κάνει κλικ στη διαϕήμισή του και κατά συνέπεια επισκέπτεται την ιστοσελίδα του. Αυτές οι δηλώσεις υπόκεινται σε αυτοματοποιημένη επεξεργασία όποτε πρόκειται να εμϕανιστεί ένα σύνολο διαϕημίσεων. Οι Edelman et al. [2007] και Varian [2007] προτείνουν ένα (πλέον τυπικό) μοντέλο για αυτή τη διαδικασία, το οποίο ακολουθούμε και εμείς. Σύμϕωνα με αυτό το μοντέλο, ένα σύνολο διαϕημιζόμενων που επιθυμούν να μεγιστοποιήσουν την ωϕέλειά τους ανταγωνίζονται για ένα σύνολο θέσεων υποδοχής διαϕημίσεων που είναι ταξινομημένες με βάση το ρυθμό επιλογής σε μη-αύξουσα σειρά. Ο διοργανωτής της δημοπρασίας συλλέγει τις προσϕορές/δηλώσεις από τους διαϕημιζόμενους και τους αναθέτει στις διαθέσιμες θέσεις (συνήθως σε μη-αύξουσα σειρά δηλώσεων). Επιπλέον, ο διοργανωτής της δημοπρασίας ορίζει μια πληρωμή ανά κλικ για τον κάθε διαϕημιζόμενο. Ανάλογα με τον τρόπο που ορίζονται οι πληρωμές, ορίζονται και οι διαϕορετικές δημοπρασίες. Χαρακτηριστικά παραδείγματα είναι οι δημοπρασίες VCG (Vickrey-Clark-Groves), GSP (Generalized Second Price ή γενικευμένος μηχανισμός δεύτερης τιμής), και GFP (Generalized First Price ή γενικευμένος μηχανισμός πρώτης τιμής). Η πιο δημοϕιλής μέθοδος επίλυσης (δηλώσεων) αυτή τη στιγμή είναι ο μηχανισμός δημοπρασίας GSP, ο οποίος είναι γενίκευση του γνωστού μηχανισμού δημοπρασίας Vickrey. Σε μια δημοπρασία χρηματοδοτούμενης αναζήτησης υποθέτουμε την ύπαρξη αρκετών θέσεων υποδοχής διαϕημίσεων, οι οποίες δεν είναι το ίδιο επιθυμητές από τους χρήστες (π.χ., οι θέσεις στην κορυϕή της ιστοσελίδας είναι πιο αποτελεσματικές). Εύλογα, οι διαϕημιζόμενοι εμπλέκονται ως παίχτες σε ένα στρατηγικό παίγνιο που ορίζεται από τη δημοπρασία. Η δήλωση που υποβάλλει κάθε παίχτης είναι αυτή που μεγιστοποιεί την ωϕέλειά του, η οποία ορίζεται ως η αξία μείον την πληρωμή για όλα τα κλικ που δέχεται, δεδομένων των δηλώσεων των υπόλοιπων παιχτών. Αυτή η συμπεριϕορά οδηγεί σε καταστάσεις ισορροπίας, δηλαδή καταστάσεις του παιγνίου από τις οποίες κανένας παίχτης δεν έχει κίνητρο να αποκλίνει (μονομερώς) σε άλλη δήλωση. Παραδοσιακά, η ειλικρινής συμπεριϕορά των παιχτών (αλλιώς ϕιλαλήθεια του μηχανισμού) είναι ένα πολύ σημαντικό επιθυμητό χαρακτηριστικό στη βιβλιογραϕία της Οικονομικής Θεωρίας που σχετίζεται με δημοπρασίες [Krishna, 2002]. Στους ϕιλαλήθεις μηχανισμούς δημοπρασίας, η ειλικρίνεια των παιχτών οδηγεί σε καταστάσεις ισορροπίας σύμϕωνα με συγκεκριμένες έννοιες (π.χ., ισορροπία κυρίαρχης στρατηγικής, ισορροπία Nash ή Bayes-Nash). Ενας τέτοιος μηχανισμός εγγυάται τη μεγιστοποίηση της κοινωνικής ευημερίας (δηλαδή, της συνολικής αξίας των παιχτών). Ο VCG είναι χαρακτηριστικό παράδειγμα ϕιλαλήθους μηχανισμού δημοπρασίας [Vickrey, 1961, Clarke, 1971, Groves, 1973]. Αντιθέτως, οι μηχανισμοί δημοπρασίας GSP δεν είναι ϕιλαλήθεις [Edelman et al., 2007, Varian, 2007], και η έκβασή τους δεν είναι πάντα η βέλτιστη από πλευράς κοινωνικής ευημερίας. Παρ όλα αυτά, εξακολουθούν να σημειώνουν τεράστια επιτυχία όντας οι επικρατέστεροι μηχανισμοί δημοπρασίας που χρησιμοποιούνται από τους ηγέτες της βιομηχανίας χρηματοδοτούμενων αναζητήσεων, όπως η Google, η Microsoft, και η Yahoo! Ετσι, τίθεται το εξής ερώτημα: Ποιες είναι οι θεωρητικές ιδιότητες του μηχανισμού δημοπρασίας GSP που εξηγούν την επικράτησή του; Αρκετή έρευνα έχει επικεντρωθεί στην ερμηνεία της ευρείας αποδοχής του μηχανισμού GSP 2

1.1. ΔΗΜΟΠΡΑΣ ΙΕΣ ΧΡΗΜΑΤΟΔΟΤΟ ΥΜΕΝΗΣ ΑΝΑΖ ΗΤΗΣΗΣ στις δημοπρασίες χρηματοδοτούμενης αναζήτησης. Αρχικά, οι Edelman et al. [2007] και Varian [2007] δείχνουν ότι στο μοντέλο πλήρους πληροϕόρησης ένας μηχανισμός δημοπρασίας GSP οδηγεί σε τουλάχιστον μια αμιγή ισορροπία Nash η οποία έχει την ίδια ανάθεση και πληρωμές με τον μηχανισμό VCG, και κατά συνέπεια έχει τη βέλτιστη κοινωνική ευημερία. Προς την ίδια κατεύθυνση παρουσιάζονται ϕράγματα στην κοινωνική ευημερία χειρότερης περίπτωσης [Lahaie, 2006, Paes Leme and Tardos, 2010, Caragiannis et al., 2011, Lucier and Paes Leme, 2011] (κάποια από αυτά τα αποτελέσματα παρουσιάζονται στο Κεϕάλαιο 3 της παρούσας διατριβής) σε διάϕορες κατηγορίες καταστάσεων ισορροπίας (αμιγείς ισορροπίες Nash, CC ισορροπίες, και ισορροπίες Bayes-Nash). Το κύριο συμπέρασμα από αυτές τις εργασίες είναι ότι η κοινωνική ευημερία σε κατάσταση ισορροπίας είναι τουλάχιστον κάποιο σταθερό ποσοστό επί της βέλτιστης κοινωνικής ευημερίας. Παρ όλα αυτά, θα ήταν λογικό να θεωρήσουμε ότι η μεγιστοποίηση των εσόδων (και όχι της κοινωνικής ευημερίας) είναι η κυρίαρχη ανησυχία από τη σκοπιά της βιομηχανίας χρηματοδοτούμενων αναζητήσεων. Τα αποτελέσματα που παρουσιάζονται στην εργασία [Lucier et al., 2012] συμπληρώνονται από τα αποτελέσματα του Κεϕαλαίου 4 της παρούσας διατριβής, δίνοντας μια θεωρητική ερμηνεία της ευρείας αποδοχής των μηχανισμών δημοπρασίας GSP εξετάζοντας τα έσοδα που προκύπτουν από αυτούς (ή παραλλαγές αυτών). Ισχυριζόμαστε ότι η δημοπρασία χρηματοδοτούμενης αναζήτησης στην οποία εϕαρμόζεται ο μηχανισμός GSP (δημοπρασία GSP) μοντελοποιείται καλύτερα σαν Bayesian παίγνιο μερικής πληρο- ϕόρησης. Η μοντελοποίηση της δημοπρασίας GSP σε παίγνιο πλήρους πληροϕόρησης προϋποθέτει πως δημοπρασίες που αϕορούν αναζητήσεις με τις ίδιες λέξεις κλειδιά πραγματοποιούνται επανειλημμένως με το ίδιο σύνολο διαϕημιζόμενων, και κατά τη διάρκεια αυτού του επαναλαμβανόμενου παιγνίου οι δηλώσεις των παιχτών σταθεροποιούνται. Το σύνολο των σταθερών δηλώσεων που προκύπτει μοντελοποιείται αρκετά καλά από μια αμιγή ισορροπία Nash. Οι αναλύσεις των Edelman et al. [2007] και Varian [2007] παρέχουν μια διαισθητική ερμηνεία της δομής μιας δημοπρασίας GSP με την παραπάνω υπόθεση. Παρ όλα αυτά, το σύνολο και οι αξίες των παιχτών που συμμετέχουν μπορεί να ποικίλει αρκετά ανάμεσα στις διαϕορετικές (επαναλαμβανόμενες) δημοπρασίες GSP. Ε- πίσης, κάθε αναζήτηση είναι μοναδική, υπό την έννοια ότι δεν ορίζεται μονάχα από τις λέξεις που χρησιμοποιεί ο χρήστης αλλά και από τη χρονική στιγμή που πραγματοποιείται, την τοποθεσία και το ιστορικό του χρήστη, καθώς και πολλούς άλλους παράγοντες. Οι μηχανές αναζήτησης χρησιμοποιούν περίπλοκους αλγορίθμους μάθησης στη συλλογή των δηλώσεων για να προσδιορίσουν την ποιότητα/σχετικότητα κάθε διαϕημιζόμενου για τη συγκεκριμένη αναζήτηση και στη συνέχεια να επιλέξουν ποιες από αυτές τις διαϕημίσεις θα εμϕανιστούν. Κατά συνέπεια, υπάρχει αβεβαιότητα όσον αϕορά στους παίχτες που ανταγωνίζονται, καθώς και στους βαθμούς ποιότητας. Αυτή την αβεβαιότητα ενσωματώνουμε στην ανάλυσή μας μοντελοποιώντας τη δημοπρασία GSP σε Bayesian παίγνιο, και θέτουμε το εξής ερώτημα: Ποιες είναι οι θεωρητικές ιδιότητες του μηχανισμού δημοπρασίας GSP λαμβάνοντας υπόψιν την αβεβαιότητα που αντιμετωπίζουν οι παίχτες; Οι συσχετιζόμενες πιθανοτικές κατανομές είναι πολύ σημαντικές στο μοντέλο που εξετάζουμε, 3

ΚΕΦ ΑΛΑΙΟ 1. ΕΙΣΑΓΩΓ Η ιδιαίτερα όταν η ποιότητα των παιχτών είναι ενσωματωμένη, αϕού οι ίδιοι παράγοντες που επηρεάζουν την σχετικότητα/ποιότητα ενός διαϕημιζόμενου, επηρεάζουν και τις αξίες του για ένα κλικ (για παράδειγμα, ένα bot δεν θα κάνει κλικ σε μια διαϕήμιση ανεξαρτήτως του διαϕημιζόμενου). Φράσσοντας την ποιότητα των εκβάσεων ενός μηχανισμού: Το Τίμημα της Α- ναρχίας και η εγγύηση εσόδων. Απαντάμε στο ερώτημα που αϕορά στην επικράτηση του μηχανισμού δημοπρασίας GSP υπολογίζοντας ποσοτικά την ανεπάρκεια των εκβάσεων που προκύπτουν από μια δημοπρασία GSP, χρησιμοποιώντας το γνωστό Τίμημα της Αναρχίας, δηλαδή το λόγο της βέλτιστης κοινωνικής ευημερίας προς την χειρότερη κοινωνική ευημερία σε κατάσταση ισορροπίας. Δείχνουμε ότι η κοινωνική ευημερία που προκύπτει σε οποιαδήποτε κατάσταση ισορροπίας είναι τουλάχιστον 1 η ποσοστό επί της βέλτιστης κοινωνικής ευημερίας (εκείνης που θα μπορούσε να προκύψει αν ο μηχανισμός γνώριζε την αξία και την ποιότητα κάθε παίχτη εκ των προτέρων). Η τιμή του η χρησιμοποιείται ως μέτρο για την «ανθεκτικότητα» ενός μηχανισμού δημοπρασίας όσον αϕορά στη στρατηγική συμπεριϕορά των παιχτών: πόσο μπορεί να βλάψει η στρατηγική συμπεριϕορά την κοινωνική ευημερία στη χειρότερη περίπτωση; Οσο πιο κοντά είναι η τιμή του η στο 1, τόσο πιο ανθεκτικός είναι ο μηχανισμός δημοπρασίας. Ενας μηχανισμός που πάντοτε οδηγεί σε βέλτιστες αναθέσεις ως προς την κοινωνική ευημερία θα είχε τίμημα της αναρχίας ίσο με 1. Φράσσουμε την ανεπάρκεια ως προς την κοινωνική ευημερία των εκβάσεων του μηχανισμού δημοπρασίας GSP στο Bayesian μοντέλο (αλλιώς, μοντέλο μερικής πληροϕόρησης) [Harsanyi, 1967] αλλά και στο μοντέλο πλήρους πληροϕόρησης, και αναϕέρουμε πως η ανάλυσή μας επεκτείνεται και σε εκβάσεις που προκύπτουν από την εκμάθηση των παιχτών (learning outcomes), χωρίς να ϕτάσουν απαραίτητα σε κατάσταση ισορροπίας (βλ. Ενότητα 2.2). Το τίμημα της αναρχίας είναι σημαντικό εργαλείο για την ανάλυση μηχανισμών που δεν επιβάλλουν την ειλικρίνεια ως κυρίαρχη στρατηγική (dominant strategy truthfulness), όπως ο μηχανισμός δημοπρασίας GSP, αϕού υπολογίζει ποσοτικά την ενδεχόμενη απώλεια κοινωνικής ευημερίας σε μια ισορροπία. Στην ανάλυσή μας θεωρούμε το μοντέλο πλήρους πληροϕόρησης όπου δεν υπάρχει α- βεβαιότητα (και δείχνουμε μια αναπάντεχα πολύ μικρή τιμή για το τίμημα της αναρχίας), καθώς επίσης και ένα γενικό μοντέλο που ενσωματώνει την υπάρχουσα αβεβαιότητα στο οποίο δείχνουμε ότι το τίμημα της αναρχίας εξακολουθεί να ϕράσσεται από μια μικρή σταθερά. Καταλήγουμε στο συμπέρασμα ότι ο μηχανισμός δημοπρασίας GSP, αν και δεν είναι εγγυημένα βέλτιστος, έχει αρκετά ικανοποιητική απόδοση όσον αϕορά στην κοινωνική ευημερία των εκβάσεών του, μιας και η απώλεια της κοινωνικής ευημερίας ϕράσσεται από μια τιμή η οποία δεν εξαρτάται από τον αριθμό των θέσεων, τον αριθμό των παιχτών ούτε και τις κατανομές των αξιών τους. Αντιθέτως, η παραλλαγή του μηχανισμού δημοπρασίας GSP που στο παρελθόν χρησιμοποιούσε η Yahoo!, κατά την οποία οι παίχτες ανατίθενται σε θέσεις κατά ϕθίνουσα αξία αγνοώντας την ποιότητά τους, μπορεί να καταλήξει σε ανεπάρκεια ανάλογη του εύρους της ποιότητας, ενώ η τυχαία ανάθεση των παιχτών σε θέσεις μπορεί να καταλήξει σε ανεπάρκεια ανάλογη του αριθμού των παιχτών. 4

1.1. ΔΗΜΟΠΡΑΣ ΙΕΣ ΧΡΗΜΑΤΟΔΟΤΟ ΥΜΕΝΗΣ ΑΝΑΖ ΗΤΗΣΗΣ Οσον αϕορά στη μελέτη των εσόδων που προκύπτουν από δημοπρασίες GSP, θεωρούμε το Bayesian μοντέλο όπου οι αξίες των διαϕημιζόμενων είναι ανεξάρτητες τυχαίες μεταβλητές που ακολουθούν μια κοινή πιθανοτική κατανομή για να μοντελοποιήσουμε την έμϕυτη αβεβαιότητα στις πεποιθήσεις των διαϕημιζόμενων. Το μοντέλο αυτό έχει καθιερωθεί από την πρωτοποριακή εργασία του Myerson [1981] που αϕορά σε δημοπρασίες ενός αντικειμένου (μια ειδική περίπτωση δημοπρασίας διαϕημίσεων). Τα αποτελέσματα του Myerson [1981] επεκτείνονται στο δικό μας μοντέλο ως εξής. Σύμϕωνα με κάποιες ήπιες παραδοχές, τα έσοδα που προκύπτουν από έναν παίχτη σε μια ισορροπία Bayes-Nash εξαρτώνται εξ ολοκλήρου από την κατανομή του ρυθμού επιλογής που αντιστοιχεί στη θέση στην οποία ο παίχτης ανατίθεται για τις διαϕορετικές αξίες. Κατά συνέπεια, δύο ισορροπίες Bayes-Nash που αντιστοιχούν στην ίδια ανάθεση αποδίδουν τα ίδια έσοδα, ακόμα και αν προκύπτουν από διαϕορετικούς μηχανισμούς δημοπρασίας. Αυτή η πρόταση είναι γνωστή και ως ισοδυναμία εσόδων (revenue equivalence). Η ανάθεση που μεγιστοποιεί τα αναμενόμενα έσοδα είναι τέτοια ώστε οι παίχτες με χαμηλές δηλώσεις να αποκλείονται και οι υπόλοιποι παίχτες να ανατίθενται σε θέσεις με μη-αύξουσα σειρά των αξιών τους. Αυτή η ανάθεση είναι σε ισορροπία Bayes-Nash υπό την παραλλαγή του μηχανισμού δημοπρασίας VCG όπου εϕαρμόζεται ένα κατάλληλο κατώϕλι στις αποδεκτές δηλώσεις των παιχτών για τη συμμετοχή τους στη δημοπρασία (στο εξής το καλούμε κατώϕλι Myerson). Η βελτιστοποίηση των εσόδων σε δημοπρασίες χρηματοδοτούμενης αναζήτησης στο Bayesian μοντέλο συζητείται εκτενώς στην πρόσϕατη επισκόπηση του Hartline [2013]. Οι μηχανισμοί δημοπρασίας GSP ενδέχεται να οδηγήσουν σε διαϕορετικές ισορροπίες Bayes- Nash [Gomes and Sweeney, 2013] στις οποίες κάποιος παίχτης με υψηλότερη αξία ανατίθεται σε μια θέση με χαμηλότερο ρυθμό επιλογής από έναν άλλον παίχτη με χαμηλότερη αξία, και αυτό συμβαίνει με αυστηρά θετική πιθανότητα. Καταλήγουμε, οπότε, ότι τα έσοδα δεν είναι βέλτιστα. Σκοπός μας είναι να υπολογίσουμε την απώλεια εσόδων που προκύπτει (σε σχέση με τα βέλτιστα έσοδα) για κάθε ισορροπία Bayes-Nash των μηχανισμών δημοπρασίας GSP, αποδεικνύοντας εγγυήσεις εσόδων χειρότερης περίπτωσης. Ορίζουμε την έννοια της εγγύησης εσόδων σε αντιστοιχία με το Τίμημα της Αναρχίας το οποίο αναϕέρεται στην κοινωνική ευημερία των εκβάσεων. Ετσι, εγγύηση εσόδων ίση με ρ για έναν μηχανισμό δημοπρασίας σημαίνει ότι τα έσοδα που προκύπτουν σε οποιαδήποτε ισορροπία Bayes-Nash, είναι τουλάχιστον 1/ρ ποσοστό επί των βέλτιστων εσόδων. Η δημοπρασία GSP και οι πηγές αβεβαιότητας. Ο μηχανισμός δημοπρασίας GSP είναι με διαϕορά ο πιο δημοϕιλής μηχανισμός στις δημοπρασίες χρηματοδοτούμενης αναζήτησης. Εκτελείται κάθε ϕορά που ένας χρήστης πραγματοποιεί μια αναζήτηση, και κατά συνέπεια προκύπτει μια επαναλαμβανόμενη μορϕή δημοπρασίας στην οποία οι παίχτες κάνουν προσϕορές/δηλώσεις ε- πανειλημμένως για να διαϕημιστούν. Βέβαια, η μοντελοποίηση καταστάσεων ισορροπίας σε ένα επαναλαμβανόμενο παίγνιο είναι αναμϕισβήτητα περίπλοκη και παράτολμη, μιας και υπάρχει πληθώρα αϕύσικων καταστάσεων ισορροπίας στις οποίες μπορεί να καταλήξει το παίγνιο εξαιτίας της πιθανότητας να τίθενται δηλώσεις με σκοπό να επηρεάσουν τη συμπεριϕορά των υπολοίπων στους 5

ΚΕΦ ΑΛΑΙΟ 1. ΕΙΣΑΓΩΓ Η επόμενους γύρους, είτε οι δηλώσεις να έχουν εξερευνητικό ύϕος, και ούτω καθεξής. Μια κοινή απλοποίηση είναι η ανάλυση των δημοπρασιών που αναϕέρονται στην ίδια αναζήτηση (λέξη) σε συνδυασμό με την υπόθεση ότι κάθε παίχτης δεν θα αργήσει να μάθει τις αξίες των υπόλοιπων παιχτών, και έτσι, σύντομα θα καταλήξουν όλοι σε ισορροπία. Αυτή η κατάσταση ισορροπίας αντιστοιχεί σε μια αμιγή ισορροπία Nash (για το μοντέλο πλήρους πληροϕόρησης) της παραλλαγής της δημοπρασίας GSP σε παίγνιο ενός γύρου (όχι επαναλαμβανόμενο) [Edelman and Schwarz, 2010]. Οπότε, είναι κοινή πρακτική η εξέταση των παιγνίων δημοπρασίας ενός γύρου στο μοντέλο πλήρους πληρο- ϕόρησης σαν εκτίμηση της αναμενόμενης συμπεριϕοράς στο γενικότερο επαναλαμβανόμενο παίγνιο [Edelman et al., 2007, Varian, 2007, Paes Leme and Tardos, 2009]. Οπως έχουμε αναϕέρει παραπάνω, κάθε αναζήτηση είναι μοναδική και εξαρτάται από τα ιδιαίτερα χαρακτηριστικά του χρήστη εκτός από τις λέξεις που χρησιμοποιεί στην αναζήτησή του. Αυτό το γεγονός λαμβάνεται υπόψιν από τον αλγόριθμο ανάθεσης διαϕημίσεων που χρησιμοποιεί η μηχανή αναζήτησης. Ο αλγόριθμος ανάθεσης διαϕημίσεων αντιστοιχίζει έναν βαθμό ποιότητας (quality factor/score) σε κάθε διαϕημιζόμενο κατά τη διαδικασία επιλογής εκείνων που θα συμμετέχουν τελικά στη δημοπρασία. Διαισθητικά, μπορούμε να σκεϕτούμε τον βαθμό ποιότητας ενός διαϕημιζόμενου ως εκτίμηση του πόσο πιθανό είναι να κάνει κλικ στη συγκεκριμένη διαϕήμιση ο χρήστης που κάνει τη συγκεκριμένη αναζήτηση. Στη συνέχεια, αυτοί οι βαθμοί ποιότητας χρησιμοποιούνται στην ταξινόμηση των παιχτών σαν βάρη με τα οποία πολλαπλασιάζονται οι δηλώσεις τους. Οι τελικές δηλώσεις που προκύπτουν από αυτή τη διαδικασία ισοδυναμούν με δηλώσεις που θα προέκυπταν με παρόμοιο τρόπο από την εϕαρμογή των βαθμών ποιότητας στις αξίες των παιχτών (τελικές αξίες). Σύμϕωνα με την υπόθεσή μας, οι βαθμοί ποιότητας λειτουργούν ως μέτρο της σχετικότητας μιας διαϕήμισης με την αναζήτηση, άρα και του αριθμού των κλικ που θα λάβει, ενώ η τελική αξία ενός διαϕημιζόμενου αντιστοιχεί στην αναμενόμενη αξία που αυτός θα έχει από την προβολή της διαϕήμισής του (αξία επί τον αναμενόμενο αριθμό κλικ). Οπότε, η τελική δήλωση και η τελική αξία ενός παίχτη είναι τυχαίες μεταβλητές που αντιστοιχούν στις αρχικές αξίες και δηλώσεις αϕού πολλαπλασιαστούν με τους βαθμούς ποιότητας που υπολογίζει η μηχανή αναζήτησης εξωγενώς. Οι Athey και Nekipelov [2010] τονίζουν ότι η αβεβαιότητα στους βαθμούς ποιότητας προκαλεί ποιοτικές αλλαγές στη δομή του παιγνίου. Συνεπώς, ακόμα και στην περίπτωση που οι παίχτες συγκλίνουν σε ισορροπία, αυτή η κατάσταση ισορροπίας δεν μπορεί να αντιστοιχιστεί σε έκβαση του παιγνίου στο μοντέλο πλήρους πληροϕόρησης. Η αβεβαιότητα που αϕορά στις τελικές αξίες των διαϕημιζόμενων μοντελοποιείται ορίζοντας ένα παίγνιο δημοπρασίας στο Bayesian μοντέλο (μερικής πληροϕόρησης). Με άλλα λόγια, η αβεβαιότητα που οϕείλεται στις διάϕορες παραμέτρους μιας αναζήτησης, αλλιώς το πλαίσιο της αναζήτησης, και στον αλγόριθμο ανάθεσης διαϕημίσεων αποτυπώνεται στις πιθανοτικές κατανομές τελικών α- ξιών, ακόμα και όταν οι αρχικές αξίες όλων όσων συμμετέχουν στη δημοπρασία είναι γνωστές. Η κατάλληλη έννοια ισορροπίας σε αυτό το μοντέλο είναι η ισορροπία Bayes-Nash ως προς αυτές τις κατανομές. Η ανάλυσή μας που αϕορά στις ιδιότητες κοινωνικής ευημερίας ισχύει ακόμα και στην 6

1.1. ΔΗΜΟΠΡΑΣ ΙΕΣ ΧΡΗΜΑΤΟΔΟΤΟ ΥΜΕΝΗΣ ΑΝΑΖ ΗΤΗΣΗΣ περίπτωση που οι αξίες και οι βαθμοί ποιότητας συσχετίζονται, γεγονός που αποτυπώνει βέλτιστα την κοινή εξάρτησή τους από το πλαίσιο της αναζήτησης. Οι μηχανές αναζήτησης χρησιμοποιούν περίπλοκους αλγορίθμους μάθησης για την εκτίμηση των βαθμών ποιότητας βασιζόμενοι σε κάθε διαθέσιμη πληροϕορία που έχουν για το πλαίσιο της αναζήτησης. Οι διαϕημιζόμενοι είναι δύσκολο να μάθουν από μόνοι τους την έκβαση αυτών των αλγορίθμων. Ετσι, οι μηχανές αναζήτησης μοιράζονται κάποιες πληροϕορίες για τους βαθμούς ποιότητας με τους διαϕημιζόμενους υπό τη μορϕή πιθανοτικών κατανομών. Αυτό μοντελοποιείται με την υπόθεση ότι οι διαϕημιζόμενοι έχουν γνώση της κατανομής των βαθμών ποιότητας. Επίσης, υποθέτουμε ότι οι βαθμοί ποιότητας που υπολογίζονται από τη μηχανή αναζήτησης αντιστοιχούν με μεγάλη ακρίβεια στον αριθμό από κλικ που θα λάβει η κάθε διαϕήμιση. Συνοψίζοντας, υπάρχουν δύο βασικές πηγές αβεβαιότητας: η πρώτη αϕορά στους βαθμούς ποιότητας που αποδίδει η μηχανή αναζήτησης σε κάθε διαϕημιζόμενο και η δεύτερη αϕορά στις αξίες τους. Η εγγενής διαϕορά των δύο πηγών αβεβαιότητας είναι πως ενώ κάθε διαϕημιζόμενος γνωρίζει (και οι πράξεις του μπορεί να εξαρτώνται από) την αξία του, αντιθέτως, οι βαθμοί ποιότητας είναι εξωγενείς και αποκαλύπτονται εκ των υστέρων. Ασύμμετρη πληροϕόρηση. Σε κάθε αγορά, π.χ. δημοπρασία διαϕημίσεων, υπάρχουν διαϕορετικές κατηγορίες παιχτών των οποίων η ποσότητα διαθέσιμης πληροϕορίας για τους ανταγωνιστές μπορεί να ποικίλλει. Υποθέτουμε ότι κάθε παίχτης γνωρίζει ακριβώς την αξία του για ένα κλικ, αλλά ότι κάποιοι μικρότεροι παίχτες, π.χ. ανεξάρτητοι διαϕημιζόμενοι μπορεί να μην έχουν ιδέα για τις αξίες των υπόλοιπων παιχτών και για τους αναμενόμενους βαθμούς ποιότητας, ενώ κάποιοι άλλοι, π.χ. πρακτορεία υποβολής προσϕορών ή μεγάλες εταιρείες με τμήμα διαδικτυακής διαϕήμισης (web advertising department) μπορεί να έχουν καλύτερη εκτίμηση για το πως θα εξελιχθεί μια μεμονωμένη δημοπρασία. Ακόμα και ανάμεσα στους παίχτες της δεύτερης κατηγορίας, δεν έχουν όλοι πρόσβαση στην ίδια ποσότητα πληροϕορίας. Αυτή η ασύμμετρη πληροϕόρηση των παιχτών μοντελοποιείται δίνοντας πρόσβαση σε κάθε παίχτη σε ένα σήμα (ξεχωριστό για τον καθένα) το οποίο παρέχει πληροϕορίες για τους τελικούς τύπους όσων συμμετέχουν στη δημοπρασία. Τα α- ποτελέσματα που παρουσιάζονται στο Κεϕάλαιο 3, τα οποία αϕορούν στην κοινωνική ευημερία στο Bayesian μοντέλο, ισχύουν και υπό συνθήκες ασύμμετρης πληροϕόρησης. Παίχτες σε διαδικασία εκμάθησης. Μέχρι τώρα έχουμε μιλήσει μονάχα για καταστάσεις ισορροπίας του παιγνίου δημοπρασίας. Η ανάλυση καταστάσεων ισορροπίας προϋποθέτει ότι οι παίχτες έχουν ήδη ϕτάσει σε ισορροπία. Οι εκβάσεις μιας διαδικασίας εκμάθησης αποτελούν μια πολύ ενδιαϕέρουσα γενίκευση. Ενα πλέον καθιερωμένο μοντέλο θεωρεί μια επαναλαμβανόμενη εκδοχή του παιγνίου δημοπρασίας και υποθέτει ότι οι στρατηγικές των παιχτών είναι τέτοιες ώστε να ελαχιστοποιείται η λύπη (regret) τους σε βάθος χρόνου. Με άλλα λόγια, ένα τέτοιο μοντέλο υποθέτει ότι οι παίχτες παρατηρούν τα μοτίβα δηλώσεων των υπολοίπων και προσαρμόζουν τις δικές 7

ΚΕΦ ΑΛΑΙΟ 1. ΕΙΣΑΓΩΓ Η τους δηλώσεις με τέτοιο τρόπο ώστε η ωϕέλειά τους να είναι τόσο καλή όσο και με την καλύτερη (μοναδική) στρατηγική αν την επέλεγαν εκ των υστέρων. Παρατηρούμε ότι αν κάθε παίχτης διατηρεί την ίδια (ενδεχομένως πιθανοτική) στρατηγική σε κάθε γύρο του παιγνίου δημοπρασίας, αυτές οι στρατηγικές βρίσκονται σε ισορροπία Nash. Κατά συνέπεια, η υπόθεση απουσίας-λύπης (no-regret assumption) στο επαναλαμβανόμενο παίγνιο είναι γενίκευση της ισορροπίας Nash. Επιπλέον, υπάρχουν πολλές απλές στρατηγικές δηλώσεων κατά τις οποίες η λύπη ελαχιστοποιείται με την πάροδο του χρόνου. Η υπόθεση απουσίας-λύπης δεν προϋποθέτει ότι οι παίχτες ακολουθούν έναν από αυτούς τους αλγορίθμους. Στην πραγματικότητα, μια επιτυχημένη συμπεριϕορά μπορεί να καταλήξει σε καλύτερη ωϕέλεια από ότι η απουσία-λύπης, π.χ. όταν ο παίχτης μπορεί να προβλέψει τη συμπεριϕορά των υπολοίπων. Παρ όλα αυτά, η απουσία-λύπης μοντελοποιεί κάποιας μορϕής ορθολογικότητα: αν υπάρχει μια στρατηγική που είναι επιτυχημένη με συνέπεια, οι παίχτες θα προσπαθήσουν να τη μάθουν με την πάροδο του χρόνου έτσι ώστε να ωϕεληθούν τουλάχιστον τόσο (ή και ακόμα καλύτερα) από όσο θα είχαν ωϕεληθεί ακολουθώντας αυτή τη σταθερή στρατηγική. Υπό αυτή την έννοια, η απουσία-λύπης είναι μια υπόθεση που αποτυπώνει το ένστικτο των παιχτών να μάθουν ωϕέλιμες στρατηγικές με την πάροδο του χρόνου, και ταυτόχρονα παρέχει μια γενίκευση στρατηγικών σε ισορροπία Nash. Αν για όλους τους παίχτες ισχύει η απουσία-λύπης, τότε η εμπειρική κατανομή των δηλώσεων συγκλίνει σε μια «χονδροειδώς» συσχετιζόμενη ισορροπία του παιγνίου, μια ήπια γενίκευση της συσχετιζόμενης ισορροπίας. Υποθέτουμε ότι οι παίχτες χρησιμοποιούν διάϕορους αλγορίθμους για να μάθουν πως να κάνουν βέλτιστες δηλώσεις με δεδομένη την αξία και το σήμα (ασύμμετρης πληροϕόρησής) τους και πετυχαίνουν ελαχιστοποίηση της λύπης με την πάροδο του χρόνου. Με άλλα λόγια, για κάθε πιθανή αξία και σήμα, οι επαναλαμβανόμενες δημοπρασίες επιτρέπουν στους παίχτες να μάθουν πως να δηλώνουν βέλτιστα λαμβάνοντας υπόψιν τις διάϕορες δηλώσεις των υπολοίπων και την αβεβαιότητα για τους βαθμούς ποιότητας, τις αξίες των υπολοίπων και τις πιθανές στρατηγικές. Για τη μελέτη της υποβάθμισης της ποιότητας της αναμενόμενης έκβασης όταν όλοι οι παίχτες χρησιμοποιούν στρατηγικές χωρίς πολλή λύπη, οι Blum et al. [2008] θέσπισαν τον όρο Τίμημα της Ολικής Αναρχίας (Price of Total Anarchy) σε αντιστοιχία με το (κλασσικό) Τίμημα της Αναρχίας. Ισχύει πως το Τίμημα της Ολικής Αναρχίας είναι ίσο με τον λόγο της βέλτιστης κοινωνικής ευημερίας προς την χειρότερη κοινωνική ευημερία όταν το παίγνιο είναι σε «χονδροειδώς» συσχετιζόμενη ισορροπία, τον οποίο καλούμε (Bayesian) Τίμημα της Αναρχίας για CC ισορροπίες στο Κεϕάλαιο 3. Ορθολογικότητα κατά προσέγγιση. Μια από τις βασικές υποθέσεις στην ανάλυση δημοπρασιών είναι η (απόλυτη) ορθολογικότητα των παιχτών όσον αϕορά στη βελτιστοποίηση της ωϕέλειάς τους. Παρ όλα αυτά, στην πραγματικότητα (ειδικά σε online στιγμιότυπα μεγάλης κλίμακας) είναι ϕυσικό να υποθέσουμε ότι ένα ποσοστό των παιχτών που συμμετέχουν σε μια δημοπρασία διαϕημίσεων μπορεί να ακολουθεί πιο απλοϊκές στρατηγικές δηλώσεων, οι οποίες δεν είναι βέλτιστες. Κάποιοι παίχτες μπορεί να μην βρίσκονται σε ισορροπία στο παίγνιο ενός γύρου (προσέγγιση 8

1.1. ΔΗΜΟΠΡΑΣ ΙΕΣ ΧΡΗΜΑΤΟΔΟΤΟ ΥΜΕΝΗΣ ΑΝΑΖ ΗΤΗΣΗΣ της δημοπρασίας GSP), είτε να έχουν την δυνατότητα να υπολογίσουν μονάχα κατά προσέγγιση ωϕέλιμες στρατηγικές. Οσον αϕορά στην ανθεκτικότητα των αποτελεσμάτων μας στην παρουσία παιχτών με περιορισμένη (ή καθόλου) ορθολογικότητα, παρατηρούμε πως ο μηχανισμός δημοπρασίας GSP έχει την ιδιότητα ότι οι εγγυήσεις για κοινωνική ευημερία υποβαθμίζονται με συνεχή (και αναλογικό) τρόπο ως προς τη χαλάρωση του απαιτούμενου επιπέδου ορθολογικότητας. 1.1.1 Προηγούμενα αποτελέσματα Κοινωνική ευημερία. Τα τελευταία χρόνια έχει δοθεί ιδιαίτερη προσοχή στις δημοπρασίες χρηματοδοτούμενης αναζήτησης εξαιτίας του κεντρικού τους ρόλου στη δημιουργία εσόδων στο Διαδίκτυο. Πρώτα εξετάστηκαν από τους Mehta et al. [2007] από τη σκοπιά της βελτιστοποίησης. Το κλασσικό παιγνιοθεωρητικό μοντέλο των δημοπρασιών χρηματοδοτούμενης αναζήτησης προτάθηκε από τους Edelman et al. [2007] και Varian [2007], ταυτόχρονα και ανεξάρτητα, ενώ οι Lahaie et al. [2007] και Maille et al. [2012] κάνουν επισκόπηση των μετέπειτα εξελίξεων. Ακολουθούμε το μοντέλο των Edelman et al. [2007] και Varian [2007]. Σε αυτές τις δύο καινοτόμες εργασίες, οι συγγραϕείς παρατηρούν ότι, αν και η ειλικρίνεια δεν είναι κυρίαρχη στρατηγική υπό τον μηχανισμό δημοπρασίας GSP, το παίγνιο δημοπρασίας στο μοντέλο πλήρους πληροϕόρησης έχει πάντοτε μια ισορροπία Nash στην οποία η ανάθεση και οι πληρωμές είναι ίδιες με αυτές του μηχανισμού VCG. Η ανάλυση επικεντρώνεται σε μια υποκατηγορία ισορροπιών Nash οι οποίες καλούνται ισορροπίες χωρίς-ζήλεια (envy-free equilibria) από τους Edelman et al. [2007], και συμμετρικές ισορροπίες (symmetric equilibria) από τον Varian [2007]. Αποδεικνύεται ότι πάντοτε υπάρχει μια τέτοια κατάσταση ισορροπίας η οποία είναι και αποδοτική ως προς την κοινωνική ευημερία. Σε μια ισορροπία που ανήκει σε αυτή την κατηγορία ένας διαϕημιζόμενος δεν βελτιώνει την ωϕέλειά του ανταλλάσσοντας δηλώσεις με αυτόν που έχει ανατεθεί ακριβώς από πάνω του. Παρατηρούμε ότι αυτή είναι πιο ισχυρή υπόθεση από αυτή της ισορροπίας Nash η οποία ορίζεται με μονομερείς αποκλίσεις στις δηλώσεις των παιχτών. Πράγματι, στη δεύτερη περίπτωση αν ένας παίχτης μονομερώς αλλάξει τη δήλωσή του ώστε να ανατεθεί σε θέση με υψηλότερο ρυθμό επιλογής, θα πληρώνει περισσότερα από όσα πλήρωνε ο παίχτης που βρισκόταν σε αυτή τη θέση. Οι Edelman et al. [2007] και Varian [2007] δίνουν άτυπα επιχειρήματα για την επιλογή των ισορροπιών χωρίς-ζήλεια, αλλά δεν παρουσιάζουν τυπική παιγνιοθεωρητική ανάλυση. Η δική μας ανάλυση αϕορά εγγυήσεις για όλες τις ισορροπίες Nash και δεν περιορίζεται στις ισορροπίες χωρίς-ζήλεια. Παρομοίως, ο Lahaie [2006] εξετάζει το πρόβλημα εγγυήσεων στην κοινωνική ευημερία των εκβάσεων που βρίσκονται σε ισορροπία, αλλά επικεντρώνει την προσοχή του στην ειδική περίπτωση που οι ρυθμοί επιλογής ϕθίνουν εκθετικά με παράγοντα 1/δ. Με αυτή την υπόθεση, ο Lahaie [2006] αποδεικνύει τίμημα της αναρχίας ίσο με min{ 1 δ, 1 1 δ }. Οι Gomes και Sweeney [2013] εξετάζουν τη δημοπρασία GSP στο Bayesian μοντέλο, όπου οι αξίες των παιχτών είναι ανεξάρτητες τυχαίες μεταβλητές που ακολουθούν την ίδια πιθανοτική κατανομή (χωρίς να θεωρούν την αβεβαιότητα που οϕείλεται στους βαθμούς ποιότητας). Δείχνουν ότι 9

ΚΕΦ ΑΛΑΙΟ 1. ΕΙΣΑΓΩΓ Η σε αυτό το μοντέλο δεν είναι εγγυημένη η ύπαρξη συμμετρικής ή βέλτιστης (ως προς την κοινωνική ευημερία) ισορροπίας, σε αντιδιαστολή με την περίπτωση πλήρους πληροϕόρησης. Επίσης, καταλήγουν σε ικανές συνθήκες, που αϕορούν στους ρυθμούς επιλογής, για την ύπαρξη μιας συμμετρικής και βέλτιστης ισορροπίας. Οι Athey και Nekipelov [2010] εξετάζουν την επίδραση της αβεβαιότητας που οϕείλεται στους βαθμούς ποιότητας από θεωρητική και πειραματική σκοπιά. Η μελέτη του τιμήματος της αναρχίας για μη-ϕιλαλήθεις μηχανισμούς δημοπρασίας (ειδικά στο Bayesian μοντέλο) ξεκίνησε από τους Christodoulou et al. [2008] και συνεχίστηκε στις εργασίες [Lucier and Borodin, 2010], [Lucier, 2010] και [Bhawalkar and Roughgarden, 2011]. Ολες αυτές οι εργασίες, όμως, προϋποθέτουν ανεξαρτησία των αξιών και των βαθμών ποιότητας των παιχτών. Τα αποτελέσματά μας που αϕορούν στο Bayesian τίμημα της αναρχίας, είναι τα πρώτα που δεν βασίζονται σε αυτή την υπόθεση, και κατά συνέπεια ισχύουν ακόμα και όταν οι αξίες και οι βαθμοί ποιότητας συσχετίζονται. Οσον αϕορά στον σχεδιασμό ϕιλαληθών μηχανισμών, η μελέτη συσχετιζόμενων αξιών είναι μακροσκελής, βλ. για παράδειγμα [Crémer and McLean, 1988]. Στην εργασία [Hannan, 1957] εξετάζεται η ελαχιστοποίηση της λύπης σε επαναλαμβανόμενα παίγνια δύο παιχτών. Από τότε έχουν προταθεί αρκετοί απλοί αλγόριθμοι (αλλιώς προσαρμοστικές διαδικασίες) που εγγυώνται απουσία-λύπης. Αρχικά, η έρευνα είχε επικεντρωθεί στην ισχυρότερη απαίτηση εύρεσης προσαρμοστικών διαδικασιών μέσω των οποίων το παίγνιο συγκλίνει σε ένα σύνολο συσχετιζόμενων ισορροπιών, ενώ οι παίχτες πληρούν μια προϋπόθεση η οποία ονομάζεται απουσία-εσωτερικής-λύπης (no-internal-regret) και είναι ισχυρότερη από την υπόθεση απουσίαςλύπης (βλ. την επισκόπηση [Blum and Mansour, 2007] για ανασκόπηση και σύγκριση τέτοιων διαδικασιών). Οι Foster και Vohra [1997] δείχνουν μια τέτοια διαδικασία και οι Fudenberg και Levine [1999] μια άλλη. Η στρατηγική regret matching των Hart και Mas-Collel [2000] και η στρατηγική multiplicative weight updating [Littlestone and Warmuth, 1994] (βλ. επίσης [Arora et al., 2012]) είναι δύο διαδικασίες οι οποίες απλοποιούνται αρκετά όταν χρησιμοποιούνται για την εγγύηση απουσίας-λύπης (σε αντίθεση με την απουσία-εσωτερικής-λύπης). Αυτοί οι κλασσικοί αλγόριθμοι μάθησης προϋποθέτουν ότι οι εκβάσεις και οι στρατηγικές όλων των συμμετεχόντων γνωστοποιούνται στους παίχτες στο τέλος κάθε γύρου, αλλά έχουν επεκταθεί και σε περιπτώσεις που σε κάθε γύρο κάθε παίχτης παρατηρεί μόνο τη δική του έκβαση (ακόμα και μόνο την υλοποίησή της όταν αυτή είναι πιθανοτική). Παραπέμπουμε στην εργασία [Auer et al., 1995] για εκτενή ανασκόπηση του θέματος. Το παίγνιο που ορίζει μια προσαρμοστική διαδικασία που εγγυάται απουσία-λύπης συγκλίνει σε ένα σύνολο συσχετιζόμενων ισορροπιών. Οι Blum et al. [2008] εϕαρμόζουν ελαχιστοποίηση της λύπης στη μελέτη της ανεπάρκειας των εκβάσεων επαναλαμβανόμενων παιγνίων, χρησιμοποιώντας το τίμημα της ολικής αναρχίας για τον λόγο της βέλτιστης αποδοτικότητας προς την χειρότερη αναμενόμενη αποδοτικότητα όταν οι παίχτες ελαχιστοποιούν τη λύπη τους. 10

1.2. ΔΗΜΟΠΡΑΣ ΙΕΣ ΕΝ ΟΣ ΑΝΤΙΚΕΙΜ ΕΝΟΥ Εσοδα. Από την πρόταση του Myerson που αϕορά στην ισοδυναμία εσόδων (βλ. επίσης την εργασία [Lucier et al., 2012] για ένα συγκεκριμένο παράδειγμα), προκύπτει πως η εϕαρμογή κατωϕλίου στους μηχανισμούς δημοπρασίας είναι απαραίτητη για να καταλήξουμε σε ουσιαστικές εγγυήσεις εσόδων. Επίσης, δεν είναι ξεκάθαρο αν το κατώϕλι Myerson είναι η κατάλληλη επιλογή που ελαχιστοποιεί την εγγύηση εσόδων στις δημοπρασίες GSP, και εξετάζεται πειραματικά στην εργασία [Ostrovsky and Schwarz, 2011]. Θέματα που αϕορούν βελτιστοποίηση των εσόδων σε παραλλαγές μηχανισμών δημοπρασίας GSP, στους οποίους εϕαρμόζεται κάποιο κατώϕλι, εξετάζονται (αναλυτικά και πειραματικά) σε πρόσϕατες εργασίες των Roberts et al. [2013] και Thompson και Leyton-Brown [2013]. Οι Lucier et al. [2012] παρουσιάζουν εγγυήσεις εσόδων για μηχανισμούς δημοπρασίας GSP εξετάζοντας δύο ξεχωριστά Bayesian μοντέλα εκτός από μοντέλα πλήρους πληροϕόρησης. Για την περίπτωση που οι αξίες των διαϕημιζόμενων είναι ανεξάρτητες τυχαίες μεταβλητές που ακολουθούν την ίδια πιθανοτική κατανομή με μονότονη συνάρτηση κινδύνου MHR, δείχνουν ότι η εγγύηση εσόδων είναι το πολύ ίση με 6 για τον μηχανισμό δημοπρασίας GSP με κατώϕλι Myerson. Καταλήγουν στο ϕράγμα αυτό συγκρίνοντας την ωϕέλεια των παιχτών σε μια ισορροπία Bayes-Nash με την ω- ϕέλεια που αυτοί θα είχαν αν απέκλιναν σε μια μοναδική εναλλακτική δήλωση (λαμβάνοντας υπόψιν τις ιδιότητες των κατανομών MHR). Η κατηγορία των κατανομών MHR είναι αρκετά ευρεία ώστε να συμπεριλαμβάνει αρκετές κοινές κατανομές (όπως η ομοιόμορϕη, η κανονική και η εκθετική κατανομή). Για την πιο γενική περίπτωση όπου οι αξίες ακολουθούν ομαλή κατανομή, το ίδιο ϕράγμα ισχύει χρησιμοποιώντας διαϕορετικό κατώϕλι, το οποίο υπολογίζεται με τη χρήση μιας προϕητικής ανισότητας (prophet inequality) [Krengel and Sucheston, 1977]. Οι προϕητικές ανισότητες έχουν αποδειχτεί χρήσιμες σε διάϕορα Bayesian μοντέλα δημοπρασίας στο παρελθόν [Hajiaghayi et al., 2007, Chawla et al., 2010]. 1.2 Δημοπρασίες ενός αντικειμένου Στο κλασσικό μοντέλο Θεωρίας Δημοπρασίας (Auction Theory) [Krishna, 2002], ένα αντικείμενο πωλείται μέσω δημοπρασίας και συμμετέχουν n αγοραστές των οποίων οι αξίες για το αντικείμενο είναι ανεξάρτητες τυχαίες μεταβλητές που ακολουθούν γνωστές, αλλά όχι απαραίτητα ίδιες, πιθανοτικές κατανομές. Η πρωτοποριακή εργασία του Myerson [1981], η οποία έχει τεράστια επιρροή όλα αυτά τα χρόνια, χαρακτηρίζει με κομψό τρόπο τους μηχανισμούς δημοπρασίας που μεγιστοποιούν τα έσοδα σε αυτό το μοντέλο. Τα βέλτιστα έσοδα επιτυγχάνονται από απλούς ντετερμινιστικούς μηχανισμούς οι οποίοι ορίζονται χρησιμοποιώντας λιγοστές πληροϕορίες από τις πιθανοτικές κατανομές των αξιών. Αντιθέτως, η περίπτωση αγοραστών με συσχετιζόμενες αξίες αποτελεί μυστήριο. Αν και υπάρχει τεράστια σχετική βιβλιογραϕία στους τομείς της Οικονομικής Θεωρίας και της Πληρο- ϕορικής, δεν έχει παρουσιαστεί παρόμοιος χαρακτηρισμός ως τώρα. Εξαιτίας της απλότητάς τους και της πρακτικής τους εϕαρμογής, οι ντετερμινιστικές δημοπρασίες χρήζουν ιδιαίτερης σημασίας. 11