Τεχνικές Εκτίμησης Υπολογιστικών Συστημάτων Ενότητα 7: Η επιλογή των πιθανοτικών κατανομών εισόδου

Σχετικά έγγραφα
1 η Διάλεξη. Ενδεικτικές λύσεις ασκήσεων

Ενδεικτικές λύσεις ασκήσεων διαχείρισης έργου υπό συνθήκες αβεβαιότητας

Εισαγωγή στους Αλγορίθμους

Εισαγωγή στους Αλγορίθμους

Τεχνικές Εκτίμησης Υπολογιστικών Συστημάτων Ενότητα 1: Προσομοίωση ενός συστήματος αναμονής

Μαθηματικά Διοικητικών & Οικονομικών Επιστημών

Μαθηματικά Διοικητικών & Οικονομικών Επιστημών

Καθ. Γιάννης Γαροφαλάκης. ΜΔΕ Επιστήμης και Τεχνολογίας Υπολογιστών Τμήμα Μηχανικών Η/Υ & Πληροφορικής

Κβαντική Επεξεργασία Πληροφορίας

Τεχνικές Εκτίμησης Υπολογιστικών Συστημάτων Ενότητα 4: Δίκτυα Συστημάτων Αναμονής

Κβαντική Επεξεργασία Πληροφορίας

Τίτλος Μαθήματος: Μαθηματική Ανάλυση Ενότητα Γ. Ολοκληρωτικός Λογισμός

Μαθηματικά Διοικητικών & Οικονομικών Επιστημών

Μαθηματικά Διοικητικών & Οικονομικών Επιστημών

Μαθηματικά Διοικητικών & Οικονομικών Επιστημών

Θερμοδυναμική. Ανοικτά Ακαδημαϊκά Μαθήματα. Πίνακες Νερού σε κατάσταση Κορεσμού. Γεώργιος Κ. Χατζηκωνσταντής Επίκουρος Καθηγητής

Εισαγωγή στους Αλγορίθμους

Πληροφοριακά Συστήματα Διοίκησης Ενότητα 10: Διαχείριση Έργων (2ο Μέρος)

Διαχείριση Έργων. Ενότητα 10: Χρονοπρογραμματισμός έργων (υπό συνθήκες αβεβαιότητας)

Μεθοδολογία των Επιστημών του Ανθρώπου: Στατιστική

Ενδεικτικές λύσεις ασκήσεων διαγραμμάτων περίπτωσης χρήσης (1ο Μέρος)

Κβαντική Επεξεργασία Πληροφορίας

Λογιστική Κόστους Ενότητα 12: Λογισμός Κόστους (2)

Διοικητική Λογιστική

Συστήματα Αναμονής. Ενότητα 7: Ουρά Μ/Μ/1. Αγγελική Σγώρα Τμήμα Μηχανικών Πληροφορικής ΤΕ

Ανοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Αθήνας. Βιοστατιστική (Ε) Ενότητα 3: Έλεγχοι στατιστικών υποθέσεων

Συστήματα Αναμονής. Ενότητα 2: Τυχαίες Μεταβλητές. Αγγελική Σγώρα Τμήμα Μηχανικών Πληροφορικής ΤΕ

Ανοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Αθήνας. Βιοστατιστική (Ε) Ενότητα 1: Καταχώρηση δεδομένων

Έλεγχος και Διασφάλιση Ποιότητας Ενότητα 4: Μελέτη ISO Κουππάρης Μιχαήλ Τμήμα Χημείας Εργαστήριο Αναλυτικής Χημείας

Κβαντική Φυσική Ι. Ενότητα 19: Εισαγωγή στα τετραγωνικά δυναμικά. Ανδρέας Τερζής Σχολή Θετικών Επιστημών Τμήμα Φυσικής

Μαθηματικά Διοικητικών & Οικονομικών Επιστημών

Ανοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Αθήνας. Βιοστατιστική (Ε) Ενότητα 2: Περιγραφική στατιστική

Βέλτιστος Έλεγχος Συστημάτων

Πληροφοριακά Συστήματα Διοίκησης (ΜΒΑ) Ενότητα 5: Διαχείριση Έργων υπό συνθήκες αβεβαιότητας

Εισαγωγή στους Η/Υ. Ενότητα 2β: Αντίστροφο Πρόβλημα. Δημήτρης Σαραβάνος, Καθηγητής Πολυτεχνική Σχολή Τμήμα Μηχανολόγων & Αεροναυπηγών Μηχανικών

Μαθηματικά Διοικητικών & Οικονομικών Επιστημών

ΣΥΣΤΗΜΑΤΑ ΗΛΕΚΤΡΙΚΗΣ ΕΝΕΡΓΕΙΑΣ ΙIΙ

ΣΥΣΤΗΜΑΤΑ ΗΛΕΚΤΡΙΚΗΣ ΕΝΕΡΓΕΙΑΣ ΙIΙ

ΣΥΣΤΗΜΑΤΑ ΗΛΕΚΤΡΙΚΗΣ ΕΝΕΡΓΕΙΑΣ ΙIΙ

Συστήματα Αναμονής. Ενότητα 5: Ανέλιξη Poisson. Αγγελική Σγώρα Τμήμα Μηχανικών Πληροφορικής ΤΕ

Τίτλος Μαθήματος: Μαθηματική Ανάλυση Ενότητα Β. Διαφορικός Λογισμός

Εισαγωγή στους Αλγορίθμους Φροντιστήριο 1

Προσχολική Παιδαγωγική Ενότητα 2: Οργάνωση χρόνου και χώρου στα νηπιαγωγεία

ΘΕΡΜΟΔΥΝΑΜΙΚΗ Ι. Ενότητα 2: Θερμοδυναμικές συναρτήσεις. Σογομών Μπογοσιάν Πολυτεχνική Σχολή Τμήμα Χημικών Μηχανικών

Μαθηματικά Διοικητικών & Οικονομικών Επιστημών

Λογιστική Κόστους Ενότητα 8: Κοστολογική διάρθρωση Κύρια / Βοηθητικά Κέντρα Κόστους.

Ψηφιακή Επεξεργασία και Ανάλυση Εικόνας Ενότητα 4 η : Βελτίωση Εικόνας. Καθ. Κωνσταντίνος Μπερμπερίδης Πολυτεχνική Σχολή Μηχανικών Η/Υ & Πληροφορικής

Εκπαιδευτική Διαδικασία και Μάθηση στο Νηπιαγωγείο Ενότητα 1: Εισαγωγή

Τεχνικές Εκτίμησης Υπολογιστικών Συστημάτων Ενότητα 1: Εισαγωγή. Γαροφαλάκης Ιωάννης Πολυτεχνική Σχολή Τμήμα Μηχ/κών Η/Υ & Πληροφορικής

ΦΥΣΙΚΟΧΗΜΕΙΑ I Ασκήσεις

Φυσική ΙΙΙ. Ενότητα 4: Ηλεκτρικά Κυκλώματα. Γεώργιος Βούλγαρης Σχολή Θετικών Επιστημών Τμήμα Φυσικής

ΟΙΚΟΝΟΜΕΤΡΙΑ. Ενότητα 1: Εκτιμητές και Ιδιότητες. Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά)

Θεωρία Λήψης Αποφάσεων

Τηλεματική και Νέες Υπηρεσίες

Ορισμός κανονικής τ.μ.

Ψηφιακή Επεξεργασία και Ανάλυση Εικόνας Ενότητα 10 η : Ανάλυση Εικόνας. Καθ. Κωνσταντίνος Μπερμπερίδης Πολυτεχνική Σχολή Μηχανικών Η/Υ & Πληροφορικής

Εισαγωγή στη Δικτύωση Υπολογιστών

Εφαρμογές των Τεχνολογιών της Πληροφορίας και των Επικοινωνιών στη διδασκαλία και τη μάθηση

Εισαγωγή στους Υπολογιστές

Ενότητα. Εισαγωγή στις βάσεις δεδομένων

Τεχνικές Εκτίμησης Υπολογιστικών Συστημάτων Ενότητα 5: Εισαγωγή στην Προσομοίωση

Κβαντική Επεξεργασία Πληροφορίας

Συστήματα Αναμονής. Ενότητα 9: Ανέλιξη Γέννησης - Θανάτου. Αγγελική Σγώρα Τμήμα Μηχανικών Πληροφορικής ΤΕ

Διοίκηση Ολικής Ποιότητας & Επιχειρηματική Αριστεία Ενότητα 1.3.3: Μεθοδολογία εφαρμογής προγράμματος Ολικής Ποιότητας

Μηχανολογικό Σχέδιο Ι

Εισαγωγή στους Αλγορίθμους Ενότητα 9η Άσκηση - Αλγόριθμος Prim

Γραμμική Άλγεβρα και Μαθηματικός Λογισμός για Οικονομικά και Επιχειρησιακά Προβλήματα

Μυελού των Οστών Ενότητα #1: Ερωτήσεις κατανόησης και αυτόαξιολόγησης

Εισαγωγή στη Δικτύωση Υπολογιστών

Πληροφοριακά Συστήματα Διοίκησης (ΜΒΑ) Ενότητα 6: Συμπίεση Έργου

2 η Διάλεξη. Ενδεικτικές λύσεις ασκήσεων

ΗΛΕΚΤΡΟΝΙΚΗ ΙIΙ Ενότητα 6

Γενική Φυσική Ενότητα: Ταλαντώσεις

Επιχειρησιακή Έρευνα

Εισαγωγή στους Αλγορίθμους Ενότητα 10η Άσκηση Αλγόριθμος Dijkstra

Διοικητική Λογιστική

Ψηφιακή Επεξεργασία Εικόνων

Μάρκετινγκ Αγροτικών Προϊόντων

Θερμοδυναμική. Ανοικτά Ακαδημαϊκά Μαθήματα. Πίνακες Νερού Υπέρθερμου Ατμού. Γεώργιος Κ. Χατζηκωνσταντής Επίκουρος Καθηγητής

Βέλτιστος Έλεγχος Συστημάτων

Εισαγωγή στους Αλγορίθμους Ενότητα 9η Άσκηση - Αλγόριθμος Kruskal

Διοίκηση Επιχειρήσεων

Συστήματα Αναμονής. Ενότητα 6: Θεωρία Ουρών. Αγγελική Σγώρα Τμήμα Μηχανικών Πληροφορικής ΤΕ

Διεθνείς Οικονομικές Σχέσεις και Ανάπτυξη

Εισαγωγή στην Διοίκηση Επιχειρήσεων

Βάσεις Περιβαλλοντικών Δεδομένων

6 η Διάλεξη. Ενδεικτικές λύσεις ασκήσεων

Εφαρμογές των Τεχνολογιών της Πληροφορίας και των Επικοινωνιών στη διδασκαλία και τη μάθηση

Βέλτιστος Έλεγχος Συστημάτων

Συστήματα Αναμονής. Ενότητα 1: Εισαγωγή. Αγγελική Σγώρα Τμήμα Μηχανικών Πληροφορικής ΤΕ

Ευφυής Προγραμματισμός

Μάρκετινγκ. Ενότητα 2: Αξία για τους Πελάτες

Κβαντική Φυσική Ι. Ενότητα 12: Ασκήσεις. Ανδρέας Τερζής Σχολή Θετικών Επιστημών Τμήμα Φυσικής

Λογιστική Κόστους Ενότητα 11: Λογισμός Κόστους (1)

Χωρικές σχέσεις και Γεωμετρικές Έννοιες στην Προσχολική Εκπαίδευση

Διδακτική Πληροφορικής

Μαθηματικά Διοικητικών & Οικονομικών Επιστημών

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ

Διοίκηση Ολικής Ποιότητας & Επιχειρηματική Αριστεία Ενότητα 1.3.2: Παραδοσιακή VS νέα προσέγγιση της ΔΟΠ

Γραμμική Άλγεβρα και Μαθηματικός Λογισμός για Οικονομικά και Επιχειρησιακά Προβλήματα

Transcript:

Τεχνικές Εκτίμησης Υπολογιστικών Συστημάτων Ενότητα 7: Η επιλογή των πιθανοτικών κατανομών εισόδου Γαροφαλάκης Ιωάννης Πολυτεχνική Σχολή Τμήμα Μηχ/κών Η/Υ & Πληροφορικής

Περιεχόμενα ενότητας Εισαγωγή Συλλογή δεδομένων Χαρακτηριστικά κατανομών Χρήσιμες πιθανοτικές κατανομές Εμπειρικές κατανομές Αυθεντικά δεδομένα Προσαρμογή θεωρητικής κατανομής 2

Εισαγωγή (1) Υλοποίηση μιας προσομοίωσης με τη χρήση τυχαίων εισόδων Καθορισμός πιθανοτικών κατανομών που τις περιγράφουν Η προσομοίωση εξελίσσεται με τη δημιουργία και χρήση τυχαίων τιμών από τις κατανομές αυτές 3

Εισαγωγή (2) Πηγές Τυχαιότητας Πραγματικών Συστημάτων 4

Εισαγωγή Συλλογή δεδομένων (1) Αν είναι δυνατόν να συλλέξουμε δεδομένα από μια τυχαία μεταβλητή εισόδου που μας ενδιαφέρει, μπορούμε να τα χρησιμοποιήσουμε με τους εξής τρόπους, προκειμένου να προσδιορίσουμε την κατανομή εισόδου Τα ίδια τα δεδομένα χρησιμοποιούνται απευθείας στην προσομοίωση. Τότε θα έχουμε ιχνο-οδηγούμενη προσομοίωση. Τα δεδομένα χρησιμοποιούνται για να ορισθεί μία εμπειρική συνάρτηση κατανομής για τη μεταβλητή εισόδου. Προσαρμόζουμε μια γνωστή θεωρητική μορφή κατανομής (π.χ. εκθετική ή Poisson) στα δεδομένα που έχουμε. 5

Εισαγωγή Συλλογή δεδομένων (2) Σύγκριση 1 ος τρόπος Η προσομοίωση θα αναπαράγει απλώς ότι έγινε στην πραγματικότητα. Σπανίως έχουμε αρκετά δεδομένα για να εκτελέσουμε όλες τις απαραίτητες προσομοιώσεις. 2 ος τρόπος Αντιμετωπίζει τα μειονεκτήματα αυτά, αφού τουλάχιστον για συνεχή δεδομένα, μπορεί να παραχθεί οποιαδήποτε τιμή μεταξύ της ελάχιστης και μέγιστης που έχουμε στη διάθεσή μας. Είναι προτιμητέος ο δεύτερος από τον πρώτο τρόπο, ο πρώτος συνιστάται για τον έλεγχο εγκυρότητας ενός μοντέλου, συγκεκριμένα όταν θέλουμε να συγκρίνουμε τις εξόδους του μοντέλου με τις εξόδους του πραγματικού συστήματος. 6

Εισαγωγή Συλλογή δεδομένων (3) Αν μπορούμε να βρούμε μια θεωρητική κατανομή που προσαρμόζεται ικανοποιητικά στα δεδομένα που έχουμε (τρίτος τρόπος), την προτιμούμε από την εμπειρική κατανομή (δεύτερος τρόπος), για τους παρακάτω λόγους: 7

Εισαγωγή Χαρακτηριστικά κατανομών Μία εμπειρική κατανομή μπορεί να έχει σημεία ασυνέχειας, ή άλλες ανωμαλίες, ιδιαίτερα αν διαθέτουμε λίγα μόνο δεδομένα για τον προσδιορισμό της. Αντίθετα, μια θεωρητική κατανομή εξομαλύνει τα δεδομένα και μπορεί να δώσει πληροφορία για τη συνολική συμπεριφορά της μεταβλητής εισόδου. Συνήθως δεν μπορούμε να παράγουμε τυχαίες τιμές από μια εμπειρική κατανομή έξω από τα όρια των δεδομένων που διαθέτουμε. Το γεγονός αυτό δημιουργεί μερικές φορές σημαντικό πρόβλημα, αφού η απόδοση ενός συστήματος μπορεί να εξαρτάται από την πιθανότητα εμφάνισης ενός ακραίου γεγονότος, όπως για παράδειγμα ενός πολύ μεγάλου χρόνου εξυπηρέτησης. Αντίθετα, μια θεωρητική κατανομή μπορεί να μας δώσει και τιμές έξω από το μέγιστο και ελάχιστο των δεδομένων που διαθέτουμε. 8

Χρήσιμες πιθανοτικές κατανομές (1) Εκθετική (exponential): Χρησιμοποιείται για τη μοντελοποίηση εντελώς τυχαίων γεγονότων, όπως οι χρόνοι μεταξύ αστοχιών, ή οι χρόνοι μεταξύ αφίξεων πελατών. Συχνά χρησιμοποιείται ως η μόνη λύση όταν δεν υπάρχουν ενδείξεις για την κατανομή που πρέπει να χρησιμοποιηθεί. Βήτα (beta): Χρησιμοποιείται για τη μοντελοποίηση τυχαίων αναλογιών, όπως το κλάσμα των πακέτων που απαιτούν επανεκπομπή σε μία γραμμή μετάδοσης δεδομένων. Zipf: Για την επιλογή από σύνολο σελίδων στο Web, από σύνολο multimedia αντικειμένων (π.χ. ταινίες σε video on demand σύστημα) κ.α. Τα στοιχεία του συνόλου είναι ταξινομημένα με βάση τη δημοτικότητα. Γάμμα (gamma): Χρησιμοποιείται για τη μοντελοποίηση χρόνων εξυπηρέτησης. Σε ένα σύστημα αναμονής περιγράφει το χρόνο εξυπηρέτησης, όταν έχουμε m εκθετικούς εξυπηρετητές εν σειρά. Δυωνυμική (binomial): Χρησιμοποιείται στη μοντελοποίηση του αριθμού επιτυχιών σε μια ακολουθία n ανεξαρτήτων δοκιμών Bernoulli. Για παράδειγμα, ο αριθμός των bits σε ένα πακέτο που δεν έχουν επηρεασθεί από το θόρυβο. 9

Χρήσιμες πιθανοτικές κατανομές (2) Γεωμετρική (geometric): Χρησιμοποιείται στη μοντελοποίηση του αριθμού των εμφανίσεων γεγονότων μεταξύ άλλων σημαντικών γεγονότων. Π.χ. ο αριθμός των σωστών bits μεταξύ δύο λανθασμένων bits σε ένα πακέτο δεδομένων, ή ο αριθμός των αιτήσεων σε μια τοπική Βάση Δεδομένων (ΒΔ) μεταξύ δύο αιτήσεων σε μια απομακρυσμένη ΒΔ. Αρνητική Δυωνυμική (negative binomial): Χρησιμοποιείται για τον αριθμό των αποτυχιών πριν τη m-στή επιτυχία, όπως ο αριθμός των επανεκπομπών ενός αρχείου που αποτελείται από m πακέτα, ή ο αριθμός των αιτήσεων σε μια τοπική ΒΔ πριν τη m-στή αίτηση σε μια απομακρυσμένη ΒΔ. Poisson: Χρησιμοποιείται στη μοντελοποίηση του αριθμού εμφανίσεων γεγονότων κατά τη διάρκεια μιας συγκεκριμένης περιόδου, όπως ο αριθμός των αστοχιών εξαρτημάτων στη μονάδα του χρόνου, ή ο αριθμός των αιτήσεων σε μια ΒΔ σε χρονικό διάστημα t. Κανονική (normal): Χρησιμοποιείται για τη μοντελοποίηση του αθροιστικού φαινομένου διαφόρων ανεξαρτήτων πηγών, όπως τα λάθη μετρήσεων. Weibull: Χρησιμοποιείται για μετρήσεις αξιοπιστίας, όπως ο χρόνος ζωής εξαρτημάτων. 10

Εμπειρικές κατανομές Όταν δεν είναι δυνατόν να βρούμε μια θεωρητική κατανομή που να ταιριάζει στα δεδομένα που διαθέτουμε, προσπαθούμε να καθορίσουμε απευθείας μια εμπειρική κατανομή, από την οποία θα δημιουργούνται τυχαίες τιμές κατά τη διάρκεια της προσομοίωσης. Για συνεχείς τυχαίες μεταβλητές, ο τύπος της εμπειρικής κατανομής που μπορούμε να ορίσουμε, εξαρτάται από το αν διαθέτουμε τις ίδιες τις τιμές των επιμέρους αυθεντικών παρατηρήσεων, ή μόνο τον αριθμό των που βρίσκονται μέσα σε κάθε ένα από ορισμένα καθορισμένα διαστήματα. Στη δεύτερη περίπτωση λέμε ότι έχουμε ομαδοποιημένα δεδομένα, ή δεδομένα με τη μορφή ιστογράμματος. 11

Εμπειρικές κατανομές Αυθεντικά δεδομένα (1) Αν έχουμε στη διάθεσή μας τα αυθεντικά δεδομένα, μπορούμε να ορίσουμε μία συνεχή, τμηματικά γραμμική, συνάρτηση κατανομής F, έχοντας ταξινομήσει τα Χ κατά αύξουσα σειρά. X ( i) X j Έστω το i-στό μικρότερο από τα έτσι ώστε X 1 X 2 X n ( ) ( ) ( ) 12

Εμπειρικές κατανομές Αυθεντικά δεδομένα (2) H F δίνεται από τη σχέση: F( x) 0 i 1 x X ( i) n 1 ( n 1)( X ( i 1) X ( i) ) 1 x X X ( i) ( i 1 ) ( n) ( 1) X x X i 1, 2,, n 1 x 13

Εμπειρικές κατανομές Αυθεντικά δεδομένα (3) Συνεχής, τμηματικά γραμμική, εμπειρική συνάρτηση κατανομής από τα αυθεντικά δεδομένα 14

Εμπειρικές κατανομές Αυθεντικά δεδομένα (4) Το Σχήμα 7.1 δείχνει μία περίπτωση για F( x) n 6 Το αυξάνεται γρηγορότερα στις περιοχές του x στις οποίες τα είναι κατανεμημένα πιο πυκνά, όπως επιθυμούμε. Για κάθε i, F( X, το οποίο είναι κατά προσέγγιση (για ( i) ) ( i 1) ( n 1) μεγάλο n) το ποσοστό των X i που είναι μικρότερα από X i γεγονός επίσης επιθυμητό για μία συνεχή συνάρτηση κατανομής. Ένα μειονέκτημα της εμπειρικής κατανομής που φτιάξαμε με τη μέθοδο αυτή, είναι ότι οι τυχαίες τιμές που δημιουργούνται από αυτήν κατά τη διάρκεια της προσομοίωσης, δεν μπορούν να είναι μικρότερες από X ( 1) ή μεγαλύτερες από. X ( n) F( x) X ( n) Η μέση τιμή της δεν είναι ίση με τη δειγματοληπτική μέση τιμή των. X i 15

Εμπειρικές κατανομές Ομαδοποιημένα δεδομένα (1) Διαφορετική προσέγγιση Δεν γνωρίζουμε τις τιμές των επιμέρους Έστω ότι τα n είναι ομαδοποιημένα σε k συνεχόμενα διαστήματα a0, a1, a1, a2,, ak 1, ak, έτσι ώστε το j-στό διάστημα να περιέχει παρατηρήσεις, όπου Μία λογική, τμηματικά γραμμική εμπειρική συνάρτηση κατανομής G G( a0) 0 X i n j G( a ) ( n n n ) / n j για X i n n n n 1 2 j j 1, 2,, k 1 2 k 16

Εμπειρικές κατανομές Ομαδοποιημένα δεδομένα (2) Με γραμμική παρεμβολή μεταξύ των 0 x a0 x a j 1 G( x) G( a j 1) G( a j ) G( a j 1) a j 1 x a j j 1, 2,, k a j a j 1 1 ak x 17

Εμπειρικές κατανομές Ομαδοποιημένα δεδομένα (3) 18

Εμπειρικές κατανομές Ομαδοποιημένα δεδομένα (4) Στο Σχήμα 7.2 φαίνεται μία τέτοια κατανομή k 4 G( x) Το G( a j ) είναι το ποσοστό των X i που είναι μικρότερα από a j και η G( x) αυξάνει γρηγορότερα στα διαστήματα του x όπου οι παρατηρήσεις είναι πιο πυκνές. Οι τυχαίες τιμές που θα δημιουργηθούν από την κατανομή αυτή, θα βρίσκονται μεταξύ των και a 0 για a k 19

Εμπειρικές κατανομές Ομαδοποιημένα δεδομένα (5) Στην πράξη, πολλές συνεχείς κατανομές εκτείνονται μειούμενες προς τα δεξιά, με μία μορφή συνάρτησης πυκνότητας πιθανότητας παρόμοια με αυτήν της κατανομής gamma. Αν το μέγεθος του δείγματος n δεν είναι πολύ μεγάλο, μάλλον θα έχουμε λίγες (αν έχουμε) παρατηρήσεις από τη δεξιά ουρά της πραγματικής κατανομής, αφού η πιθανότητα να βρεθούμε στην ουρά είναι συνήθως μικρή. 20

Εμπειρικές κατανομές Ομαδοποιημένα δεδομένα (6) Οι παραπάνω εμπειρικές κατανομές δεν επιτρέπουν τη δημιουργία τυχαίων τιμών μεγαλύτερων από τη μέγιστη παρατήρηση. Οι πολύ μεγάλες τιμές μπορεί να έχουν σημαντική επίπτωση στην προσομοίωση, όπως για παράδειγμα, ένας μεγάλος χρόνος εξυπηρέτησης ο οποίος σε ένα σύστημα αναμονής πιθανόν να προκαλέσει τη δημιουργία μεγάλων ουρών και κατά συνέπεια καθυστερήσεων. Έχει προταθεί να προστίθεται μία εκθετική κατανομή στο δεξιό τμήμα της εμπειρικής κατανομής, ώστε να επιτρέπεται η δημιουργία τυχαίων τιμών μεγαλύτερων από 21

Εμπειρικές κατανομές Διακριτά δεδομένα Είναι αρκετά εύκολο να ορισθεί μία εμπειρική κατανομή, αν είναι διαθέσιμες οι αυθεντικές τιμές X 1, X 2,, X n. Για κάθε πιθανή τιμή x, μπορεί να ορισθεί μία εμπειρική συνάρτηση μάζας πιθανότητας p( x) η οποία θα είναι το ποσοστό των που θα είναι ίσα με x. X i Για ομαδοποιημένα διακριτά δεδομένα, θα μπορούσαμε να ορίσουμε μία συνάρτηση μάζας, έτσι ώστε το άθροισμα των p( x) πάνω σε όλες τις πιθανές τιμές του x σε ένα διάστημα, να είναι ίσο με το ποσοστό των στο διάστημα αυτό. X i Ο τρόπος που δημιουργούνται τα επιμέρους p( x) για τις πιθανές τιμές του x μέσα σε ένα διάστημα, είναι ουσιαστικά αυθαίρετος. 22

Προσαρμογή θεωρητικής κατανομής (1) Όταν θέλουμε να βρούμε μια γνωστή κατανομή και να την προσαρμόσουμε στα δεδομένα που διαθέτουμε, ώστε να τη χρησιμοποιήσουμε στη συνέχεια για τη δημιουργία τυχαίων τιμών, ακολουθούμε γενικά τα παρακάτω βήματα: Δημιουργούμε ένα ιστόγραμμα από τα δεδομένα που διαθέτουμε. Επιλέγουμε μια γνωστή κατανομή, με μορφή παρόμοια με αυτήν του ιστογράμματος που έχουμε κατασκευάσει. Υπολογίζουμε την πρώτη και δεύτερη δειγματοληπτική ροπή των δεδομένων που έχουμε. Χρησιμοποιούμε τις ροπές για να υπολογίσουμε τις παραμέτρους της θεωρητικής κατανομής (δηλ. αντιστοιχούμε τις δειγματοληπτικές ροπές των δεδομένων, με τις ροπές της θεωρητικής κατανομής). Κάνουμε ένα τεστ για να δούμε πόσο καλά αντιπροσωπεύει τα δεδομένα μας, η θεωρητική κατανομή που επιλέξαμε (π.χ. το τεστ για διακριτές κατανομές και το τεστ Kolmogorov - Smirnov για συνεχείς κατανομές). 23

Προσαρμογή θεωρητικής κατανομής (2) Αν δεν μπορέσουμε να βρούμε θεωρητική κατανομή με τον τρόπο αυτό, τότε ίσως να είναι δυνατόν να μετασχηματίσουμε με κάποιο τρόπο τα αρχικά δεδομένα. Δημιουργούμε ένα νέο σύνολο δεδομένων Y i από τα αρχικά δεδομένα, με Y g( X ), όπου g( x) είναι μία συνάρτηση μετασχηματισμού. i i Εφαρμόζουμε και πάλι τα παραπάνω 5 βήματα, ελπίζοντας να προσδιορίσουμε μία θεωρητική κατανομή που θα προσαρμοσθεί ικανοποιητικά στα μετασχηματισμένα δεδομένα. Στην επιλογή της g( x) συνιστάται να χρησιμοποιούμε απλές συναρτήσεις, όπως γραμμικούς μετασχηματισμούς, λογαρίθμους, ή δυνάμεις. Είναι πιθανό πάντως να χρειασθούμε αρκετές δοκιμές μέχρι να βρούμε μια θεωρητική κατανομή που να προσαρμόζεται ικανοποιητικά στα αρχικά δεδομένα. Y i X i 24

Τέλος Ενότητας

Χρηματοδότηση Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στo πλαίσιo του εκπαιδευτικού έργου του διδάσκοντα. Το έργο «Ανοικτά Ακαδημαϊκά Μαθήματα στο Πανεπιστήμιο Πατρών» έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού. Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος «Εκπαίδευση και Δια Βίου Μάθηση» και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους. 26

Σημείωμα Ιστορικού Εκδόσεων Έργου Το παρόν έργο αποτελεί την έκδοση 1.0. 27

Σημείωμα Αναφοράς Copyright Πανεπιστήμιο Πατρών, Ιωάννης Γαροφαλάκης, 2015. «Τεχνικές Εκτίμησης Υπολογιστικών Συστημάτων». Έκδοση: 1.0. Πάτρα 2015. Διαθέσιμο από τη δικτυακή διεύθυνση: https://eclass.upatras.gr/courses/ceid1093/. 28

Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά, Μη Εμπορική Χρήση Παρόμοια Διανομή 4.0 [1] ή μεταγενέστερη, Διεθνής Έκδοση. Εξαιρούνται τα αυτοτελή έργα τρίτων π.χ. φωτογραφίες, διαγράμματα κ.λ.π., τα οποία εμπεριέχονται σε αυτό και τα οποία αναφέρονται μαζί με τους όρους χρήσης τους στο «Σημείωμα Χρήσης Έργων Τρίτων». [1] http://creativecommons.org/licenses/by-nc-sa/4.0/ Ως Μη Εμπορική ορίζεται η χρήση: που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου, για το διανομέα του έργου και αδειοδόχο που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (π.χ. διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση, εφόσον αυτό του ζητηθεί. 29