εφαρμογών Συμπεριφορά απόδοσης εφαρμογών Benchmarks, Profiling GRNET ntell [at] grnet.gr Χρονοεπίδοση και αξιολόγηση απόδοσης εφαρμογών

Σχετικά έγγραφα
εφαρμογών Συμπεριφορά απόδοσης εφαρμογών Benchmarks, Profiling GRNET ntell [at] grnet.gr Χρονοεπίδοση και αξιολόγηση απόδοσης εφαρμογών

Οδηγι ες Χρη σης του MPICH στα Νέα LinuxXX.di.uoa.gr

Gprof - Scalasca - VTune

Gprof - Scalasca - VTune

Πολιτική Πρόσβασης στο σύστημα ARIS και στα άλλα Ευρωπαϊκά υπολογιστικά συστήματα

11/28/2016 Απόδοση Συστημάτων, Remote Jmeter και Dacappo

ΤΕΧΝΙΚΕΣ ΑΠΟΔΟΤΙΚΗΣ ΧΡΗΣΗΣ ΤΟΥ ΕΘΝΙΚΟΥ ΥΠΕΡΥΠΟΛΟΓΙΣΤΙΚΟΥ ΣΥΣΤΗΜΑΤΟΣ ARIS Αθήνα, 17 Δεκεµβρίου2015 Ιωάννης Λιαµπότης iliaboti at grnet.

Οδηγίες Χρήσης Παράλληλης Μηχανής 160 πυρήνων (rbs.marie.hellasgrid.gr)

ΤΕΧΝΙΚΕΣ ΑΠΟΔΟΤΙΚΗΣ ΧΡΗΣΗΣ ΤΟΥ ΕΘΝΙΚΟΥ ΥΠΕΡΥΠΟΛΟΓΙΣΤΙΚΟΥ ΣΥΣΤΗΜΑΤΟΣ ARIS Αθήνα, 25 Οκτωβρίου 2016 Ιωάννης Λιαμπότης iliaboti at grnet.

Οδηγίες Χρήσης Παράλληλης Μηχανής 160 πυρήνων (rbs.marie.hellasgrid.gr)

ΕΘΝΙΚΟ ΚΑΙ ΚΑΠΟΔΙΣΤΡΙΑΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ ARIS SUPERCOMPUTER

Οδηγίες Χρήσης Παράλληλης Μηχανής 160 πυρήνων (rbs.marie.hellasgrid.gr)

ARIS GRNET. ntell [at] grnet.gr Μοντέλα Παράλληλης Χρήσης ARIS. Εργαλεία και βέλτιστες πρακτικές. Δρ. Δημήτρης Ντελλής. Σύστημα. Environment Modules

ARIS GRNET. ntell [at] grnet.gr Παράλληλη Χρήση ARIS. Εργαλεία και βέλτιστες πρακτικές. Δρ. Δημήτρης Ντελλής. Σύστημα. Environment Modules

Search and Replication in Unstructured Peer-to-Peer Networks

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΙΡΑΙΩΣ. Εργαστηριακές Ασκήσεις για το Μάθημα «Δίκτυα Υπολογιστών I»


Κατανεμημένος και Παράλληλος Προγραμματισμός. Εισαγωγή στο MPI. Εγκατάσταση MPICH σε ένα ΗΥ 10/3/2017

ΘΕΜΑ PROJECT COMPILER FLAGS ΤΡΑΧΑΝΗΣ ΔΗΜΗΤΡΗΣ 6108 ΤΡΑΧΑΝΗΣ ΓΕΩΡΓΙΟΣ 5789

HY-486 Αρχές Κατανεμημένου Υπολογισμού Εαρινό Εξάμηνο

Μέθοδοι μονοδιάστατης ελαχιστοποίησης

ΗΥ486 - Αρχές Κατανεμημένου Υπολογισμού Εαρινό Εξάμηνο Δεύτερη Προγραμματιστική Εργασία

Ταχύτερα compile με ccache και distcc

Hase οδηγίες χρήσης.

Συστήματα Παράλληλης & Κατανεμημένης Επεξεργασίας

Προσομείωση ασύρματων δικτύων με τη χρήση του OPNET Modeler

Hase οδηγίες χρήσης.

GRNET. ntell [at] grnet.gr

GRNET. ntell [at] grnet.gr

Μέθοδοι μονοδιάστατης ελαχιστοποίησης

Διαδικασιακός Προγραμματισμός

GRNET. ntell [at] grnet.gr

Hase οδηγίες χρήσης.

Οδηγίες για την εγκατάσταση του πακέτου Cygwin

. Πρόκειται για ένα σημαντικό βήμα, καθώς η παράμετρος χρόνος υποχρεωτικά μεταβάλλεται σε κάθε είδους κίνηση. Η επιλογή της χρονικής στιγμής t o

GRNET. ntell [at] grnet.gr

Εισαγωγή στο περιβάλλον Code::Blocks

Προγραμματισμός Ι (HY120)

Συστήματα Παράλληλης & Κατανεμημένης Επεξεργασίας

GRNET. ntell [at] grnet.gr

Μετρικές & Επιδόσεις. Κεφάλαιο V

Συστήματα Παράλληλης και Κατανεμημένης Επεξεργασίας

-Δεν υπάρχουν.java αρχεία στο φάκελο.μόνο.class και το text file -Δεν γίνεται έλεγχος για Ν<0

Τεχνικές μεταγλώττισης - Αποσφαλμάτωση

Συστήματα Παράλληλης και Κατανεμημένης Επεξεργασίας

Κατανεμημένος και Παράλληλος Προγραμματισμός MPI. Γρήγορος οδηγός αναφοράς 1/4/2017

ΕΠΛ 605: ΑΡΧΙΤΕΚΤΟΝΙΚΗ ΥΠΟΛΟΓΙΣΤΩΝ ΧΕΙΜΕΡΙΝΟ ΕΞΑΜΗΝΟ 2018 ΕΡΓΑΣΙΑ 3 (13/10/2018) Ηµεροµηνία Παράδοσης δεύτερου µέρους: 18/10/2018

ΔΙΚΤΥΑ ΕΠΙΚΟΙΝΩΝΙΩΝ Εργαστηριακή Άσκηση 3

ΤΕΙ Κρήτης, Παράρτηµα Χανίων

ΟΔΗΓΙΕΣ ΓΙΑ ΤΗΝ ΕΝΗΜΕΡΩΣΗ ΤΩΝ ΔΗΜΟΣΙΩΝ ΟΙΚΟΝΟΜΙΚΩΝ ΥΠΗΡΕΣΙΩΝ (Δ.Ο.Υ.)

Apache Jmeter. Αν θέλετε να τεστάρετε μία υφιστάμενη web εφαρμογή π.χ. το Java Petstore

6. Ethernet. 6.1 Εισαγωγή

Δομές Δεδομένων Εργαστηριακή Άσκηση Γκόγκος Νίκος Α.Μ.: 4973 Έτος: 3 ο gkogkos@ceid.upatras.gr. Εισαγωγικά:

ΕΙΣΑΓΩΓΗ ΣΤΗ ΒΕΛΤΙΣΤΟΠΟΙΗΣΗ ΣΥΣΤΗΜΑΤΩΝ

Μάθημα Επιλογής 8 ου εξαμήνου

Επιβεβαίωση ορθής λειτουργίας απλών ψηφιακών κυκλωμάτων

8. Προσομοίωση Λειτουργίας Ασύρματων Δικτύων Υποδομής

ΠΛΗΡΟΦΟΡΙΚΗ Ι JAVA Τμήμα θεωρίας με Α.Μ. σε 8 & 9 18/10/07

Οδηγίες εγκατάστασης και χρήσης του Quartus

Matrix Algorithms. Παρουσίαση στα πλαίσια του μαθήματος «Παράλληλοι. Αλγόριθμοι» Γ. Καούρη Β. Μήτσου

Δίκτυο Άμεσης Σύνδεσης με Έλεγχο Πρόσβασης στο Μέσο

Λειτουργικά Συστήματα Ι - Εργαστήριο

Λειτουργικά Συστήματα (Λ/Σ)

Αριθμητική εύρεση ριζών μη γραμμικών εξισώσεων

Χρήση Βιβλιοθηκών και Εφαρμογών

Φύλλο Εργασίας 4 Συνθετική εργασία

2. Β Εξισώσεις Με Απόλυτες Τιμές

ΑΣΚΗΣΗ 1: TO ΠΕΡΙΒΑΛΛΟΝ ΕΡΓΑΣΙΑΣ DEV-C++

Σημειώσεις του εργαστηριακού μαθήματος Πληροφορική ΙΙ. Εισαγωγή στην γλώσσα προγραμματισμού

ΚΕΦΑΛΑΙΟ 5. Matlab GUI για FWSVM και Global SVM

Προσομοίωση BP με το Bizagi Modeler

Διάλεξη 15: Αναδρομή (Recursion) Διδάσκων: Παναγιώτης Ανδρέου

Αναπτύσσοντας developer tools στην Αpple. Αργύριος Κυρτζίδης Προπτυχιακός φοιτητής ΗΜΜΥ

server : Ο υπολογιστής του καθηγητή που θέλουμε να ελέγχει τους υπόλοιπους του εργαστηρίου client : Οι υπολογιστές των μαθητών

Άσκηση 1 η Τοπικά Δίκτυα Δεδομένων (LANs)

Πώς γίνεται το debug? Το debug γίνεται με δύο τρόπους, ως επί το πλείστον. Τουλάχιστον, εγώ δύο έμαθα, και αυτούς αναφέρω.

Επιστημονικοί Υπολογισμοί - Μέρος ΙΙΙ: Παράλληλοι Υπολογισμοί

SMPcache. Ένα εργαλείο για προσομοίωση-οπτικοποίηση κρυφής μνήμης (Cache)

Επιστημονικοί Υπολογισμοί - Μέρος ΙΙΙ: Παράλληλοι Υπολογισμοί

ΤΕΙ ΘΕΣΣΑΛΟΝΙΚΗΣ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΜΑΘΗΜΑ: ΔΙΚΤΥΑ Η/Υ

ΔΙΔΑΣΚΑΛΙΑ ΤΗΣ ΕΝΝΟΙΑΣ ΤΟΥ ΟΡΙΟΥ ΣΥΝΑΡΤΗΣΗΣ

Αρχιτεκτονικές Δικτύων & Πρωτόκολλα Ι

$./jms console -w <jms in> -r <jms out> -o <operations file> namedpipe. (standard input).

H ΓΛΩΣΣΑ C. Μάθηµα 1: Το Πρώτο µας Πρόγραµµα σε C. ηµήτρης Ψούνης

Αριθμητικές Μέθοδοι σε Προγραμματιστικό Περιβάλλον

ΗΜΥ 213 Εργαστήριο Οργάνωσης Υπολογιστών και Μικροεπεξεργαστών

Εθνικό Μετσόβιο Πολυτεχνείο Σχολή Ηλεκτρολόγων Μηχ. και Μηχανικών Υπολογιστών. Οδηγίες εργαστηρίου. Συστήματα Παράλληλης Επεξεργασίας 9 ο Εξάμηνο

Εργαστηριακή άσκηση Στατικοί υπολογισμοί σε μεταλλικά συστήματα (Πλεγματική σταθερά, ενέργεια συνοχής, μέτρο ελαστικότητας όγκου)

Το κείμενο που ακολουθεί αποτελεί επεξεργασία του πρωτότυπου κειμένου του Α. Κάστωρ για την επίλυση των παραδειγμάτων κρίσιμης αλυσίδας που

επιστρέφει το αμέσως μεγαλύτερο από το x στοιχείο του S επιστρέφει το αμέσως μικρότερο από το x στοιχείο του S

ΛΕΙΤΟΥΡΓΙΑ ΣΥΣΤΗΜΑΤΩΝ LRT ΣΕ ΑΣΤΙΚΕΣ ΠΕΡΙΟΧΕΣ

Εξοικείωση με το πρόγραμμα DEV C++ Επικοινωνία Χρήστη - Υπολογιστή

Υπολογιστική Νέφους: Εργαστήριο 1

Εκτέλεση ασκήσεως ΕΚΤΕΛΕΣΗ ΤΗΣ ΑΣΚΗΣΗΣ Η Εργαλειοθήκη

Λειτουργικά Συστήματα 7ο εξάμηνο, Ακαδημαϊκή περίοδος

1.2 Δραστηριότητα: Εισαγωγή στο όριο ακολουθίας

Σύστηµα Μικροπληρωµών στο Internet Περίπτωση: Χρυσή Ευκαιρία. Βίλλιαµ ράκος ιευθύνων Σύµβουλος IS Impact

ΠΛΕ- 074 Αρχιτεκτονική Υπολογιστών 2

ΦΥΛΛΟ ΔΡΑΣΤΗΡΙΟΤΗΤΩΝ

Τμήμα Τεχνολογίας Πληροφορικής και Τηλεπικοινωνιών. Βαρτζιώτης Φώτης. ΠΡΟΧΩΡΗΜΕΝΑ ΘΕΜΑΤΑ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΥ ΔΙΚΤΥΩΝ ] Εργαστήριο 2

Transcript:

Χρονοεπίδοση Συμπεριφορά Benchmarks, GRNET ntell [at] grnet.gr Εκπαιδευτικό Σεμινάριο ARIS Θεσσαλονίκη, 28-29 Σεπ. 2015 1/28

Χρονοεπίδοση κλιμάκωση Παράγοντες που επηρεάζουν την επίδοση Αναζήτηση σημείων κώδικα που αποτελούν bottleneck. Εκπαιδευτικό Σεμινάριο ARIS Θεσσαλονίκη, 28-29 Σεπ. 2015 2/28

Benchmark : μελέτη της ταχύτητας εκτέλεσης μιας εφαρμογής Scaling : Η δυνατότητα μιας εφαρμογής να μικραίνει ο χρόνος εκτέλεσης όσο μεγαλώνει ο αριθμός των cores που χρησιμοποιούνται, παράγοντες που την επηρεάζουν. Τι μετράμε πόσο αντιπροσωπευτικό είναι για εύρεση σημείων/διαδικασιών που επιβραδύνουν την εφαρμογή. Εκπαιδευτικό Σεμινάριο ARIS Θεσσαλονίκη, 28-29 Σεπ. 2015 3/28

Έστω κάποια εφαρμογή στην οποία έχουν εφαρμοστεί όλες οι πρακτικές βελτιτοποίησης για σειριακούς κώδικες. Μετράμε το χρόνο εκτέλεσης της σειριακής εφαρμογής. Ένα απλό παράδειγμα είναι η επίλυση γραμμικού συστήματος εξισώσεων. Πιθανότατα όλοι έχουν συνειδοποιήσει κάποια στιγμή ότι σειριακά ο χρόνος επίλυσης εξαρτάται από το μέγεθος του συστήματος που επιλύεται, όσο μεγαλύτερο το μέγεθος τόσο μεγαλύτερος ο χρόνος εκτέλεσης. Εκπαιδευτικό Σεμινάριο ARIS Θεσσαλονίκη, 28-29 Σεπ. 2015 4/28

Όταν μεταβαίνουμε σε παράλληλη εκτέλεση θεωρητικά αναμένουμε να ελατώνεται ο χρόνος εκτέλεσης με τον αριθμό των cores που χρησιμοποιούμε, (ιδανικό scaling). Η πραγματικότητα είναι διαφορετική. Εκπαιδευτικό Σεμινάριο ARIS Θεσσαλονίκη, 28-29 Σεπ. 2015 5/28

Όσο πιο πολλά process παίρουν μέρος σε μια παράλληλη διαδικασία, τόσο μικραίνει ο χρόνος υπολογισμού του καθενός process. Ασχέτως του πόσα processes χρησιμοποιούμε, χρειάζεται επικοινωνία μεταξύ των process. Όσο περισότερα procs συμπεριλαμβάνει μια παράλληλη εργασία, τόσο μεγαλύτερη είναι η επικοινωνία μεταξύ τους. Εκπαιδευτικό Σεμινάριο ARIS Θεσσαλονίκη, 28-29 Σεπ. 2015 6/28

Αρα, όσο μεγαλώνει ο αριθμός των processes έχουμε : το χρόνο υπολογισμού να μικραίνει το χρόνο επικοινωνίας να αυξάνει. Κάποια στιγμή, αυξάνοντας τον αριθμό των procs η επικοινωνία θα γίνει ο κύριος παράγοντας για την επίδοση. Έστω ότι έχουμε ένα vector ή array θέλουμε π.χ. να διπλασιάσουμε τις τιμές του κάθε στοιχείου, ότι δεν έχουμε πρόβλημα επικοινωνίας. Στην ιδανική περίπτωση, πρέπει ο αριθμός των στοιχείων του vector/array να διαιρείται ακριβώς με τον αριθμό των processes. Αλλιώς εισάγεται η έννοια του load imbalance : Δεν έχουν όλα τα processes τον ίδιο αριθμό πράξεων να κάνουν. Εκπαιδευτικό Σεμινάριο ARIS Θεσσαλονίκη, 28-29 Σεπ. 2015 7/28

Όσο πιο κοντά είναι μεταξύ των process ο αριθμός των πράξεων που έχουν να κάνουν, τόσο μικρότερη είναι η επιρροή στην ταχύτητα. Στον όρο πράξεων ανά process μετράμε όλες τις πιθανές πράξεις, OpenMP/Threads συμπεριλαμβανομένων. Εκπαιδευτικό Σεμινάριο ARIS Θεσσαλονίκη, 28-29 Σεπ. 2015 8/28

: Μετράμε σωστά? Είναι αυτό που μετράμε αντιπροσωπευτικό της? Συνήθως στα benchmarks, μετράμε κάποια λίγα βήματα στην έναρξη των υπολογισμών. Συνηθίζεται στα πρώτα βήματα να γίνονται πολύ περισσότερα από ότι αργότερα, initialization, load balancer, auto tuning, κλπ. Προφανώς αυτά τα βήματα πρέπει να μείνουν εκτός υπολογισμών, ή να τρέξουμε αρκετά τυπικά βήματα ώστε η επιρροή του/των πρώτων να είναι μικρή στο συνολικό χρόνο εκτέλεσης. Προφανώς διεργασίες αυτού του τύπου που επαναλαμβάνονται περιοδικά πρέπει να λαμβάνονται υπόψιν. Εκπαιδευτικό Σεμινάριο ARIS Θεσσαλονίκη, 28-29 Σεπ. 2015 9/28

: Μετράμε σωστά? Μερικά παραδείγματα Κώδικας : NAMD Machines HeCToR (Cray XE6), Juqueen (Bluegene/Q) 4096 cores Performance during first 1000 steps in averages of 100, average over 1000 steps. Εκπαιδευτικό Σεμινάριο ARIS Θεσσαλονίκη, 28-29 Σεπ. 2015 10/28

: NAMD, 28M atoms, 4096 cores, HeCToR (Cray XE6) Εκπαιδευτικό Σεμινάριο ARIS Θεσσαλονίκη, 28-29 Σεπ. 2015 11/28

: NAMD, 28M atoms, 4096 cores, Juqueen(Bluegene/Q) Εκπαιδευτικό Σεμινάριο ARIS Θεσσαλονίκη, 28-29 Σεπ. 2015 12/28

: NAMD, 28M atoms 4096 cores, SuperMUC (IBM similar to ARIS but 8C) Εκπαιδευτικό Σεμινάριο ARIS Θεσσαλονίκη, 28-29 Σεπ. 2015 13/28

: Eνα παράδειγμα από το ARIS, CP2K, 64 Water, 40 cores, 200 MD Steps Εκπαιδευτικό Σεμινάριο ARIS Θεσσαλονίκη, 28-29 Σεπ. 2015 14/28

: NAMD, 4096 cores on all Στα πρώτα 100-400 iterations δουλεύει ο load balancer, μετά από αυτά ότι load imbalance υπάρχει από τις αρχικές συνθήκες έχει ισοροπήσει, υπάρχει σταθερό perfonmance. Αυτό που θα δεί τελικά ο χρήστης σε ένα τυπικό run μερικών εκατομυρίων iterations, είναι το όριο στο οποίο συγκλίνει το performance. Εκπαιδευτικό Σεμινάριο ARIS Θεσσαλονίκη, 28-29 Σεπ. 2015 15/28

: CP2K, 40 cores, 64 Waters, TZVP, 200 MD Steps, on ARIS Στο πρώτο βήμα γίνονται : αρχικοποίηση, πολύ περισότερα εσωτερικά iterations, κλπ Αυτό που θα δεί τελικά ο χρήστης σε ένα τυπικό run μερικών χιλιάδων ή μυριάδων iterations, είναι το όριο στο οποίο συγκλίνει το performance. Εκπαιδευτικό Σεμινάριο ARIS Θεσσαλονίκη, 28-29 Σεπ. 2015 16/28

: Συμπέρασμα Πρέπει να είμαστε προσεκτικοί στο τι μετράμε στην προγραμμάτων, συστημάτων, μεθόδων κλπ. Όπως είδαμε χτές, υπάρχουν περιπτώσεις όπως το WRF, όπου συστηματικά εμφανίζονται ανά διαστήματα steps με (σημαντικά) αυξημένο χρόνο εκτέλεσης. Στην περίπτωση αυτή, σαφώς πρέπει να λαμβάνονται υπόψιν τα βήματα αυτά στην, επειδή επηρεάζουν το performance που θα δεί ο τελικός χρήστης στις μεγάλης διάρκειας προσομοιώσεις του. Εκπαιδευτικό Σεμινάριο ARIS Θεσσαλονίκη, 28-29 Σεπ. 2015 17/28

: : Lightweight, Scalable MPI http://mpip.sourceforge.net/ Είναι μια βιβλιοθήκη, η οποία χωρίς ΚΑΜΙΑ αλλαγή στον κώδικα της εφαρμογής, εφόσον γίνει link σωστά αντικαθιστά τις MPI κλήσεις, κάνει μετρήσεις κατά την εκτέλεση στο τέλος βγάζει report. Τρόπος Χρήσης : Εκπαιδευτικό Σεμινάριο ARIS Θεσσαλονίκη, 28-29 Σεπ. 2015 18/28

: Φυσιολογικό Compilation : mpicc mpif90 -O source.[c f] -o exe Compilation για profiling με : module load mpicc mpif90 -g -O source.[c f] -L$MPIPROOT/lib -lunwind -lbfd -o exe Τρέχουμε την εφαρμογή ως συνήθως Αν όντως έχει γίνει σωστά το link, στην αρχή της εκτέλεσης εμφανίζεται ένα μήνυμα : : : V3.4.1 (Build Sep 7 2015/16:33:51) : Direct questions and errors to mpip-help@lists.sourceforge.net : Εκπαιδευτικό Σεμινάριο ARIS Θεσσαλονίκη, 28-29 Σεπ. 2015 19/28

: Μετά την εκτέλεση, εμφανίζεται στην directory που τρέξαμε ένα text file με όνομα : EXE.MPITASKS.PID.NUMBER. Το file περιέχει το summary την ανάλυση του profile. Το καλό του είναι ότι πολύ γρήγορα μπορούμε να βρούμε ποια είναι τα σημεία του κώδικα που έχουμε τις top καθυστερήσεις, πιθανότατα το λόγο. Εκπαιδευτικό Σεμινάριο ARIS Θεσσαλονίκη, 28-29 Σεπ. 2015 20/28

:, σημαντικά σημεία του summary @ Report generation : Collective @ MPI Task Assignment : 0 node049 @ MPI Task Assignment : 1 node049... @ MPI Task Assignment : 19 node049... --------------------------------------------------------------------------- @--- MPI Time (seconds) --------------------------------------------------- --------------------------------------------------------------------------- Task AppTime MPITime MPI% 0 1.71e+03 13.3 0.78... 19 1.71e+03 163 9.55 * 3.42e+04 2.04e+03 5.97... --------------------------------------------------------------------------- @--- Callsites: 43 -------------------------------------------------------- --------------------------------------------------------------------------- ID Lev File/Address Line Parent_Funct MPI_Call 1 0 parallel.c 759 par_broadcast Bcast 2 0 parallel.c 295 par_imax Allreduce... Εκπαιδευτικό Σεμινάριο ARIS Θεσσαλονίκη, 28-29 Σεπ. 2015 21/28

--------------------------------------------------------------------------- @--- Aggregate Time (top twenty, descending, milliseconds) ---------------- --------------------------------------------------------------------------- Call Site Time App% MPI% COV Allreduce 32 2.03e+06 5.94 99.44 0.75... --------------------------------------------------------------------------- @--- Aggregate Sent Message Size (top twenty, descending, bytes) ---------- --------------------------------------------------------------------------- Call Site Count Total Avrg Sent% Allreduce 10 4000 3.91e+09 9.77e+05 96.58 Bcast 27 20 1.28e+07 6.4e+05 0.32 Bcast 30 20 1.28e+07 6.4e+05 0.32 Εκπαιδευτικό Σεμινάριο ARIS Θεσσαλονίκη, 28-29 Σεπ. 2015 22/28

Εξάσκηση με, δοκιμάστε είτε δικό σας κώδικα είτε το χτεσινό παράδειγμα για BLAS/Scalapack. Φτιάξτε το Makefile για, κάντε compile, τρέξτε την εφαρμογή, δείτε τα αποτελέσματα. Απορίες - συζήτηση Εκπαιδευτικό Σεμινάριο ARIS Θεσσαλονίκη, 28-29 Σεπ. 2015 23/28

module load scalasca Compilation για scalasca : scalasca -instrument mpicc mpif90 -O source.[c f] -o exe Run : Στο SLURM, αλλάζει μόνο το run : scalasca -analyze srun EXE ARGS Παράγεται μιά directory με τα results, scorep_exename_mpitasks_sum Results : scalasca -examine το όνομα της directory ΧΡΕΙΑΖΕΤΑΙ Χ11. Πρακτική εξάσκηση με scalasca. Εκπαιδευτικό Σεμινάριο ARIS Θεσσαλονίκη, 28-29 Σεπ. 2015 24/28

Εξάσκηση με, δοκιμάστε είτε δικό σας κώδικα είτε το χτεσινό παράδειγμα για BLAS/Scalapack. Φτιάξτε το Makefile για, κάντε compile, τρέξτε την εφαρμογή, δείτε τα αποτελέσματα. Απορίες συζήτηση. Εκπαιδευτικό Σεμινάριο ARIS Θεσσαλονίκη, 28-29 Σεπ. 2015 25/28

Εργαλεία όπως Allinea DDT (, $) Με τα γνωστά εργαλεία, όχι ότι καλύτερο αλλά δουλεύει καλά για μικρό αριθμό MPI Tasks. mpirun -np 4 xterm -e gdb EXE. Ανοίγει ένα X-terminal που τρέχει GBD EXE για κάθε ένα MPI Task. Εκπαιδευτικό Σεμινάριο ARIS Θεσσαλονίκη, 28-29 Σεπ. 2015 26/28

Ερωτήσεις? Εκπαιδευτικό Σεμινάριο ARIS Θεσσαλονίκη, 28-29 Σεπ. 2015 27/28

Θέματα Πρακτικής εξάσκησης Χρήση Βιβλιοθηκών, χρονομέτρηση κλπ. Κώδικας, Makefiles, αποτελέσματα από ARIS στο Material του events.hpc.grnet.gr : Εάν έχετε κάποιο δικό σας κώδικα, δοκιμάστε ή για profiling Εκπαιδευτικό Σεμινάριο ARIS Θεσσαλονίκη, 28-29 Σεπ. 2015 28/28