Εισαγωγή στο Flex. Μεταγλωττιστές, Χειμερινό εξάμηνο

Σχετικά έγγραφα
Εργαστήριο 3 Εισαγωγή στο Flex Διδάσκοντες: Δρ. Γεώργιος Δημητρίου Δρ. Άχμεντ Μάχντι

Εισαγωγή στο Bison. Μεταγλωττιστές, Χειμερινό εξάμηνο

Εισαγωγή στο Bison. Μεταγλωττιστές, Χειμερινό εξάμηνο

Σχεδίαση Γλωσσών Προγραμματισμού. Εαρινό Εξάμηνο Lec04 19/02/2019

Υλοποίηση ΛΑ με το flex

Μεταγλωττιστές. Ενότητα 6: Λεκτική ανάλυση (Μέρος 2 ο ) Αγγελική Σγώρα Τμήμα Μηχανικών Πληροφορικής ΤΕ

Παρουσίαση του εργαλείου FLEX

ΜΕΤΑΓΛΩΤΤΙΣΤΕΣ. Στην εξοικείωση με τη διαδικασία κατασκευής ενός Λεξικού Αναλυτή κάνοντας χρήση του lex.

Φροντιστήριο 1ο Εισαγωγή στο FLEX. Flex. Regular Expressions (1/4)

Γλώσσες Προγραμματισμού Μεταγλωττιστές. Συντακτική Ανάλυση με το Εργαλείο BISON

Υλοποίηση ΣΑ με το bison

Υλοποίηση ΣΑ με το bison

Παρουσίαση του εργαλείου BISON

HY340, 2009 Α. Σαββίδης Slide 2 / 26. HY340, 2009 Α. Σαββίδης Slide 3 / 26. HY340, 2009 Α. Σαββίδης Slide 4 / 26

Mεταγλωττιστές. 4 ο εργαστηριακό μάθημα Λεξική ανάλυση και flex. Θεωρία

Παρουσίαση του εργαλείου. flex. γεννήτρια λεκτικών αναλυτών. για το µάθηµα: Μεταγλωττιστές. Χανιά, flex 1

Μεταγλωττιστές. Εργαστήριο 5. Εισαγωγή στο BISON. Γεννήτρια Συντακτικών Αναλυτών. 2 η Φάση Μεταγλώττισης Συντακτική Ανάλυση

Εργαστήριο 08 Εισαγωγή στo Yacc

Εργαστήριο 4_1 Λεκτική Ανάλυση - Flex Διδάσκοντες: Δρ. Γεώργιος Δημητρίου Δρ. Άχμεντ Μάχντι

Μεταγλωττιστές. Γιώργος Δημητρίου. Μάθημα 8 ο. Πανεπιστήμιο Θεσσαλίας - Τμήμα Ηλεκτρολόγων Μηχανικών & Μηχανικών Υπολογιστών

Δομημένος Προγραμματισμός (ΤΛ1006)

Παρουσίαση του εργαλείου BISON

Μεταγλωττιστές. Γιώργος Δημητρίου. Μάθημα 3 ο. Πανεπιστήμιο Θεσσαλίας - Τμήμα Πληροφορικής

Γλώσσες Προγραμματισμού Μεταγλωττιστές. Λεκτική Ανάλυση

HY340, 2010 Α. Σαββίδης. Slide 3 / 43. Slide 4 / 43

Εργασία Προγραµµατισµού

Θα χρησιμοποιήσουμε το bison, μια βελτιωμένη έκδοση του yacc. Φροντιστήριο 2ο Εισαγωγή στο YACC. Yacc. Δομή Προγράμματος Yacc

Δομημένος Προγραμματισμός (ΤΛ1006)

Εργασία Προγραµµατισµού

Προγραμματισμός Η/Υ (ΤΛ2007 )

Προεπεξεργαστής της C. C Preprocessor. Προγραμματισμός II 1

Αρχές Γλωσσών Προγραμματισμού και Μεταφραστών: Εργαστηριακή Άσκηση

Εισαγωγή στον Προγραµµατισµό. Διάλεξη 2 η : Βασικές Έννοιες της γλώσσας προγραµµατισµού C Χειµερινό Εξάµηνο 2011

Η-Υ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ. Εργαστήριο 1 Εισαγωγή στη C. Σοφία Μπαλτζή s.mpaltzi@di.uoa.gr

Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό υλικό, όπως εικόνες, που υπόκειται σε άλλου τύ

Λεκτικός Αναλυτής. Διαλέξεις στο μάθημα: Μεταφραστές Γιώργος Μανής

Εργαστήριο 2ο. Περίγραμμα Εργαστηριακής Άσκησης

Προγραμματισμός Η/Υ (ΤΛ2007 )

Δομημένος Προγραμματισμός (ΤΛ1006)

Δομημένος Προγραμματισμός

Αρχές Γλωσσών Προγραμματισμού και Μεταφραστών: Εργαστηριακή Άσκηση

ΠΑΝΕΠΙΣΤΗΜΙΟ ΙΩΑΝΝΙΝΩΝ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ

Γλώσσα Προγραμματισμού C++ Εισαγωγή - Μια πρώτη ματιά

Ανάπτυξη Μεγάλων Εφαρµογών στη Γλώσσα C (2)

Προγραμματισμός Ι. Δείκτες. Δημήτρης Μιχαήλ. Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο

Αντίρριο, 14/03/2017 Προδιαγραφές Εργαστηριακής Εργασίας για το μάθημα «Μεταγλωττιστές»

Προγραμματισμός Η/Υ (ΤΛ2007 )

Δομημένος Προγραμματισμός (ΤΛ1006)

Η γλώσσα προγραμματισμού C

Τι είναι το yacc. Δομή ενός αρχείου yacc. Πρόλογος. ΗΥ 340 Γλώσσες και Μεταφραστές Φροντιστήριο. Ο yacc είναι ένας γενικού σκοπού parser generator.

Προγραμματισμός Ι. Προχωρημένα Θέματα. Δημήτρης Μιχαήλ. Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο

Προγραμματισμός Η/Υ (ΤΛ2007 )

ΕΡΓΑΣΤΗΡΙΟ 3: Προγραμματιστικά Περιβάλλοντα και το Πρώτο Πρόγραμμα C

ΠΟΛΥΤΕΧΝΕΙΟ ΚΡΗΤΗΣ Τμήμα Ηλεκτρονικών Μηχανικών & Μηχανικών Υπολογιστών Τομέας Πληροφορικής

ΔΟΜΗΜΕΝΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ

Διάλεξη 3η: Τύποι Μεταβλητών, Τελεστές, Είσοδος/Έξοδος

Δομημένος Προγραμματισμός

Κεφάλαιο : Εισαγωγή στην C: (Διαλέξεις 3-4)

Εργαστήριο 08 Δημιουργία 1 ου Συντακτικού Αναλυτή

Τύποι Δεδομένων Είσοδος/Έξοδος

Εισαγωγή. Διαλέξεις στο μάθημα: Μεταφραστές Γιώργος Μανής

ΜΕΤΑΓΛΩΤΤΙΣΤΕΣ. Στις βασικές έννοιες που σχετίζονται με τη λεξική ανάλυση. Στη δήλωση ορισμό κανονικών εκφράσεων

Προγραμματισμός Ι (ΗΥ120)

ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ Η/Υ Ακαδημαϊκό έτος ΤΕΤΡΑΔΙΟ ΕΡΓΑΣΤΗΡΙΟΥ #4

Προγραμματισμός Η/Υ (ΤΛ2007 )

Προγραμματισμός Η/Υ 1 (Εργαστήριο)

Παρακάτω δίνεται o σκελετός προγράμματος σε γλώσσα C. Σχολιάστε κάθε γραμμή του κώδικα.

Δομημένος Προγραμματισμός

Ανάπτυξη και Σχεδίαση Λογισμικού

ΠΑΝΕΠΙΣΤΗΜΙΟ ΙΩΑΝΝΙΝΩΝ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ

ΑΡΧΕΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΥ

Β. Εισαγωγή στον Προγραμματισμό Η/Υ με την JavaScript

Προγραμματισμός Η/Υ (ΤΛ2007 )

Προγραμματισμό για ΗΜΥ

Προγραμματισμός Ι (ΗΥ120)

ΠΙΝΑΚΑΣ ΠΕΡΙΕΧΟΜΕΝΩΝ

S, (5, -3, 34, -23, 7) ( *, _

Δομημένος Προγραμματισμός. Τμήμα Επιχειρηματικού Σχεδιασμού και Πληροφοριακών Συστημάτων

Στόχοι και αντικείμενο ενότητας. Εκφράσεις. Η έννοια του τελεστή. #2.. Εισαγωγή στη C (Μέρος Δεύτερο) Η έννοια του Τελεστή

Κεφάλαιο , 3.2: Συναρτήσεις II. (Διάλεξη 12)

3ο σετ σημειώσεων - Πίνακες, συμβολοσειρές, συναρτήσεις

Μέρος 2 Κατασκευή Συντακτικού Αναλυτή

Μεθόδων Επίλυσης Προβλημάτων

Δομημένος Προγραμματισμός (ΤΛ1006)

Προγραμματισμός Η/Υ (ΤΛ2007 )

ΤΕΜ-101 Εισαγωγή στους Η/Υ Εξεταστική Ιανουαρίου 2011 Θέματα Β

ΕΡΓΑΣΤΗΡΙΟ 1 ΕΙΣΑΓΩΓΗ ΣΤΗ C. Τµήµα Πληροφορικής και Τηλεπικοινωνιών

Τι είναι το Flex. Περιγραφή ενός λεξικογραφικού αναλυτή στη γλώσσα του lex/flex. Γενικά Χαρακτηριστικά του Flex

Κεφάλαιο 2: Τυπικές γλώσσες. Νίκος Παπασπύρου, Κωστής Σαγώνας Μεταγλωττιστές Μάρτιος / 216

Μεταφραστής (Compiler)

Προγραμματισμός H/Y Ενότητα 1: Εισαγωγή. Επικ. Καθηγητής Συνδουκάς Δημήτριος Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά)

Η γλώσσα προγραμματισμού C

Στοιχειώδης προγραμματισμός σε C++

Διδάσκων: Κωνσταντίνος Κώστα Διαφάνειες: Δημήτρης Ζεϊναλιπούρ

Διάλεξη 2η: Αλγόριθμοι και Προγράμματα

Προγραμματισμός Η/Υ (ΤΛ2007 )

Π. Σταθοπούλου ή Οµάδα Α (Φοιτητές µε µονό αριθµό Μητρώου ) ιδασκαλία : Παρασκευή 11πµ-13µµ ΗΛ7

Βασικές Αρχές Προγραμματισμού

Γλώσσες Προγραμματισμού Μεταγλωττιστές. Σημασιολογική Ανάλυση

Εισαγωγή στη γλώσσα προγραμματισμού C++

Transcript:

Εισαγωγή στο Flex Μεταγλωττιστές, Χειμερινό εξάμηνο 2014-2015

Ημερομηνίες Διαδικαστικά Παρουσίαση Flex 7 Νοεμβρίου 15:00 17:00 Παρουσίαση Bison 28 Νοεμβρίου 15:00 17:00 Στοιχεία επικοινωνίας Λίστα μαθήματος : ce320@inf-server.inf.uth.gr Προσωπικό email: gefloros@inf.uth.gr Ώρες γραφείου: Ε5 Τετάρτη 11:00-12:00

Λεκτική Ανάλυση Αποτελεί την πρώτη φάση της μετάφρασης. Αναγνώριση λεκτικών μονάδων ενός προγράμματος. Απόκρυψη των περιττών λεπτομερειών από τον συντακτικό αναλυτή. Που βοηθάει το Flex? Εργαλείο κατασκευής λεκτικού αναλυτή. Αναγνωρίζει λεκτικές μονάδες από ένα αρχείο. Δυνατότητα επιστροφής τιμών για κάθε λεκτική μονάδα. Κατασκευάζει αυτόματα το ΔΜ.

Flex Μετα-εργαλείο παραγωγής λεκτικών αναλυτών. Open source Linux OS Download address: http://flex.sourceforge.net/ Windows OS Διατίθεται μαζί με το περιβάλλον Cygwin http://www.cygwin.com

Εγκατάσταση Flex Αποσυμπίεση: tar zxvf flex-2.5.37.tar.gz Στον κατάλογο που δημιουργείται δίνουμε:./configure make make install

Παράδειγμα Λεκτικής Ανάλυσης Μετατροπής μιας έκφρασης από χαρακτήρες σε μια σειρά από tokens. foo = 1-3**2 Lex Foo Token type Variable = Assignment operator 1 Number - Subtraction operator 3 Number ** Power operator 2 Number

FLEX/BISON στο flowchart ενός compiler Flex (.l spec file) Bison (.y spec file)

Λειτουργία Flex Το Flex και Bison λειτουργούν σχεδόν με τον ίδιο τρόπο. Καθορισμός των εκφράσεων προς αναγνώριση. Σε αυτήν την περίπτωση χρησιμοποιούνται κανονικές εκφράσεις. Καθαρισμός ενεργειών μετά την αναγνώριση.

Δομή Αρχείου Εισόδου Το αρχείο εισόδου στο Flex αποτελείται από 3 μέρη. Ορισμοί. Κανόνες. Συναρτήσεις. Δομή: /*Statements block*/ %% /*Rules block*/ %% /*User Functions*/

Τμήμα Ορισμών Το τμήμα ορισμών περιλαμβάνει: Επιλογές του εργαλείου: % option noyywrap //tells Flex to read only one input file %option case-insensitive Δηλώσεις αρχικών καταστάσεων. %x STATE_COMMENT Ορισμός αναγνωριστικών για Κ.Ε. Ανάθεση ονομάτων σε σύνολα από αναγνωριστικά Letterdigit [A-Za-z0-9] Whitechar [\t\n] Literal blocks περικλείεται μέσα σε %{ code %} και περιέχει κώδικα C. Header file inclusion. Define constants and global variables.

Τμήμα Κανόνων Περιλαμβάνει τις κανονικές εκφράσεις και τους διάφορους κανόνες. Μορφή κανόνων: Κανονική έκφραση {C code} 0 ( -?[1-9][0-9]*)) {return (INTEGER);} Κώδικας εντός των %{..%} αντιγράφεται αυτούσιος. ΠΡΟΣΟΧΗ!!! To Flex θα χρησιμοποιήσει το πρώτο κανόνα που κάνει match σε περίπτωση σύγκρουσης.(παραδείγματα παρακάτω)

Τμήμα Συναρτήσεων Χρήστη Περιλαμβάνει τις οριζόμενες από τον χρήστη συναρτήσεις. Παραδείγματα: main() yyerror() yywrap() Ουσιαστικά δημιουργούμε όποια συνάρτηση θέλουμε εμείς για να επεξεργαστούμε τυχόν δεδομένα.

Ειδικοί Χαρακτήρες Character Operation. Οποιοσδήποτε χαρακτήρας εκτός του \n [] Κλάσεις χαρακτήρων, π.χ. [a-z],[0-9] ^ Αναγνώριση της αρχής μίας γραμμής $ Αναγνώριση του τέλους μια γραμμής {} Πλήθος εμφανίσεων ή αναφορά σε ένα pattern \ Escape sequence όπως στη C * Μηδέν ή περισσότερες εμφανίσεις της Κ.Ε. που προηγείται

Ειδικοί Χαρακτήρες Character Operation + Μία ή περισσότερες εμφανίσεις της Κ.Ε. που προηγείται? Μηδέν ή μία εμφάνιση της Κ.Ε. που προηγείται Τελεστής διάζευξης Αναγνώριση κυριολεκτικών () Ομαδοποίηση Κ.Ε. / Αναγνώριση βασισμένη σε συμφραζόμενα <<EOF>> Αναγνώριση τέλους αρχείου

Αναγνώριση Εκφράσεων Αναγνώριση της έκφρασης με το μεγαλύτερο μήκος συμβολοσειράς. Σε περίπτωση σύγκρουσης επιλέγεται ο προγενέστερος κανόνας Απλά παραδείγματα: if {return(if);} [a-za-z0-9]+ {return(id);}

Rules [a-za-z0-9]+ post Input post Output Παραδείγματα Συνέχεια {printf( Hello );} {printf( World );} Θα κάνει match με τον πρώτο κανόνα και άρα θα τυπώσει Hello

Αρχικές Καταστάσεις Χρησιμοποιούνται για αναγνώριση με χρήση συμφραζομένων. Προσθήκη του <STATE_NAME> πριν από κάθε κανόνα της κατάστασης. Δήλωση των καταστάσεων που χρησιμοποιούμε, στο τμήμα ορισμών: %x: Αποκλειστικές καταστάσεις Ενεργοί είναι μόνο οι κανόνες που ανήκουν στην κατάσταση. %s: Κοινόχρηστες καταστάσεις. Ενεργοί είναι οι κανόνες που ανήκουν στην κατάσταση όσο και όσοι δεν ονοματίζουν κάποια κατάσταση.

Αρχικές Καταστάσεις Αρχική κατάσταση του αναλυτή είναι η INITIAL. Μετάβαση μεταξύ καταστάσεων: BEGIN(STATE_NAME); Χρήση κατάστασης <STATE_NAME>{ DERIVED_STATE_RULES.}

Παράδειγμα C-style comments: /* <COMMENT> */ <COMMENT>\n <COMMENT>. <COMMENT><<EOF>> {BEGIN(COMMENT);} {BEGIN(INITTIAL);} {lineno++;} {printf( Unterminated comment );return 0;}

YYSTYPE yylval: Χρήσιμες Μεταβλητές Είναι ίσως η σημαντικότερη μεταβλητή, καθώς χρησιμοποιείται για επικοινωνία του λεκτικού με τον συντακτικό αναλυτή. Περιέχει την τιμή που θα περαστεί στον συντακτικό αναλυτή. Μπορεί να περιέχει πολλαπλά πεδία αν ξαναοριστεί ως union τύπου YYSTYPE στο τμήμα ορισμών του αρχείου. int yyleng: Περιέχει το μήκος της αναγνωρισθείσας λεκτικής μονάδας. char *yytext: Περιέχει την αναγνωρισθείσα λεκτική μονάδα.

Χρήσιμες Συναρτήσεις int yylex(): Καλείται για την αναγνώριση της επόμενης λεκτικής μονάδας. void yymore(): Ενσωματώνει την επόμενη λεκτική μονάδα στην τρέχουσα void yyless(int n): Κρατάει τους n χαρακτήρες του λεκτικού και επιστρέφει τους υπόλοιπους int yywrap(): Καθορίζει την λειτουργία του λεκτικού αναλυτή. Καλείται αυτόματα και μπορεί να επιστρέψει την αναγνώριση πολλαπλών αρχείων.

Χρήσιμες Συναρτήσεις ( εκτός Flex) Συναρτήσεις μετατροπής: Όταν αναγνωριστεί μία λεκτική μονάδα η yytext που την περιέχει είναι τύπου char. Για να επιστραφεί με χρήση της yyval χρειάζεται μετατροπή. atof char to float atoi char to int Αν χρειαστούν άλλες βάσεις?? Debugging: Χρησιμοποίηση της printf για να επιστρέψει τη αναγνωρίζει το Flex.

Εκτέλεση Flex Όνομα αρχείου file_name.l Εντολή flex file_name.l Παράγεται το αρχείο lex.yy.c Override με o Output_File Compile του παραγόμενου αρχείου για παραγωγή εκτελέσιμου: Με gcc Mε gcc και σύνδεση με την βιβλιοθήλη libfl: gcc lex.yy.c o lexer_name -lfl Εκτέλεση λεκτικού αναλυτή:./lexer_name input_file_name

ΕΡΩΤΗΣΕΙΣ/ΑΠΟΡΙΕΣ???