Δράση 9.14 / Υπηρεσία εντοπισμού λογοκλοπής Κυρίως Παραδοτέο / Εκπαίδευση προσωπικού βιβλιοθηκών μελών Σ.Ε.Α.Β στο πληροφοριακό σύστημα εντοπισμού λογοκλοπής. Επιμέρους Παραδοτέο 9.14.3.1 / Προδιαγραφές σχήματος μεταδεδομένων του αποθετηρίου Χρονικό διάστημα Ιούλιος 2012 Σεπτέμβριος 2012 Υπεύθυνο Ίδρυμα Πάντειο Πανεπιστήμιο Ημερομηνία Παράδοσης: 4/10/2012 Έκδοση (τελική) ΣΕΛΙΔΑ 1
Εμπλεκόμενοι στην υλοποίηση του Ενδιάμεσου Παραδοτέου 9.Χ.Χ.Χ: Συγγραφείς Δημήτρης Αντωνάκης Υπεύθυνος Δράσης Κωνσταντία Κακάλη Επιθεωρητές ΣΕΛΙΔΑ 2
Πίνακας Περιεχομένων 1 Συνοπτικά Στοιχεία κυρίως παραδοτέου 9.14.3.1... 4 1.1 Περιγραφή - Εξέλιξη... 4 2 Επιμέρους παραδοτεο 9.14.3.1... 5 2.1 Σχήμα μεταδεδομενων του αποθετηριου... 5 3 Επικοινωνία με Ακαδημαϊκά και Τεχνολογικά Ιδρύματα... 7 4 Επικοινωνία με λοιπά μέλη Ακαδημαϊκής Κοινότητας... 9 5 Βιβλιογραφία... 10 ΣΕΛΙΔΑ 3
1 ΣΥΝΟΠΤΙΚΑ ΣΤΟΙΧΕΙΑ ΚΥΡΙΩΣ ΠΑΡΑΔΟΤΕΟΥ 9.14.3.1 1.1 Περιγραφή - Εξέλιξη Το κυρίως παραδοτέο της δράσης αφορά στο σχεδιασμό και ανάπτυξη του λογισμικού και της βάσης δεδομένων (αποθετηρίου) για τη λογοκλοπή (η ιδιοποίηση λέξεων, έργου ή ιδεών άλλου (πνευματικής ιδιοκτησίας), χωρίς την σχετική ύπαρξη αναφοράς στην αρχική πηγή είτε αυτό γίνεται σκόπιμα είτε χωρίς πρόθεση) των πνευματικών προϊόντων της ακαδημαϊκής κοινότητας. Κρίθηκε αναγκαία η μελέτη των κοινών περιπτώσεων λογοκλοπής (αντιγραφή/επικόλληση, παράφραση, μετάφραση, εσκεμμένα ανακριβή χρήση ψεύτικων αναφορών, ολική αντιγραφή, εισαγωγή παρόμοιων χαρακτήρων από ξένα αλφάβητα, εισαγωγή λευκών χαρακτήρων στα κενά μεταξύ λέξεων) καθώς επίσης και οι κατηγορίες λογοκλοπής (τυχαία, ακούσια, σκόπιμη και αυτόλογοκλοπή) που συναντώνται. Μελετήθηκαν επίσης, τεχνικές εντοπισμού λογοκλοπής, καθώς αυτές καθορίζουν την απόδοση των συστημάτων εντοπισμού λογοκλοπής. Για τον εντοπισμό κυρίως της αντιγραφής/επικόλλησης που είναι και το ευκολότερο γίνεται κυρίως χρήση των τεχνικών substring matching, fingerprinting, bag f wrds analysis. Όσο μεγαλώνει το επίπεδο «μεταμφίεσης» της λογοκλοπής τόσο μεγαλώνει και ο δείκτης δυσκολίας εντοπισμού. Στην περίπτωση της παράφρασης κυρίως γίνεται χρήση της stylmetry με χαμηλά ποσοστά εντοπισμού και της citatin-based plagiarism detectin. Στην περίπτωση της μετάφρασης μπορεί να γίνει χρήση citatin-based plagiarism detectin και crss-language plagiarism detectin. Τέλος έγινε συλλογή πραγματικού δείγματος περιπτώσεων λογοκλοπής ούτως ώστε να ακολουθήσει μια διαδικασία εκπαίδευσης του αλγορίθμου. ΣΕΛΙΔΑ 4
2 ΕΠΙΜΕΡΟΥΣ ΠΑΡΑΔΟΤΕΟ 9.14.3.1 2.1 Σχήμα μεταδεδομενων του αποθετηριου Η περιγραφή των ψηφιακών τεκμηρίων που θα εισάγονται στο αποθετήριο για να υποβληθούν στη διαδικασία ταυτοποίησης των πρωτότυπων εργασιών και των εργασιών που είναι αποτέλεσμα λογοκλοπής, θα γίνει βάσει περιγραφικών μεταδεδομένων, δομικών μεταδεδομένων αλλά και μεταδεδομένων διαχείρισης. Τα περιγραφικά μεταδεδομένα αφορούν την ανάκτηση και ταυτοποίησή τους, τα δομικά μεταδεδομένα, τη δομή τους και τα μεταδεδομένα διαχείρισης αφορούν τις τεχνικές πληροφορίες για τη διαχείριση των πηγών. Το σχήμα μεταδεδομένων που καλύπτει το απαιτούμενο φάσμα είναι το Dublin Cre Metadata Element Set. Η επιλογή του γίνεται για λόγους διαλειτουργικότητας, λαμβάνοντας υπόψιν την ευρεία χρήση και αποδοχή του, που έχει ως αποτέλεσμα να είναι άμεσα προσβάσιμο από τους OAI prviders των εμπλεκόμενων ιδρυμάτων. Ακολουθούν παρακάτω τα δώδεκα στοιχεία του Dublin Cre Metadata Element Set που θα χρησιμοποιηθούν. Α/Α 1 Τίτλος 2 Δημιουργός 3 Θέμα 4 Περιγραφή 5 Εκδότης 6 Συντελεστής 7 Ημερομηνία 8 Τύπος Πηγής 9 Μορφότυπο 10 Πηγή 11 Γλώσσα 12 Δικαιώματα Χρήσης Τίτλος: η ονομασία που έχει δοθεί στο τεκμήριο από τον συγγραφέα. Δημιουργός: το όνομα του συγγραφέα του τεκμηρίου Θέμα: η θεματική κατηγοριοποίηση του τεκμηρίου σύμφωνα με τους ταξινομικούς πίνακες Dewey. Έργα Γενικής Φύσεως Φιλοσοφία και Ψυχολογία Θρησκεία Κοινωνικές Επιστήμες Γλώσσα Φυσικές Επιστήμες και Μαθηματικά Εφαρμοσμένες Επιστήμες / Ιατρική Καλές Τέχνες / Ψυχαγωγία Λογοτεχνία και Ρητορική ΣΕΛΙΔΑ 5
Γεωγραφία / Βιογραφία / Ιστορία Περιγραφή: η περίληψη του τεκμηρίου. Εκδότης: το υπεύθυνο ίδρυμα στο οποίο ανήκουν τα τεκμήρια.. Συντελεστής: ο επιβλέπων καθηγητής του τεκμηρίου Ημερομηνία: η ημερομηνία κατάθεσης του τεκμηρίου Τύπος Πηγής: η φύση του τεκμηρίου. (διδακτορική διατριβή, μεταπτυχιακή εργασία, πτυχιακή εργασία, άρθρο) Μορφότυπο: pdf, txt Πηγή: το ψηφιακό αποθετήριο του εκάστοτε ιδρύματος Γλώσσα: η γλώσσα στην οποία είναι γραμμένο το κυρίως κείμενο του τεκμηρίου. Δικαιώματα Χρήσης: δικαιώματα χρήσης τα οποία συνοδεύουν το τεκμήριο ΣΕΛΙΔΑ 6
3 ΕΠΙΚΟΙΝΩΝΙΑ ΜΕ ΑΚΑΔΗΜΑΪΚΑ ΚΑΙ ΤΕΧΝΟΛΟΓΙΚΑ ΙΔΡΥΜΑΤΑ Η ευκταία λειτουργία της Υπηρεσίας Εντοπισμού Λογοκλοπής, καθορίζεται ολικά από τη διαδικασία εκπαίδευσης και μάθησης του αλγορίθμου που θα χρησιμοποιηθεί. Γι αυτό το λόγο, επιχειρήθηκε επαφή με τις Βιβλιοθήκες των Ακαδημαϊκών και Τεχνολογικών Ιδρυμάτων της Ελλάδος, ώστε να γίνει συλλογή των εργασιών φοιτητών, πτυχιακών, διδακτορικών και επιστημονικών άρθρων όπου έχει εντοπιστεί και εξακριβωθεί η ύπαρξη λογοκλοπής. Συγκεκριμένα εστάλη το εξής κείμενο: Το παραπάνω ηλεκτρονικό μήνυμα έλαβαν οι Βιβλιοθήκες των ακόλουθων Ιδρυμάτων: Στα πλαίσια υλοποίησης της πράξης Προηγμένες Κεντρικές Υπηρεσίες Ψηφιακών Βιβλιοθηκών Ανοιχτής Πρόσβασης Σ.Ε.Α.Β και της δράσης για τη δημιουργία Υπηρεσίας Εντοπισμού Λογοκλοπής, θέλουμε να συλλέξουμε περιπτώσεις εργασιών φοιτητών, πτυχιακών, διδακτορικών αλλά και επιστημονικών άρθρων που έχει διαπιστωθεί λογοκλοπή, ώστε να έχουμε στη διάθεσή μας πραγματικό δείγμα περιπτώσεων λογοκλοπής των Ελληνικών Ακαδημαϊκών και Τεχνολογικών Εκπαιδευτικών Ιδρυμάτων. Δεν χρειαζόμαστε κανένα δεδομένο (π.χ. όνομα συγγραφέα, τίτλο, ίδρυμα κ.λπ.) σε περίπτωση που υπάρξει πρόβλημα με τους επιβλέποντες καθηγητές ή οποιοδήποτε από τα εμπλεκόμενα μέλη της εκάστοτε περίπτωσης λογοκλοπής. Αυτό που χρειαζόμαστε όμως, είναι το πρωτότυπο κείμενο από το οποίο έχει διαπιστωθεί η λογοκλοπή εφόσον έχει γίνει η αντιστοίχηση. Αν η Βιβλιοθήκη δεν έχει στη διάθεσή της περίπτωση λογοκλοπής παρακαλούμε να προωθήσετε το παρόν μήνυμα στην αρμόδια διοικητική υπηρεσία του ιδρύματός σας όπου γίνονται οι σχετικές καταγγελίες. Σε κάθε περίπτωση παρακαλείσθε να δώσετε απάντηση στο παρόν μήνυμα. Εθνικό & Καποδιστριακό Πανεπιστήμιο Αθηνών Εθνικό Μετσόβιο Πολυτεχνείο Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης Οικονομικό Πανεπιστήμιο Αθηνών Γεωπονικό Πανεπιστήμιο Αθηνών Ανωτάτη Σχολή Καλών Τεχνών Πάντειο Πανεπιστήμιο Κοινωνικών Πολιτικών Επιστημών Πανεπιστήμιο Πειραιώς Πανεπιστήμιο Στερεάς Ελλάδας Πανεπιστήμιο Μακεδονίας Οικονομικών και κοινωνικών επιστημών Πανεπιστήμιο Δυτικής Μακεδονίας Πανεπιστήμιο Πατρών Πανεπιστήμιο Πελοποννήσου Πανεπιστήμιο Ιωαννίνων Δημοκρίτειο Πανεπιστήμιο Θράκης Πανεπιστήμιο Κρήτης Πολυτεχνείο Κρήτης Πανεπιστήμιο Αιγαίου Ιόνιο Πανεπιστήμιο ΣΕΛΙΔΑ 7
Πανεπιστήμιο Θεσσαλίας Χαροκόπειο Πανεπιστήμιο Ελληνικό Ανοικτό Πανεπιστήμιο Διεθνές Πανεπιστήμιο Ελλάδας Πανεπιστήμιο Δυτικής Ελλάδας Αλεξάνδρειο Τεχνολογικό Εκπαιδευτικό Ίδρυμα Θεσσαλονίκης Τεχνολογικό Εκπαιδευτικό Ίδρυμα Αθηνών Τεχνολογικό Εκπαιδευτικό Ίδρυμα Δυτικής Μακεδονίας Τεχνολογικό Εκπαιδευτικό Ίδρυμα Hπείρου Τεχνολογικό Εκπαιδευτικό Ίδρυμα Ιονίων Νήσων Τεχνολογικό Εκπαιδευτικό Ίδρυμα Καβάλας Τεχνολογικό Εκπαιδευτικό Ίδρυμα Καλαμάτας Τεχνολογικό Εκπαιδευτικό Ίδρυμα Κρήτης Τεχνολογικό Εκπαιδευτικό Ίδρυμα Λαμίας Τεχνολογικό Εκπαιδευτικό Ίδρυμα Λάρισας Τεχνολογικό Εκπαιδευτικό Ίδρυμα Μεσολογγίου Τεχνολογικό Εκπαιδευτικό Ίδρυμα Πάτρας Τεχνολογικό Εκπαιδευτικό Ίδρυμα Πειραιώς Τεχνολογικό Εκπαιδευτικό Ίδρυμα Σερρών Τεχνολογικό Εκπαιδευτικό Ίδρυμα Χαλκίδας Ανώτατη Σχολή Παιδαγωγικής και Τεχνολογικής Εκπαίδευσης Στις περιπτώσεις κατά τις οποίες δεν δόθηκε απάντηση στο ηλεκτρονικό μήνυμα, έγινε ξεχωριστή τηλεφωνική επικοινωνία ώστε να εξακριβωθεί αν η Βιβλιοθήκη ή οποιοδήποτε άλλη υπηρεσία των Ιδρυμάτων, έχει στη διάθεσή της κάποια περίπτωση λογοκλοπής, είτε να γίνει η απαραίτητη παραπομπή με την αρμόδια υπηρεσία του εκάστοτε Ιδρύματος όπου γίνονται οι καταγγελίες σχετικές με τη λογοκλοπή. ΣΕΛΙΔΑ 8
4 ΕΠΙΚΟΙΝΩΝΙΑ ΜΕ ΛΟΙΠΑ ΜΕΛΗ ΑΚΑΔΗΜΑΪΚΗΣ ΚΟΙΝΟΤΗΤΑΣ Εν συνεχεία επιχειρήθηκε η εύρεση εναλλακτικών διαύλων εύρεσης των περιπτώσεων λογοκλοπής διενεργώντας επικοινωνία με μέλη της Ακαδημαϊκής κοινότητας. Ο Βασίλης Μούγιος, Καθηγητής Βιοχημείας της Άσκησης του Τμήματος Επιστήμης Φυσικής Αγωγής και Αθλητισμού του Αριστοτέλειου Πανεπιστημίου Θεσσαλονίκης, ως εκπρόσωπος μιας ομάδας πρωτοβουλίας κατά της λογοκλοπής στην Ανώτατη Εκπαίδευση, συνέβαλε στην συλλογή 7 περιπτώσεων λογοκλοπής στην αγγλική γλώσσα από Έλληνες ερευνητές. Ο Β. Μούγιος βεβαίωσε την ύπαρξη και άλλων περιπτώσεων λογοκλοπής, τις οποίες έχει στη διάθεσή του αλλά είναι σε έντυπη μορφή. Είναι στη διάθεση της δράσης σε περίπτωση που αυτό κριθεί απαραίτητο. Επιχειρήθηκε επίσης η ανάκτηση του καταλόγου των καταγγελιών για λογοκλοπές, για να καταστεί στη διάθεση της δράσης, μια πρωτοβουλία του Πρώην Υφυπουργού Παιδείας Δια Βίου Μάθησης & Θρησκευμάτων, Ιωάννη Πανάρετου, χωρίς επιτυχία. Βάση Δεδομένων Déjà vu Η ύπαρξη αρκετών εφαρμογών (εμπορικών και ελεύθερου λογισμικού) εντοπισμού λογοκλοπής καταδεικνύει το μέγεθος του προβλήματος διεθνώς. Το Garner Lab τουvirginia Biinfrmatics Institute έχει καταστήσει διαθέσιμη δημόσια τη Βάση Δεδομένων Déjà vu, η οποία χρησιμοποιεί την μηχανή σύγκρισης κειμένου etblast, για τις επιστημονικές δημοσιεύσεις της Βάσης Δεδομένων MEDLINE. Από τη συγκεκριμένη βάση έχουν συλλεχθεί περιπτώσεις λογοκλοπής στην αγγλική γλώσσα, για τις οποίες έχουν ήδη επιβληθεί κυρώσεις. Έγινε προσπάθεια να συλλεχθούν οι πιο σύνθετες περιπτώσεις κατά τις οποίες η λογοκλοπή έχει γίνει από παραπάνω του ενός άρθρου, με σκοπό την εκπαίδευση του αλγορίθμου. ΣΕΛΙΔΑ 9
5 ΒΙΒΛΙΟΓΡΑΦΙΑ Beasley, J.D. (2004). The impact f technlgy n plagiarism preventin and detectin: research prcess autmatin-a new apprach fr preventin. Available at: http://plagiarismadvice.cm/dcuments/abstracts/2004abstract03.pdf Bard f Regents f the University System f Gergia. (2007). (http://net.educause.edu/ir/library/pdf/ser07017b.pdf) Dee T.S., Jacb B.A. (2012). Ratinal Ignrance in Educatin: A Field Experiment in Student Plagiarism. Jurnal f Human Resurces, 47 (2), 397-434. Dublin Cre Metadata Element Set, Versin 1.1. (http://dublincre.rg/dcuments/dces) Lancaster, T., Culwin. F. (2005). Classificatins f Plagiarism Detectin Engines. ITALICS, 4 (2). Lukashenk R., Graudina V., & Grundspenkis J. (2007). Cmputer-Based Plagiarism Detectin Methds and Tls: An Overview. Prceedings f 2007 Internatinal Cnference n Cmputer Systems and Technlgies (CmpSysTech 07), vl. 285, University f Russe, Bulgaria Maurer H., Zaka H., & Kappe F. (2006). Plagiarism-A Survey. Jurnal f Universal Cmputer Science, 12 (8), 1050-1084. Errami M., Sun Z., Lng T.C., Gerge A.C. (2009) Deja vu: a database f highly similar citatins in the scientific literature. Nucleic Acids Research, 37 ( D921-D924) Plagiarism Prtal (http://plagiat.htw-berlin.de/start-en/) Plagiarism preventin technlgy (http://www.plagiarism.rg/) The Plagiarism Resurce Site: Dealing with Plagiarism (http://plagiarism.blmfieldmedia.cm) ΣΕΛΙΔΑ 10