Παραγωγή βιοοικονομικών μοντέλων για την πρόβλεψη της ανάπτυξης του ψαριού στην ιχθυοακαλλιέργεια, με την χρήση

Σχετικά έγγραφα
Αναγνώριση Προτύπων. Σημερινό Μάθημα

Ας υποθέσουμε ότι ο παίκτης Ι διαλέγει πρώτος την τυχαιοποιημένη στρατηγική (x 1, x 2 ), x 1, x2 0,

Αποδεικτικές Διαδικασίες και Μαθηματική Επαγωγή.

Αναγνώριση Προτύπων. Σημερινό Μάθημα

ΑΡΧΗ 1ΗΣ ΣΕΛΙΔΑΣ Γ ΤΑΞΗ

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ ΜΑΘΗΜΑ: ΕΡΩΤΗΣΕΙΣ ΟΙΚΟΝΟΜΙΚΗΣ ΘΕΩΡΙΑΣ

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ ΜΑΘΗΜΑ: ΟΙΚΟΝΟΜΙΚΗ ΘΕΩΡΙΑ

Αναγνώριση Προτύπων. Σήμερα! Λόγος Πιθανοφάνειας Πιθανότητα Λάθους Κόστος Ρίσκο Bayes Ελάχιστη πιθανότητα λάθους για πολλές κλάσεις

ΑΠΟΛΥΤΗΡΙΕΣ ΕΞΕΤΑΣΕΙΣ Γ ΤΑΞΗΣ ΗΜΕΡΗΣΙΟΥ ΓΕΝΙΚΟΥ ΛΥΚΕΙΟΥ ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ: ΑΡΧΕΣ ΟΙΚΟΝΟΜΙΚΗΣ ΘΕΩΡΙΑΣ ΜΑΘΗΜΑ ΕΠΙΛΟΓΗΣ Γ ΛΥΚΕΙΟΥ

Οι γέφυρες του ποταμού... Pregel (Konigsberg)

HY 280. θεμελιακές έννοιες της επιστήμης του υπολογισμού ΑΣΚΗΣΕΙΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ ΤΜΗΜΑ ΕΠΙΣΤΗΜΗΣ ΥΠΟΛΟΓΙΣΤΩΝ. Γεώργιος Φρ.

ΜΑΘΗΜΑ: ΟΙΚΟΝΟΜΙΚΗ ΘΕΩΡΙΑ

ΘΕΜΑ: Aποτελεσματικότητα της νομισματικής και δημοσιονομικής πολιτικής σε μια ανοικτή οικονομία

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ. Εαρινό Εξάμηνο

Εξαναγκασμένες ταλαντώσεις, Ιδιοτιμές με πολλαπλότητα, Εκθετικά πινάκων. 9 Απριλίου 2013, Βόλος

Αναγνώριση Προτύπων. Σημερινό Μάθημα

ΘΕΜΑ: Διαφορές εσωτερικού εξωτερικού δανεισμού. Η διαχρονική κατανομή του βάρους από το δημόσιο δανεισμό.

{ i f i == 0 and p > 0

Το κράτος είναι φτιαγμένο για τον άνθρωπο και όχι ο άνθρωπος για το κράτος. A. Einstein Πηγή:

ΣΧΟΛΙΚΟ ΕΤΟΣ ΕΥΘΥΓΡΑΜΜΗ ΟΜΑΛΗ ΚΙΝΗΣΗ ΤΡΙΩΡΗ ΓΡΑΠΤΗ ΕΞΕΤΑΣΗ ΣΤΗ ΦΥΣΙΚΗ A ΛΥΚΕΙΟΥ. Ονοματεπώνυμο Τμήμα

Το υπόδειγμα IS-LM: Εισαγωγικά

Έννοια. Η αποδοχή της κληρονομίας αποτελεί δικαίωμα του κληρονόμου, άρα δεν

ΑΣΕΠ 2000 ΑΣΕΠ 2000 Εμπορική Τράπεζα 1983 Υπουργείο Κοιν. Υπηρ. 1983

Προτεινόμενα θέματα. στο μάθημα. Αρχές οργάνωσης και διοίκησης επιχειρήσεων. ΟΜΑΔΑ Α: Ερωτήσεις Σωστού Λάθους.

Ταξινόμηση των μοντέλων διασποράς ατμοσφαιρικών ρύπων βασισμένη σε μαθηματικά κριτήρια.

ΜΑΘΗΜΑ: ΠΟΛΙΤΙΚΗ ΟΙΚΟΝΟΜΙΑ-ΔΗΜΟΣΙΑ ΟΙΚΟΝΟΜΙΚΗ

ΣΤΟ ΦΑΡΜΑΚΕΙΟ. Με την πιστοποίηση του έχει πρόσβαση στο περιβάλλον του φαρμακείου που παρέχει η εφαρμογή.

17 Μαρτίου 2013, Βόλος

Μονάδες α. Να γράψετε στο τετράδιό σας τον παρακάτω πίνακα σωστά συµπληρωµένο.

1. Σε περίπτωση κατά την οποία η τιμή ενός αγαθού μειωθεί κατά 2% και η ζητούμενη

ΣΤΟ ΙΑΤΡΕΙΟ. Με την πιστοποίηση του αποκτά πρόσβαση στο περιβάλλον του ιατρού που παρέχει η εφαρμογή.

ΗΛΕΚΤΡΙΚΗ ΕΝΕΡΓΕΙΑ ΣΤΗ ΚΡΗΤΗ

ΤΑΞΙΝΟΜΗΣΗ ΟΡΓΑΝΙΣΜΩΝ

Προτεινόμενα θέματα στο μάθημα. Αρχές Οικονομικής Θεωρίας ΟΜΑΔΑ Α. Στις προτάσεις από Α.1. μέχρι και Α10 να γράψετε στο τετράδιό σας τον αριθμό της

Αναγνώριση Προτύπων. Σημερινό Μάθημα

1. Ας υποθέσουμε ότι η εισοδηματική ελαστικότητα ζήτησης για όσπρια είναι ίση με το μηδέν. Αυτό σημαίνει ότι:

23/2/07 Sleep out Πλατεία Κλαυθμώνος

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ ΜΑΘΗΜΑ: ΕΜΠΟΡΙΚΟ ΔΙΚΑΙΟ

Η ανισότητα α β α±β α + β με α, β C και η χρήση της στην εύρεση ακροτάτων.

Το εγχειρίδιο του καλού κηπουρού

Ψηφιακή Εικόνα. Σημερινό μάθημα!

ΜΑΘΗΜΑ: ΕΜΠΟΡΙΚΟ ΔΙΚΑΙΟ

ΜΙΚΡΟΟΙΚΟΝΟΜΙΚΗ Η ΚΑΤΑΝΑΛΩΤΙΚΗ ΑΠΟΦΑΣΗ. Άσκηση με θέμα τη μεγιστοποίηση της χρησιμότητας του καταναλωτή

Επίλυση ειδικών μορφών ΣΔΕ

Συμπεριφοριακή Επιχειρηματικότητα

Εισαγωγικά. 1.1 Η σ-αλγεβρα ως πληροφορία

«ΔΙΑΚΡΙΤΑ ΜΑΘΗΜΑΤΙΚΑ»

1. Ο εγγυημένος ρυθμός οικονομικής ανάπτυξης στο υπόδειγμα Harrod Domar εξαρτάται

ΑΠΟΛΥΤΗΡΙΕΣ ΕΞΕΤΑΣΕΙΣ Γ ΤΑΞΗΣ ΕΝΙΑΙΟΥ ΛΥΚΕΙΟΥ ΤΡΙΤΗ 30 ΜΑΪΟΥ 2000 ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ ΘΕΤΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ: ΧΗΜΕΙΑ ΣΥΝΟΛΟ ΣΕΛΙ ΩΝ: ΕΞΙ (6)

Ημέρα 3 η. (α) Aπό την εργασιακή διαδικασία στη διαδικασία παραγωγής (β) Αξία του προϊόντος και αξία της εργασιακής δύναμης

Προτεινόμενα θέματα. στο μάθημα. Αρχές οργάνωσης και διοίκησης επιχειρήσεων. ΟΜΑΔΑ Α: Ερωτήσεις Σωστού Λάθους.

α) Το έλλειμμα ή το πλεόνασμα του εμπορικού ισοζυγίου δεν μεταβάλλεται

Eισηγητής: Μουσουλή Μαρία

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ. Εαρινό Εξάμηνο

21/11/2005 Διακριτά Μαθηματικά. Γραφήματα ΒΑΣΙΚΗ ΟΡΟΛΟΓΙΑ : ΜΟΝΟΠΑΤΙΑ ΚΑΙ ΚΥΚΛΟΙ Δ Ι. Γεώργιος Βούρος Πανεπιστήμιο Αιγαίου

ΔΙΚΑΙΩΜΑΤΑ ΠΡΟΣΟΡΜΙΣΗΣ, ΠΑΡΑΒΟΛΗΣ, ΠΡΥΜΝΟΔΕΤΗΣΗΣ ΚΑΙ ΕΛΛΙΜΕΝΙΣΜΟΥ ΣΚΑΦΩΝ ΣΕ ΘΑΛΑΣΣΙΕΣ ΠΕΡΙΟΧΕΣ. (ΛΙΜΑΝΙΑ κ.λπ.) ΤΟΠΙΚΗΣ ΑΡΜΟΔΙΟΤΗΤΑΣ ΛΙΜΕΝΙΚΩΝ

Κεφάλαιο 2.3: Marketing Κοινωνικών Επιχειρήσεων. Στο παρόν κεφάλαιο παρουσιάζονται εν τάχει τα βασικά

2. Κατάθεσε κάποιος στην Εθνική Τράπεζα 4800 με επιτόκιο 3%. Μετά από πόσο χρόνο θα πάρει τόκο 60 ; α) 90 ημέρες β) 1,5 έτη γ) 5 μήνες δ) 24 μήνες

Αλγόριθμοι & Βελτιστοποίηση

Εργαστηριακή Άσκηση Θερμομόρφωση (Thermoforming)

Κεφάλαιο 2.4: Τα βασικά στοιχεία ενός Επιχειρηματικού Σχεδίου (Business Plan) Μέσα από αυτό το κεφάλαιο φαίνεται ότι αφενός η σωστή δημιουργία και

Σχέσεις και ιδιότητές τους

Επίλυση δικτύων διανομής

Ευρωπαϊκά παράγωγα Ευρωπαϊκά δικαιώματα

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ. Πρώτη Γραπτή Εργασία. Εισαγωγή στους υπολογιστές Μαθηματικά

Αναγνώριση Προτύπων 1

τεσσάρων βάσεων δεδομένων που θα αντιστοιχούν στους συνδρομητές

ΠΡΟΣΑΡΤΗΜΑ ΤΟΥ ΙΣΟΛΟΓΙΣΜΟΥ ΤΗΣ 31 ης ΔΕΚΕΜΒΡΙΟΥ 2016

Εστω X σύνολο και A μια σ-άλγεβρα στο X. Ονομάζουμε το ζεύγος (X, A) μετρήσιμο χώρο.

ΜΑΘΗΜΑ: ΒΙΟΛΟΓΙΑ ΟΜΑΔΑ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ Γ ΛΥΚΕΙΟΥ

Δ Ι Α Κ Ρ Ι Τ Α Μ Α Θ Η Μ Α Τ Ι Κ Α. 1η σειρά ασκήσεων

ΜΑΘΗΜΑ: ΓΕΝΙΚΟ ΔΙΟΙΚΗΤΙΚΟ ΔΙΚΑΙΟ ΔΙΚΑΣΤΩΝ

Ο Ισχυρός Νόμος των Μεγάλων Αριθμών

Συναρτήσεις. Σημερινό μάθημα

ΚΛΑΔΟΣ: ΠΕ11 ΦΥΣΙΚΗΣ ΑΓΩΓΗΣ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ. Εαρινό Εξάμηνο

( ιμερείς) ΙΜΕΛΕΙΣ ΣΧΕΣΕΙΣ Α Β «απεικονίσεις»

Αναγνώριση Προτύπων. Σημερινό Μάθημα

3. Με βάση τη βραχυχρόνια καμπύλη Phillips η σχέση πληθωρισμού και ανεργίας είναι:

Pointers. Σημερινό Μάθημα! Χρήση pointer Τελεστής * Τελεστής & Γενικοί δείκτες Ανάκληση Δέσμευση μνήμης new / delete Pointer σε αντικείμενο 2

Eισηγητής: Μουσουλή Μαρία

1. Η Μακροοικονομική ασχολείται με τη λειτουργία και τα προβλήματα: α) των δημοσίων επιχειρήσεων και των οργανισμών. β) των ιδιωτικών επιχειρήσεων

ΑΡΧΗ 1ΗΣ ΣΕΛΙΔΑΣ Γ ΤΑΞΗ

CSE.UOI : Μεταπτυχιακό Μάθημα

Ημέρα 4 η (α) Αγορά και πώληση της εργασιακής δύναμης. (β) Η απόλυτη υπεραξία. Αγορά και πώληση της εργασιακής δύναμης

ΠΡΟΤΕΙΝΟΜΕΝΟ ΘΕΜΑ. Μορφές δημόσιου δανεισμού. Σύνταξη: Παπαδόπουλος Θεοχάρης, Οικονομολόγος, MSc, PhD Candidate

ΑΡΧΗ 1ΗΣ ΣΕΛΙ ΑΣ Β ΤΑΞΗ. ΘΕΜΑ 1ο

ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ. Μούλου Ευγενία

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ

Βελτίωση Εικόνας. Σήμερα!

Ποια έντομα είναι εχθροί των φυτών και πώς θα τα αντιμετωπίσετε

«Εξατομικεύοντας την επιλογή των πόρων των ψηφιακών βιβλιοθηκών για την υποστήριξη της σκόπιμης μάθησης» Άννα Μαρία Ολένογλου

- 1 - Ποιοι κερδίζουν από το εμπόριο αγαθών και υπηρεσιών; Γιατί η άμεση ανταλλαγή αγαθών, ορισμένες φορές, είναι δύσκολο να

Συντάκτης: Παναγιώτης Βεργούρος, Οικονομολόγος Συγγραφέας βιβλίων, Μικρο μακροοικονομίας διαγωνισμών ΑΣΕΠ

(3 ο ) Εξαντλητική αναζήτηση I: μεταθέσεις & υποσύνολα (4 o ) Εξαντλητική αναζήτηση II: συνδυασμοί, διατάξεις & διαμερίσεις

Η εξίσωση Black-Scholes

ΓΥΜΝΑΣΙΟ ΓΟΥΜΕΝΙΣΣΑΣ ΕΡΓΑΣΙΑ ΓΕΩΓΡΑΦΙΑΣ

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ

1. Εστω ότι A, B, C είναι γενικοί 2 2 πίνακες, δηλαδή, a 21 a, και ανάλογα για τους B, C. Υπολογίστε τους πίνακες (A B) C και A (B C) και

Π Ο Λ Υ Τ Ε Χ Ν Ε Ι Ο Κ Ρ Η Τ Η Σ

Transcript:

Παραγωγή βιοοικονομικών μοντέλων για την πρόβλεψη της ανάπτυξης του ψαριού στην ιχθυοακαλλιέργεια, με την χρήση μεθόδων της εξόρυξης δεδομένων Γιώργος Κουρνέτας ιπλωματική Εργασία που υπεβλήθη για τη μερική ικανοποίηση των απαιτήσεων για την απόκτηση Μεταπτυχιακού ιπλώματος Ειδίκευσης Σχολή Οργάνωσης και ιοίκησης Επιχειρήσεων Τμήμα Οικονομικών Επιστημών Μεταπτυχιακό ίπλωμα Ειδίκευσης στην «Εφαρμοσμένη Οικονομική και Ανάλυση εδομένων» Σεπτέμβριος 2017

Πανεπιστήμιο Πατρών, Τμήμα Οικονομικών Επιστημών Γιώργος Κουρνέτας 2017 Με την επιφύλαξη παντός δικαιώματος

Τριμελής Επιτροπή Επίβλεψης διπλωματικής εργασίας Επιβλέπων: Εμμανουήλ Τζαγκαράκης Επίκουρος Καθηγητής Μέλος Επιτροπής: Ιωάννης Βενέτης Αναπληρωτής Καθηγητής Μέλος Επιτροπής: Κωνσταντίνος Κουνετάς Επίκουρος Καθηγητής Η παρούσα διπλωματική εργασία με τίτλο «Παραγωγή βιοοικονομικών μοντέλων για την πρόβλεψη της ανάπτυξης του ψαριού στην ιχθυοακαλλιέργεια, με την χρήση μεθόδων της εξόρυξης δεδομένων» εκπονήθηκε από τον Γεώργιο Κουρνέτα, Α.Μ 1057266, για τη μερική ικανοποίηση των απαιτήσεων για την απόκτηση Μεταπτυχιακού ιπλώματος Ειδίκευσης στην «Εφαρμοσμένη Οικονομική και Ανάλυση εδομένων» από το Πανεπιστήμιο Πατρών και εγκρίθηκε από τα μέλη της τριμελούς επιβλέπουσας επιτροπής.

Θα ήθελα να αφιερώσω τη διπλωματική μου εργασία σε όσους με στήριξαν την ακαδημαϊκή χρονιά 2016-2017

Ευχαριστίες Θα ήθελα να ευχαριστήσω τους καθηγητές μου στην Σχολή Οργάνωσης και ιοίκησης Επιχειρήσεων του Τμήματος Οικονομικών Επιστημών και κυρίως το κύριο Εμμανουήλ Τζαγκαράκη για την πολύτιμη βοήθειά του στην εκπόνηση αυτής της εργασίας. Θα ήθελα να ευχαριστήσω επίσης τους συμφοιτητές μου και κυρίως τους Απόστολο Μήτρου, Παναγιώτη Τσακτσίρα και Γεράσιμο Ελ-Άνυ που είχαμε άψογη συνεργασία σε όλη την ακαδημαϊκή χρονιά 2016-2017. Ιδιαίτερες ευχαριστίες θα ήθελα να εκφράσω στον Αριστείδη Λαύκα και στον Σωτήρη Λαύκα που με βοήθησαν και μου έδωσαν το δικαίωμα χρήσης του ιντερνετικού προγράμματος fishfarm.io

i Περίληψη Στόχος της παρούσας διπλωματικής εργασίας είναι να παραχθούν βιοοικονομικά μοντέλα, που θα είναι ικανά να προβλέπουν την ανάπτυξη των ψαριών στην ιχθυοκαλλιέργεια, χρησιμοποιώντας μεθόδους της εξόρυξης δεδομένων, κάτω από συγκεκριμένες συνθήκες θερμοκρασίας και σε οποιοδήποτε στάδιο ανάπτυξης του ψαριού. Εκτός από την ανάπτυξη του ψαριού θα είναι ικανά να προβλέπουν και το σχετικό κόστος ανάπτυξης του ψαριού που αποτελεί βασικό συστατικό για την βιωσιμότητα και την ευημερία μιας εταιρίας που δραστηριοποιείται στον κλάδο της ιχθυοκαλλιέργειας. Συγκεκριμένα, θα χρησιμοποιήσουμε δεδομένα από μία ιχθυοκαλλιεργητική μονάδα, με έναν χρονικό εύρος 10 μηνών και με την βοήθεια του αλγορίθμου Κ-ΝΝ (κ-κοντινότερων γειτόνων) θα παράξουμε στατιστικούς πίνακες που θα εκτιμούν την ανάπτυξη του ψαριού για δεδομένη θερμοκρασία και ποσότητα τροφής, ανά στάδιο ανάπτυξης του ψαριού. Λέξεις κλειδιά: ιχθυοκαλλιέργεια, βιοοικονομικό μοντέλο, αλγόριθμος Κ-ΝΝ, εξόρυξη δεδομένων, FCR

ii Summary In this dissertation, we examine the fitness of bioeconomic models in predicting the growth of fish in aquaculture, under the standard conditions of sea temperature and fish state of growth. In order to achieve our goal, we use data mining techniques and especially the K-NN algorithm. Our data come from actual observations from one aquaculture in Greece. The variables of our data are temperature, amount of food, fish weight and FCR ratio. The data was all about sea bass. We manage to create statistical tables which provide us with the ability to predict in great accuracy the growth of fish, based in sea temperature, amount of food and state of growth fish have. Keywords: bioeconomic model, aquaculture, FCR, algorithm K-NN, data mining

iii Περιεχόμενα 1 Εισαγωγή 1 2 Επισκόπηση βιβλιογραφίας 8 2.1 Αναφορά στα γραμμικά και μη γραμμικά μοντέλα ανάπτυξης ψαριών.. 8 2.1.1 Γραμμικά μοντέλα............................. 9 2.1.2 Μη-γραμμικά μοντέλα........................... 11 2.2 Μοντέλο ανάπτυξης της άσπρης γαρίδας.................... 15 2.3 Μέθοδοι εξόρυξης δεδομένων και βιολογικά μεγέθη ζωντανών οργανισμών 18 2.3.1 Πρόβλεψη ασθενειών σε εκτρεφόμενα βοοειδή............ 18 2.3.2 Πρόβλεψη διακοπής της παραγωγικής λειτουργίας μιας μυδοκαλλιέργειας................................. 18 2.3.3 Πρόβλεψη του ρυθμού ανάπτυξης του πληθυσμού του Bufo melanostictus στην φύση, με την χρήση του Γενετικού Αλγορίθμου (Genetic Algorithm)............................. 19 3 Ανάλυση και Περιγραφή εδομένων 21 3.1 Λειτουργία ιχθυοκαλλιέργειας........................... 21 3.1.1 Χρήσιμοι δείκτες που εφαρμόζονται στην ιχθυοκαλλιέργεια.... 22 3.2 Ανάλυση δεδομένων................................. 25 4 Εμπειρική Ανάλυση 29 4.1 Περιγραφή του Αλγορίθμου K-NN........................ 29 4.2 Μοντέλα Γραμμικής Παλινδρόμησης........................ 30 4.3 Εφαρμογή του Αλγορίθμου K-NN......................... 32 4.4 Αποτελέσματα Αλγορίθμου............................ 34 5 Συμπεράσματα 38

ΠΕΡΙΕΧΟΜΕΝΑ iv Βιβλιογραφία 40

ΠΕΡΙΕΧΟΜΕΝΑ v Κατάλογος Γραφημάτων

vi 2.1 Καμπύλη βάρους ψαριού σε ιχθυοκαλλιέργεια μέχρι 400 γρ......... 12 3.1 Συχνότητες Βαρών................................. 28 3.2 Συχνότητες Θερμοκρασίας............................. 28 4.1 Συχνότητες Θερμοκρασιών............................. 35 4.2 Συχνότητες Κλάσεις Βαρών............................ 36

Κατάλογος Πινάκων vii

viii 1.1............................................. 2 3.1 Συνοπτικά στατιστικά............................... 26 3.2 Πίνακας Συσχετίσεων................................ 26 3.3 Κλάσεις Βαρών.................................... 28 4.1 Αποτελέσματα Παλινδρόμησης.......................... 31 4.2 Εκτιμώμενες Τιμές FCR ανά κλάση Βάρους και Θερμοκρασία........ 34 4.3 Πίνακας συχνοτήτων ηηηηηηηηηηηηηηηηηηηηηθερμοκρασίας........ 35 4.4 Πίνακας συχνοτήτων ηηηηηηηηηηηηηηηηηη Κλάσεις Βαρών........ 36

1 Κεφάλαιο 1 Εισαγωγή Η κατανάλωση ψαριού αποτελεί μια σημαντική διατροφική πηγή καθώς και ένα πεδίο απασχόλησης για εκατομμύρια ανθρώπους σε όλο τον κόσμο. Σε μερικές περιοχές είναι δε και η μοναδική πηγή πρόσληψης σε πρωτεΐνες και άλλα διατροφικά στοιχε- ία, σημαντικά για την υγεία του ανθρώπινου οργανισμού. Σύμφωνα με στοιχεία από παγκόσμιες μελέτες (FAO, 2016) το 2014 αυξήθηκε η παγκόσμια ετήσια κατανάλωση ανά άτομο στα 20 κιλά, εξαιτίας της έντονης ανάπτυξης που είχε ο κλάδος της ιχθυοκαλλιέργειας σε παγκόσμιο επίπεδο. Ενας άλλος παράγοντας ήταν ότι οι ανάγκες του διαρκώς αυξανόμενου παγκόσμιου πληθυσμού, δεν μπορούσαν να καλυφθούν από τα διαρκώς συρρικνωμένα λόγω υπεραλίευσης, φυσικά αποθέματα. Με αυτόν τον τρόπο, η κατανάλωση ψαριών, προερχόμενα από την ιχθυοκαλλιέργεια ξεπέρασε την αντίστοιχη κατανάλωση άγριων ψαριών το 2015. Η ιχθυοκαλλιέργεια στην Ελλάδα αποτελεί έναν σημαντικό κλάδο, ο οποίος δραστηριοποιείται σημαντικά στις εξαγωγές. Πιο συγκεκριμένα, η Ελλάδα αποτελεί ηγέτρια δύναμη στην λεκάνη της Μεσογείου, όσον αφορά την παραγωγή τσιπούρας και λαυρακίου. Το 80% των ελληνικών παραγόμενων προϊόντων ιχθυοκαλλιέργειας εξάγεται σε χώρες της Ευρώπης αλλά και εκτός αυτής. Σύμφωνα με την ΕΛΣΤΑΤ, τα ψάρια αποτελούν το δεύτερο εξαγώγιμο προϊόν μετά το ελαιόλαδο από τα αγροτικά προϊόντα που παράγει η Ελλάδα και συνολικά το έκτο σε σειρά κατάταξης όλων των εξαγώγιμων προϊόντων της. Επιπροσθέτως, στις ελληνικές ιχθυοκαλλιέργειες απασχολούνται περίπου 15000 άτομα είτε ως άμεσα απασχολούμενοι είτε ως έμμεσα απασχολούμενοι. Τέλος, ο κύκλος εργασιών για το 2016 ήταν περίπου 800.000.000, το οποίο αντιστοιχεί 0,38% του ΑΕΠ.

2 Μολονότι, οι συνθήκες που υπάρχουν στον Ελλαδικό χώρο συνιστούν ένα γόνιμο περιβάλλον στο οποίο οι εταιρείες που δραστηριοποιούνται στις ιχθυοκαλλιέργειες, να μπορούν να αναπτύσσονται και να απολαμβάνουν ευημερία, τα δεδομένα είναι κάπως διαφορετικά. Πολλές εταιρείες που δεν είναι ζημιογόνες, εμφανίζουν πρόβλημα ρευστότητας και είναι υπερχρεωμένες, ενώ κυρίως οι μικρότερες εταιρείες δεν μπορούν να ανταγωνιστούν λόγω υπερσυγκεντρωτισμού του κλάδου, τις μεγαλύτερες. Πολλές εταιρείες δομήθηκαν με άναρχο τρόπο και στηρίχτηκαν είτε στις κρατικές είτε στις Ευρωπαϊκές ε- πιχορηγήσεις, εστιάζοντας στην υπερπαραγωγή, αγνοώντας το κόστος και άλλα δομικά οικονομικά στοιχεία που καθιστούν μια επιχείρηση βιώσιμη και ανταγωνιστική. Ενας άλλος παράγοντας που διαδραματίζει σπουδαίο ρόλο, είναι η φύση των εργασιών που λαμβάνουν χώρα κατά την παραγωγή ψαριών στην ιχθυοκαλλιέργεια. Οι άνθρωποι σε μια ιχθυοκαλλιεργητική μονάδα συχνά, δεν έχουν τα εποπτικά εκείνα εργαλεία που θα τους δίνουν την δυνατότητα να παράγουν και να αναλύουν δεδομένα ώστε να γίνεται πιο εύκολα υλοποιήσιμος ένας στρατηγικός σχεδιασμός για την πορεία της εταιρείας στο άμεσο μέλλον. Ενδεικτικά, αναφέρουμε μερικά βασικά οικονομικά μεγέθη για τις 10 μεγαλύτερες εταιρείες στον Ελλαδικό Χώρο, με βάση τον κύκλο εργασιών τους για το 2015, στον πίνακα 1.1, όπως δημοσιεύονται στην ιστοσελίδα (Infobank Hellstat A.E., 2016 www.imentor.gr) ΠΙΝΑΚΑΣ 1.1 Χρηματοοικονομικό Προφίλ κλάδου Ιχθυοκαλλιέργεια Βασικά μεγεθη 10 μεγαλύτερων [2015] Κύκλος εργασιών ΚΠΤΦ Κέρδη προ φόρων Συνολικό ενεργητικό Ιδια κεφάλαια Βραχ. υποχρεώσεις Ξένα προς ίδια κεφάλαια ROA 1 ΝΗΡΕΥΣ ΙΧΘΥΟΚΑΛΛΙΕΡΓΕΙΕΣ Α.Ε. 165,42 32,53 69,00 365,11 123,90 93,13 1,95 18,9% 2 ΣΕΛΟΝΤΑ ΙΧΘΥΟΤΡΟΦΕΙΑ Α.Ε.Γ.Ε. 140,40 5,81-4,15 217,66 15,08 91,54 13,44-1,9% 3 ΑΝ ΡΟΜΕ Α Α.Ε. 53,21 7,63 2,99 85,67 23,10 27,03 2,71 3,5% 4 ΙΑΣ ΙΧΘΥΟΚΑΛΛΙΕΡΓΕΙΕΣ Α.Β.Ε.Ε. 47,60-7,67-12,10 41,04-135,73 173,61-29,5% 5 ΓΑΛΑΞΙ Ι ΘΑΛΑΣΣΙΕΣ ΚΑΛΛΙΕΡΓΕΙΕΣ Α.Ε. 44,66 3,25 0,63 59,72 16,44 38,21 2,63 1,1% 6 ΙΧΘΥΟΚΑΛΛΙΕΡΓΕΙΕΣ ΦΟΡΚΥΣ Α.Ε. 24,62 1,78 0,94 31,43 0,83 5,89 37,05 3,0% 7 ΜΠΙΤΣΑΚΟΣ Γ. & Π. Υ ΑΤΟΚΑΛΛΙΕΡΓΕΙΕΣ Α.Ε. 11,05 0,98 0,36 20,39 7,04 8,46 1,90 1,8% 8 ΝΙΜΟΣ Α.Ε.Β.Ε. 9,43-0,10-0,45 11,27-7,88 19,04-4,0% 9 ΠΕΤΑΛΑ ΑΦΟΙ Α.Ε. 7,58 0,25 0,18 10,80 3,82 6,36 1,83 1,6% 10 ΜΑΡΚΕΛΛΟΣ Α.Ε. ΙΧΘΥΟΚΑΛΛΙΕΡΓΕΙΕΣ ΛΕΡΟΥ 7,54 0,61-0,32 14,49 0,97 9,13 13,98-2,2%

3 Τέλος, θα μπορούσαμε να αναφέρουμε ως ενδεικτικό, της άσχημης κατάστασης στην οποία πέρασαν οι ελληνικές ιχθυοκαλλιέργειες ότι, οι 3 από τις 4 μεγαλύτερες εταιρείες, που αναφέρει ο πίνακας 1.1 (ΝΗΡΕΥΣ, ΣΕΛΟΝΤΑ και ΙΑΣ), χρειάστηκαν την παρέμβαση των τραπεζών για να μην χρεοκοπήσουν με τις πιστώτριες τράπεζες να έχουν την πλειοψηφία των μετοχών και να έχουν ορίσει δικιά τους διοίκηση. Πιο αναλυτικά, ο κλάδος της ιχθυοκαλλιέργειας απαιτεί σχετικά χαμηλές επενδύσεις αλλά πολύ υψηλά κεφάλαια. Η πορεία μιας εταιρείας στο χώρο στης ιχθυοκαλλιέργειας είναι ευμετάβλητη και άμεσα εξαρτώμενη από την βιολογική πορεία των θαλάσσιων ειδών που εκτρέφει (Baer, 2010). Ο λόγος που συμβαίνει αυτό είναι διότι το μεγαλύτερο κόστος που έχει να αντιμετωπίσει μια ιχθυοκαλλιεργητική μονάδα, είναι το κόστος των τροφών, ενώ το κέρδος που έχει να λαμβάνει, έχει να κάνει με το βάρος που έχει φτάσει το ψάρι, (συνήθως 300-400 γρ) το οποίο επιτυγχάνεται αφού έχει επενδυθεί σχεδόν για 17-22 μήνες (όσο διαρκεί η βιολογική πορεία του ψαριού μέχρι να φτάσει το επιθυμητό βάρος) ένα σχετικά μεγάλο χρηματικό ποσό. Είναι φυσιολογικό να συμπεράνει κανείς, πως ο επιθυμητός στόχος ενός ιχθυοκαλλιεργητή είναι να παράξει όσο πιο ομαλά, με λιγότερο κόστος και στο κατάλληλο χρόνο, όσο το δυνατόν μεγαλύτερο ψάρι, καθώς έτσι θα έχει δεσμεύσει λιγότερα κεφάλαια και θα έχει περισσότερο κέρδος. Η πρόβλεψη της βιολογικής πορείας των εκτρεφόμενων ειδών όμως, είναι άμεσα συνδεδεμένη με ένα πλήθος ιδιαζόντων παραγόντων, που την καθιστούν δύσκολη εάν όχι και αδύνατη πολλές φορές. Μερικούς από αυτούς τους παράγοντες θα αναφέρουμε και θα περιγράψουμε παρακάτω: 1. Περιβαλλοντολογικές συνθήκες : η ικανότητα του ψαριού να μεταβολίζει την τροφή του και να την μετατρέπει σε βάρος, εξαρτάται άμεσα από την θερμοκρασία της θάλασσας (Karas Klingsheim 1997). Ενδεικτικά μπορούμε να αναφέρουμε ότι το ίδιο ψάρι σε διαφορετικές τιμές θερμοκρασίας και με την ίδια ποσότητα τροφής, αναπτύσσεται με διαφορετικό τρόπο. Η θερμοκρασία της θάλασσας περιγράφεται καλύτερα ως μια χρονοσειρά με έντονο το στοιχείο της εποχικότητας και της περιοδικότητας. Επομένως, καθίσταται αναγκαίο για έναν ιχθυοκαλλιεργητή να λαμβάνει υπόψη του το θερμοκρασιακό προφίλ της μονάδας στην οποία εργάζεται, ώστε να μπορεί να κάνει βραχυπρόθεσμες και μακροπρόθεσμες εκτιμήσεις της ανάπτυξης του ψαριού. Οι εκτιμήσεις αυτές όμως, δεν μπορούν να είναι ακριβείς

4 σε πολλές περιπτώσεις (ανάλογα και με την γεωγραφική τοποθεσία της εκάστοτε μονάδας) και ιδιαίτερα τον χειμώνα, όπου τα συχνά καιρικά φαινόμενα επηρεάζουν ακανόνιστα και με έντονο τρόπο, την διακύμανση των τιμών της θερμοκρασίας της θάλασσας. Άλλοι παράγοντες που επηρεάζουν, σε μικρότερο βαθμό βέβαια, την ανάπτυξη του ψαριού, όπως η οξυγόνωση του νερού (Brett 1979), η αλατότητα (e.g. Karas & Klingsheim 1997; Imsland et al. 2007a,b), το μικροβιακό φορτίο (e.g. Deniel 1990), η έκθεση σε ηλιακή ακτινοβολία (Imsland & janassen 2003) κ.α., είναι σε γενικές γραμμές λιγότερο ευμετάβλητα μεγέθη και αποτελούν ιδιαίτερα χαρακτηριστικά της τοποθεσίας στην οποία εκτρέφονται τα ψάρια. Επομένως, οι ιχθυοκαλλιεργητές έχουν μια σαφή εικόνα των προαναφερθέντων μεγεθών και δεν απαιτείται ιδιαίτερη προσπάθεια για να εκτιμηθούν οι τιμές τους. 2. υσκολία στην καταμέτρηση του πληθυσμού των ψαριών : τα ψάρια σε μια ι- χθυοκαλλιεργητική μονάδα εισάγονται σε μορφή γόνου (από 2-5 γρ μέσο βάρος) σε ειδικούς κλωβούς, μετά από αντίστοιχη παραγγελία σε ιχθυογεννητικούς σταθμούς. Η ποσοτική περιγραφή της εκάστοτε παραγγελίας αναφέρει με ακρίβεια την βιομάζα που θα έχουν τα νεαρά ψάρια, δηλαδή το μέσο βάρος ψαριών επί το πλήθος ψαριών, δίνοντας ωστόσο λιγότερο ακριβείς εκτιμήσεις για το μέσο βάρος των ψαριών και του αντίστοιχου πληθυσμού τους. Υπάρχουν διάφορες τεχνικές και εργαλεία με τα οποία μπορεί να εκτιμήσει κανείς, σε ένα μεγάλο βαθμό τον πληθυσμό των ψαριών, που περιέχονται σε έναν κλωβό, ωστόσο πολλές φορές είτε τα εργαλεία αυτά δεν είναι στην κατοχή των μονάδων ιχθυοκαλλιέργειας, είτε η διαδικασία της καταμέτρησης του πληθυσμού αποφεύγεται εξαιτίας της ταλαιπωρίας και της πρόκλησης άγχους που δημιουργείται στα ψάρια, με αποτέλεσμα πολλές φορές να εκδηλώνεται ο κίνδυνος της θνησιμότητας. Επιπλέον, η διαδικασία της καταμέτρησης δεσμεύει για ένα μεγάλο χρονικό διάστημα ένα μέρος του προσωπικού της μονάδας. Με αυτόν τον τρόπο γίνεται ακόμα πιο δύσκολη η καταμέτρηση των ψαριών, εάν αναλογιστεί κανείς ότι πολλές μονάδες έχουν την δυνατότητα να εκτρέφουν ταυτόχρονα παραπάνω από 60 παρτίδες σε αντίστοιχο αριθμό κλωβών. Επιπροσθέτως, για την σωστή καταμέτρηση του πληθυσμού απαιτείται σωστή καταμέτρηση των θνησιμοτήτων, που ειδικά στα πρώτα στάδια ανάπτυξης των ψαριών είναι σχετικά συχνές και αναμενόμενες.το εγχείρημα αυτό υπόκειται

5 σε μεγάλου βαθμού δυσκολίες, γιατί ενώ οι επιφορτισμένοι με το σχετικό έργο ειδικοί δύτες, είναι ικανοί να καταγράψουν το πλήθος των νεκρών ψαριών που βρίσκονται, είτε στον πάτο του κλωβού, είτε στην επιφάνεια της θάλασσας, δεν μπορούν να καταγράψουν τα νεκρά ψάρια που προέκυψαν από τις κανιβαλιστικές τάσεις που αναπτύχθηκαν μέσα στο πληθυσμό. Σε μερικές περιπτώσεις δε, που οι θνησιμότητες προκαλούνται από επιθέσεις πουλιών λόγω έλλειψης προστατευτικού καλύμματος, η καταμέτρηση των θνησιμοτήτων είναι αδύνατη. Τέλος, η φυγή ενός μέρους του πληθυσμού των ψαριών από έναν κλωβό, λόγω φθοράς του εξοπλισμού (τρύπες στα δίχτυα, σχισίματα κ.α.) δεν μπορεί να υπολογιστεί με ακρίβεια καθώς πολλές φορές γίνεται αντιληπτό ημέρες μετά το συμβάν. Για όλους τους παραπάνω λόγους παρατηρείται συχνά το φαινόμενο, πολλοί ιχθυοκαλλιεργητές να υπερεκτιμούν ή να υποεκτιμούν τον πραγματικό πληθυσμό της κάθε παρτίδας ψαριών που αναπτύσσεται στον εκάστοτε κλωβό και συνολικά στην μονάδα τους. 3. υσκολία στην ακριβής εκτίμηση του μέσου βάρους : τα ψάρια από την στιγμή της εισαγωγής τους στην μονάδα σε ειδικούς κλωβούς, μέχρι και το τελικό στάδιο ανάπτυξής τους στο οποίο αλιεύονται, θεωρούνται σαν ένα σώμα. Αναλυτικότερα, κάθε κλωβός θεωρείται ότι περιέχει μια παρτίδα ψαριών, με συγκεκριμένο πληθυσμό, μέσο βάρος και προφανώς είδος ψαριού. Τα μεγέθη αυτά, είναι σημαντικό να εκτιμούνται σωστά γιατί έτσι θα μπορεί να γνωρίζει το προσωπικό της μονάδας, πως να διαχειριστεί την εκάστοτε παρτίδα και να προβλέψει πως θα κυμανθεί η βιολογική πορεία της παρτίδας. Συνεπώς καθίσταται σημαντικό να γνωρίζουν με όσο δυνατόν μεγαλύτερη ακρίβεια, τον μέσο βάρος της παρτίδας. Αυτό επιτυγχάνεται με δειγματοληψίες. Οι δειγματοληψίες επειδή είναι σχετικά χρονοβόρες και σε πολλές περιπτώσεις από δύσκολο έως και αδύνατο να συμβούν (λόγω κακοκαιρίας, μεγάλης απόστασης κλωβών από στην στεριά, μεγάλο βάθος κλωβών κ.α ), σε πολλές μονάδες δεν συμβαίνουν όσο συχνά απαιτείται, με αποτέλεσμα οι ιχθυοκαλλιεργητές να έχουν από μικρές έως πολύ μεγάλες αποκλίσεις στις ε- κτιμήσεις τους για το μέσο βάρος της παρτίδας. Το γεγονός αυτό δημιουργεί κακοδιαχειριζόμενες παρτίδες με άμεσες επιπτώσεις στην κερδοφορία της εταιρε- ίας. Το πρόβλημα αυτό εντείνεται, από το γεγονός ότι, το γενετικό προφίλ των ψαριών παρουσιάζει διαφοροποιήσεις ακόμα και αν αυτά προέρχονται από τους

6 ίδιους γεννήτορες. Επομένως, κάτω από τις ίδιες συνθήκες, ο μεταβολισμός και η ανάπτυξη των ψαριών μιας παρτίδας διαφοροποιείται από ψάρι σε ψάρι. Για αυτό τον λόγο συνήθως το μέσο βάρος της παρτίδας προέρχεται από ένα σύνολο ατομικών βαρών που έχουν σχετικά μεγάλη διακύμανση. Η διακύμανση αυτή μεγαλώνει καθώς τα ψάρια αναπτύσσονται και δημιουργεί ανταγωνισμό μεταξύ των μεγάλων και των μικρών ψαριών αλλά και την ανάγκη να διαχειριστούν με μεγαλύτερη προσοχή. 4. Ποιότητα γόνου και ασθένειες : η ποιότητα γόνου είναι δύσκολο να προβλεφθεί εξ αρχής και είναι κάτι που μπορεί να θέσει εμπόδια στους υπεύθυνους διαχειριστές της εκάστοτε παρτίδας με αποτέλεσμα να ανεβάσει το κόστος της παρτίδας και επομένως την κερδοφορία από αυτήν. Η ποιότητα των μικρών ιχθύων που εισάγονται στην μονάδα έχει να κάνει με την ομοιόμορφη ανάπτυξή τους, την βιολογική απόδοσή τους και την αντοχή σε ασθένειες. Οι ιχθυοκαλλιεργητές θα πρέπει να παρακολουθούν στενά τη βιολογική πορεία των ψαριών και να ελέγχουν για τυχόν συμπτώματα ασθενειών ώστε να παίρνουν όσο πιο σύντομα γίνεται, τα κατάλληλα μέτρα για την καταπολέμηση των ασθενειών και τυχόν μετάδοσή τους σε περισσότερα ψάρια της μονάδας. Οι παραπάνω ιδιαίτερες συνθήκες αποτελούν πολλές φορές τους αστάθμητους παράγοντες που καθιστούν δύσκολη, την σωστή διαχείριση για την βιωσιμότητα μιας επιχείρησης στον κλάδο της ιχθυοκαλλιέργειας. Για αυτόν τον λόγο, είναι αναγκαία η χρήση και η εξέλιξη στατιστικών μοντέλων, που μπορούν να προβλέπουν τις συνθήκες, κάτω από τις οποίες τα ψάρια επιτυγχάνουν την ιδανική ανάπτυξη με ταυτόχρονη αναφορά στο κόστος. Ελλείψει ακαδημαϊκών ερευνών στο συγκεκριμένο ζήτημα, η παρούσα εργασία θα προσπαθήσει να προτείνει έναν τρόπο κατασκευής στατιστικών πινάκων που θα μπορούν ανάλογα των συνθηκών της θερμοκρασίας και το επίπεδο ανάπτυξης που έχει περιέλθει το ψάρι (μέσο βάρος παρτίδας), να προβλέψει την απόδοση του μεταβολισμού που αναμένεται να έχει, με δεδομένη την ποσότητα τροφής. Με αυτόν τον τρόπο θα μπορούμε να δώσουμε μια πιο σαφή εικόνα της βιολογικής πορείας των παρτίδων μιας μονάδας και επομένως τα εποπτικά εκείνα εργαλεία, με τα οποία ένας ιχθυοκαλλιεργητής, θα μπορεί να πάρει αποφάσεις για το πως να διαχειριστεί τις παρτίδες που παρακολουθεί, ώστε να αποφέρει μεγαλύτερο κέρδος στην εταιρεία ενώ

7 ταυτόχρονα να δεσμεύσει όσο τον δυνατό λιγότερα κεφάλαια. Αυτό μπορεί να αποτελέσει ένα πρώτο βήμα για την λύση του προβλήματος της έλλειψης ρευστότητας αλλά και η βάση με την οποία θα χτίζεται ένας στρατηγικός σχεδιασμός για την απόδοση των κεφαλαίων που επενδύονται στις εταιρείες του κλάδου. Για την κατασκευή των πινάκων, θα χρησιμοποιήσουμε πραγματικά δεδομένα από μία ιχθυοκαλλιεργητική μονάδα που έχουν χρονικό εύρος 10 μηνών και αφορούν την βιολογική πορεία λαυρακίου, με μεταβλητές, το μέσο βάρος της παρτίδας, τη θερμοκρασία της θάλασσας, την ποσότητα τροφής και ένα κλάσμα σχετικής ανάπτυξης ψαριού που στην ιχθυοκαλλιέργεια είναι γνωστό ως FCR (Food Conversion Ratio). Οι τεχνικές που θα χρησιμοποιήσουμε προέρχονται από τον κλάδο της εξόρυξης δεδομένων (Data Mining), και πιο συγκεκριμένα θα επικεντρωθούμε στον αλγόριθμο κατηγοριοποίησης K-NN (K-Nearest Neighbors). Τέλος, θα προβούμε τόσο σε ποσοτική όσο και σε ποιοτική ανάλυση των δεδομένων που θα παράξουμε και θα εκτιμήσουμε πόσο καλά το μοντέλο μας ερμηνεύει την πραγματικότητα με κριτήριο αντίστοιχες βιβλιογραφικές αναφορές. Τα ευρήματά μας θα υποδείξουν ότι ο αλγόριθμος K-NN είναι ικανός, κάτω από τις κατάλληλες συνθήκες, να παράξει σε ικανοποιητικό βαθμό ακρίβειας, τους στατιστικούς πίνακες που προβλέπουν την ανάπτυξη του ψαριού, για δεδομένες τιμές θερμοκρασίας, ποσότητα τροφής και σταδίου ανάπτυξης του ψαριού.

8 Κεφάλαιο 2 Επισκόπηση βιβλιογραφίας Στο κεφάλαιο αυτό, θα αναδείξουμε βιβλιογραφικές αναφορές, στις οποίες αναφέρονται τρόποι εκτίμησης βασικών μεγεθών για την βιολογική πορεία ζωντανών οργανισμών, είτε προέρχονται από τον κλάδο της εξόρυξης δεδομένων είτε προέρχονται από διαφορετικούς επιστημονικούς κλάδους. Γενικά, η βιβλιογραφία γύρω από το συγκεκριμένο θέμα δεν είναι αρκετά πλούσια και ειδικότερα για το χώρο της ιχθυοκαλλιέργειας θα μπορούσαμε να πούμε ότι είναι ελλιπής ή αρκετά φτωχή. 2.1 Αναφορά στα γραμμικά και μη γραμμικά μοντέλα α- νάπτυξης ψαριών Το 2014 οι Lugert, Thaller, Tetens, Schulz και Krieter (Lugert, Thaller, Tetens, Schulz, Krieter 2014) από το πανεπιστήμιο του Κίελου, διερεύνησαν την καταλληλότητα των συνηθισμένων συναρτήσεων -γραμμικών μοντέλων- που υπάρχουν στην ιχθυοκαλλιέργεια καθώς και 5 μη-γραμμικών μοντέλων με στόχο την μελλοντική πρόβλεψη της ανάπτυξης των ψαριών σε ιχθυοκαλλιέργεια. Σε κάθε συνάρτηση που διερεύνησαν, είτε γραμμική είτε μη-γραμμική, προσπάθησαν να κάνουν παρεκβολή (extrapolation) ώστε να ελέγξουν ποιές από αυτές, μπορούν να δώσουν μια ρεαλιστική πρόβλεψη της α- νάπτυξης του ψαριού. Τα δεδομένα τους για τις μετρήσεις, τα πήραν από την εκτροφή 150 θηλυκών καλκανιών σε ένα σύστημα ιχθυοκαλλιέργειας με ανακυκλοφορία 1 (RAS), κατά την χρονική περίοδο 340 ημερών. Οι συνθήκες κάτω από τις οποίες έγιναν οι 1 Το σύστημα ιχθυοκαλλιέργειας με ανακυκλοφορία γνωστό και ως RAS είναι μια τεχνική εκτροφής ψαριών σε δεξαμενές που βρίσκονται στην στεριά, στις οποίες το νερό διαρκώς ανακυκλώνεται και παρακολουθείται, ώστε να διατηρούνται οι κατάλληλες συνθήκες ανάπτυξης ψαριών

2.1 Αναφορά στα γραμμικά και μη γραμμικά μοντέλα ανάπτυξης ψαριών 9 μετρήσεις ήταν απόλυτα ελεγχόμενες και σταθερές, μιας και το επιτρέπει το είδος της ιχθυοακαλλιέργειας που επέλεξαν. Τα κριτήρια για να ελέγξουν την καταλληλότητα των μοντέλων ήταν το R 2 και η μέση ποσοστιαία απόκλιση (Mean Percentage Deviation, MPD%). Για τα μη-γραμμικά μοντέλα χρησιμοποίησαν επιπλέον το τυπικό σφάλμα καταλοίπων (Residual Standard Error) και το Akaike κριτήριο (AIC). 2.1.1 Γραμμικά μοντέλα 1. Μέσος ρυθμός ανάπτυξης : AGR = w t w i t (2.1) όπου το w t είναι το τελικό βάρος και το w i είναι το αρχικό βάρος των μετρήσεων και t είναι ο χρόνος που παρεμβάλλεται μεταξύ των δύο παρατηρήσεων βάρους, σε πλήθος ημερών. Στην ουσία με αυτήν την εξίσωση υπολογίζεται ο μέσος ρυθμός ανάπτυξης ανά ημέρα. Για το σύνολο των παρατηρήσεων που εξέτασαν, υπολόγισαν ότι το R 2 είναι ίσο με 0.985871 και το MPD ίσο με 11.27%. Όπως σε κάθε γραμμικό μοντέλο, έτσι και εδώ, δεν λαμβάνονται υπόψη οι ενδιάμεσες παρατηρήσεις παρά μόνο η αρχική και η τελική παρατήρηση βάρους, με αποτέλεσμα οι προβλέψεις να μην είναι ακριβείς. Για το συγκεκριμένο σύνολο δεδομένων, οι ερευνητές διαπίστωσαν ότι όλες οι προβλέψεις έδιναν υπερεκτιμημένα αποτελέσματα κάτι που περιγράφεται και από το σχετικά μεγάλο MPD. Το AGR είναι ένας γρήγορος τρόπος ώστε να κατατάξει κανείς, την βιολογική πορεία του ψαριού σε διάφορες κατηγορίες (γρήγορη ανάπτυξη, αργή ανάπτυξη κ.τ.λ.). Σε αντιδιαστολή δεν μπορεί να χρησιμοποιηθεί ως μοντέλο πρόβλεψης ανάπτυξης ψαριού, ειδικά για μεγάλες χρονικές περιόδους. 2. Σχετικός ρυθμός ανάπτυξης : RGR = w t w i w i 100 (2.2) όπου το w t είναι το τελικό βάρος και το w i είναι το αρχικό βάρος των μετρήσεων. Όπως φαίνεται και από τον τύπο, ο σχετικός ρυθμός ανάπτυξης περιγράφει την αύξηση βάρους του ψαριού σε σχέση με το αρχικό του βάρος, με αναφορά στο πλήθος των ημερών που χρειάστηκαν για αυτήν την ανάπτυξη. Το χαρακτηρι-

2.1 Αναφορά στα γραμμικά και μη γραμμικά μοντέλα ανάπτυξης ψαριών 10 στικό μειονέκτημα εδώ, είναι πώς γνωρίζοντας τον σχετικό ρυθμό ανάπτυξης για μια χρονική περίοδο κάμποσων ημερών δεν είναι εφικτό να αναχθεί σε διαφορετικό πλήθος ημερών. Μπορεί ωστόσο να χρησιμοποιηθεί ως ένα μέτρο σύγκρισης μεταξύ διαφορετικών παρτίδων, οι οποίες ξεκίνησαν από το ίδιο βάρος αλλά είχαν διαφορετική διατροφή για το ακριβώς ίδιο χρονικό διάστημα. Με αυτόν τον τρόπο, θα μπορούμε να διαλέγουμε την καλύτερη δυνατή διατροφή. Σε κάθε περίπτωση όμως το RGR δεν είναι κατάλληλο για την πρόβλεψη της ανάπτυξης του ψαριού. 3. Ειδικός ρυθμός μεταβολής : SGR = log(w t) log(w i ) t 100 (2.3) όπου το w t είναι το τελικό βάρος και το w i είναι το αρχικό βάρος των μετρήσεων και t είναι ο χρόνος που παρεμβάλλεται μεταξύ των δύο παρατηρήσεων βάρους, σε πλήθος ημερών. Όπως φαίνεται και από τον τύπο, ο Ειδικός ρυθμός μεταβολής περιγράφει το ποσοστιαίο ρυθμό μεταβολής ανά ημέρα, κάτι που τον καθιστά πιο ευέλικτο από τον Σχετικό ρυθμό μεταβολής. Στην συγκεκριμένη περίπτωση οι ερευνητές υπολόγισαν ότι το R 2 είναι ίσο με 0.967807 και το αντίστοιχο MPD είναι ίσο με 13.37%. Επιπλέον, απέδειξαν ότι το SGR δεν θα μπορούσε να χρησιμοποιηθεί ως μοντέλο πρόβλεψης ανάπτυξης ψαριών γιατί οι εκτιμήσεις εκτός της χρονικής περιόδου που ανήκουν τα δεδομένα, είναι υπερεκτιμημένες ενώ για οι εκτιμήσεις εντός της χρονικής περιόδου, είναι υποεκτιμημένες. Μεγαλύτερο πρόβλημα παρατηρείται όταν, κατά την διαδικασία της πρόβλεψης, χρησιμοποιούνται και βραχυχρόνια και μακροχρόνια δεδομένα. Στην ιχθυοκαλλιέργεια χρησιμοποιείται συχνά γιατί μπορεί εύκολα να εφαρμοστεί και χρησιμέυσει άμεσα ως μέτρο σύγκρισης δύο παρτίδων. 4. Συντελεστής ανάπτυξης με θερμοκρασία : TGC = w1 /3 t w 1 /3 i T t (2.4) όπου το w t είναι το τελικό βάρος και το w i είναι το αρχικό βάρος των μετρήσεων, T είναι η θερμοκρασία της θάλασσας σε βαθμούς κελσίου και t είναι η χρονική περίοδος σε πλήθος ημερών. Το TGC είναι μια προσπάθεια βελτίωσης του SGR.

2.1 Αναφορά στα γραμμικά και μη γραμμικά μοντέλα ανάπτυξης ψαριών 11 Στην πραγματικότητα για τα δεδομένα που είχαν οι ερευνητές, υπολόγισαν το R 2 ίσο με 0.993926 και το MPD ίσο με 5.51%. Σε σύγκριση με τα αντίστοιχα αποτελέσματα από το SGR, η καταλληλότητα του συντελεστή TGC ήταν μεγαλύτερη. Στο σημείο αυτό θα πρέπει να επισημανθεί ότι, οι τιμές του TGC και ο ρυθμός ανάπτυξης των ψαριών είναι σε μεγάλο βαθμό εξαρτώμενα μεγέθη από το είδος του ψαριού, από τα ποσοτικά και τα ποιοτικά χαρακτηριστικά της διατροφής, καθώς και του τρόπου εκτροφής του εκάστοτε είδους. Επομένως, συνιστάται να μελετηθεί το TGC ανά εκτρεφόμενο είδος και ανά ιχθυοκαλλιεργητική μονάδα και ανά συγκεκριμένο σύνολο συνθηκών ώστε να μπορούμε να πούμε με μεγαλύτερη βεβαιότητα αν και κατά πόσο, το μοντέλο του TGC είναι κατάλληλο να προβλέπει την ανάπτυξη του ψαριού. Σίγουρα θα πρέπει να αποφευχθεί για τις περιπτώσεις όπου οι τιμές τις θερμοκρασίας είναι ακραίες και αρκετά μακρυά από τις βέλτιστες τιμές. Ωστόσο, παραμένει το πιο αξιόπιστο και το πιο εύκολα εφαρμόσιμο από τα γραμμικά μοντέλα. 2.1.2 Μη-γραμμικά μοντέλα Για το πόσο καλά ταιριάζουν τα μη-γραμμικά μοντέλα, στην πρόβλεψη ανάπτυξης ψαριού, οι ερευνητές βασίστηκαν στην έρευνα του Hesse (Hesse, 1927). Τα αποτελέσματα της έρευνας αυτής, υποδεικνύουν πως ο μεταβολισμός των ψαριών εξαρτάται άμεσα από τον λόγο της επιφάνειας των εντέρων προς τη μάζα του ψαριού. Ο λόγος αυτός συνδέεται με την ποσότητα των θρεπτικών συστατικών που απορροφούν τα ψάρια και την ικανότητα να δεσμεύουν όση τροφή δεν καταναλώθηκε για τις άμεσες λειτουργίες τους, για την αύξηση του βάρους τους. Αυτός λόγος μικραίνει καθώς το ψάρι αναπτύσσεται σε βάρος, διότι συρρικνώνεται η αναλογία της επιφάνειας των εντέρων προς το διαρκώς αυξανόμενο βάρος και επειδή το ψάρι καθώς μεγαλώνει σε μάζα, απαιτεί μεγαλύτερες ποσότητες ενέργειας για να καλύψει τις βασικές του λειτουργίες, οπότε δεσμεύεται αναλογικά, λιγότερη τροφή για την αύξηση του βάρους. Για αυτόν τον λόγο, η καμπύλη που περιγράφει το βάρος του ψαριού σε σχέση με τον χρόνο, αναμένεται να είναι ασυμπτωτική και να παρουσιάζεται με την μορφή μιας καμπύλης που θυμίζει S (βλέπε Γράφημα 2.1). Με βάση την ιδιαιτερότητα αυτή, οι ερευνητές πρόσθεσαν ένα επιπλέον κριτήριο καταλληλότητας των μη-γραμμικών μοντέλων. Προσπάθησαν να συ-

2.1 Αναφορά στα γραμμικά και μη γραμμικά μοντέλα ανάπτυξης ψαριών 12 γκρίνουν τα γραφήματα που παράγονται από τα μη-γραμμικά μοντέλα με το γράφημα της καμπύλης βάρους. Ξεχωριστή ερμηνευτική σημασία δίνεται στο σημείο καμπής της εκάστου καμπύλης, της χρονικής στιγμής στην οποία βρίσκεται το σημείο καμπής καθώς και η πάνω ασύμπτωτος της καμπύλης. Σε κάθε περίπτωση τα μη-γραμμικά μοντέλα αποδείχτηκαν καλύτερα από τα γραμμικά. Γράφημα 2.1: Καμπύλη βάρους ψαριού σε ιχθυοκαλλιέργεια μέχρι 400 γρ. 1. Λογιστική συνάρτηση: P (t) = όπου το P(t) είναι το βάρος και το t είναι ο χρόνος. 1 1 + e t (2.5α) Η λογιστική συνάρτηση διαμορφώθηκε κατάλληλα για να μπορεί να δίνει εκτιμήσεις για την ανάπτυξη βάρους του ψαριού ως εξής: y (t) = 1 + a ( b t c ) (2.5β) όπου y (t) είναι η εξαρτημένη μεταβλητή του βάρους ως προς τον χρόνο, a είναι η πάνω ασύμπτωτος της καμπύλης, b είναι ο χρόνος στον οποίο υπάρχει το σημείο καμπής και c είναι ο ρυθμός ανάπτυξης του βάρους. Κάνοντας τους υπολογισμούς οι ερευνητές βρήκαν ότι το R 2 είναι ίσο με 0.999486, το MPD ίσο με 2.54%, το RSE ίσο με 193.331 (με 747 βαθμούς ελευθερίας) και το κριτήριο AIC ίσο με 100030.01. Αποδείχτηκε ότι η λογιστική συνάρτηση είναι καταλληλότερη από κάθε γραμμική συνάρτηση και ότι δίνει εύστοχες εκτιμήσεις για τις τιμές που βρίσκονται ενδιάμεσα των δεδομένων. Από την άλλη πλευρά τείνει να δίνει υποεκτιμημένες προβλέψεις για μεγαλύτερα μεγέθη ψαριών λόγω της απόλυτης συμμετρίας της.

2.1 Αναφορά στα γραμμικά και μη γραμμικά μοντέλα ανάπτυξης ψαριών 13 2. Συνάρτηση Gompertz : Y(t) = a e b e( c t) (2.6) όπου y (t) είναι η εξαρτημένη μεταβλητή του βάρους ως προς τον χρόνο, a είναι η πάνω ασύμπτωτος της καμπύλης, b καθορίζει την μετατόπιση του y και το c είναι ο ρυθμός ανάπτυξης. Αντιστοίχως, το R 2 υπολογίστηκε ίσο με 0.9999850, το MPD ίσο με 1,61%, το RSE ίσο με 193.203 (με 747 βαθμούς ελευθερίας) και το κριτήριο AIC ίσο με 100029.01. Σε σχέση με την λογιστική, η συνάρτηση Gompertz είναι μη-συμμετρική και για αυτό τον λόγο μπορεί να δώσει πολύ καλύτερες προβλέψεις, παρουσιάζοντας μεγαλύτερη ρεαλιστικότητα στην εικόνα της ανάπτυξης του ψαριού. 3. Συνάρτηση Von Bertalanffy (VBGF) : w (t) = W inf (1 e ( k(t t 0)) ) b (2.7) όπου το w (t) είναι το βάρος σε μία δεδομένη στιγμή, W inf είναι το ασυμπτωτικό βάρος, το b εκφράζεται από την εξίσωση W = a L b που περιγράφει την σχέση μεταξύ βάρους και μήκους ψαριού ανά είδος, t 0 είναι το σημείο στο οποίο η καμπύλη του βάρους πλησιάζει τον άξονα του χρόνου και k είναι ο συντελεστής ανάπτυξης της καμπύλης βάρους. Οι παράμετροι εδώ μπορούν να υπολογιστούν, είτε με γραμμική παλινδρόμηση είτε με την μέθοδο των μη-γραμμικών ελαχίστων τετραγώνων (Nonlinear Least Squares). Αντίστοιχα, το R 2 υπολογίστηκε ίσο με 0.9999898, το MPD ίσο με 0.66%, το RSE ίσο με 193.332 (με 746 βαθμούς ελευθερίας) και το κριτήριο AIC ίσο με 100031.01. Η συνάρτηση VBGF είναι αποδεδειγμένα μία από τις καλύτερες συναρτήσεις πρόβλεψης ανάπτυξης ψαριών, όσον αφορά την ανάπτυξή τους σε μήκος. Το μειονέκτημα εδώ είναι πως για την αντίστοιχη πρόβλεψη του βάρους του ψαριού, χρησιμοποιείται η σχέση W = a L b όπου το μήκος L που έχει υπολογιστεί, μετατρέπεται μέσω της συνάρτησης αυτής σε βάρος. Οι παράμετρες a και b όμως διαφέρουν ανά είδος ψαριού. Για αυτό τον λόγο, η συνάρτηση VBGF θα πρέπει, για να μας δώσει επιθυμητής ακρίβειας προβλέψεις, να έχουν υπολογιστεί πολύ καλά τα a και b, για το είδος ψαριού που μελετάμε, κάτι που δεν είναι εφικτό πολλές φορές λόγω έλλειψης δεδομένων.

2.1 Αναφορά στα γραμμικά και μη γραμμικά μοντέλα ανάπτυξης ψαριών 14 4. Συνάρτηση των Kanis and Koops : y (i) = a e b((t i c)/t i ) (2.8) όπου y (t) είναι η εξαρτημένη μεταβλητή του βάρους ως προς τον χρόνο, t i καθορίζει το χρονικό πλαίσιο και a,b,c οι παράμετροι της συνάρτησης. Το R 2 υπολογίστηκε ίσο με 0.9999072, το MPD ίσο με 1.16%, το RSE ίσο με 193.223 (με 747 βαθμούς ελευθερίας) και το κριτήριο AIC ίσο με 100029.17. Η συνάρτηση των Kanis and Koops, λόγω μαθηματικής κατασκευής είναι ικανή να παρουσιάσει εξίσου καλές προβλέψεις με την συνάρτηση VBGF, παρόλο που αρχικός σχεδιασμός της προοριζόταν για να προβλέπει την καθημερινή ανάπτυξη σε βάρος, εκτρεφόμενων γουρουνιών. Ενα βασικό μειονέκτημα είναι ότι δεν μπορεί να προβλέψει μείωση του βάρους και σε αυτές τις περιπτώσεις υποθέτει ότι το βάρος θα παραμείνει αμετάβλητο. Οι ερευνητές εδώ, προτείνουν να γίνει περαιτέρω μελέτη για την συνάρτηση αυτή καθώς δεν έχει χρησιμοποιηθεί στην ιχθυοκαλλιέργεια, ενώ θα μπορούσε να φανεί πολύ χρήσιμη στον κλάδο. 5. Συνάρτηση Schnute : y (t) = [ ( t )]1/b y b 1 + (y 2 b y 1 b ) t1 t 2 t 1 (2.9) όπου y (t) είναι η εξαρτημένη μεταβλητή του βάρους ως προς τον χρόνο, t 1 είναι η πρώτη ηλικία ψαριού, από τα δεδομένα, μετρημένη σε ημέρες ενώ αντίστοιχα το t 2 η τελευταία ηλικία από τα δεδομένα, τα y 1 και y 2 είναι τα βάρη που αντιστοιχούν στα t 1 και t 2, b incremental relative rate of relative growth rate. Αντιστοίχως, το R 2 υπολογίστηκε ίσο με 0.9999989, το MPD ίσο με 0.67%, το RSE ίσο με 193.331 (με 747 βαθμούς ελευθερίας) και το κριτήριο AIC ίσο με 100031.01. Η συνάρτηση Schnute συγκεντρώνει όλα τα θετικά στοιχεία από τις προηγούμενες μη-γραμμικές εξισώσεις και έρχεται δεύτερη καλύτερη όσον αφορά το κριτήριο MPD. Αυτό που την κάνει ξεχωριστή από όλες τις υπόλοιπες, είναι ο ρεαλισμός της εκτιμώμενης καμπύλης βάρους που παράγει, ακόμα και σε ακραίες τιμές.

2.2 Μοντέλο ανάπτυξης της άσπρης γαρίδας 15 2.2 Μοντέλο ανάπτυξης της άσπρης γαρίδας Οι Raule Cervajal και Angela Nebot το 1997 (Cervajal, Nebot 1997), προσπάθησαν να κατασκευάσουν μοντέλα πρόβλεψης ανάπτυξης της άσπρης γαρίδας, κάτω από συνθήκες ημιεντατικής ιχθυοκαλλιέργειας 2. Η κατασκευή των μοντέλων έγινε χρησιμοποιώντας την μέθοδο FIR (Fuzzy Inductive Reasoning). Η μέθοδος αυτή χρησιμοποιεί μια επαγωγική διαδικασία ποιοτικής ανάλυσης των δεδομένων και δεν στηρίζεται σε προϋπάρχουσα γνώση για την δομή των σχέσεων μεταξύ των μεταβλητών των δεδομένων. Το βασικό της πλεονέκτημα είναι ότι στην διαδικασία της μηχανικής μάθησης (machine learning operation), παρατηρεί τα πρότυπα αλληλεπίδρασης μεταξύ των μεταβλητών και προβαίνει σε μοντελοποίηση αυτών των αλληλεπιδράσεων, χωρίς να απαιτείται περαιτέρω γνώση για την δομή των δεδομένων. Με αυτόν τον τρόπο η μέθοδος FIR παρουσιάζει πολύ καλά αποτελέσματα σε προβλήματα όπως της ιχθυοκαλλιέργειας, που δεν είναι γνωστό εξαρχής οι σχέσεις μεταξύ των μεταβλητών και της ανάπτυξης του ψαριού. Τέλος, μπορεί να χρησιμοποιήσει τα μοντέλα που έχει παράξει και να κάνει προβλέψεις, ακόμα και για συνθήκες στις οποίες δεν είχαν συμπεριληφθεί στην διαδικασία της μηχανικής μάθησης. Η μέθοδος FIR αποτελείται από 4 στάδια επεξεργασίας δεδομένων το Fuzzification, την Ποιοτική Μοντελοποίηση, την Ποιοτική Προσομοίωση και το Defuzzification. 1. Fuzzification: Κατά την διαδικασία του Fuzzification, κάθε ποσοτική τιμή των δεδομένων αντιστοιχείται με μια τριάδα αριθμών. Πριν γίνει η διαδικασία του Fuzzification θα πρέπει να έχουν δοθεί οδηγίες για την κατηγοριοποίηση των δεδομένων ανά μεταβλητή. Συνήθως η κατηγοριοποίηση αυτή, γίνεται με τέτοιο τρόπο ώστε όλες οι μεταβλητές να έχουν το ίδιο πλήθος κατηγοριών και η κάθε κατηγορία να περιέχει το ίδιο πλήθος τιμών. Στην τριάδα των αριθμών που θα παράξει η διαδικασία του Fuzzification, περιγράφονται με την σειρά, η κατηγορία στην οποία ανήκει η αρχική ποσοτική τιμή της εκάστοτε μεταβλητής, το επίπεδο σημαντικότητας με το οποίο η συγκεκριμένη αρχική τιμή βρίσκεται στην κατηγορία που ανήκει και ο τρίτος 2 Ημιεντατική ιχθυοκαλλιέργεια: οι εκμεταλλεύσεις εκτροφής ή καλλιέργειας υδρόβιων οργανισμών, όπου ο άνθρωπος επεμβαίνει σε ένα ή σε όλα τα στάδια ανάπτυξης, χρησιμοποιώντας διάφορες τεχνικές, ανάλογα με το εκτρεφόμενο είδος. Η βασική διαφορά με την εντατική ιχθυοκαλλιέργεια, έγκειται στο γεγονός ότι ο άνθρωπος στην ημιεντατική ιχθυοκαλλιέργεια επεμβαίνει λιγότερο και ότι η πυκνότητα των εκτρεφόμενων ειδών είναι σχετικά πιο αραιή.

2.2 Μοντέλο ανάπτυξης της άσπρης γαρίδας 16 αριθμός περιγράφει το σημείο που βρίσκεται η εκάστοτε αρχική ποσοτική τιμή, σε σχέση με την κορυφή της καμπανοειδούς καμπύλης, που εκφράζει την διάταξη των τιμών για κάθε μεταβλητή και κάθε κατηγορία. 2. Ποιοτική Μοντελοποίηση: Στο στάδιο αυτό, η μέθοδος FIR προσπαθεί να εντοπίσει τις χωροχρονικές σχέσεις αιτιότητας μεταξύ των μεταβλητών, που είναι πιο πιθανό να δώσουν τις καλύτερες προβλέψεις στο μέλλον. Ο τρόπος με τον οποίο γίνεται αυτό, περιγράφεται από την ενδεικτική εξίσωση 2.10 που ακολουθεί. Στην ουσία η μέθοδος FIR χρησιμοποιεί χαρακτηριστικές μήτρες, που στην αντίστοιχη ορολογία της μεθόδου ονομάζονται Mask. χ t 2δt t δt t u 1 u 2 y 1 y 2 y 3 0 0 0 0 1 0 2 3 0 0 4 0 +1 0 0 (2.10) όπου u 1, u 2 είναι μεταβλητές εισόδου του συστήματος και y 1, y 2 και y 3 είναι οι μεταβλητές εξόδου του συστήματος. Η εξίσωση 2.10 παρουσιάζει την αιτιώδη σχέση που έχουν οι μεταβλητές στον χρόνο και αλλά και μεταξύ τους. Τα στοιχε- ία του πίνακα δεν είναι αριθμητικές ποσότητες αλλά πληροφορίες συσχέτισης των μεταβλητών μεταξύ τους αλλά και στον χρόνο. Χωρίς να αναλύσουμε περισσότερο την όλη διαδικασία, μπορούμε να αναφέρουμε ενδεικτικά ότι η μεταβλητή εξόδου y 3 από την εξίσωση 2.10, προκύπτει ότι συνδέεται με τον εαυτό της 2 χρονικές υστερήσεις πρίν. Αυτό το βλέπουμε καθώς η τιμή -1 συνδέεται κάθετα με το y 3 και οριζόντια με το t 2δt. Τέλος, στο στάδιο αυτό δημιουργείται ένα σύνολο υποψήφιων πινάκων Mask που μπορούν να περιγράφουν τις αιτιακές σχέσεις μεταξύ των μεταβλητών. Από αυτό το σύνολο επιλέγεται ο βέλτιστος πίνακας με την μέθοδο της εξάντλησης, ώστε να δίνει τις καλύτερες προβλέψεις για την μελλοντική ανάπτυξη της γαρίδας. Το μέτρο σύγκρισης του πόσο καλά προβλέπει ένας πίνακας δίνεται από τα δεδομένα μας. Όπως σε όλες τις περιπτώσεις μηχανικής μάθησης, έτσι και εδώ, ένα μέρος το δεδομένων λειτουργεί ως βάση, για να εκπαιδεύσει τον αλγόριθμο (Training Set) και ένα άλλο μέρος των δεδομένων ως ένα σύνολο για να ελέγξει τα αποτελέσματα που παράγει ο αλγόριθμος (Test Set).

2.2 Μοντέλο ανάπτυξης της άσπρης γαρίδας 17 3. Ποιοτική Προσομοίωση: Η ποιοτική Προσομοίωση είναι η διαδικασία στην οποία η μέθοδος FIR, θα προσπαθήσει να προβλέψει την μελλοντική ανάπτυξη, εφαρμόζοντας τον βέλτιστο πίνακα Mask στα δεδομένα που ανήκουν στο Test Set. Η διαδικασία αυτή γίνεται με την βοήθεια του αλγορίθμου K-nn, ο οποίος θα εντοπίσει τα δεδομένα του Training Set που μοιάζουν (έχουν δηλαδή παρόμοιες τιμές σε αντίστοιχες μεταβλητές) με τα δεδομένα του Test Set. Για να αποδοθούν καταλλήλως τα δεδομένα που μοιάζουν περισσότερο μεταξύ τους, θα πρέπει να γίνει κανονικοποίηση των δεδομένων καθώς και να περιγραφεί η κατάλληλη μετρική που θα περιγράφει την έννοια της απόστασης μεταξύ των δεδομένων. Με αυτόν τον τρόπο θα προσομοιώσει την σταθμισμένη ανάπτυξη λόγω πίνακα Mask που είχαν τα δεδομένα του Training Set, στα δεδομένα του Test Set. 4. Defuzzification: Για να ολοκληρωθεί η διαδικασία του FIR, θα πρέπει οι διατεταγμένες τριάδες αριθμών που είχαν δημιουργηθεί στο στάδιο Fuzzification και με τις οποίες έγιναν όλες οι επεξεργασίες δεδομένων στα επόμενα στάδια, να μετατραπούν στην μορφή που είχαν πριν ξεκινήσει η όλη μέθοδος. Θα μπορούσαμε να πούμε ότι το Defuzzification είναι η ακριβώς αντίστροφη διαδικασία του Fuzzification. Μερικά ενδιαφέροντα συμπεράσματα από αυτήν την επιστημονική έρευνα, είναι πως η μέθοδος FIR έδωσε προβλέψεις που εμφάνιζαν μόνο 10% σφάλμα, ενώ η μέθοδος που χρησιμοποιούσαν στην συγκεκριμένη ιχθυοκαλλιέργεια που ήταν μια πολλαπλή παλινδρόμηση (Multiple Regression) έδινε σφάλμα 20%. Επίσης, διαπίστωσαν ότι, για προβλήματα των οποίων οι συνθήκες διαφοροποιούνται σημαντικά ανά χρονικές περιόδους, όπως είναι η ανάπτυξη του βάρους των εκτρεφόμενων ειδών στην ιχθυοκαλλιέργεια, είναι καλό να μοντελοποιούνται ανά χρονική περίοδο και όχι συνολικά.

2.3 Μέθοδοι εξόρυξης δεδομένων και βιολογικά μεγέθη ζωντανών οργανισμών 18 2.3 Μέθοδοι εξόρυξης δεδομένων και βιολογικά μεγέθη ζωντανών οργανισμών Παρακάτω θα αναφέρουμε ενδεικτικά περιπτώσεις βιβλιογραφίας όπου χρησιμοποιο- ύνται τεχνικές προερχόμενες από την εξόρυξη δεδομένων, για τον υπολογισμό βιολογικών μεγεθών, αλλά όχι για την καθεαυτή ανάπτυξη ζωντανών οργανισμών. Σκοπός είναι να αναδείξουμε την αποτελεσματική εφαρμογή που έχουν οι αλγόριθμοι της εξόρυξης δεδομένων σε τέτοιου είδους προβλήματα και ότι ίσως μια περαιτέρω έρευνα προς αυτήν την κατεύθυνση, θα βοηθούσε περισσότερο τις ιχθυοκαλλιέργειες αλλά και κάθε είδους εκτροφής ζώων. 2.3.1 Πρόβλεψη ασθενειών σε εκτρεφόμενα βοοειδή Στην έρευνα με τίτλο Use of data mining techniques to investigate disease risk οι Pelaez και Pfeiffer το 2008 (Pelaez, Pfeiffer 2008) προσπάθησαν να εντοπίσουν τις συνθήκες κάτω από τις οποίες είναι πιο πιθανό τα βοειδή να νοσήσουν, ώστε να υπάρχει ένα σύστημα προειδοποίησης για τις φάρμες που συντηρούν αυτές τις συνθήκες, να μπορούν να λάβουν έγκαιρα τα κατάλληλα μέτρα. Στην προσπάθεια αυτή χρησιμοποιήσανε 3 αλγόριθμους από την εξόρυξη δεδομένων που ανήκουν στην κατηγοριοποίηση δεδομένων (Classification algorithms). Συγκεκριμένα χρησιμοποίησαν την Λογιστική παλινδρόμηση (Logistic Regression), τα έντρα Κατηγοριοποίησης (Classification Trees) και τους Κανόνες Συσχέτισης (Factor Analysis). Τα αποτελέσματα έδειξαν ότι ο κάθε αλγόριθμος μπορο- ύσε να προβλέψει ικανοποιητικά τις συνθήκες στις οποίες είναι πιθανό τα βοοειδή να νοσήσουν και ότι ο κάθε αλγόριθμος παρουσίαζε συγκριτικά καλύτερα αποτελέσματα ανάλογα με την ποιότητα των δεδομένων που ανέλυε. 2.3.2 Πρόβλεψη διακοπής της παραγωγικής λειτουργίας μιας μυδοκαλλιέργειας Στην έρευνα των Shahriar και McCulloch (Shahriar and McCulloch, 2016), έγινε προσπάθεια να προβλέψουν την προσωρινή διακοπή λειτουργίας μιας μυδοκαλλιέργιας, λόγω καιρικών φαινομένων που επιφέρουν αλλαγές στους βιοχημικούς παράγοντες της θάλασσας. Η παραγωγική διαδικασία μιας μυδοκαλλιέργειας, εξαρτάται άμεσα από την ύπαρξη

2.3 Μέθοδοι εξόρυξης δεδομένων και βιολογικά μεγέθη ζωντανών οργανισμών 19 ρυπαντών του νερού στο οποίο βρίσκεται η μυδοκαλλιέργεια. Συνήθως όταν οι ρυπαντές αυτοί ξεπεράσουν κάποιο επιτρεπτό όριο, θα πρέπει να διακόπτεται η λειτουργία της μυδοκαλλιέργειας προσωρινά, μέχρι η βιοχημική σύσταση του νερού, επανέλθει στα κανονικά επίπεδα. Η ύπαρξη ή η απουσία ρυπαντών, συσχετίζεται με την εκδήλωση καιρικών φαινομένων (συνήθως βροχοπτώσεων) και την αύξηση της ροής των γειτονικών ποταμών. Για αυτό τον λόγο προσπάθησαν με την χρήση αλγορίθμων της εξόρυξης δεδομένων να προβλέψουν έγκαιρα και με μεγάλο βαθμό ακρίβειας το πότε θα έπρεπε να διακοπεί προσωρινά η λειτουργία των μονάδων μυδοκαλλιέργειας. Οι αλγόριθμοί που χρησιμοποίησαν ήταν : 1. ιάνυσμα Υποστήρηξης Μηχανής (Support Vector Maschine) 2. Κ- Κοντινότεροι Γείτονες (K-Nearest Neighbor, K-NN) 3. Νευρωνικά ίκτυα (Multilayer Percepton) 4. έντρο Απόφασης (Decision Tree) 5. Μπαεσιανό ίκτυο (Bayesian Network) Τα αποτελέσματα έδειξαν ότι ο κάθε αλγόριθμος θα μπορούσε να δώσει συγκριτικά με τους υπολοίπους, καλύτερες προβλέψεις ανάλογα την περιοχή που βρίσκεται η εκάστοτε μονάδα μυδοκαλλιέργειας και ανάλογα την συχνότητα των καιρικών φαινομένων. Στον μέσο όρο των περιπτώσεων ο αλγόριθμος με τα καλύτερα αποτελέσματα ήταν ο αλγόριθμος Support Vector Maschine αλλά θα πρέπει να μελετηθεί περισσότερο το πρόβλημα ώστε να υπάρχουν σαφή συμπεράσματα. 2.3.3 Πρόβλεψη του ρυθμού ανάπτυξης του πληθυσμού του Bufo melanostictus στην φύση, με την χρήση του Γενετικού Αλγορίθμου (Genetic Algorithm) Στην έρευνα των Majumder και Barman (Majumder and N Barman, 2013), πρόσπαθησαν να προβλέψουν τον ρυθμό ανάπτυξης του πληθυσμού του Bufo melanostictus 3 στην φύση 3 Bufo melanostictus: είναι ένα είδος ασιατικού βατράχου που δεν απειλείται άμεσα προς εξαφάνιση, αλλά διαρκώς συρρικνώνεται ο πληθυσμός του στην φύση, λόγω καταστροφής των βιοτόπων στους οποίους επιβιώνει.

2.3 Μέθοδοι εξόρυξης δεδομένων και βιολογικά μεγέθη ζωντανών οργανισμών 20 με την χρήση του Γενετικού αλγορίθμου. Ο Γενετικός αλγόριθμος είναι μία μη-γραμμική μέθοδος, που προσπαθεί να δημιουργήσει ένα πλήθος νέων γνωρισμάτων ή να εξελίξει τα ήδη υπάρχοντα, μεταξύ των μεταβλητών, των δεδομένων. Ανάλογα με την εξαρτημένη μεταβλητή που πρέπει να υπολογίσει, ο αλγόριθμος προσπαθεί να σταθμίσει τις α- νεξάρτητες μεταβλητές με τρόπο αναλογικό. Επειτα από πολλούς υπολογισμούς αρχίζει και δίνει την κατάλληλη βαρύτητα στις ανεξάρτητες μεταβλητές έτσι ώστε να αυξάνεται η επιτυχία πρόβλεψης του μοντέλου. Το μοντέλο αυτό διαφοροποιείται ανάλογα με τα δεδομένα που λαμβάνει, καθώς ο Γενετικός αλγόριθμος έχει την ιδιότητα της μηχανικής μάθησης (Maschine Learning Algorithm). Η αναζήτηση για την καταλληλότερη βαρύτητα των ανεξάρτητων μεταβλητών σταματάει όταν επιτευχθεί ένα συγκεκριμένο όριο σωστών προβλέψεων ή όταν ξεπεραστεί ένα επιτρεπτό μέγιστο πλήθος υπολογισμών. Η όλη διαδικασία ολοκληρώνεται με την κατασκευή μιας αντικειμενικής συνάρτησης που είναι ανάλογη της εξαρτημένης μεταβλητής (στο συγκεκριμένο πρόβλημα, του ρυθμού ανάπτυξης του πληθυσμού). Στην συγκεκριμένη έρευνα δόθηκε στους επιστήμονες, η ικανότητα να μελετούν την συνεισφορά της κάθε μεταβλητής ξεχωριστά, στον ρυθμό ανάπτυξης του πληθυσμού των βατράχων. Ο Γενετικός αλγόριθμος έδωσε ακρίβεια πρόβλεψης 96% για κάποιες ομάδες δεδομένων και αναδείχθηκε πολύτιμο εργαλείο για τέτοιου είδους προβλήματα.

21 Κεφάλαιο 3 Ανάλυση και Περιγραφή εδομένων Σε αυτό το κεφάλαιο, θα περιγράψουμε τα δεδομένα, που είχαμε στην διάθεσή μας για να κατασκευάσουμε ένα στατιστικό μοντέλο, που θα περιγράφει τον αναμενόμενο ρυθμό ανάπτυξης του ψαριού, σε σχέση με το στάδιο ανάπτυξης στο οποίο βρίσκεται και την θερμοκρασία της θάλασσας. Θα πρέπει να τονίσουμε εδώ ότι η ενδεδειγμένη ποσότητα τροφής για το εκάστοτε ψάρι θεωρείται δεδομένη, όπως έχει οριστεί από τους σχετικούς διατροφικούς πίνακες. Για να δοθεί μια επαρκής περιγραφή των δεδομένων μας θα πρέπει πρώτα να περιγράψουμε την παραγωγική διαδικασία μιας ιχθυοκαλλιεργητικής μονάδας. 3.1 Λειτουργία ιχθυοκαλλιέργειας Η ζωή του ψαριού στην ιχθυοκαλλιέργεια ξεκινά σε μορφή γόνου, περίπου στα 2-5 γραμμάρια ατομικό βάρος. Στις μονάδες ιχθυοκαλλιέργειας που δεν διαθέτουν ιχθυογεννητικούς σταθμούς, ο γόνος εισάγεται από αντίστοιχες εταιρείες. Η εισαγωγή γόνου για την ιχθυοκαλλιέργεια, συνίσταται στην μεταφορά των νεαρών ιχθύων από τους ιχθυογεννητικούς σταθμούς σε κατάλληλους κλωβούς μέσα στην θάλασσα και στην έναρξη του σταδίου της πάχυνσης, που διαρκεί περίπου 17-24 μήνες ανάλογα με τις συνθήκες που επικρατούν, μέχρι την τελική εξαλίευση και πώληση των ψαριών. Από την στιγμή αυτή το περιεχόμενο του κάθε κλωβού λογίζεται ως μια παρτίδα ψαριών και αντιμετωπίζεται σαν μία ολότητα με ενιαία χαρακτηριστικά. Τα βασικά χαρακτηριστικά μιας παρτίδας ψαριών είναι, το είδος ψαριών (σε κάθε παρτίδα, τα μέλη της ανήκουν στο ίδιο είδος ψαριού), η κοινή ημερομηνία εισαγωγής στην ιχθυοκαλλιέργεια, η κοινή

3.1 Λειτουργία ιχθυοκαλλιέργειας 22 ηλικία των ψαριών που την απαρτίζουν (ηλικία μετράται σε ημέρες) και ο κοινός προμηθευτής. Με αυτόν τον τρόπο τα ατομικά χαρακτηριστικά του κάθε ψαριού, δίνουν την θέση τους στα χαρακτηριστικά της παρτίδας που ανήκει. Όταν για παράδειγμα μιλάμε για το βάρος του ψαριού, στην ουσία εννοούμε το μέσο βάρος των ψαριών της παρτίδας στην οποία ανήκει. Το ίδιο αντίστοιχα συμβαίνει για την ανάπτυξη και για την ποσότητα τροφής του ψαριού. Η πραγματικότητα όμως είναι λίγο πιο περίπλοκη. Συγκεκριμένα, η ανάπτυξη των ψαριών μιας παρτίδας δεν είναι το ίδιο ομοιόμορφη όσο εικάζουν οι υποθέσεις περί μιας ολότητας με ενιαία χαρακτηριστικά. Αυτό συμβαίνει διότι, ενώ τα ψάρια μιας παρτίδας έχουν παρόμοιο γονιδιακό προφίλ και αναπτύσσονται κάτω από τις ίδιες συνθήκες, τις περισσότερες φορές εμφανίζονται υποομάδες ψαριών που αναπτύσσονται με διαφορετικό ρυθμό ανάπτυξης μέσα στην ίδια την παρτίδα. Το φαινόμενο αυτό κλιμακώνεται με την πάροδο του χρόνου καθώς τα μεγαλύτερα ψάρια λειτουργούν ανταγωνιστικά έναντι των μικρότερων. Σε αυτό το σημείο θα πρέπει η παρτίδες που εμφανίζουν αυτό το πρόβλημα να διαχειριστούν κατάλληλα. Η διαχείριση τέτοιων παρτίδων στην ιχθυοκαλλιέργεια αποτελεί η μετακίνηση ένας μέρος μιας παρτίδας σε άλλον κλωβό που είναι άδειος ή πολλές φορές που περιέχει ένα μέρος μιας άλλης παρτίδας με όμοια χαρακτηριστικά. Η ένωση ή ο διαχωρισμός παρτίδων οδηγεί στην δημιουργία καινούργιων παρτίδων με διαφορετικά χαρακτηριστικά μεγέθη, όπως μέσο βάρος, πληθυσμό, βιομάζα και αναμενόμενο ρυθμό ανάπτυξης. 3.1.1 Χρήσιμοι δείκτες που εφαρμόζονται στην ιχθυοκαλλιέργεια Σε πολλές ιχθυοκαλλιεργητικές μονάδες χρησιμοποιούνται κάποιοι δείκτες που περιγράφουν την σχετική ανάπτυξη των ψαριών σε σχέση με το μέσο βάρος τους καθώς και κάποιους διατροφικούς δείκτες που περιγράφουν την ποσότητα τροφής που είναι ενδεδειγμένη για την ομαλη ανάπτυξη του ψαριού. είκτης FCR (Food Conversion Ratio) Ο δείκτης FCR εμφανίζεται με πολλές παραλλαγές και με διαφορετικά τεχνικά χαρακτηριστικά κάθε φορά. Εδώ, θα περιγράψουμε τον δείκτη FCR όπως αυτός περιέχεται στα δεδομένα μας. Ο δείκτης FCR περιέχει την πληροφορία της ανάπτυξης του ψαριού σε

3.1 Λειτουργία ιχθυοκαλλιέργειας 23 σχέση με την ποσότητα τροφής που έφαγε και το μέσο βάρος που είχε. Μια συχνή διαφοροποίηση του δείκτη αυτού, είναι ότι άλλοτε μπορεί αναφέρεται για περίοδο μιας ημέρας και άλλοτε για περισσότερες από μία ημέρα χρονική περίοδο. Ο δείκτης που περιέχεται στα δεδομένα μας αναφέρεται για μιας ημέρας ανάπτυξη (FCR ημέρας). Ο μαθηματικός τύπος του FCR ημέρας είναι : όπου το meal 1 FCR = meal 1 w 2 w 1 (3.1) είναι η ποσότητα τροφής σε γραμμάρια που εκτιμάται ότι έφαγε το ψάρι, την ημέρα t = 1, w 1 και w 2 είναι το βάρος του ψαριού που εκτιμάται ότι είχε την ημέρα t = 1 και αντίστοιχα την επόμενη ακριβώς ημέρα t = 2 1. Όταν το ψάρι έχει FCR κοντά στην τιμή 1, σημαίνει ότι σχεδόν όλη η ποσότητα τροφής που έφαγε μετατράπηκε σε αύξηση του βάρους του. Όσο η τιμή του δείκτη αυξάνεται και παίρνει τιμές μεγαλύτερες του 1, σημαίνει ότι ολοένα και μικρότερο ποσοστό της τροφής που δίνεται στο ψάρι, μεταβολίζεται και μετατρέπεται σε αύξηση του βάρους του. αρχικά στάδια ανάπτυξης του ψαριού παρατηρούνται τιμές του FCR κάτω από 1. Αυτό έχει να κάνει με το είδος της τροφής (ξηρά τροφή Pellet), που μετράται στη ξηρή της κατάσταση πριν δοθεί στο ψάρι, αλλά όταν μπει στο νερό δεσμεύει ποσότητα υγρασίας και η αύξηση του βάρους του ψαριού, περιέχει ποσότητα υγρασίας που απλά εγκλωβίστηκε στην τροφή. Εν γένη, ο δείκτης FCR δεν παίρνει αρνητικές τιμές. Υπάρχουν όμως περιπτώσεις στις οποίες το ψάρι χάνει βάρος λόγω ωοτοκίας και γέννησης αυγών. Στις περιπτώσεις αυτές, παρατηρούνται τιμές κοντά στο -4 για τον δείκτη FCR. Η μαθηματική κατασκευή του FCR, μας επιτρέπει να υπολογίζουμε ποιό ποσοστό τροφής μεταβολίζεται από το ψάρι που έχει ως αποτέλεσμα την αύξηση του βάρους του και μας δίνει την δυνατότητα να εκτιμήσουμε την βιολογική απόδοση του ψαριού. Είναι εμφανές ότι ο δείκτης FCR έχει και οικονομικές προεκτάσεις, γιατί μπορούμε να αντικαταστήσουμε την ποσότητα τροφής στον αριθμητή με το αντίστοιχο κόστος τροφής και να κοστολογήσουμε την αύξηση βάρους του ψαριού. Ο δείκτης FCR εκτός από εκτιμήσεις για το πως αναπτύχθηκε το ψάρι στο παρελθόν μπορεί να χρησιμοποιηθεί και ως ένας δείκτης αναμενόμενης ανάπτυξης του ψαριού στο 1 Εδώ θα πρέπει να γίνει σαφές ότι όταν μιλάμε για ανάπτυξη ψαριού ή τροφή ψαριού ή βάρος ψαριού, εννοούμε την μέση ανάπτυξη παρτίδας, το μέσο όρο ποσότητας τροφής και τον μέσο βάρος της παρτίδας αντίστοιχα, στην οποία ανήκει το ψάρι Σε

3.1 Λειτουργία ιχθυοκαλλιέργειας 24 μέλλον. Από δεδομένα πολλών ετών η εκάστοτε ιχθυοκαλλιεργητική μονάδα διαμορφώνει με εμπειρικό τρόπο, πίνακες FCR με τους οποίους γίνονται οι προβλέψεις τους για την μελλοντική ανάπτυξη των ψαριών που εκτρέφουν. Οι πίνακες αυτοί για να έχουν μεγαλύτερη ακρίβεια στις προβλέψεις τους, θα πρέπει να λαμβάνουν υπόψην τους την θερμοκρασία της θάλασσας και το στάδιο ανάπτυξης στο οποίο βρίσκεται το ψάρι, γιατί αποτελούν τους πιο σημαντικούς παράγοντες στην ανάπτυξη του ψαριού όπως επιβεβαιώνεται από το σύνολο τη βιβλιογραφίας (Hesse 1927, Von Bertalanffy 1934). Βάσει της διαθέσιμης βιβλιογραφίας, αναμένουμε οι τιμές του FCR να είναι μεγαλύτερες καθώς το ψάρι μεταβαίνει σε μεγαλύτερα στάδια ανάπτυξης. Σε αντιδιαστολή, θα πρέπει να αναμένουμε μικρότερες τιμές FCR, καθώς αυξάνεται η θερμοκρασία. Στόχος της παρούσας εργασίας είναι να αναδείξουμε τους τρόπους με τους οποίους είναι δυνατόν να κατασκευαστούν οι πίνακες FCR, οριοθετώντας με επιστημονικά κριτήρια τις δυνατότητες πρόβλεψης αλλά και τα σχετικά σφάλματα των προβλέψεων αυτών. είκτης SFR (Specific Feeding Ratio) Ο δείκτης SFR περιγράφει την αναλογία της ποσότητας τροφής του ψαριού σε σχέση με το βάρος του. Ο μαθηματικός τύπος του είναι ο εξής : SFR = meal 100 w (3.2) όπου meal είναι η ποσότητα τροφής μετρημένη σε γραμμάρια και w είναι το βάρος του ψαριού μετρημένο σε γραμμάρια. Κάθε μέγεθος της εξίσωσης αναφέρεται στην ίδια χρονική στιγμή. Το SFR έχει διπλή χρησιμότητα. Μπορεί απλά να χρησιμοποιείται για να καταγράψει το τάισμα του ψαριού (μιας παρτίδας ψαριών) στο παρελθόν αλλά μπορεί να χρησιμεύσει και ως δείκτης που θα υποδεικνύει στο μέλλον ποιά ποσότητα τροφής είναι ενδεδειγμένη για την ομαλή ανάπτυξη του ψαριού. Όταν χρησιμοποιείται για μελλοντικά ταΐσματα συνήθως συνδυάζεται με τους πίνακες FCR που μιλήσαμε πιο πάνω. Κάθε εταιρεία που προμηθεύει με τροφές μια ιχθυοκαλλιεργητική μονάδα, χρησιμοποιεί πίνακες SFR οι οποίοι περιγράφουν ανά τύπο τροφής, ανά είδος ψαριού, ανά θερμοκρασία νερού και ανά στάδιο ανάπτυξης του ψαριού, την συνιστώμενη ποσότητα τροφής. Παρατηρώντας τον τύπο του SFR, κατανοούμε ότι δεν μπορεί να παίρνει αρνητικές

3.2 Ανάλυση δεδομένων 25 τιμές, γιατί ούτε η ποσότητα τροφής ούτε το βάρος των ψαριών μπορούν να πάρουν αρνητικές τιμές. Αν λάβουμε υπόψη μας την σχετική βιβλιογραφία που αναφέρει ότι σε αρχικά στάδια ανάπτυξης του ψαριού, δηλαδή σε μικρό ατομικό βάρος, η ανάπτυξή του σε σχέση με το βάρος του, είναι αναλογικά πιο γρήγορη από ότι σε μεταγενέστερα στάδια, θα περιμένουμε οι πίνακες SFR να έχουν μεγαλύτερες τιμές σε αρχικά στάδια ανάπτυξης, οι οποίες θα μικραίνουν καθώς μεταβαίνουμε σε μεταγενέστερα στάδια α- νάπτυξης. Επίσης, από την βιβλιογραφία γνωρίζουμε ότι όσο αυξάνεται η θερμοκρασία του νερού, αυξάνεται και η ικανότητα μεταβολισμού της τροφής από τα ψάρια που έχει ως αποτέλεσμα την αύξηση του βάρους τους. Επομένως, αναμένουμε στους πίνακες SFR να αυξάνονται οι τιμές του SFR καθώς αυξάνεται η θερμοκρασία. Περιγραφή Βιοοικονομικού Μοντέλου Το βιοικονομικό μοντέλο που θα χρησιμοποιήσουμε, εκφράζεται ως συνδυασμός των δεικτών FCR και SFR. Συγκεκριμένα, περιγράφεται από τις εξισώσεις 3.3 και 3.4 που ακολουθούν : FCR = SFR w 1 100 w 2 w 1 = SFR w 1 100 (w 2 w 1 ) (3.3) w 2 w 1 = SFR w 1 100 FCR (3.4) Στην ουσία, λύσαμε από τον τύπο του SFR ως προς Meal και αντικαταστήσαμε στον τύπο του FCR, όπου Meal το ίσον του. 3.2 Ανάλυση δεδομένων Για την έρευνά μας, χρησιμοποιήσαμε πραγματικά δεδομένα από μία ιχθυοκαλλιέργεια, με χρονικό ορίζοντα 10 μηνών, από τις αρχές του Οκτωβρίου του 2016 μέχρι το τέλος Ιουλίου του 2017. Τα δεδομένα μας περιέχουν 71 παρτίδες λαυρακίου. Κάθε παρτίδα είχε διαφορετικό χρόνο ύπαρξης. Υπάρχουν παρτίδες ψαριών που υφίσταντο για 2 ημέρες και άλλες για 300 ημέρες. Το σύνολο των δεδομένων μας αποτελείται από 4595 παρατηρήσεις με μεταβλητές, το FCR ημέρας του ψαριού (το FCR ημέρας της παρτίδας), το βάρος του ψαριού (μέσο βάρος παρτίδας), τη θερμοκρασία της θάλασσας και τη ποσότητας της τροφής. Στο σύνολό τους τα δεδομένα αναφέρονται για ένα

3.2 Ανάλυση δεδομένων 26 είδος ψαριού, το λαυράκι. Το γεγονός αυτό έρχεται σε συμφωνία με την βιβλιογραφική επισκόπηση όπου συνίσταται να μελετούνται τα διάφορα μοντέλα ανά εκτρεφόμενο είδος. Στον πίνακα 3.1 που ακολουθεί αναφέρονται τα βασικά στατιστικά μεγέθη των μεταβλητών. Ενδεικτικά μπορούμε να αναφέρουμε ότι το FCR εμφανίζεται να ΠΙΝΑΚΑΣ 3.1. Συνοπτικά στατιστικά Variable Obs Mean Std.Dev. Min Max FCR 4595 1.691.526-3 3.032 Weight 4595 171.898 134.722 3.52 1015.679 Temperature 4595 19.238 3.613 12 25 Meal 4595 1.383 1.065.018 18.673 παίρνει τιμές από -3 έως 3.032, το μέσο βάρος παρτίδας από 3.52 έως 1015.679, η θερμοκρασία της θάλασσας από 12 έως 25 και η ποσότητα τροφής που αντιστοιχεί σε κάθε ψάρι μιας παρτίδας από 0.018 έως 18.673. Συνεχίζοντας με την περιγραφική στατιστική των δεδομένων μας, παραθέτουμε τον πίνακα 3.2 όπου περιγράφονται οι συσχετίσεις μεταξύ των βασικών μας μεταβλητών. Παρατηρούμε ότι το βάρος έχει θετική συσχέτιση με το FCR μέτριας δυναμικής κάτι ΠΙΝΑΚΑΣ 3.2. Πίνακας Συσχετίσεων Variables FCR Weight Temperature Meal FCR 1.000 Weight 0.457 1.000 Temperature -0.211 0.070 1.000 Meal 0.344 0.775 0.426 1.000 που έρχεται σε απόλυτη συμφωνία με την σχετική βιβλιογραφία. Επίσης, σε συμφωνία με την βιβλιογραφία έρχεται η αρνητική συσχέτιση της θερμοκρασίας με το FCR, αλλά ενδεχομένως να μην είναι της ισχύς που αναμέναμε. Τέλος, παρατηρούμε την θετική συσχέτιση της ποσότητας τροφής με το FCR που είναι αναμενόμενο εφόσον αναλογιστούμε ότι η μεγαλύτερη ποσότητα τροφής δίνεται σε μεγαλύτερα στάδια ανάπτυξης, όπου το FCR είναι μεγαλύτερο. Τα δεδομένα μας δεν μπορούν να αποδώσουν την ολοκληρωμένη εικόνα της βιολογικής πορείας του ψαριού, καθώς ο χρονικός ορίζοντας των δεδομένων μας είναι μονάχα

3.2 Ανάλυση δεδομένων 27 ένα μέρος του χρόνου που απαιτείται για να ολοκληρωθεί ένας βιολογικό κύκλος. Θυμίζουμε ότι τα δεδομένα μας έχουν χρονικό ορίζοντα 10 μηνών, ενώ ένα ψάρι σε μορφή γόνου μέχρι την τελική του εξαλίευση απαιτεί συνήθως από 17-22 μήνες. Η ετερογένεια των δεδομένων μας όσον αφορά τις διαφορετικές συχνότητες των παρατηρήσεων, ανά στάδιο ανάπτυξης και θερμοκρασίας, θα αποτυπωθεί στα γραφήματα και τους πίνακες που ακολουθούν. Για την καλύτερη επεξεργασία των σταδίων ανάπτυξης συμβουλευτήκαμε εμπειρικά μοντέλα και κατηγοριοποιήσαμε τα βάρη σε κλάσεις. Στον Πίνακα 3.3 της επόμενης σελίδας, παρουσιάζεται ο τρόπος που κατηγοριοποιήσαμε τα μέσα βάρη παρτίδων των δεδομένων μας και αντίστοιχα στο Γράφημα 3.1 παρουσιάζεται το ιστόγραμμα των συχνοτήτων για τις κλάσεις βαρών.

κλάση βάρους εύρος γραμμαρίων 0 0.5-1.99 1 2-3.99 2 4-5.99 3 6-7.99 4 8-9.99 5 10-11.99 6 12-14.99 7 15-19.99 8 20-24.99 9 25-29.99 10 30-34.99 11 35-39.99 12 40-49.99 13 50-59.99 14 60-74.99 15 75-89.99 16 90-104.99 17 105-119.99 18 120-149.99 19 150-199.99 20 200-249.99 21 250-299.99 22 300-349.99 23 350-449.99 24 450-549.99 25 550-649.99 26 650-749.99 27 750-849.99 28 850-1500 Γράφημα 3.1: Συχνότητες Βαρών ΠΙΝΑΚΑΣ 3.3. Κλάσεις Βαρών Γράφημα 3.2: Συχνότητες Θερμοκρασίας Όπως φαίνεται χαρακτηριστικά στο Γράφημα 3.1, υπάρχει μεγάλη ανομοιομορφία στο πλήθος των παρατηρήσεων που διαθέτουμε ανά κλάση βάρους και σε αρκετές περιπτώσεις το πλήθος των παρατηρήσεων είναι κάτω από 50. Το γεγονός αυτό είναι αναμενόμενο να δυσκολέψει το έργο της στατιστικής ανάλυσης των δεδομένων μας. Στο Γράφημα 3.2, παρουσιάζονται οι α- ντίστοιχες συχνότητες των τιμών της θερμοκρασίας. Όπως διαφαίνεται και εδώ, οι ετερογένεια στο πλήθος των παρατηρήσεων ανά τιμή θερμοκρασίας είναι μεγάλη καθώς υπάρχουν τιμές θερμοκρασίας με παραπάνω από 400 παρατηρήσεις και τιμές θερμοκρασίας με λιγότερο από 40 παρατηρήσεις. Η εμφάνιση αυτο- ύ του φαινομένου προκαλείται, διότι 10 μηνών δεδομένα θερμοκρασίας δεν είναι αρκετά για να περιγράψουν με σαφήνεια το θερμοκρασιακό προφίλ της εκάστοτε περιοχής.

Κεφάλαιο 4 Εμπειρική Ανάλυση Για την κατασκευή πινάκων FCR με τους οποίους θα μπορούμε να προβλέπουμε την μελλοντική ανάπτυξη του ψαριού, ανάλογα με την θερμοκρασία και το στάδιο ανάπτυξης στο οποίο βρίσκεται, χρησιμοποιήσαμε τον αλγόριθμο K-NN (K-Nearest Neighbors), που αποτελεί στοιχείο του κλάδου της εξόρυξης δεδομένων, που ονομάζεται κατηγοριοποίηση (Classification). Σε αυτό το κεφάλαιο θα περιγράψουμε τον αλγόριθμο K-NN, θα αναλύσουμε τον τρόπο που εφαρμόσαμε τον αλγόριθμο στα δεδομένα μας, θα παρουσιάσουμε τα αποτελέσματα που παρήγαγε και τέλος θα προβούμε στα σχετικά συμπεράσματα. 4.1 Περιγραφή του Αλγορίθμου K-NN Ο αλγόριθμος K-NN, χρησιμοποιείται είτε για κατηγοριοποίηση δεδομένων είτε για παλινδρόμηση. Εδώ, θα περιγράψουμε την λειτουργία του αλγορίθμου για τα προβλήματα κατηγοριοποίησης, όπως ακριβώς τον χρησιμοποιήσαμε στην έρευνά μας. Για την λειτουργία του K-NN αλγορίθμου, απαιτείται ο διαχωρισμός των δεδομένων σε δύο υποομάδες δεδομένων. Στα δεδομένα εκπαίδευσης του αλγορίθμου (Training Set) και στα δεδομένα ελέγχου του αλγορίθμου (Test Set). Συνήθως χρησιμοποιείται ο κανόνας του 10% για να ορίσουμε το μέγεθος του Test Set, όπου το 10% του πλήθους όλων των δεδομένων μας θα αποτελέσει το Test Set και αντίστοιχα το υπόλοιπο 90% των δεδομένων μας θα αποτελέσει το Training Set. Ο αλγόριθμος στην συνέχεια θα προσπαθήσει να βρει τους Κ κοντινότερους γείτονες για καθένα από τα δεδομένα του Test Set ψάχνοντάς τους στο Training Set.

4.2 Μοντέλα Γραμμικής Παλινδρόμησης 30 Η έννοια του κοντινότερου γείτονα έχει να κάνει με την ομοιότητα των δεδομένων. Όμοιες θεωρούνται δύο παρατηρήσεις όταν οι τιμές τους, στις αντίστοιχες μεταβλητές δεν διαφέρουν πολύ. Για να οριστεί επακριβώς τι θεωρείται κοντινό και τι όχι, θα πρέπει να ορίζεται μια μετρική η οποία θα μπορεί να εφαρμόζεται σε όλα τα δεδομένα μας. Υπάρχει ένα πλήθος διαφορετικών μετρικών που μπορούν να εφαρμοστούν ανάλογα με την φύση των δεδομένων και την φύση του προβλήματος που εξετάζουμε. Επίσης, θα πρέπει να ορίσουμε το πλήθος των κοντινών γειτόνων, που αλγόριθμος K-NN θα προσπαθήσει να βρει. Η επιλογή του πλήθους K των γειτόνων, είναι μια σημαντική διαδικασία η οποία μπορεί να επηρεάσει την ακρίβεια των αποτελεσμάτων. Σε περιπτώσεις όπου το K είναι πολύ μικρό για τα δεδομένα μας, υπάρχει περίπτωση οι γείτονες που θα επιλεγούν να περιέχουν θόρυβο και να επηρεάσουν την τελική εκτίμησή μας. Από την άλλη πλευρά, εάν το K επιλεχθεί ώστε να είναι πολύ μεγάλο για τα δεδομένα μας, υπάρχει ο κίνδυνος οι κοντινότεροι γείτονες να μην είναι τόσο κοντά όσο θα θέλαμε. Συνήθως, υπάρχει ο κανόνας της τετραγωνικής ρίζας για την επιλογή του Κ, με την οποία το Κ ορίζεται ως η τετραγωνική ρίζα του πλήθους των παρατηρήσεων που έχουμε. Εφόσον, ορίσουμε το Training Set, το Test Set, την μετρική και το K, τότε ο αλγόριθμος K-NN, θα είναι έτοιμος να βρει τους Κ- κοντινότερους γείτονες για καθένα από τα δεδομένα του Test Set. Εχοντας βρει, τους Κ-κοντινότερους γείτονες, μπορούμε να υπολογίσουμε το γνώρισμα των δεδομένων που μας ενδιαφέρει είτε παίρνοντας τον μέσο όρο των γειτόνων για την συγκεκριμένη μεταβλητή, είτε τον διάμεσο, είτε οποιοδήποτε άλλο στατιστικό μέτρο θέλουμε. 4.2 Μοντέλα Γραμμικής Παλινδρόμησης Σε αυτήν την ενότητα θα παρουσιάσουμε 2 Μοντέλα Γραμμικής παλινδρόμησης που εφαρμόσαμε στα δεδομένα μας. Η μαθηματική διατύπωση για το πρώτο γραμμικό μας μοντέλο είναι: FCR = a 0 + a 1 Weigh + a 2 T (4.1)

4.2 Μοντέλα Γραμμικής Παλινδρόμησης 31 ενώ η μαθηματική διατύπωση για το δεύτερο μοντέλο μας είναι FCR = a 0 + a 1 Meal + a 2 T + a 3 Weight (4.2) όπου το Meal είναι η ποσότητα τροφής που αναλογεί για κάθε ψάρι μιας παρτίδας, T είναι η θερμοκρασία της θάλασσας, Weight είναι το μέσο βάρος της παρτίδας και FCR είναι το FCR ημέρας για κάθε ψάρι της ίδιας παρτίδας. Όλες οι μεταβλητές παίρνουν τιμές για την ίδια χρονική στιγμή και πιο συγκεκριμένα για την ίδια ημέρα. Στον πίνακα 4.1 που ακολουθεί, παρουσιάζονται συνοπτικά τα αποτελέσματα των παλινδρομήσεων για τα δύο μοντέλα. Όπως παρατηρούμε και στα δύο μοντέλα το P value του F Test είναι 0, που σημαίνει ότι τα μοντέλα μας έχουν κάποια ισχύ. Επίσης, οι μεταβλητές που χρησιμοποιήσαμε είναι στατιστικά σημαντικές, σε επίπεδο σημαντικότητας τουλάχιστον 99%. Το μειονέκτημα των μοντέλων είναι το χαμηλό R 2, που σημαίνει ότι εξηγούν πολύ μικρό ποσοστό της διακύμανσης του FCR. Αυτό το χαρακτηριστικό επηρεάζει πολύ τις προβλέψεις. Επιπλέον, από την έρευνα των (Lugert, Thaller, Tetens, 2014), επισημαίνεται ότι οποιοδήποτε γραμμικό μοντέλο πρόβλεψης ανάπτυξης βάρους για την ιχθυοκαλλιέργεια δεν είναι αρκετά αξιόπιστο και για αυτό θα πρέπει να καταφεύγουμε σε μη-γραμμικά μοντέλα. ΠΙΝΑΚΑΣ 4.1 Αποτελέσματα Παλινδρόμησης (1) (2) FCR FCR Weight 0.00185 0.000942 Temperature -0.0355-0.0524 Meal 0.154 _cons 2.056 2.325 N 4595 4595 F 840.1 634.3 Prob >F 0.000 0.000 R 2 0.2679 0.2930 Root MSE 0.45035 0.4264 p <0.05, p <0.01, p <0.001

4.3 Εφαρμογή του Αλγορίθμου K-NN 32 4.3 Εφαρμογή του Αλγορίθμου K-NN Το λογισμικό περιβάλλον στο οποίο χρησιμοποιήσαμε τον αλγόριθμο K-NN ήταν ο α- νοικτός κώδικας R. Αρχικά, ορίσαμε τα υποσύνολα των δεδομένων μας που θα είχαν το ρόλο της εκπαίδευσης του αλγορίθμου (Training set) και έπειτα τα δεδομένα που θα είχαν το ρόλο του ελέγχου των δεδομένων (Test Set). Επειδή, τα δεδομένα μας ήταν διατεταγμένα ανά παρτίδα, για να αποκλείσουμε την πιθανότητα να κατασκευάσουμε το Training set, από παρτίδες που ενδεχομένως να περιέχουν ακραίες τιμές ή οι παρατηρήσεις τους να έχουν θόρυβο, επιλέξαμε τυχαία παρατηρήσεις κατά μήκος όλων των δεδομένων μας. Με αυτό τον τρόπο καταφέραμε να επιλέξουμε δεδομένα σχεδόν από όλες τις παρτίδες. Η τυχαία επιλογή έγινε με την βοήθεια της Uniform κατανομής με την οποία αναδιατάξαμε τα δεδομένα μας. Η μετρική που διαλέξαμε για τον εντοπισμό των Κ- κοντινότερων γειτόνων, ήταν η ευκλείδεια απόσταση για δεδομένα 3 διαστάσεων, αφού τα δεδομένα μας είχαν 3 ανεξάρτητες μεταβλητές, την ποσότητα τροφής, την Θερμοκρασία και το Βάρος. Κάνοντας την επιλογή της συγκεκριμένης μετρικής έπρεπε να κανονικοποιήσουμε τα δεδομένα μας, διότι η κάθε μεταβλητή έχει διαφορετική τάξη μεγέθους. Σε διαφορετική περίπτωση παίρνοντας την ευκλείδεια απόσταση μεταξύ δύο παρατηρήσεων, σχεδόν τον αποκλειστικό ρόλο στην διαμόρφωση της υπολογισμένης απόστασης θα είχε το βάρος, αφού σε πολλές περιπτώσεις μετριέται σε εκατοντάδες γραμμάρια ενώ η θερμοκρασία σε δεκάδες βαθμούς C. Επομένως, θα επιλέγαμε χωρίς την θέλησή μας, να υποβαθμίσουμε αισθητά τον ρόλο που παίζουν όλες οι υπόλοιπες μεταβλητές στον υπολογισμό του FCR. Επειδή όμως δεν έχουμε κάποιο εμπειρικό ή θεωρητικό υπόβαθρο που να επιβεβαιώνει κάτι τέτοιο, με αυτόν τον τρόπο θα προσθέταμε μεροληψία στα αποτελέσματά μας. Ο τρόπος με τον οποίο κανονικοποιήσαμε τα δεδομένα περιγράφεται από την εξίσωση 4.3, η οποία, εφαρμόστηκε για κάθε ανεξάρτητη μεταβλητή ξεχωριστά: f(x) = x min(x) max(x) min(x) (4.3) Για το μέγεθος του Test Set χρησιμοποιήσαμε τον άτυπο κανόνα του 10% που περιγράψαμε πιο πάνω, οπότε στο σύνολο των 4595 παρατηρήσεων προέκυψε ότι το μέγεθος του Test Set είναι 459 παρατηρήσεις. Αντιστοίχως, το Training Set κατασκευ- άστηκε από τις υπόλοιπες 4136 παρατηρήσεις. Για την επιλογή του αριθμού Κ,

4.3 Εφαρμογή του Αλγορίθμου K-NN 33 χρησιμοποιήσαμε τον κανόνα της τετραγωνικής ρίζας, οπότε K = 4595 = 67. Επομένως, το πρόβλημα μας σε αυτό το σημείο είχε αναχθεί στην εύρεση 67-κοντινότερων γειτόνων για κάθε μία από τις 495 παρατηρήσεις του Test Set μέσα από το Training Set. Εχοντας βρει 67-κοντινότερους γείτονες για μια παρατήρηση από το Test Set, στην ουσία είχαμε βρει τις παρατηρήσεις εκείνες του Training Set που η ευκλείδεια απόσταση των ανεξάρτητων μεταβλητών τους, δηλαδή της ποσότητας τροφής, της Θερμοκρασίας και του Βάρους 1, ήταν η μικρότερη σε σχέση με τις υπόλοιπες παρατηρήσεις από το Training Set. Ανάλογα με τη συχνότητα των δεδομένων, για συγκεκριμένη τιμή θερμοκρασίας και κλάσης βάρους, στου 67-κοντινότερους γείτονες για μια παρατήρηση με θερμοκρασία T = T 0, βάρος w 0 WeightClass = x, και ποσότητα τροφής Meal = m 0, εμφανίζονταν γείτονες που είχαν θερμοκρασία T = T 0 αλλά και πολλοί γείτονες που είχαν θερμοκρασία T T 0. Το ίδιο συνέβαινε και με τις κλάσεις βάρους αντίστοιχα. Με δεδομένη την σημαντικότητα της θερμοκρασίας και του σταδίου ανάπτυξης του ψαριού, επιλέξαμε μόνο τους γείτονες που άνηκαν στην ίδια κλάση βάρους και είχαν την ίδια θερμοκρασία, με την εξεταζόμενη παρατήρηση του Test Set. Σε αυτό το στάδιο, προσπαθήσαμε να προβλέψουμε την τιμή του FCR για την εξεταζόμενη τιμή του Test Set, χρησιμοποιώντας τον μέσο όρο των τιμών FCR των γειτόνων που είχαμε επιλέξει. Για να αποφευχθεί τυχόν αμεροληψία, που θα προέκυπτε λόγω ακραίων τιμών μιας παρτίδας, της οποίας οι παρατηρήσεις θα αποτελούσαν γείτονες της εξεταζόμενης τιμής, ορίσαμε ένα κατώτατο όριο γειτόνων με το οποίο θα προβαίναμε σε πρόβλεψη. Το κατώτατο όριο ήταν 20 γείτονες με την ίδια θερμοκρασία και την ίδια κλάση βάρους. Στην περίπτωση, όπου το σύνολο των γειτόνων ήταν κάτω από το συγκεκριμένο όριο, δίναμε την εντολή να μην εκτελεστεί η πρόβλεψη. Επιπλέον, επειδή το FCR παίρνει συνεχείς τιμές και είναι σχετικά απίθανο δύο παρατηρήσεις από διαφορετικές παρτίδες να έχουν ακριβώς την ίδια τιμή FCR, δώσαμε την εντολή στο αλγόριθμο να κάνει πρόβλεψη μόνο με τον μέσο όρο των μοναδικών τιμών FCR που παρατηρούνται στου γείτονες. Με αυτόν τον τρόπο αποφύγαμε την επίδραση στην πρόβλεψη που θα είχε το ενδεχόμενο να έχουμε γείτονες από μικρό πλήθος παρτίδων, γιατί μόνο από παρατηρήσεις της ίδιας παρτίδας, εμφανίζονται τιμές του FCR που είναι ακριβώς ίδιες. Στην ενότητα που ακολουθεί θα παραθέσουμε τα αποτελέσματα του K-NN. 1 Βάρος: Το βάρος εδώ, σηματοδοτεί το στάδιο ανάπτυξης του ψαριού στο οποίο βρίσκεται για δεδομένη στιγμή το ψάρι, όπως έχει διατυπωθεί από τους (Hesse, 1927 και Baer et al, 2010 )

4.4 Αποτελέσματα Αλγορίθμου ΠΙΝΑΚΑΣ 4.2. Εκτιμώμενες Τιμές FCR ανά κλάση Βάρους και Θερμοκρασία Θερμοκρασία Κλάσεις Βάρους 13 14 15 16 16.5 17 17.5 18 18.5 19 2 3.99 4 5.99 1.256 0.949 6 7.99 1.259 0.901 8 9.99 1.250 10 11.99 1.125 12 14.99 1.199 15 19.99 20 24.99 25 29.99 30 34.99 35 39.99 1.334 1.268 50 59.99 60 74.99 75 89.99 90 104.99 105 119.99 2.320 120 149.99 2.018 1.984 2.152 2.075 1.814 150 199.99 2.118 1.913 1.943 1.902 1.738 200 249.99 2.027 1.929 1.872 1.877 1.886 1.831 250 299.99 1.894 300 349.99 2.140 1.943 Θερμοκρασία Κλάσεις Βάρους 19.5 20 20.5 21 21.5 22 22.5 23 24 25 2 3.99 0.876 4 5.99 0.876 6 7.99 0.834 8 9.99 10 11.99 0.834 12 14.99 0.896 0.851 0.85 15 19.99 1.243 0.851 0.85 20 24.99 1.201 0.947 25 29.99 1.201 0.899 0.933 30 34.99 1.201 35 39.99 50 59.99 60 74.99 75 89.99 1.565 90 104.99 1.592 105 119.99 555555555555 1.592 120 149.99 150 199.99 1.757 1.672 200 249.99 1.867 1.841 1.734 1.65 250 299.99 1.900 1.987 1.782 1.741 300 349.99 1.8 1.853 350 449.99 2.0063 1.85

4.4 Αποτελέσματα Αλγορίθμου 35 Στον πίνακα 4.2 παρουσιάζονται οι τιμές του πίνακα FCR όπως τις παρήγαγε ο αλγόριθμος K-NN. Όπως ήταν αναμενόμενο τα περισσότερα κελιά του πίνακα είναι άδεια, αφού για τις περισσότερες τιμές θερμοκρασίας του πίνακα και τις αντίστοιχες κλάσεις βάρους δεν είχαμε το απαραίτητο πλήθος παρατηρήσεων στα δεδομένα μας. Επιπλέον, τα κριτήρια που θέσαμε στον αλγόριθμο για να κάνει προβλέψεις, όπως αυτά περιγράφονται στην ενότητα 4.3, περιόρισαν ακόμα περισσότερο το πλήθος των προβλέψεων. Ενδεικτικό, της συρρίκνωσης της δεξαμενής των δεδομένων από τα οποία προήλθαν οι προβλέψεις του K-NN είναι το Γράφημα 4.1 και ο αντίστοιχος Πίνακας Συχνοτήτων 4.3. Συγκεκριμένα το πλήθος των δεδομένων μας μειώθηκε από τις 4595 παρατηρήσεις στις 3105. Γράφημα 4.1: Συχνότητες Θερμοκρασιών Θερμοκρασία Συχνότητες 13 106 14 426 16 328 16.5 92 17 170 18 133 18.5 74 19 272 20 175 21 106 21.5 82 22 299 22.5 128 23 142 24 342 25 230 Σύνολο 3105 ΠΙΝΑΚΑΣ 4.3. Πίνακας συχνοτήτων ηηηηηηηηηηηηηηηηηηηηηθερμοκρασίας Στην επόμενη σελίδα παραθέτουμε τις διαθέσιμες παρατηρήσεις των δεδομένων μας, όπως αυτές προέκυψαν από την αντίστοιχη εφαρμογή των κριτηρίων που προαναφέραμε, για τις κλάσεις βάρους.

4.4 Αποτελέσματα Αλγορίθμου 36 Κλάσεις Βάρους Συχνότητες 1 130 2 112 3 114 4 100 5 103 6 106 16 91 17 263 18 532 19 485 20 293 21 261 22 81 Γράφημα 4.2: Συχνότητες Κλάσεις Βαρών Σύνολο 2671 ΠΙΝΑΚΑΣ 4.4. Πίνακας συχνοτήτων ηηηηηηηηηηηηηηηηηη Κλάσεις Βαρών Σε αυτό το σημείο τα δεδομένα μας μειώθηκαν ακόμα περισσότερο και από το αρχικό νούμερο των 4595 παρατηρήσεων, τελικά ο αλγόριθμος K-NN, χρησιμοποίησε μόνο 2671 παρατηρήσεις. Για την αξιολόγηση των αποτελεσμάτων, βρήκαμε ότι το R 2 είναι ίσο με 0.97994371, που είναι πολύ υψηλότερο σε σχέση με τα γραμμικά μοντέλα παλινδρόμησης, που κυμαίνονταν γύρω στο 0.29. Η ερμηνεία των αποτελεσμάτων με βάση τον δείκτη R 2, είναι ότι το 97.99% της διακύμανσης του δείκτη FCR, εξηγείται από τον αλγόριθμο K-NN και το μοντέλο πρόβλεψης που χρησιμοποιήσαμε. Επίσης, το p value για το μοντέλο μας ήταν 2.2e 16, που σημαίνει ότι είναι στατιστικά σημαντικό σε επίπεδο σημαντικότητας τουλάχιστον 99%. Για την ποιοτική αξιολόγηση των αποτελεσμάτων, βασιστήκαμε στην βιβλιογραφία των (Hesse,1927 και Von Bertalanffy, 1934), όπου αναφέρεται ότι ο ρυθμός ανάπτυξης του ψαριού είναι άμεσα εξαρτώμενος, από την αναλογία της επιφάνειας των εντέρων του ψαριού προς το σωματικό του βάρος και ότι όσο αυξάνεται το σωματικό βάρος