Περίληψη
Η γεωργία διαδραματίζει καθοριστικό ρόλο στην παγκόσμια οικονομική ανάπτυξη, καθώς καλύπτει τη θεμελιώδη ανάγκη της ανθρωπότητας για τροφή και παρέχει σημαντική πηγή απασχόλησης παγκοσμίως. Ταυτόχρονα, αντιμετωπίζει αυξανόμενες προκλήσεις λόγω της κλιματικής αλλαγής, της εξάντλησης των φυσικών πόρων και της αυξανόμενης ζήτησης. Οι πρόσφατες εξελίξεις στη μηχανική μάθηση επιτρέπουν την ανάλυση μεγάλου όγκου γεωργικών δεδομένων και υποστηρίζουν έγκαιρες, βασισμένες σε δεδομένα παρεμβάσεις σε σύγκριση με τις παραδοσιακές μεθόδους παρακολούθησης. Οι εφαρμογές της μηχανικής μάθησης στη γεωργία εντάσσονται σε τέσσερις βασικούς τομείς: (i) πρόβλεψη απόδοσης καλλιεργειών, (ii) ανίχνευση και πρόβλεψη ασθενειών, (iii) διάκριση μεταξύ ζιζανίων και καλλιεργειών και (iv) αξιολόγηση ποιότητας και ασφάλειας τροφίμων. Η παρούσα διατριβή διερευνά πώς οι μέθοδοι μηχανικής μάθησης μπορούν να αντιμετωπίσουν προβλήματα στη γεωργία, όπου το περιορισμένο πλήθος δεδομένων, η ανομοιογένεια των μεταβλητών και η ...
Η γεωργία διαδραματίζει καθοριστικό ρόλο στην παγκόσμια οικονομική ανάπτυξη, καθώς καλύπτει τη θεμελιώδη ανάγκη της ανθρωπότητας για τροφή και παρέχει σημαντική πηγή απασχόλησης παγκοσμίως. Ταυτόχρονα, αντιμετωπίζει αυξανόμενες προκλήσεις λόγω της κλιματικής αλλαγής, της εξάντλησης των φυσικών πόρων και της αυξανόμενης ζήτησης. Οι πρόσφατες εξελίξεις στη μηχανική μάθηση επιτρέπουν την ανάλυση μεγάλου όγκου γεωργικών δεδομένων και υποστηρίζουν έγκαιρες, βασισμένες σε δεδομένα παρεμβάσεις σε σύγκριση με τις παραδοσιακές μεθόδους παρακολούθησης. Οι εφαρμογές της μηχανικής μάθησης στη γεωργία εντάσσονται σε τέσσερις βασικούς τομείς: (i) πρόβλεψη απόδοσης καλλιεργειών, (ii) ανίχνευση και πρόβλεψη ασθενειών, (iii) διάκριση μεταξύ ζιζανίων και καλλιεργειών και (iv) αξιολόγηση ποιότητας και ασφάλειας τροφίμων. Η παρούσα διατριβή διερευνά πώς οι μέθοδοι μηχανικής μάθησης μπορούν να αντιμετωπίσουν προβλήματα στη γεωργία, όπου το περιορισμένο πλήθος δεδομένων, η ανομοιογένεια των μεταβλητών και η υψηλή διαστασιμότητα δημιουργούν πρακτικούς περιορισμούς στη μοντελοποίηση των προβλημάτων και απαιτούν ισορροπία μεταξύ προγνωστικής απόδοσης και ερμηνευσιμότητας. Το μεθοδολογικό πλαίσιο εξετάζει επιβλεπόμενες και μη επιβλεπόμενες προσεγγίσεις σε προβλήματα παλινδρόμησης, ταξινόμησης, ομαδοποίησης και μείωσης διαστασιμότητας, αναδεικνύοντας ότι η επιλογή μοντέλου πρέπει να καθοδηγείται από τα χαρακτηριστικά των δεδομένων, την πολυπλοκότητα του προβλήματος και την ανάγκη για ερμηνεύσιμα αποτελέσματα που μπορούν να υποστηρίξουν τη λήψη αποφάσεων, και όχι από την υπόθεση ύπαρξης μιας καθολικά βέλτιστης μεθόδου. Οι πρωτότυπες ερευνητικές συνεισφορές της παρούσας διατριβής επικεντρώνονται κυρίως στην αξιολόγηση ποιότητας και ασφάλειας τροφίμων και στην πρόβλεψη φυτοπαθολογικών ασθενειών. Στον τομέα της ασφάλειας τροφίμων, αναπτύχθηκε μεθοδολογικό πλαίσιο μοντελοποίησης για την πρόβλεψη του κινδύνου επιμόλυνσης από αφλατοξίνες σε αποξηραμένα σύκα, αξιοποιώντας περιβαλλοντικές, εδαφικές και μικροβιολογικές μεταβλητές. Τα αποτελέσματα κατέδειξαν ότι δεδομένα μη βασισμένα σε απεικονιστικές τεχνικές μπορούν να λειτουργήσουν ως αξιόπιστοι πρώιμοι δείκτες επιμόλυνσης. Η προβλεπτική ικανότητα των μοντέλων ενισχύθηκε μέσω τεχνικών μείωσης διαστασιμότητας και μετασχηματισμού του χώρου χαρακτηριστικών, γεγονός που αύξησε τον διαχωρισμό μεταξύ των κλάσεων και βελτίωσε τη διακριτική ικανότητα του μοντέλου. Στον τομέα της ποιότητας τροφίμων, πρωτότυπες μελέτες στο ελαιόλαδο ανέδειξαν ερμηνεύσιμες συσχετίσεις μεταξύ της χημικής σύστασης και των οργανοληπτικών χαρακτηριστικών, επιτρέποντας την πρόβλεψη βασικών οργανοληπτικών ιδιοτήτων και υποστηρίζοντας την εκπαίδευση και βαθμονόμηση των οργανοληπτικών πάνελ. Συμπληρωματική μελέτη κατέδειξε ότι τα οργανοληπτικά χαρακτηριστικά από μόνα τους δύνανται να αποτυπώσουν ουσιαστικά ποικιλιακά πρότυπα, αναδεικνύοντας ομάδες ποικιλιών ελαιόλαδου με παρόμοιο οργανοληπτικό προφίλ. Με βάση τα ευρήματα αυτά, αναπτύχθηκε μοντέλο μηχανικής μάθησης το οποίο αναπαριστά κάθε ομάδα μέσω αντιπροσωπευτικών προτύπων, επιτρέποντας την ακριβή ταξινόμηση δειγμάτων ελαιολάδου σε ποικιλιακές κατηγορίες. Η προσέγγιση αυτή παρέχει ουσιαστική υποστήριξη στην εκπαίδευση των οργανοληπτικών πάνελ.Στο ίδιο επιστημονικό πεδίο, η διατριβή παρουσιάζει διαδραστική διαδικτυακή εφαρμογή, η οποία ενσωματώνει πολυμεταβλητή ανάλυση και τεχνικές ομαδοποίησης για την ταξινόμηση εξαιρετικών παρθένων ελαιόλαδων ποικιλίας Κορωνέϊκη σε υποομάδες ποιότητας εντός της κατηγορίας «εξαιρετικό παρθένο». Η κύρια συνεισφορά της εφαρμογής συνίσταται: (i) στη δεδομενοκεντρική υποκατηγοριοποίηση της ευρείας κατηγορίας του εξαιρετικού παρθένου ελαιολάδου, η οποία περιλαμβάνει ευρύ φάσμα ποιοτικών διαβαθμίσεων, (ii) στη θεμελίωση της υποκατηγοριοποίησης αποκλειστικά στα θετικά οργανοληπτικά χαρακτηριστικά και (iii) στην ανάπτυξη ενός πρακτικού και φιλικού προς τον χρήστη εργαλείου για την ταξινόμηση νέων δειγμάτων στις αντίστοιχες ομάδες ποιότητας. Παράλληλα, παρουσιάζεται λογισμικό ειδικά σχεδιασμένο για την παρακολούθηση της ποιότητας ελαιολάδου σε επίπεδο μεμονωμένου παραγωγού, βασισμένο στα θετικά οργανοληπτικά χαρακτηριστικά δειγμάτων που συλλέγονται διαχρονικά. Η ομαδοποίηση των δειγμάτων με βάση την οργανοληπτική τους ομοιότητα επιτρέπει την αναγνώριση δομών συνέπειας, βελτιώσεων ή πιθανών αδυναμιών στην παραγωγική διαδικασία και ενισχύει τη συνεχή βελτίωση της ποιότητας μέσω τεκμηριωμένων αποφάσεων. Στον τομέα της πρόβλεψης ασθενειών, η διατριβή εξετάζει κατά πόσο εδαφικές, φυλλοδιαγνωστικές και δενδροκομικές παράμετροι μπορούν να αποτελέσουν πρώιμους δείκτες της ανθράκωσης της ελιάς. Η μελέτη αποτελεί μία από τις πρώτες προσπάθειες πρόβλεψης της ασθένειας με χρήση πραγματικών εδαφικών και φυλλοδιαγνωστικών δεδομένων πεδίου. Η ανάλυση αντιμετώπισε τους περιορισμούς μικρού και υψηλής διαστασιμότητας συνόλου δεδομένων και περιέλαβε συστηματική συγκριτική αξιολόγηση πολλαπλών μοντέλων για τον προσδιορισμό της βέλτιστης μεθοδολογικής προσέγγισης. Μέσω αυτής της διαδικασίας εντοπίστηκαν οι σημαντικότεροι παράγοντες που επηρεάζουν την εμφάνιση της ασθένειας. Το τελικό μοντέλο παρείχε ερμηνεύσιμες πληροφορίες για τους γεωπόνους, ενισχύοντας την κατανόηση των βασικών παραγόντων εμφάνισης της ασθένειας και επιτρέποντας έγκαιρη παρέμβαση για αποτελεσματική διαχείρισή της. Συνολικά, η παρούσα διατριβή αναδεικνύει τις δυνατότητες της μηχανικής μάθησης στην πρόβλεψη ασθενειών και στην αξιολόγηση ποιότητας και ασφάλειας τροφίμων. Πέρα από τις μεθοδολογικές συνεισφορές, τονίζεται η σημασία της ερμηνευσιμότητας, της γνώσης του πεδίου και της πρακτικής εφαρμοσιμότητας σε πραγματικά γεωργικά προβλήματα. Τα αναπτυγμένα μοντέλα και τα λογισμικά εργαλεία παρέχουν όχι μόνο προγνωστική ικανότητα αλλά και ουσιαστικές πληροφορίες που υποστηρίζουν τους εμπλεκόμενους φορείς στην κατανόηση και βελτίωση των πρακτικών τους.
περισσότερα
Περίληψη σε άλλη γλώσσα
Agriculture plays a critical role in global economic development by meeting humanity’s need for food and sustaining employment worldwide. At the same time, it faces growing challenges from climate change, resource scarcity, and increasing demand. Recent advances in machine learning enable the analysis of big agricultural data and support earlier, data-driven interventions compared to traditional monitoring approaches. Machine learning applications in agriculture fall into four broad fields: (i) crop yield prediction, (ii) disease detection and prediction, (iii) weed/crop identification, and (iv) food quality and safety assessment. This thesis explores how machine learning methods can address real-world problems in agriculture, where limited data size, heterogeneous variables, and high dimensionality impose practical modeling constraints and require a balance between predictive performance and interpretability. The methodological framework examines supervised and unsupervised learning a ...
Agriculture plays a critical role in global economic development by meeting humanity’s need for food and sustaining employment worldwide. At the same time, it faces growing challenges from climate change, resource scarcity, and increasing demand. Recent advances in machine learning enable the analysis of big agricultural data and support earlier, data-driven interventions compared to traditional monitoring approaches. Machine learning applications in agriculture fall into four broad fields: (i) crop yield prediction, (ii) disease detection and prediction, (iii) weed/crop identification, and (iv) food quality and safety assessment. This thesis explores how machine learning methods can address real-world problems in agriculture, where limited data size, heterogeneous variables, and high dimensionality impose practical modeling constraints and require a balance between predictive performance and interpretability. The methodological framework examines supervised and unsupervised learning across regression, classification, clustering, and dimensionality-reduction tasks, demonstrating that model selection should be guided by data characteristics, problem complexity, and the need for interpretable results that support decision-making, rather than by the assumption of a universally optimal method. The original research contributions of this thesis focus primarily on food quality and safety and plant disease prediction. In the food safety domain, a modeling framework was developed to predict aflatoxin contamination risk in dried figs using environmental, soil, and microbiological variables, demonstrating that non-imaging data can provide reliable early indicators of contamination. Predictive performance was enhanced through dimensionality reduction and a transformation of the feature space that increased discriminative separation among samples. In the food quality domain, original studies on olive oil revealed interpretable relationships between chemical composition and sensory attributes, enabling prediction of key sensory characteristics and supporting sensory panel training. A complementary study further showed that sensory attributes alone can capture meaningful varietal patterns, revealing groups of olive oil varieties with similar sensory profiles. Based on these findings, a machine learning model was developed to represent each group through prototypes, enabling accurate classification of olive oil samples into varietal groups. This approach provides valuable support for sensory panel training. Within the same domain, the thesis introduces an interactive web application, which integrates multivariate analysis and clustering to classify Koroneiki extra virgin olive oils into quality subgroups within the extra virgin category. The main contribution lies in (i) providing a data-driven subcategorization of the broad extra virgin olive oil class, which encompasses a wide spectrum of quality levels, (ii) establishing this subcategorization using only the sensory attributes, and (iii) delivering a practical and user-friendly tool for classifying new samples into these quality groups. The thesis also introduces a producer-specific software tool for monitoring the quality of olive oil from a single producer using the three sensory attributes of olive oil samples produced over time by a single producer. Clustering identifies natural groupings based on sensory similarity, enabling detection of improvements, consistency patterns, or weaknesses in production practices, and supporting data-driven quality improvement. In the domain of disease prediction, the thesis examines whether soil, foliar, and orchard variables can serve as early indicators of olive anthracnose. The study represents one of the first attempts to predict the disease using real field-based soil and foliar data. The analysis addressed the challenge of a small, high-dimensional dataset and included a comparative evaluation of multiple models to identify the most suitable approach for the task. This process enabled the identification of the most influential parameters associated with disease occurrence. The resulting model provided interpretable insights for agronomists, supporting understanding of key disease drivers and enabling early intervention for effective disease management. Overall, this thesis demonstrates the potential of machine learning to support disease prediction and food quality and safety assessment. Beyond methodological contributions, the work highlights the importance of interpretability, domain knowledge, and practical applicability in real-world agricultural problems. The developed models and software tools provide not only predictive capability but also meaningful insights that support stakeholders in understanding and improving their practices.
περισσότερα