Περίληψη
Πολλοί επιστημονικοί τομείς δείχνουν μεγάλο ενδιαφέρον για την εξαγωγή και επεξεργασία χωροχρονικών δεδομένων, όπως η ιατρική με έμφαση στην επιδημιολογία και τη νευρολογία, η γεωλογία, οι κοινωνικές επιστήμες, η μετεωρολογία, ενώ μεγάλο ενδιαφέρον παρατηρείται και στη μελέτη των μεταφορών. Τα χωροχρονικά δεδομένα διαφέρουν σημαντικά από τα χωρικά δεδομένα, καθώς τα χωροχρονικά δεδομένα αναφέρονται σε μετρήσεις, οι οποίες λαμβάνουν υπόψη τόσο τον τόπο όσο και τον χρόνο στον οποίο λαμβάνονται, με τα αντίστοιχα χαρακτηριστικά τους, ενώ τα χωρικά δεδομένα αναφέρονται και περιγράφουν πληροφορίες που σχετίζονται μόνο με τον τόπο. Η καινοτομία που έφερε η χωροχρονική εξόρυξη δεδομένων έχει προκαλέσει επανάσταση σε πολλούς επιστημονικούς τομείς, και αυτό συμβαίνει επειδή μέσω αυτής μπορούμε πλέον να παρέχουμε λύσεις και απαντήσεις σε σύνθετα προβλήματα, καθώς και να παρέχουμε χρήσιμες και πολύτιμες προβλέψεις, μέσω της προγνωστικής μάθησης. Ωστόσο, ο συνδυασμός χρόνου και τόπου στην εξόρυξη δ ...
Πολλοί επιστημονικοί τομείς δείχνουν μεγάλο ενδιαφέρον για την εξαγωγή και επεξεργασία χωροχρονικών δεδομένων, όπως η ιατρική με έμφαση στην επιδημιολογία και τη νευρολογία, η γεωλογία, οι κοινωνικές επιστήμες, η μετεωρολογία, ενώ μεγάλο ενδιαφέρον παρατηρείται και στη μελέτη των μεταφορών. Τα χωροχρονικά δεδομένα διαφέρουν σημαντικά από τα χωρικά δεδομένα, καθώς τα χωροχρονικά δεδομένα αναφέρονται σε μετρήσεις, οι οποίες λαμβάνουν υπόψη τόσο τον τόπο όσο και τον χρόνο στον οποίο λαμβάνονται, με τα αντίστοιχα χαρακτηριστικά τους, ενώ τα χωρικά δεδομένα αναφέρονται και περιγράφουν πληροφορίες που σχετίζονται μόνο με τον τόπο. Η καινοτομία που έφερε η χωροχρονική εξόρυξη δεδομένων έχει προκαλέσει επανάσταση σε πολλούς επιστημονικούς τομείς, και αυτό συμβαίνει επειδή μέσω αυτής μπορούμε πλέον να παρέχουμε λύσεις και απαντήσεις σε σύνθετα προβλήματα, καθώς και να παρέχουμε χρήσιμες και πολύτιμες προβλέψεις, μέσω της προγνωστικής μάθησης. Ωστόσο, ο συνδυασμός χρόνου και τόπου στην εξόρυξη δεδομένων παρουσιάζει σημαντικές προκλήσεις και δυσκολίες που πρέπει να ξεπεραστούν. Η χωροχρονική εξόρυξη και ανάλυση δεδομένων είναι μια σχετικά νέα προσέγγιση στην εξόρυξη δεδομένων, η οποία έχει μελετηθεί πιο συστηματικά την τελευταία δεκαετία. Σκοπός της παρούσας διατριβής είναι να παρέχει μια καλή εισαγωγή στα χωροχρονικά δεδομένα, και μέσω αυτής της λεπτομερούς περιγραφής, επιχειρούμε να εισαγάγουμε την περιγραφική λογική και να αποκτήσουμε μια ολοκληρωμένη γνώση αυτών των δεδομένων. Στόχος μας είναι να εισαγάγουμε έναν νέο τρόπο περιγραφής τους, στοχεύοντας σε μελλοντικές μελέτες, συνδυάζοντας τις εκφράσεις που προκύπτουν ανά τύπο δεδομένων, χρησιμοποιώντας περιγραφική λογική, με νέες εκφράσεις που μπορούν να εξαχθούν, για να περιγράψουμε μελλοντικές καταστάσεις αντικειμένων και περιβαλλόντων με μεγάλη ακρίβεια, παρέχοντας ακριβείς προβλέψεις. Προκειμένου να τονίσουμε την αξία των χωροχρονικών δεδομένων, προχωράμε σε μια σύντομη περιγραφή των δεδομένων ST στην εισαγωγή αλλά και κάνουμε ιδιαίτερη αναφορά στη πρόβλεψη γεγονότων και πιο συγκεκριμένα τροχαίου ατυχήματος. Περιγράφουμε τη σχετική εργασία που έχει πραγματοποιηθεί μέχρι σήμερα, τους τύπους χωροχρονικών (ST) δεδομένων, τις ιδιότητές τους και τους μετασχηματισμούς που μπορούν να γίνουν μεταξύ τους, επιχειρώντας, σε μικρό βαθμό, να εισαγάγουμε περιορισμούς και κανόνες χρησιμοποιώντας περιγραφική λογική, εισάγοντας περιγραφική λογική στα χωροχρονικά δεδομένα ανά τύπο, κατά την αρχική παρουσίαση των δεδομένων ST. Στη συνέχεια περιγράφονται τα στιγμιότυπα δεδομένων ανά είδος και οι ομοιότητες μεταξύ των περιπτώσεων. Παρουσιάζουμε μεθόδους, εισάγοντας την ομαδοποίηση, τις δυναμικές συστάδες ST, την προγνωστική μάθηση, τη συχνότητα εξόρυξης προτύπων και την εμφάνιση προτύπων, και προβλήματα όπως η ανίχνευση ανωμαλιών, ο προσδιορισμός χρονικών σημείων αλλαγών στη συμπεριφορά του παρατηρούμενου αντικειμένου και η ανάπτυξη σχέσεων μεταξύ τους. Περιγράφουμε την εφαρμογή των δεδομένων ST σε διάφορους τομείς σήμερα, καθώς και τη μελλοντική εργασία. Στόχος είναι η εξαγωγή των συμπερασμάτων μας, σχετικά με την αναπαράσταση και μελέτη των χωροχρονικών δεδομένων που μπορούν, σε συνδυασμό με άλλες ιδιότητες που συνοδεύουν όλα τα φυσικά φαινόμενα, μέσω της κατάλληλης επεξεργασίας τους, να οδηγήσουν σε ασφαλή συμπεράσματα σχετικά με τη μελέτη προβλημάτων, αλλά και με μεγάλη ακρίβεια στην εξαγωγή προβλέψεων προσδιορίζοντας με ακρίβεια τις μελλοντικές καταστάσεις ενός περιβάλλοντος ή ενός αντικειμένου. Έτσι, η σημασία των χωροχρονικών δεδομένων, και ιδιαίτερα των δεδομένων τύπου γεγονότων, τα καθιστά ιδιαίτερα πολύτιμα σήμερα σε διάφορους επιστημονικούς τομείς, και η εξόρυξή τους αποτελεί μια ιδιαίτερα απαιτητική πρόκληση για το μέλλον.Πιο συγκεκριμένα, ένα γεγονός που λαμβάνει χώρα σε συγκεκριμένη χρονική στιγμή και τοποθεσία είναι ένα γεγονός, το οποίο μπορεί να είναι είτε μετεωρολογικό (χιονόπτωση), κοινωνικό (έγκλημα), φυσικό (σεισμός), πολιτικό (πολιτική αναταραχή), ή ακόμη και ιατρικού χαρακτήρα (πανδημία). Είναι γεγονότα που δεν ανήκουν στο φάσμα των «φυσιολογικών» ή «συνήθων» γεγονότων και έρχονται να αλλάξουν μια δεδομένη κατάσταση. Η πρόβλεψή τους θα ήταν πολύ ωφέλιμη, τόσο στην άμεση και έγκαιρη αντίδρασή τους όσο και στην αποτροπή τους, ειδικά όταν αναφερόμαστε σε γεγονότα με αρνητικές επιπτώσεις στον άνθρωπο, για παράδειγμα στην αποφυγή ενός τροχαίου ατυχήματος, μέσω της πρόληψης. Αυτή είναι η πρόκληση που αντιμετωπίζουν σήμερα οι ερευνητές, οι οποίοι καλούνται να διαχειριστούν και να αναλύσουν έναν τεράστιο όγκο δεδομένων, προκειμένου να σχεδιάσουν εφαρμογές που θα οδηγήσουν σε ασφαλή πρόβλεψη γεγονότων, έχοντας ως πόρους τη χρήση τεχνητής νοημοσύνης και υψηλής υπολογιστικής ισχύος. Παρ' όλα αυτά, έχει σημειωθεί μεγάλη πρόοδος προς αυτή την κατεύθυνση, ωστόσο, η ετερογένεια των δεδομένων εισόδου που καλείται να επεξεργαστεί μια εφαρμογή πρόβλεψης, ως προς τη φύση τους (χωρική, χρονική και σημασιολογική), με τις αντίστοιχες πολύπλοκες εξαρτήσεις μεταξύ τους, αποτελεί σήμερα τη μεγαλύτερη πρόκληση για τους ερευνητές. Για το λόγο αυτό, οι πρώτες εφαρμογές πρόβλεψης ασχολούνται με την επεξεργασία δεδομένων που προέρχονται από συγκεκριμένες, ως προς τον αριθμό και τα χαρακτηριστικά τους, καταστάσεις, ενώ παράλληλα έχουν τη δυνατότητα αυτές οι εφαρμογές να μπορούν να ανταποκριθούν σε διαφορετικές καταστάσεις, π.χ. μια εφαρμογή που ασχολείται με την πρόβλεψη μιας πανδημίας, μπορεί επίσης να αντιμετωπίσει την πρόβλεψη ενός καιρικού φαινομένου, απλώς εισάγοντας ένα διαφορετικό είδος δεδομένων. Σε αυτή τη διατριβή, θα παρουσιάσουμε τις εφαρμογές πρόβλεψης που έχουν σχεδιαστεί μέχρι σήμερα. Κυρίως, θα ασχοληθούμε με τη μελέτη της πρόβλεψης τροχαίων ατυχημάτων. Θα παρουσιάσουμε μοντέλο πρόβλεψης, χρησιμοποιώντας κατηγορική λογική, δημιουργώντας μια Βάση Γνώσεων, χρησιμοποιώντας τον αλγόριθμο Ανάλυσης ως μέθοδο απόδειξης, θα μελετήσουμε και θα αναλύσουμε όλα τα πιθανά σενάρια με διαφορετικές συνθήκες που προκύπτουν κάθε φορά. Πιο αναλυτικά, υλοποιούμε ένα μοντέλο πρόβλεψης τροχαίων ατυχημάτων μέσω χάρτη, στον οποίο ο χρήστης θα ορίζει μια διαδρομή και θα εξάγονται τιμές, όπως οι συντεταγμένες της τοποθεσίας του, η ώρα που επιθυμεί να οδηγήσει, οι καιρικές συνθήκες που επικρατούν και το αν η διαδρομή περιέχει επικίνδυνα σημεία, όπως απότομες στροφές, αλλά και η νηφαλιότητα του οδηγού, δηλαδή αν ο οδηγός έχει καταναλώσει αλκοόλ ή όχι. Αυτές οι τιμές θα εισάγονται και θα ενημερώνουν μια βάση γνώσεων σε ένα αρχείο prolog, κάθε 5 δευτερόλεπτα, και στη συνέχεια, με βάση το περιεχόμενο της βάσης γνώσεων, θα ενημερώνεται ένα αρχείο jpl, εξάγοντας συμπεράσματα χρησιμοποιώντας και εκτελώντας τα απαιτούμενα ερωτήματα. Το μοντέλο επιτρέπει επίσης στον χρήστη να στείλει ένα μήνυμα (email), με ενσωματωμένες τις τρέχουσες συντεταγμένες του οχήματος, σε μια εταιρεία οδικής βοήθειας για άμεση βοήθεια, σε περίπτωση ατυχήματος.Τα σημαντικότερα πλεονεκτήματα του μοντέλου μας είναι ότι δεν απαιτεί μεγάλη υπολογιστική ισχύ ή μεγάλο όγκο δεδομένων (big data) και αποδίδει ιδιαίτερα υψηλά ποσοστά επιτυχίας.
περισσότερα
Περίληψη σε άλλη γλώσσα
Many scientific fields show great interest in the extraction and processing of spatiotemporal data, such as medicine with an emphasis on epidemiology and neurology, geology, social sciences, meteorology, and a great interest is also observed in the study of transport. Spatiotemporal data differ significantly from spatial data, since spatiotemporal data refer to measurements, which take into account both the place and the time in which they are received, with their respective characteristics, while spatial data refer to and describe information related only to place. The innovation brought about by spatiotemporal data mining has caused a revolution in many scientific fields, and this is because through it we can now provide solutions and answers to complex problems, as well as provide useful and valuable predictions, through predictive learning. However, combining time and place in data mining presents significant challenges and difficulties that must be overcome. Spatiotemporal data mi ...
Many scientific fields show great interest in the extraction and processing of spatiotemporal data, such as medicine with an emphasis on epidemiology and neurology, geology, social sciences, meteorology, and a great interest is also observed in the study of transport. Spatiotemporal data differ significantly from spatial data, since spatiotemporal data refer to measurements, which take into account both the place and the time in which they are received, with their respective characteristics, while spatial data refer to and describe information related only to place. The innovation brought about by spatiotemporal data mining has caused a revolution in many scientific fields, and this is because through it we can now provide solutions and answers to complex problems, as well as provide useful and valuable predictions, through predictive learning. However, combining time and place in data mining presents significant challenges and difficulties that must be overcome. Spatiotemporal data mining and analysis is a relatively new approach to data mining which has been studied more systematically in the last decade. The purpose of this dissertation is to provide a good introduction to spatiotemporal data, and through this detailed description, we attempt to introduce description logic and gain a complete knowledge of these data. We aim to introduce a new way of describing them, aiming for future studies, by combining the expressions that arise by type of data, using description logic, with new expressions, that can be derived, to describe future states of objects and environments with great precision, providing accurate predictions. In order to highlight the value of spatiotemporal data, we proceed to give a brief description of ST data in the introduction, but we also make special reference to the prediction of events and more specifically traffic accidents. We describe the relevant work carried out to date, the types of spatiotemporal (ST) data, their properties and the transformations that can be made between them, attempting, to a small extent, to introduce constraints and rules using description logic, introducing description logic into spatiotemporal data by type, when initially presenting the ST data. The data snapshots by species and similarities between the cases are then described. We present methods, introducing clustering, dynamic ST clusters, predictive learning, pattern mining frequency, and pattern emergence, and problems such as anomaly detection, identifying time points of changes in the behavior of the observed object, and development of relationships between them. We describe the application of ST data in various fields today, as well as the future work. The goal is to export our conclusions, about the representation and study of spatiotemporal data can, in combination with other properties which accompany all natural phenomena, through their appropriate processing, lead to safe conclusions regarding the study of problems, and also with great precision in the extraction of predictions by accurately determining future states of an environment or an object. Thus, the importance of ST data, especially ST data of type events, makes them particularly valuable today in various scientific fields, and their extraction is a particularly demanding challenge for the future.Μore specifically, an event that takes place at a specific time and location is an event, which can be either weather-related (snowfall), social (crime), natural (earthquake), political (political unrest), or even medical in nature (pandemic). They are events that do not belong to the spectrum of "normal" or "usual" events and come to change a given situation. Their prediction would be very beneficial, both in their immediate and timely response and in their avoidance, especially when we refer to events with negative impacts on humans, for example avoiding a traffic accident, through prevention. This is currently a challenge for researchers, who are called upon to manage and analyze a huge volume of data, in order to design applications that will lead to safe prediction of events, having as resources the use of artificial intelligence and high computing power. Nevertheless, great progress has been made in this direction, however, the heterogeneity of the input data that a forecasting application is called upon to process, in terms of their nature (spatial, temporal and semantic), with the corresponding complex dependencies between them, constitutes today the greatest challenge for researchers. For this reason, the first forecasting applications deal with the processing of data that come from specific, in terms of their number and characteristics, situations, while at the same time having the possibility that these applications can respond to different situations e.g. an application that deals with the prediction of a pandemic, can also cope with the prediction of a weather phenomenon, simply by introducing a different type of data. In this dissertation, we will present the forecasting applications that have been designed to date. Mainly, we will deal with the study of traffic accident prediction. We will present a prediction model, using description logic, creating a Knowledge Base, using the Analysis algorithm as a proof method, we will study and analyze all possible scenarios with different conditions that arise each time. More specifically, we implement a map-based traffic accident prediction model, in which the user will define a route and values will be extracted, such as the coordinates of his location, the time he wishes to drive, the prevailing weather conditions and whether the route contains dangerous points, such as sharp turns, as well as the driver's sobriety, i.e. whether the driver has consumed alcohol or not. These values will be entered and updated in a knowledge base in a prolog file, every 5 seconds, and then, based on the content of the knowledge base, a jpl file will be updated, extracting conclusions using and executing the required queries. The model also allows the user to send a message (email), with the current coordinates of the vehicle (auto-completed), to a roadside assistance company for immediate assistance, in case of an accident. The most important advantages of our model are that does not require much computing power or a large volume of data (big data) and yields particularly high success rates.
περισσότερα