Περίληψη
Η συμβολική αναγνώριση γεγονότων συχνά βασίζεται σε μια βάση γνώσης, η οποία περιέχει κανόνες εκφρασμένους σε λογική πρώτης τάξης, και χρησιμοποιείται για την αναγνώριση γεγονότων σε ροές δεδομένων. Τέτοια λογικά συστήματα αναγνώρισης γεγονότων προσφέρουν εύρωστο χρονικό συμπερασμό και επιτρέπουν την αυτόματη κατασκευή κανόνων με τη χρήση Επαγωγικού Λογικού Προγραμματισμού. Παρότι οι υπάρχουσες μέθοδοι για την εκμάθηση σχεσιακών δομών διευκολύνουν την εύρεση τέτοιων κανόνων σε θορυβώδεις ροές δεδομένων, υποθέτουν ότι τα δεδομένα εκμάθησης είναι πλήρως επισημειωμένα, πράγμα το οποίο είναι μη ρεαλιστικό σε πραγματικές εφαρμογές. Σε αυτή τη διατριβή επιχειρούμε να αντιμετωπίσουμε το πρόβλημα της κλιμακούμενης ημί-επιπλεπόμενης μάθησης για αναγνώριση γεγονότων. Προτείνουμε δύο καινούργιες τεχνικές για να συμπεραίνουμε τις απούσες επισημειώσεις στα δεδομένα εκπαίδευσης και να μαθαίνουμε κανόνες εκφρασμένους σε Λογισμό Γεγονότων. Το SPLICE είναι ένα σύστημα το οποίο χρησιμοποιεί γράφους για ...
Η συμβολική αναγνώριση γεγονότων συχνά βασίζεται σε μια βάση γνώσης, η οποία περιέχει κανόνες εκφρασμένους σε λογική πρώτης τάξης, και χρησιμοποιείται για την αναγνώριση γεγονότων σε ροές δεδομένων. Τέτοια λογικά συστήματα αναγνώρισης γεγονότων προσφέρουν εύρωστο χρονικό συμπερασμό και επιτρέπουν την αυτόματη κατασκευή κανόνων με τη χρήση Επαγωγικού Λογικού Προγραμματισμού. Παρότι οι υπάρχουσες μέθοδοι για την εκμάθηση σχεσιακών δομών διευκολύνουν την εύρεση τέτοιων κανόνων σε θορυβώδεις ροές δεδομένων, υποθέτουν ότι τα δεδομένα εκμάθησης είναι πλήρως επισημειωμένα, πράγμα το οποίο είναι μη ρεαλιστικό σε πραγματικές εφαρμογές. Σε αυτή τη διατριβή επιχειρούμε να αντιμετωπίσουμε το πρόβλημα της κλιμακούμενης ημί-επιπλεπόμενης μάθησης για αναγνώριση γεγονότων. Προτείνουμε δύο καινούργιες τεχνικές για να συμπεραίνουμε τις απούσες επισημειώσεις στα δεδομένα εκπαίδευσης και να μαθαίνουμε κανόνες εκφρασμένους σε Λογισμό Γεγονότων. Το SPLICE είναι ένα σύστημα το οποίο χρησιμοποιεί γράφους για να εξάγει επισημειώσεις για τα μη-επισημειωμένα δεδομένα με βάση τις αποστάσεις τους από τα αντίστοιχα επισημειωμένα. Για να εφαρμόσουμε τη μέθοδο αυτή σε λογική πρώτης τάξης, χρησιμοποιούμε μια απόσταση για σχεσιακές δομές η οποία μετράει την απόσταση μεταξύ λογικών ατόμων. Η διαδικασία της επισημείωσης των δεδομένων γίνεται σε ένα πέρασμα με χρήση ενός μηχανισμού μνήμης και του Hoeffding bound για να φιλτράρουμε αντικρουόμενα παραδείγματα. Παρόλα αυτά το SPLICE, βασίζεται σημαντικά στη μετρική που υπολογίζει τις αποστάσεις μεταξύ των λογικών ατόμων. Επιπλέον, δεν υπάρχει καμία εγγύηση για την ποιότητα των λύσεων στους τοπικούς γράφους που κατασκευάζονται από τη ροή δεδομένων. Συνεπώς, προτείνουμε μια δεύτερη μέθοδο, το SPLICE+, η οποία χρησιμοποιεί μια υβριδική απόσταση που συνδυάζει μια βελτιστοποιημένη απόσταση σχεσιακών δομών και μια απόσταση που βασίζεται στη μάζα των δεδομένων. Η πρώτη καθοδηγείται από μια επιλογή χαρακτηριστικών, ενώ η δεύτερη στην εκτίμηση της μάζα των δεδομένων. Επιπλέον, το SPLICE+ βελτιώνει την κατασκευή του γράφου με το να αποθηκεύει μια σύνοψη του παρελθόντος ώστε να πετύχει καλύτερες επισημειώσεις στους τοπικούς γράφους. Αξιολογούμε τις μεθόδους μας σε εφαρμογές σύνθετης αναγνώρισης γεγονότων χρησιμοποιώντας ένα σύνολο δεδομένων για αναγνώριση ανθρώπινων δραστηριοτήτων, ένα για αναγνώριση ναυτιλιακών συμβάντων και ένα για τη διαχείριση εμπορικών οχημάτων.
περισσότερα
Περίληψη σε άλλη γλώσσα
Symbolic event recognition systems often rely on knowledge bases of event definitions, expressed in first-order logic, to detect event occurrences over time. Logical frameworks for representing and reasoning about events provide robust temporal reasoning and enable the automated discovery of event rules via Inductive Logic Programming (ILP). Although existing structure learning approaches ease the discovery of such rules in noisy data streams, they assume the existence of fully-labelled training sequences, which is unrealistic for most real-life applications. In this thesis we address the issue of scalable semi-supervised learning for event recognition. We propose two novel techniques for inferring the missing supervision on training sequences and enable learning event rules in the Event Calculus. First, we propose SPLICE, a framework that employs a graph-based method to derive labels for unlabelled data, based on their distance to their labelled counterparts. In order to adapt the gra ...
Symbolic event recognition systems often rely on knowledge bases of event definitions, expressed in first-order logic, to detect event occurrences over time. Logical frameworks for representing and reasoning about events provide robust temporal reasoning and enable the automated discovery of event rules via Inductive Logic Programming (ILP). Although existing structure learning approaches ease the discovery of such rules in noisy data streams, they assume the existence of fully-labelled training sequences, which is unrealistic for most real-life applications. In this thesis we address the issue of scalable semi-supervised learning for event recognition. We propose two novel techniques for inferring the missing supervision on training sequences and enable learning event rules in the Event Calculus. First, we propose SPLICE, a framework that employs a graph-based method to derive labels for unlabelled data, based on their distance to their labelled counterparts. In order to adapt the graph-based method to first-order logic, we use a suitable structural distance for measuring the distance between sets of logical atoms. The labelling process is achieved online (single-pass) by means of a caching mechanism and the Hoeffding bound for filtering contradicting examples. However, SPLICE labelling may be compromised since its structural measure is agnostic of the feature semantics. Moreover, there is no guarantee about the quality of the labelling found in the local graphs that are built as the data stream in. To that end, we also propose SPLICE+, a second method that improves upon SPLICE by employing a hybrid measure combining an optimised structural distance, and a data-driven one. The former is guided by feature selection, while the latter is a mass-based dissimilarity. In addition, SPLICE+ improves the graph construction process, by storing a synopsis of the past, in order to achieve more informed labelling on the local graphs. We evaluate our approach on the task of complex event recognition by using a benchmark dataset for human activity recognition, a dataset for maritime monitoring, as well as a dataset for fleet management.
περισσότερα