Συνδυάζοντας δομημένη γνώση και αναπαραστάσεις οδηγούμενες από δεδομένα για την αναγνώριση των καταστάσεων αντικειμένων

Περίληψη

Η παρούσα διατριβή εξετάζει το πρόβλημα της Ταξινόμησης Καταστάσεων Αντικειμένων (ΤΚΑ), εστιάζοντας στις προκλήσεις της αναγνώρισης καταστάσεων αντικειμένων σε εικόνες. Εξετάζουμε την ενσωμάτωση συμβολικής γνώσης από Γράφους Γνώσης (ΓΓ) με μάθηση βασισμένη σε δεδομένα από Γράφους Νευρωνικών Δικτύων (ΓΝΔ) για την ενίσχυση της απόδοσης και των δυνατοτήτων γενίκευσης των μοντέλων ΤΚΑ, ιδιαίτερα σε περιπτώσεις μάθησης χωρίς δείγματα. Η βασική μας συνεισφορά έγκειται στην ανάπτυξη μια καινοτόμου προσέγγισης για Ταξινόμηση Καταστάσεων Μηδενικού Δείγματος Ανεξάρτητης από την Αναγνώριση Αντικειμένων που αξιοποιεί τους ΓΓ για την κωδικοποίηση γνώσης κοινής λογικής και χρησιμοποιεί ΓΝΔ για την εκμάθηση εκφραστικών ενσωματώσεων που αποτυπώνουν πλούσιες σημασιολογικές πληροφορίες. Καθοριστικό χαρακτηριστικό της μεθόδου είναι ότι λειτουργεί χωρίς να βασίζεται σε ρητή αναγνώριση αντικειμένων, γνώρισμα που την καθιστά την ανθεκτική σε διακυμάνσεις εμφάνισης και εφαρμόσιμη σε σενάρια όπου η αναγνώ ...
περισσότερα

Περίληψη σε άλλη γλώσσα

This dissertation investigates the task of Object State Classification (OSC) addressing the challenges of recognizing object states in images. We integrate symbolic knowledge from Knowledge Graphs (KGs) with data-driven Graph Neural Networks (GNNs) to enhance OSC performance and generalization capabilities, particularly in zero-shot learning scenarios. Our core contribution is a novel approach to Object-agnostic Zero-Shot State Classification that leverages KGs to encode commonsense knowledge and employs GNNs to learn expressive embeddings capturing rich semantic information. Crucially, our method operates without relying on explicit object recognition, increasing robustness to appearance variations and applicability in scenarios where object recognition may be unreliable. Through extensive experiments on four benchmark datasets, we demonstrate our method's effectiveness in recognizing unseen state classes, achieving significant improvements over baseline approaches and state-of-the-ar ...
περισσότερα

Όλα τα τεκμήρια στο ΕΑΔΔ προστατεύονται από πνευματικά δικαιώματα.

DOI
10.12681/eadd/58987
Διεύθυνση Handle
http://hdl.handle.net/10442/hedi/58987
ND
58987
Εναλλακτικός τίτλος
Combining structured knowledge and data-driven representations for object states classification
Συγγραφέας
Γουΐδης, Φίλιππος (Πατρώνυμο: Εμμανουήλ)
Ημερομηνία
01/2025
Ίδρυμα
Πανεπιστήμιο Κρήτης. Σχολή Θετικών και Τεχνολογικών Επιστημών. Τμήμα Επιστήμης Υπολογιστών
Εξεταστική επιτροπή
Πλεξουσάκης Δημήτριος
Αργυρός Αντώνιος
Φλουρής Γεώργιος
Τραχανιάς Παναγιώτης
Πάτκος Θεόδωρος
Κομοντάκης Νικόλαος
Παλιούρας Γεώργιος
Επιστημονικό πεδίο
Φυσικές ΕπιστήμεςΕπιστήμη Ηλεκτρονικών Υπολογιστών και Πληροφορική ➨ Τεχνητή νοημοσύνη
Λέξεις-κλειδιά
Ταξινόμηση Καταστάσεων Αντικειμένων; Μηδενική Μάθηση; Γράφοι γνώσης; Νευρωνικά ∆ίκτυα Γράφων; Νευροσυμβολική απαρτίωση; Μεγάλα γλωσσικά μοντέλα; Εκμάθηση Μεταμονοπατιών
Χώρα
Ελλάδα
Γλώσσα
Αγγλικά
Άλλα στοιχεία
εικ., πιν., γραφ.
Στατιστικά χρήσης
ΠΡΟΒΟΛΕΣ
Αφορά στις μοναδικές επισκέψεις της διδακτορικής διατριβής για την χρονική περίοδο 07/2018 - 07/2023.
Πηγή: Google Analytics.
ΞΕΦΥΛΛΙΣΜΑΤΑ
Αφορά στο άνοιγμα του online αναγνώστη για την χρονική περίοδο 07/2018 - 07/2023.
Πηγή: Google Analytics.
ΜΕΤΑΦΟΡΤΩΣΕΙΣ
Αφορά στο σύνολο των μεταφορτώσων του αρχείου της διδακτορικής διατριβής.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.
ΧΡΗΣΤΕΣ
Αφορά στους συνδεδεμένους στο σύστημα χρήστες οι οποίοι έχουν αλληλεπιδράσει με τη διδακτορική διατριβή. Ως επί το πλείστον, αφορά τις μεταφορτώσεις.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.