Deep learning for robotic visual perception

Στην παρούσα διδακτορική διατριβή μελετήθηκαν μεθοδολογίες βαθιάς μάθησης για την ανάπτυξη αποδοτικών συστημάτων ρομποτικής όρασης, μεγαλύτερης ακρίβειας και ευρωστίας, τα οποία είναι κατάλληλα για ρομποτικές εφαρμογές. Αυτά τα συστήματα μπορούν να διευκολύνουν τα ρομπότ να αντιμετωπίζουν ένα ευρύ φάσμα προβλημάτων οπτικής ανάλυσης που είναι απαραίτητα για την αποτελεσματικότερη ερμηνεία του περιβάλλοντός τους, αυξάνοντας έτσι τον βαθμό αυτονομίας τους και την αξιοπιστία τους. Πιο συγκεκριμένα, η παρουσιαζόμενη έρευνα αφορά τα προβλήματα της εκτίμησης στάσης αντικειμένου, της δισδιάστατης εκτίμησης ανθρώπινης στάσης σώματος/σκελετού, της σημασιολογικής κατάτμησης εικόνας και της εκτίμησης βάθους. Οι κύριες συνεισφορές αυτής της διατριβής στο πρόβλημα της εκτίμησης στάσης αντικειμένου είναι δύο. Αρχικά, προτείνεται μια συνάρτηση κόστους με πολλαπλούς στόχους για την εκπαίδευση ενός γρήγορου συνελικτικού δικτύου (Convolutional Neural Network - CNN) ως εξαγωγέα χαρακτηριστικών εικόνας, η οποία βασίζεται στα μoναδιαία τετραδόνια και επιτρέπει στο συνελικτικό δίκτυο να εξάγει περιγραφείς τρισδιάστατης στάσης αντικειμένου από τους οποίους μπορούν να εκτιμηθούν με ακρίβεια οι πραγματικές τριδιάστατες στάσεις αντικειμένων. Δεύτερον, δεικνύεται ότι το πρόβλημα εκτίμησης τρισδιάστατης στάσης αντικειμένου μπορεί να λυθεί πιο εύκολα για συνθετικές εικόνες, παρά για φυσικές εικόνες. Επιπλέον, προτείνεται μια καινοτόμος μέθοδος εκτίμησης τρισδιάστατης στάσης αντικειμένου που αποτελείται από δύο στάδια και εκμεταλλεύεται αυτήν την ιδιότητα. Όσον αφορά το πρόβλημα εκτίμησης της δισδιάστατης ανθρώπινης στάσης σώματος/σκελετού από εικόνες, προτείνεται μια καινοτόμος αρχιτεκτονική συνελικτικού δικτύου, η οποία έχει ως στόχο την επίτευξη ισορροπίας μεταξύ της εκτίμησης δισδιάστατης ανθρώπινης στάσης σώματος/σκελετού με υψηλή ακρίβεια και της γρήγορης παραγωγής προβλέψεων. Τέλος, όσον αφορά τα προβλήματα της σημασιολογικής κατάτμησης εικόνας και της εκτίμησης βάθους, προτείνεται μια μέθοδος για τη βελτίωση της απόδοσης των συνελικτικών δικτύων μέσω του συνδυασμού διαφορετικών μεθοδολογιών μάθησης/εκπαίδευσης (επιβλεπόμενη και αντιπαραθετική μάθηση). Επιπροσθέτως, η προτεινόμενη μέθοδος αποτελεί μια γενική μέθοδο που μπορεί να χρησιμοποιηθεί για την βελτίωση της ακρίβειας των συνελικτικών δικτύων σε προβλήματα επιβλεπόμενης πυκνής πρόβλεψης σε εικόνες (όπου απαιτούνται εκτιμήσεις σε επίπεδο εικονοστοιχείου), απαιτώντας ελάχιστες μόνο τροποποιήσεις για την προσαρμογή της σε νέα προβλήματα πυκνής πρόβλεψης σε εικόνες.

περισσότερα

Περίληψη σε άλλη γλώσσα

This dissertation studies deep learning methodologies for facilitating the development of accurate, efficient, and robust robotic visual perception systems. Such systems can enable robots to perform a wide range of visual analysis tasks, that are necessary to interpret their environment, more effectively, thus increasing their operational autonomy and reliability. More specifically, the presented research addresses the problems of object pose estimation, 2D human pose/skeleton estimation, semantic image segmentation, and depth estimation. The main contributions to the problem of object pose estimation are two-fold. First, a multi-objective loss function for training a fast and lightweight Convolutional Neural Network (CNN) as an image feature extractor is proposed, which is based on unit quaternions and allows the CNN to learn 3D pose descriptors from which 3D object poses can be accurately estimated. Second, it is shown that the 3D object pose estimation problem is easier to solve for ...

περισσότερα

Διαβάστε τη διατριβή (Online)

Κατεβάστε τη διατριβή σε μορφή PDF (5.59 MB) (Η υπηρεσία είναι διαθέσιμη μετά από δωρεάν εγγραφή)

Όλα τα τεκμήρια στο ΕΑΔΔ προστατεύονται από πνευματικά δικαιώματα.

DOI	10.12681/eadd/53772
Διεύθυνση Handle	http://hdl.handle.net/10442/hedi/53772
ND	53772
Εναλλακτικός τίτλος	Deep learning for robotic visual perception
Συγγραφέας	Παπαϊωαννίδης, Χρήστος (Πατρώνυμο: Παναγιώτης)
Ημερομηνία	2023
Ίδρυμα	Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης (ΑΠΘ). Σχολή Θετικών Επιστημών. Τμήμα Πληροφορικής
Εξεταστική επιτροπή	Πήτας Ιωάννης Κοτρόπουλος Κωνσταντίνος Νικολαΐδης Νικόλαος Τέφας Αναστάσιος Τσουμάκας Γρηγόριος Κομπατσιάρης Ιωάννης Λύκας Αριστείδης
Επιστημονικό πεδίο	Φυσικές Επιστήμες ➨ Επιστήμη Ηλεκτρονικών Υπολογιστών και Πληροφορική ➨ Τεχνητή νοημοσύνη Επιστήμες Μηχανικού και Τεχνολογία ➨ Επιστήμη Ηλεκτρολόγου Μηχανικού, Ηλεκτρονικού Μηχανικού, Μηχανικού Η/Υ ➨ Ρομποτική
Λέξεις-κλειδιά	Συνελικτικά νευρωνικά δίκτυα; Βαθιά μάθηση; Υπολογιστική όραση; Ρομποτική
Χώρα	Ελλάδα
Γλώσσα	Αγγλικά
Άλλα στοιχεία	εικ., πιν., σχημ.

Στατιστικά χρήσης

ΠΡΟΒΟΛΕΣ

Αφορά στις μοναδικές επισκέψεις της διδακτορικής διατριβής για την χρονική περίοδο 07/2018 - 07/2023.
Πηγή: Google Analytics.

ΞΕΦΥΛΛΙΣΜΑΤΑ

Αφορά στο άνοιγμα του online αναγνώστη για την χρονική περίοδο 07/2018 - 07/2023.
Πηγή: Google Analytics.

ΜΕΤΑΦΟΡΤΩΣΕΙΣ

Αφορά στο σύνολο των μεταφορτώσων του αρχείου της διδακτορικής διατριβής.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.

ΧΡΗΣΤΕΣ

Αφορά στους συνδεδεμένους στο σύστημα χρήστες οι οποίοι έχουν αλληλεπιδράσει με τη διδακτορική διατριβή. Ως επί το πλείστον, αφορά τις μεταφορτώσεις.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.

Σχετικές εγγραφές (με βάση τις επισκέψεις των χρηστών)

Το στοιχείο της βίας στο σύγχρονο αμερικάνικο κινηματογράφο (1992-2007)

Η βία στο σύγχρονο γαλλικό θέατρο: το παράδειγμα του Κολτές

Η ΚΟΙΝΩΝΙΚΗ ΘΕΣΗ ΤΩΝ ΓΥΝΑΙΚΩΝ ΣΤΟ ΕΡΓΟ ΤΟΥ Α. ΠΑΠΑΔΙΑΜΑΝΤΗ

Ο ηθικός λόγος στη ρητορική του Αριστοτέλη: διδακτική προσέγγιση στην εκπαιδευτική αγωγή και διαμεσολάβηση

Kant και Wittgenstein: από την κριτική της γνώσης στην κριτική του νοήματος

Η ψηφιακή αφήγηση (digital storytelling) ως διδακτικό εργαλείο στο μάθημα της λογοτεχνίας

Το εθνογραφικό στοιχείο στην σύγχρονη δημιουργική φωτογραφία

Ουσία και μορφή στον κινηματογράφο

Πορτρέτα κοσμικών δωρητών στην εντοίχια ζωγραφική του Αγίου Όρους (14ος-αρχές 16ου αιώνα): η ιστορική και η ιδεολογική διάσταση της εικονογραφίας του ορθόδοξου ηγεμόνα στο αθωνικό περιβάλλον

Η Επτανησιακή Σχολή ζωγραφικής: αναθεώρηση

"Βαθιά μάθηση για ρομποτική όραση/αντίληψη"
	Πληκτρολογήστε το κείμενο της εικόνας!
Δηλώνω ότι έλαβα γνώση και ανεπιφύλακτα συμφωνώ και αποδέχομαι τους Όρους Χρήσης του Εθνικού Αρχείου Διδακτορικών Διατριβών, καθώς και της .