Βαθιά μάθηση για ρομποτική όραση/αντίληψη

Περίληψη

Στην παρούσα διδακτορική διατριβή μελετήθηκαν μεθοδολογίες βαθιάς μάθησης για την ανάπτυξη αποδοτικών συστημάτων ρομποτικής όρασης, μεγαλύτερης ακρίβειας και ευρωστίας, τα οποία είναι κατάλληλα για ρομποτικές εφαρμογές. Αυτά τα συστήματα μπορούν να διευκολύνουν τα ρομπότ να αντιμετωπίζουν ένα ευρύ φάσμα προβλημάτων οπτικής ανάλυσης που είναι απαραίτητα για την αποτελεσματικότερη ερμηνεία του περιβάλλοντός τους, αυξάνοντας έτσι τον βαθμό αυτονομίας τους και την αξιοπιστία τους. Πιο συγκεκριμένα, η παρουσιαζόμενη έρευνα αφορά τα προβλήματα της εκτίμησης στάσης αντικειμένου, της δισδιάστατης εκτίμησης ανθρώπινης στάσης σώματος/σκελετού, της σημασιολογικής κατάτμησης εικόνας και της εκτίμησης βάθους. Οι κύριες συνεισφορές αυτής της διατριβής στο πρόβλημα της εκτίμησης στάσης αντικειμένου είναι δύο. Αρχικά, προτείνεται μια συνάρτηση κόστους με πολλαπλούς στόχους για την εκπαίδευση ενός γρήγορου συνελικτικού δικτύου (Convolutional Neural Network - CNN) ως εξαγωγέα χαρακτηριστικών εικόνας, η ...
περισσότερα

Περίληψη σε άλλη γλώσσα

This dissertation studies deep learning methodologies for facilitating the development of accurate, efficient, and robust robotic visual perception systems. Such systems can enable robots to perform a wide range of visual analysis tasks, that are necessary to interpret their environment, more effectively, thus increasing their operational autonomy and reliability. More specifically, the presented research addresses the problems of object pose estimation, 2D human pose/skeleton estimation, semantic image segmentation, and depth estimation. The main contributions to the problem of object pose estimation are two-fold. First, a multi-objective loss function for training a fast and lightweight Convolutional Neural Network (CNN) as an image feature extractor is proposed, which is based on unit quaternions and allows the CNN to learn 3D pose descriptors from which 3D object poses can be accurately estimated. Second, it is shown that the 3D object pose estimation problem is easier to solve for ...
περισσότερα
Η διατριβή είναι δεσμευμένη από τον συγγραφέα  (μέχρι και: 11/2024)
DOI
10.12681/eadd/53772
Διεύθυνση Handle
http://hdl.handle.net/10442/hedi/53772
ND
53772
Εναλλακτικός τίτλος
Deep learning for robotic visual perception
Συγγραφέας
Παπαϊωαννίδης, Χρήστος (Πατρώνυμο: Παναγιώτης)
Ημερομηνία
2023
Ίδρυμα
Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης (ΑΠΘ). Σχολή Θετικών Επιστημών. Τμήμα Πληροφορικής
Εξεταστική επιτροπή
Πήτας Ιωάννης
Κοτρόπουλος Κωνσταντίνος
Νικολαΐδης Νικόλαος
Τέφας Αναστάσιος
Τσουμάκας Γρηγόριος
Κομπατσιάρης Ιωάννης
Λύκας Αριστείδης
Επιστημονικό πεδίο
Φυσικές ΕπιστήμεςΕπιστήμη Ηλεκτρονικών Υπολογιστών και Πληροφορική ➨ Τεχνητή νοημοσύνη
Επιστήμες Μηχανικού και ΤεχνολογίαΕπιστήμη Ηλεκτρολόγου Μηχανικού, Ηλεκτρονικού Μηχανικού, Μηχανικού Η/Υ ➨ Ρομποτική
Λέξεις-κλειδιά
Συνελικτικά νευρωνικά δίκτυα; Βαθιά μάθηση; Υπολογιστική όραση; Ρομποτική
Χώρα
Ελλάδα
Γλώσσα
Αγγλικά
Άλλα στοιχεία
εικ., πιν., σχημ.
Στατιστικά χρήσης
ΠΡΟΒΟΛΕΣ
Αφορά στις μοναδικές επισκέψεις της διδακτορικής διατριβής για την χρονική περίοδο 07/2018 - 07/2023.
Πηγή: Google Analytics.
ΞΕΦΥΛΛΙΣΜΑΤΑ
Αφορά στο άνοιγμα του online αναγνώστη για την χρονική περίοδο 07/2018 - 07/2023.
Πηγή: Google Analytics.
ΜΕΤΑΦΟΡΤΩΣΕΙΣ
Αφορά στο σύνολο των μεταφορτώσων του αρχείου της διδακτορικής διατριβής.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.
ΧΡΗΣΤΕΣ
Αφορά στους συνδεδεμένους στο σύστημα χρήστες οι οποίοι έχουν αλληλεπιδράσει με τη διδακτορική διατριβή. Ως επί το πλείστον, αφορά τις μεταφορτώσεις.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.