Βαθιά ενισχυτική μάθηση με έμμεση μίμηση

Περίληψη

Η μάθηση μέσω μίμησης επιτρέπει στους πράκτορες να αποκτούν σύνθετες συμπεριφορές μαθαίνοντας από επιδείξεις ειδικών/εμπειρογνωμόνων, προσφέροντας μια εναλλακτική λύση στην ενισχυτική μάθηση που στηρίζεται στην εξαντλητική (trial and error) μέθοδο. Ωστόσο, οι συμβατικές προσεγγίσεις μάθησης μέσω μίμησης αντιμετωπίζουν κρίσιμους πρακτικούς περιορισμούς που περιορίζουν την εφαρμογή τους στον πραγματικό κόσμο. Τέτοιοι περιορισμοί είναι: η απαίτηση για πλήρεις επιδείξεις κατάστασης με ρητές ετικέτες ενεργειών· η υπόθεση ότι οι επιδείξεις των εμπειρογνωμόνων αντιπροσωπεύουν βέλτιστη συμπεριφορά· και η υπόθεση της ομοιογένειας των ενεργειών μεταξύ εμπειρογνώμονα και εκπαιδευόμενου πράκτορα. Οι περιορισμοί αυτοί δημιουργούν σημαντικά εμπόδια για την μάθηση μέσω μίμησης σε σενάρια στα οποία: η καταγραφή ενεργειών είναι τεχνικά ανέφικτη· απαιτείται η διασφάλιση του απορρήτου των ενεργειών ή η εκμάθηση μέσω μίμησης ενεργειών είναι υπερβολικά δαπανηρή· είναι γνωστό ότι εμπειρογνώμονας δεν επιδεικ ...
περισσότερα

Περίληψη σε άλλη γλώσσα

Imitation learning (IL) enables agents to acquire complex behaviours by learning from expert demonstrations, offering a compelling alternative to pure trial-and-error reinforcement learning. However, conventional imitation learning approaches face critical practical limitations that restrict their real-world applicability: the requirement for complete state-action demonstrations with explicit action labels; the assumption that expert demonstrations represent optimal behaviour; and the assumption of homogeneous expert and trainee agent action spaces. These constraints create substantial barriers in scenarios where action recording is technically infeasible, privacy-sensitive, or prohibitively expensive; where the expert is known to be suboptimal, or optimal performance is undefined or potentially unattainable; and where an expert agent and a trainee agent possess fundamentally different action capabilities.Against this background, this thesis puts forward a novel deep implicit imitation ...
περισσότερα
Η διατριβή είναι δεσμευμένη από τον συγγραφέα  (μέχρι και: 12/2027)
DOI
10.12681/eadd/60483
Διεύθυνση Handle
http://hdl.handle.net/10442/hedi/60483
ND
60483
Εναλλακτικός τίτλος
Deep implicit imitation reinforcement learning
Συγγραφέας
Χρυσομάλλης, Ιάσων (Πατρώνυμο: Σωτήριος)
Ημερομηνία
2025
Ίδρυμα
Πολυτεχνείο Κρήτης. Σχολή Ηλεκτρονικών Μηχανικών και Μηχανικών Υπολογιστών
Εξεταστική επιτροπή
Χαλκιαδάκης Γεώργιος
Λαγουδάκης Μιχαήλ
Παπαμιχαήλ Ιωάννης
Σπυρόπουλος Θρασύβουλος
Παπαγεωργίου Μάρκος
Βούρος Γεώργιος
Castellini Alberto
Επιστημονικό πεδίο
Επιστήμες Μηχανικού και ΤεχνολογίαΕπιστήμη Ηλεκτρολόγου Μηχανικού, Ηλεκτρονικού Μηχανικού, Μηχανικού Η/Υ ➨ Υπολογιστές, Υλικό (hardware) και Αρχιτεκτονική
Λέξεις-κλειδιά
Ενισχυτική μάθηση; Βαθιά μάθηση; Μίμηση
Χώρα
Ελλάδα
Γλώσσα
Αγγλικά
Άλλα στοιχεία
εικ., πιν., σχημ., γραφ.
Στατιστικά χρήσης
ΠΡΟΒΟΛΕΣ
Αφορά στις μοναδικές επισκέψεις της διδακτορικής διατριβής για την χρονική περίοδο 07/2018 - 07/2023.
Πηγή: Google Analytics.
ΞΕΦΥΛΛΙΣΜΑΤΑ
Αφορά στο άνοιγμα του online αναγνώστη για την χρονική περίοδο 07/2018 - 07/2023.
Πηγή: Google Analytics.
ΜΕΤΑΦΟΡΤΩΣΕΙΣ
Αφορά στο σύνολο των μεταφορτώσων του αρχείου της διδακτορικής διατριβής.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.
ΧΡΗΣΤΕΣ
Αφορά στους συνδεδεμένους στο σύστημα χρήστες οι οποίοι έχουν αλληλεπιδράσει με τη διδακτορική διατριβή. Ως επί το πλείστον, αφορά τις μεταφορτώσεις.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.