Μέθοδοι βαθιάς ενισχυτικής μάθησης

Περίληψη

Το αντικείμενο της παρούσας διατριβής είναι οι μέθοδοι Βαθιάς Ενισχυτικής Μάθησης (Deep Reinforcement Learning). Η διατριβή εξερευνά υπάρχουσες τεχνικές Βαθιάς Ενισχυτικής Μάθησης, ενώ επίσης παρουσιάζει νέες, οι οποίες έχουν βελτιωμένες επιδόσεις σε κοινά περιβάλλοντα αξιολόγησης σε σύγκριση με μεθόδους αιχμής της σχετικής βιβλιογραφίας, ενώ ταυτόχρονα βελτιώνουν συγκεκριμένες πτυχές τους, και πιο συγκεκριμένα, τη δειγματική αποδοτικότητα (sample-efficiency) και την ικανότητα γενίκευσης (generalization). Τέλος, παρουσιάζονται διάφορες εφαρμογές τεχνικών Μηχανικής Μάθησης σε παιχνίδια.

Περίληψη σε άλλη γλώσσα

This thesis focuses on Deep Reinforcement Learning (Deep RL) methods and their applications in games. It provides an in-depth analysis of existing state-of-the-art Deep RL methods and introduces novel techniques based on the concept of meta-RL for achieving high performance with improved sample-efficiency. Along with the theoretical foundations of Machine Learning (ML) and RL, game AI applications are also considered. This chapter summarizes the presented contributions and discusses future directions of the work on current open issues in the field. Τhe first contribution of this thesis includes a comprehensive overview of Deep RL and state-of-the-art algorithms that have achieved impressive results on various platforms and environments. The analysis delves deeply into these models, offering valuable insights and proposing new implementations that combine core Deep RL algorithms with different host algorithms. The functionalities and properties of each algorithm are also thoroughly exam ...
περισσότερα

Όλα τα τεκμήρια στο ΕΑΔΔ προστατεύονται από πνευματικά δικαιώματα.

DOI
10.12681/eadd/54399
Διεύθυνση Handle
http://hdl.handle.net/10442/hedi/54399
ND
54399
Εναλλακτικός τίτλος
Deep reinforcement learning methods
Συγγραφέας
Λαζαρίδης, Αριστοτέλης (Πατρώνυμο: Λάζαρος)
Ημερομηνία
2023
Ίδρυμα
Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης (ΑΠΘ). Σχολή Θετικών Επιστημών. Τμήμα Πληροφορικής
Εξεταστική επιτροπή
Βλαχάβας Ιωάννης
Τσουμάκας Γρηγόριος
Βράκας Δημήτριος
Τέφας Αναστάσιος
Βούρος Γεώργιος
Μπλέκας Κωνσταντίνος
Νικολαΐδης Νικόλαος
Επιστημονικό πεδίο
Φυσικές ΕπιστήμεςΕπιστήμη Ηλεκτρονικών Υπολογιστών και Πληροφορική ➨ Τεχνητή νοημοσύνη
Φυσικές ΕπιστήμεςΜαθηματικά ➨ Στατιστική και Πιθανότητες
Λέξεις-κλειδιά
Βαθιά ενισχυτική μάθηση; Μηχανική μάθηση; Τεχνητή νοημοσύνη; Παιχνίδια
Χώρα
Ελλάδα
Γλώσσα
Αγγλικά
Άλλα στοιχεία
εικ., πιν., σχημ., γραφ.
Στατιστικά χρήσης
ΠΡΟΒΟΛΕΣ
Αφορά στις μοναδικές επισκέψεις της διδακτορικής διατριβής για την χρονική περίοδο 07/2018 - 07/2023.
Πηγή: Google Analytics.
ΞΕΦΥΛΛΙΣΜΑΤΑ
Αφορά στο άνοιγμα του online αναγνώστη για την χρονική περίοδο 07/2018 - 07/2023.
Πηγή: Google Analytics.
ΜΕΤΑΦΟΡΤΩΣΕΙΣ
Αφορά στο σύνολο των μεταφορτώσων του αρχείου της διδακτορικής διατριβής.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.
ΧΡΗΣΤΕΣ
Αφορά στους συνδεδεμένους στο σύστημα χρήστες οι οποίοι έχουν αλληλεπιδράσει με τη διδακτορική διατριβή. Ως επί το πλείστον, αφορά τις μεταφορτώσεις.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.