Λήψη αποφάσεων σε πολυπρακτορικά περιβάλλοντα: εφαρμογή σε παραλλαγές ταβλιού

Περίληψη

Το πρόγραμμα TD-Gammon του Tesauro ήταν η πρώτη μεγάλη επιτυχία της μηχανικής μάθησης και της τεχνητής νοημοσύνης γενικότερα, όταν επέδειξε απόδοση παγκόσμιας κλάσης εναντίον του παγκόσμιου πρωταθλητή του ταβλιού (backgammon) εκείνη την εποχή. Ακόμη, το πιο εντυπωσιακό στοιχείο είναι ότι η χρησιμοποιηθείσα μέθοδος χρειάστηκε ελάχιστη γνώση από εξπέρ του είδους; βασιζόμενη μόνο στο παίξιμο με αντίπαλο τον εαυτό του και στην εκπαίδευση νευρωνικών δικτύων μέσω της ενισχυτικής μάθησης. Παρόλα αυτά, εκτός από το backgammon, υπάρχουν αρκετές ανεξερεύνητες παραλλαγές του ταβλιού που χρησιμοποιούν το ίδιο ταμπλό, αριθμό πουλιών και ζάρια, αλλά έχουν διαφορετικούς κανόνες για την κίνηση των πουλιών, διαφορετική αρχική θέση ή φορά κίνησης.Σε αυτή τη διατριβή επικεντρώνεται η έρευνα σε τρεις πολύ δημοφιλείς παραλλαγές στην Ελλάδα και γειτονικές χώρες, τις "Πόρτες", το "Πλακωτό" και το "Φεύγα", οι οποίες συγκεντρωτικά αποκαλούνται τάβλι. Εμπνεόμενοι από τις επιτυχημένες μεθόδους του TD-Gammon, επε ...
περισσότερα

Περίληψη σε άλλη γλώσσα

Tesauro’s TD-Gammon was the first major success of machine learning and artificial intelligence in general, when it demonstrated world-class performance against the human backgammon champion of that time. Even more impressively, the method used required little expert knowledge, relying on self-playing and training neural networks using reinforcement learning. However, apart from standard backgammon, several – yet unexplored – variants of the game exist, which use the same board, number of checkers and dice, but have different rules for moving the checkers, starting positions or movement direction. In this thesis we focus our research on three such popular variants in Greece and neighboring countries, named Portes, Plakoto, and Fevga (collectively called Tavli). Motivated by the successful methods of TD-Gammon, we extend and devise new reinforcement learning methods for building artificial intelligent agents and show that expert-level play can also be achieved in these games. All the re ...
περισσότερα
Πρέπει να είστε εγγεγραμένος χρήστης για έχετε πρόσβαση σε όλες τις υπηρεσίες του ΕΑΔΔ  Είσοδος /Εγγραφή

Όλα τα τεκμήρια στο ΕΑΔΔ προστατεύονται από πνευματικά δικαιώματα.

Διεύθυνση Handle
http://hdl.handle.net/10442/hedi/43622
ND
43622
Εναλλακτικός τίτλος
Decision making in multiplayer environments: application in backgammon variants
Συγγραφέας
Παπαχρήστου, Νικόλαος του Ελευθέριος
Ημερομηνία
2015
Ίδρυμα
Πανεπιστήμιο Μακεδονίας Οικονομικών και Κοινωνικών Επιστημών. Σχολή Επιστημών Πληροφορίας. Τμήμα Εφαρμοσμένης Πληροφορικής
Εξεταστική επιτροπή
Ρεφανίδης Ιωάννης
Σαμαράς Νικόλαος
Σακελαρίου Ηλίας
Στεφανίδης Γεώργιος
Σατρατζέμη Μαρία
Σιφαλέρας Άγγελος
Βεργίδης Κωνσταντίνος
Επιστημονικό πεδίο
Φυσικές Επιστήμες
Επιστήμες Ηλεκτρονικών Υπολογιστών & Πληροφορικής
Λέξεις-κλειδιά
Ενισχυτική μάθηση; Τάβλι; Μάθηση χρονικών διαφορών; Νευρωνικά δίκτυα
Χώρα
Ελλάδα
Γλώσσα
Αγγλικά
Άλλα στοιχεία
146 σ., εικ., πιν., σχημ., γραφ.