Βαθιά ενισχυτική μάθηση και παραγωγική ανταγωνιστική μοντελοποίηση για εφαρμογές διαχείρισης και ελέγχου ροής κυκλοφορίας

Περίληψη

Η τεχνητή νοημοσύνη (ΤΝ) έχει επιφέρει σημαντικές αλλαγές σε διάφορους τομείς της καθημερινής ζωής, φέρνοντας επανάσταση στις αλληλεπιδράσεις ανθρώπου-μηχανής. Οι ευφυείς πράκτορες, που αποτελούν τα θεμελιώδη συστατικά των συστημάτων ΤΝ, έχουν την ικανότητα να αντιλαμβάνονται, να συλλογίζονται και να ενεργούν στο περιβάλλον τους για να επιτύχουν συγκεκριμένους στόχους. Από απλά συστήματα βασισμένα σε κανόνες μέχρι πολύπλοκα μοντέλα βαθιάς μάθησης, οι ευφυείς μπορούν να εκπαιδευτούν χρησιμοποιώντας μια ποικιλία τεχνικών μάθησης που εμπίπτουν στο ευρύτερο πεδίο της μηχανικής μάθησης. Ενα σημαντικό υποπεδίο της μηχανικής μάθησης που έχει αντλήσει σημαντική προσοχή, είναι η ενισχυτική μάθηση. Η ενισχυτική μάθηση επικεντρώνεται στην εκπαίδευση ευφυών πρακτόρων για τη λήψη διαδοχικών αποφάσεων αλληλεπιδρώντας με ένα περιβάλλον, αντλώντας έμπνευση από τη μάθηση δοκιμής και σφ
Βαθιά ενισχυτική μάθηση και παραγωγική ανταγωνιστική μοντελοποίηση για εφαρμογές διαχείρισης και ελέγχου ροής κυκλοφορίας

Περίληψη

Η τεχνητή νοημοσύνη (ΤΝ) έχει επιφέρει σημαντικές αλλαγές σε διάφορους τομείς της καθημερινής ζωής, φέρνοντας επανάσταση στις αλληλεπιδράσεις ανθρώπου-μηχανής. Οι ευφυείς πράκτορες, που αποτελούν τα θεμελιώδη συστατικά των συστημάτων ΤΝ, έχουν την ικανότητα να αντιλαμβάνονται, να συλλογίζονται και να ενεργούν στο περιβάλλον τους για να επιτύχουν συγκεκριμένους στόχους. Από απλά συστήματα βασισμένα σε κανόνες μέχρι πολύπλοκα μοντέλα βαθιάς μάθησης, οι ευφυείς μπορούν να εκπαιδευτούν χρησιμοποιώντας μια ποικιλία τεχνικών μάθησης που εμπίπτουν στο ευρύτερο πεδίο της μηχανικής μάθησης. Ενα σημαντικό υποπεδίο της μηχανικής μάθησης που έχει αντλήσει σημαντική προσοχή, είναι η ενισχυτική μάθηση. Η ενισχυτική μάθηση επικεντρώνεται στην εκπαίδευση ευφυών πρακτόρων για τη λήψη διαδοχικών αποφάσεων αλληλεπιδρώντας με ένα περιβάλλον, αντλώντας έμπνευση από τη μάθηση δοκιμής και σφ"display:none">Artificial intelligence (AI) has brought significant transformations in various domains of everyday life, revolutionizing human-machine interactions. Intelligent agents, the fundamental components of AI systems, have the ability to perceive, reason, and act in their environment to achieve specific goals. Ranging from simple rule-based systems to complex deep learning models, these agents can be trained using a variety of learning schemes falling under the broader umbrella of machine learning (ML). One influential sub-field of ML that has gained considerable attention is reinforcement learning (RL). RL focuses on training intelligent agents to make sequential decisions by interacting with an environment, drawing inspiration from trial-and-error learning observed in humans and animals. Another ML technique, known as imitation learning (IL), combines supervised learning and RL principles by learning from expert demonstrations. This dissertation explores the application of both RL and IL techniques in the context of traffic applications, addressing the significant challenges of (a) congestion management and (b) trajectory modeling. Traffic applications play a vital role in modern society, as they encompass a wide range of systems and technologies aimed at managing and optimizing the behavior and the navigation of vehicles including various modes of transportation such as ground vehicles, roadway systems, air vehicles, and sea vessels. Congestion occurs when the demand for shared resources exceeds supply, leading to reduced efficiency of the overall system. Trajectory modeling involves analyzing and predicting expert behaviors based on historical demonstrated data. These challenges are not limited to the traffic domain but may also be extended to other fields where similar optimization and decision-making problems arise. This PhD is separated in three parts where the following problems are studied: (a) urban traffic navigation, (b) air traffic management, and (c) aircraft trajectory prediction.In the first part, the aim is to create efficient multi-agent systems for controlling and navigating fleets of vehicles in unsignalized large-scale urban road networks with complex scenarios and noise. By employing multi-agent reinforcement learning (MARL) techniques, the study seeks to navigate vehicles safely, preventing collisions, and minimizing traveling time. The proposed research contributes to the advancement of intelligent traffic management systems by utilizing RL techniques to optimize traffic flow and reduce congestion in urban areas.The second part focuses on tackling congestion problems in the aviation domain, particularly focusing on the demand and capacity balance (DCB) problem in air traffic management (ATM). By employing MARL schemes and leveraging hierarchical frameworks, the study seeks to minimize flight delays, optimize airspace utilization, and reduce fuel consumption and operating costs. The cooperative behavior of the involved flights is enabled to achieve more efficient use of the airspace and enhance overall performance of the multi-agent system. The final part studies generative models and trajectory modeling techniques in the aviation domain. Trajectory prediction is of an utmost importance for congestion management, and IL techniques offer a promising approach by training agents to imitate expert behaviors. Multi-modal imitation learning can further enhance trajectory prediction by capturing various behavioral patterns exhibited during flight execution. By leveraging expert data and modeling distinct patterns, the proposed approach improves the accuracy and robustness of trajectory prediction systems, leading to enhanced air traffic management, optimized route planning, and safer and more efficient flights.
περισσότερα

Όλα τα τεκμήρια στο ΕΑΔΔ προστατεύονται από πνευματικά δικαιώματα.

"display:none">Artificial intelligence (AI) has brought significant transformations in various domains of everyday life, revolutionizing human-machine interactions. Intelligent agents, the fundamental components of AI systems, have the ability to perceive, reason, and act in their environment to achieve specific goals. Ranging from simple rule-based systems to complex deep learning models, these agents can be trained using a variety of learning schemes falling under the broader umbrella of machine learning (ML). One influential sub-field of ML that has gained considerable attention is reinforcement learning (RL). RL focuses on training intelligent agents to make sequential decisions by interacting with an environment, drawing inspiration from trial-and-error learning observed in humans and animals. Another ML technique, known as imitation learning (IL), combines supervised learning and RL principles by learning from expert demonstrations. This dissertation explores the application of both RL and IL techniques in the context of traffic applications, addressing the significant challenges of (a) congestion management and (b) trajectory modeling. Traffic applications play a vital role in modern society, as they encompass a wide range of systems and technologies aimed at managing and optimizing the behavior and the navigation of vehicles including various modes of transportation such as ground vehicles, roadway systems, air vehicles, and sea vessels. Congestion occurs when the demand for shared resources exceeds supply, leading to reduced efficiency of the overall system. Trajectory modeling involves analyzing and predicting expert behaviors based on historical demonstrated data. These challenges are not limited to the traffic domain but may also be extended to other fields where similar optimization and decision-making problems arise. This PhD is separated in three parts where the following problems are studied: (a) urban traffic navigation, (b) air traffic management, and (c) aircraft trajectory prediction.In the first part, the aim is to create efficient multi-agent systems for controlling and navigating fleets of vehicles in unsignalized large-scale urban road networks with complex scenarios and noise. By employing multi-agent reinforcement learning (MARL) techniques, the study seeks to navigate vehicles safely, preventing collisions, and minimizing traveling time. The proposed research contributes to the advancement of intelligent traffic management systems by utilizing RL techniques to optimize traffic flow and reduce congestion in urban areas.The second part focuses on tackling congestion problems in the aviation domain, particularly focusing on the demand and capacity balance (DCB) problem in air traffic management (ATM). By employing MARL schemes and leveraging hierarchical frameworks, the study seeks to minimize flight delays, optimize airspace utilization, and reduce fuel consumption and operating costs. The cooperative behavior of the involved flights is enabled to achieve more efficient use of the airspace and enhance overall performance of the multi-agent system. The final part studies generative models and trajectory modeling techniques in the aviation domain. Trajectory prediction is of an utmost importance for congestion management, and IL techniques offer a promising approach by training agents to imitate expert behaviors. Multi-modal imitation learning can further enhance trajectory prediction by capturing various behavioral patterns exhibited during flight execution. By leveraging expert data and modeling distinct patterns, the proposed approach improves the accuracy and robustness of trajectory prediction systems, leading to enhanced air traffic management, optimized route planning, and safer and more efficient flights.περισσότερα
DOI
10.12681/eadd/54159
Διεύθυνση Handle
http://hdl.handle.net/10442/hedi/54159
ND

Όλα τα τεκμήρια στο ΕΑΔΔ προστατεύονται από πνευματικά δικαιώματα.

DOI
10.12681/eadd/54159
Διεύθυνση Handle
http://hdl.handle.net/10442/hedi/54159
ND
Εναλλακτικός τίτλος
Deep reinforcement learning and generative adversarial modeling in traffic applications
Συγγραφέας
Σπαθάρης, Χρήστος (Πατρώνυμο: Γεώργιος)
2023
Δηλώνω ότι έλαβα γνώση και ανεπιφύλακτα συμφωνώ και αποδέχομαι τους Ίδρυμα
Όρους Χρήσης του Εθνικού Αρχείου Διδακτορικών Διατριβών, καθώς και της
. Σχολή Πολυτεχνική. Τμήμα Μηχανικών Ηλεκτρονικών Υπολογιστών και Πληροφορικής

Όλα τα τεκμήρια στο ΕΑΔΔ προστατεύονται από πνευματικά δικαιώματα.

Εξεταστική επιτροπή
Μπλέκας Κωνσταντίνος
Λύκας Αριστείδης
Βούρος Γεώργιος
Σταφυλοπάτης Ανδρέας-Γεώργιος
Παλιούρας Γεώργιος
Νίκου Χριστόφορος
Βλάχος Κωνσταντίνος
Επιστημονικό πεδίο
Επιστήμες Μηχανικού και ΤεχνολογίαΕπιστήμη Ηλεκτρολόγου Μηχανικού, Ηλεκτρονικού Μηχανικού, Μηχανικού Η/Υ ➨ Αυτοματισμοί και Συστήματα ελέγχου
Λέξεις-κλειδιά
Μηχανική μάθηση; Ενισχυτική μάθηση; Αυτόνομοι πράκτορες; Εφαρμογές ροής κυκλοφορίας; Βαθιά μάθηση
Χώρα
Ελλάδα
Γλώσσα
Αγγλικά
Άλλα στοιχεία
εικ., πιν., χαρτ., σχημ., γραφ.
Στατιστικά χρήσης
ΠΡΟΒΟΛΕΣ
Αφορά στις μοναδικές επισκέψεις της διδακτορικής διατριβής για την χρονική περίοδο 07/2018 - 07/2023.
Πηγή: Google Analytics.
ΞΕΦΥΛΛΙΣΜΑΤΑ
Αφορά στο άνοιγμα του online αναγνώστη για την χρονική περίοδο 07/2018 - 07/2023.
Πηγή: Google Analytics.
ΜΕΤΑΦΟΡΤΩΣΕΙΣ
Αφορά στο σύνολο των μεταφορτώσων του αρχείου της διδακτορικής διατριβής.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.
ΧΡΗΣΤΕΣ
Αφορά στους συνδεδεμένους στο σύστημα χρήστες οι οποίοι έχουν αλληλεπιδράσει με τη διδακτορική διατριβή. Ως επί το πλείστον, αφορά τις μεταφορτώσεις.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.