Περίληψη
Τα τελευταία χρόνια έχει παρατηρηθεί αξιοσημείωτη αύξηση στη σχεδίαση και υλοποίηση εφαρμογών που διαφοροποιούνται από την κλασική αρχιτεκτονική των προσωπικών υπολογιστών, διακομιστών και φορητών υπολογιστών. Οι αρχιτεκτονικές αυτές αντιστοιχούν στα ετερογενή υπολογιστικά συστήματα (Heterogeneous Computing Systems, HCS), τα οποία ενσωματώνουν και συνδυάζουν διαφορετικούς τύπους επεξεργαστικών μονάδων με σκοπό την επιτάχυνση απαιτητικών εφαρμογών υψηλής υπολογιστικής πολυπλοκότητας, προσφέροντας ταυτόχρονα βελτιωμένη ενεργειακή απόδοση και αποδοτικότερη αξιοποίηση των διαθέσιμων υπολογιστικών πόρων. Εφαρμογές, οι οποίες χαρακτηρίζονται από υψηλή υπολογιστική πολυπλοκότητα, αποτελούν βασικό πεδίο της βαθιάς μάθησης (Deep Learning, DL), η οποία έχει επιφέρει σημαντικές εξελίξεις και έχει εισαγάγει νέες δυνατότητες στην έρευνα της τεχνητής νοημοσύνης (Artificial Intelligence, AI). Η DL έχει αναδειχθεί ως μια από τις πιο δυναμικές και αποδοτικές προσεγγίσεις για την επίλυση σύνθετων προβλη ...
Τα τελευταία χρόνια έχει παρατηρηθεί αξιοσημείωτη αύξηση στη σχεδίαση και υλοποίηση εφαρμογών που διαφοροποιούνται από την κλασική αρχιτεκτονική των προσωπικών υπολογιστών, διακομιστών και φορητών υπολογιστών. Οι αρχιτεκτονικές αυτές αντιστοιχούν στα ετερογενή υπολογιστικά συστήματα (Heterogeneous Computing Systems, HCS), τα οποία ενσωματώνουν και συνδυάζουν διαφορετικούς τύπους επεξεργαστικών μονάδων με σκοπό την επιτάχυνση απαιτητικών εφαρμογών υψηλής υπολογιστικής πολυπλοκότητας, προσφέροντας ταυτόχρονα βελτιωμένη ενεργειακή απόδοση και αποδοτικότερη αξιοποίηση των διαθέσιμων υπολογιστικών πόρων. Εφαρμογές, οι οποίες χαρακτηρίζονται από υψηλή υπολογιστική πολυπλοκότητα, αποτελούν βασικό πεδίο της βαθιάς μάθησης (Deep Learning, DL), η οποία έχει επιφέρει σημαντικές εξελίξεις και έχει εισαγάγει νέες δυνατότητες στην έρευνα της τεχνητής νοημοσύνης (Artificial Intelligence, AI). Η DL έχει αναδειχθεί ως μια από τις πιο δυναμικές και αποδοτικές προσεγγίσεις για την επίλυση σύνθετων προβλημάτων, αξιοποιώντας την ισχύ των νευρωνικών δικτύων για να μάθουν από τεράστια σύνολα δεδομένων και να πραγματοποιούν προβλέψεις με υψηλή ακρίβεια. Ιδιαίτερη έμφαση δίνεται στις εφαρμογές της όρασης υπολογιστών (Computer Vision, CV), οι οποίες έχουν ωφεληθεί σημαντικά από τις προόδους στις τεχνικές DL. Οι επιτυχίες σε αυτόν τον τομέα έχουν καθοδηγήσει την ερευνητική κοινότητα προς την υιοθέτηση βαθύτερων και πιο περίπλοκων μοντέλων, ενισχύοντας την ικανότητα των συστημάτων να αναγνωρίζουν και να αναλύουν οπτικά δεδομένα με υψηλή ακρίβεια. Οι εφαρμογές αυτές περιλαμβάνουν, μεταξύ άλλων, την αναγνώριση προτύπων, την ανάλυση εικόνας και την κατανόηση βίντεο, προσφέροντας σημαντικές βελτιώσεις σε τομείς όπως η ιατρική διάγνωση, η αυτόνομη οδήγηση και η παρακολούθηση ασφαλείας. Η παρούσα διατριβή επικεντρώνεται στη σχεδίαση, υλοποίηση και επιτάχυνση μοντέλων υψηλής πολυπλοκότητας DL, με έμφαση στα συνελικτικά νευρωνικά δίκτυα (Convolutional Neural Networks, CNNs), σε ετερογενείς αρχιτεκτονικές. Για την επίτευξη των παραπάνω, προτείνουμε μια μεθοδολογία για την ανάπτυξη επιταχυνόμενων και εξειδικευμένων αρχιτεκτονικών, κατάλληλων για εφαρμογές σε HCS. Η έρευνα στοχεύει στη σχεδίαση και βελτιστοποίηση αρχιτεκτονικών που αξιοποιούν πλήρως τις δυνατότητες προηγμένων HCS, όπως η προγραμματιζόμενη λογική επί του πεδίου με ενσωματωμένο σύστημα στο ίδιο τσιπ (Field-Programmable Gate Array – System on Chip, FPGA-SoC) και τα ενσωματωμένα συστήματα σε μονάδα (System on Module, SoM). Ο κύριος στόχος είναι η αύξηση της υπολογιστικής αποδοτικότητας μέσω της επιτάχυνσης των νευρωνικών μοντέλων, εξασφαλίζοντας παράλληλα την προσαρμοστικότητα των συστημάτων σε ένα ευρύ φάσμα εφαρμογών. Με την αξιοποίηση της παράλληλης επεξεργασίας, της ευελιξίας προγραμματισμού και της εξειδικευμένης αρχιτεκτονικής που προσφέρουν τα FPGA-SoC και τα SoM, τα συστήματα αυτά μπορούν να ανταποκριθούν στις αυξανόμενες απαιτήσεις των εφαρμογών της DL. Αυτή η στρατηγική προσφέρει ταυτόχρονα λύσεις υψηλής απόδοσης και μειωμένο περιβαλλοντικό αποτύπωμα, καθιστώντας τα HCS ιδανικά για εφαρμογές που απαιτούν ισορροπία μεταξύ ισχύος, ακρίβειας και ενεργειακής αποδοτικότητας. Η αξιολόγηση των προτεινόμενων αρχιτεκτονικών, από τη χρήση της μεθοδολογίας που προτείνουμε, διεξάγεται σε πραγματικά σύνολα δεδομένων, εστιάζοντας σε δύο κρίσιμες εφαρμογές: την ιατρική διάγνωση και τον αγροτικό τομέα. Και οι δύο αυτοί τομείς χαρακτηρίζονται από υψηλές απαιτήσεις επεξεργασίας και ανάγκες για ακριβή και έγκαιρη ανάλυση δεδομένων. Στην ιατρική διάγνωση, η δυνατότητα ταχείας επεξεργασίας μεγάλων συνόλων δεδομένων, όπως ακτινογραφιών, παρέχει στους επαγγελματίες υγείας τα μέσα για την έγκαιρη ανίχνευση παθήσεων και τη λήψη βελτιωμένων θεραπευτικών αποφάσεων. Στον αγροτικό τομέα, η ανάλυση εικόνων από καλλιέργειες συμβάλλει στην αποτελεσματική διαχείριση των γεωργικών πόρων και την πρόληψη ασθενειών. Τα αποτελέσματα της παρούσας διατριβής καταδεικνύουν την αποδοτικότητα της μεθοδολογίας και των παραγόμενων αρχιτεκτονικών, υπογραμμίζοντας την ευελιξία τους να προσαρμόζονται στις διαφορετικές ανάγκες των εφαρμογών. Η αξιοποίηση των HCS επιτρέπει την ευέλικτη κατανομή των υπολογιστικών πόρων ανάλογα με την πολυπλοκότητα και τον όγκο των δεδομένων, διασφαλίζοντας υψηλή απόδοση, μειωμένη καθυστέρηση και ενεργειακή αποδοτικότητα. Οι προτεινόμενες αρχιτεκτονικές συμβάλλουν σημαντικά στην επίτευξη λύσεων υψηλής απόδοσης για εφαρμογές στους τομείς της υγείας, της γεωργίας και άλλων βιομηχανικών εφαρμογών, με απώτερο στόχο την επίτευξη ισορροπίας μεταξύ της ακρίβειας, ταχύτητας και ενεργειακού αποτυπώματος.
περισσότερα
Περίληψη σε άλλη γλώσσα
In recent years, there has been a significant growth in the design and implementation of applications that differ from the traditional architecture of personal computers, servers, and laptops.These architectures correspond to heterogeneous computing systems (HCS), which integrate and combine different types of processing units in order to accelerate demanding applications with high computational complexity, while also offering improved energy efficiency and more efficient utilization of available computing resources. Applications characterized by high computational complexity constitute a primary domain of deep learning (DL), which has brought significant advancements and introduced new capabilities in artificial intelligence (AI) research. DL has emerged as one of the most dynamic and effective approaches for solving complex problems by leveraging the power of neural networks to learn from massive datasets and generate highly accurate predictions. Particular emphasis has been placed o ...
In recent years, there has been a significant growth in the design and implementation of applications that differ from the traditional architecture of personal computers, servers, and laptops.These architectures correspond to heterogeneous computing systems (HCS), which integrate and combine different types of processing units in order to accelerate demanding applications with high computational complexity, while also offering improved energy efficiency and more efficient utilization of available computing resources. Applications characterized by high computational complexity constitute a primary domain of deep learning (DL), which has brought significant advancements and introduced new capabilities in artificial intelligence (AI) research. DL has emerged as one of the most dynamic and effective approaches for solving complex problems by leveraging the power of neural networks to learn from massive datasets and generate highly accurate predictions. Particular emphasis has been placed on applications in Computer Vision (CV), which have greatly benefited from advances in DL techniques. Breakthroughs in this area have led the research community to adopt deeper and more complex models, enhancing the ability of systems to recognize and interpret visual data with high precision. These applications include, among others, pattern recognition, image analysis, and video understanding, contributing substantial improvements in domains such as medical diagnosis, autonomous driving, and security monitoring. This dissertation focuses on the design, implementation, and acceleration of high-complexity DL models, with emphasis on Convolutional Neural Networks (CNNs), on heterogeneous architectures.To achieve these goals, we propose a methodology for the development of accelerated and specialized architectures suitable for applications on HCS. The research aims to design and optimize architectures that fully exploit the capabilities of advanced HCS, such as Field-Programmable Gate Array – System on Chip (FPGA-SoC) and System on Module (SoM) devices. The main objective is to enhance computational efficiency through neural model acceleration, while ensuring the adaptability of the systems to a broad range of applications. By leveraging parallel processing, programmability, and architectural specialization offered by FPGA-SoCs and SoMs, such systems can meet the increasing demands of DL applications. This strategy enables high-performance solutions with reduced environmental footprint, making HCS ideal for scenarios requiring a balance between computational power, accuracy, and energy efficiency. The evaluation of the proposed architectures, as implemented through the methodology we propose, is conducted on real-world datasets, focusing on two critical applications: medical diagnosis and the agricultural sector. Both of these domains are characterized by high processing demands and the need for accurate and timely data analysis. In medical diagnostics, the rapid processing of large-scale datasets such as X-ray images enables healthcare professionals to detect diseases early and make improved clinical decisions. In agriculture, image analysis of crops supports efficient resource management and early disease prevention. The results of the present dissertation demonstrate the efficiency of the proposed methodology and the developed architectures, highlighting their flexibility to adapt to the diverse requirements of various applications. The exploitation of HCS allows for flexible allocation of computational resources based on data complexity and volume, ensuring high throughput, reduced latency, and energy-efficient processing. The proposed architectures significantly contribute to the realization of high-performance solutions in domains such as healthcare, agriculture, and other industrial applications, ultimately aiming to achieve a well-balanced trade-off among accuracy, speed, and energy footprint.
περισσότερα