Βελτιστοποίηση ανάλυσης δεδομένων μέσω τοπικών μεγάλων γλωσσικών μοντέλων και τεχνικών κλιμακωτής διαχείρισης δεδομένων

Περίληψη

Η σημασία που έχουν αποκτήσει τα δεδομένα σε ποικίλους τομείς, καθιστά αναγκαία την ανάπτυξη καινοτόμων προσεγγίσεων στη διαχείριση και ανάλυσή τους. Η παρούσα διδακτορική διατριβή ερευνά την ενσωμάτωση τοπικών Μεγάλων Γλωσσικών Μοντέλων (Offline LLMs) για την αυτόματη παραγωγή κώδικα, με στόχο την απλοποίηση των διαδικασιών ανάλυσης δεδομένων και, κατ’ επέκταση, τη βελτίωση της επεκτασιμότητας και αποδοτικότητας των συστημάτων διαχείρισης δεδομένων. Μέσω της αξιοποίησης τοπικά εκτελούμενων LLMs, η προτεινόμενη προσέγγιση δίνει τη δυνατότητα σε χρήστες χωρίς εκτεταμένες προγραμματιστικές γνώσεις να πραγματοποιούν αναλύσεις δεδομένων, συμβάλλοντας έτσι στη δημοκρατικοποίηση της επιστήμης των δεδομένων. Η έρευνα εστιάζει στην αρχιτεκτονική και την υλοποίηση επεκτάσιμων συστημάτων διαχείρισης δεδομένων, ικανών να διαχειρίζονται αποδοτικά σύνολα δεδομένων μεγάλου όγκου. Βασιζόμενη σε μια αποδοτική πλατφόρμα διαχείρισης δεδομένων, η εργασία εξετάζει τις δυνατότητες των offline LLMs για την ...
περισσότερα

Περίληψη σε άλλη γλώσσα

The importance of data across various sectors demands innovative approaches to data management and analytics. This PhD thesis investigates the integration of offline large language models (LLMs) for automated code generation, aiming to streamline data analysis processes, and thus enhance the scalability and efficiency of data management systems. By leveraging offline LLMs, the proposed approach empowers users to perform data analyses without extensive programming skills, thereby democratizing data analytics. The research delves into the architecture and implementation of scalable data management systems that can efficiently handle datasets of several volumes. Based on an efficient data management platform, the capabilities of offline LLMs to generate analytical code are examined, showcasing how these models can transform user queries into executable scripts that facilitate data manipulation and interpretation. Through experiments and case studies, the practical applications and benefit ...
περισσότερα

Όλα τα τεκμήρια στο ΕΑΔΔ προστατεύονται από πνευματικά δικαιώματα.

Διεύθυνση Handle
http://hdl.handle.net/10442/hedi/58941
ND
58941
Εναλλακτικός τίτλος
Optimizing data analysis through offline large language models and scalable data management techniques
Συγγραφέας
Νικολακόπουλος, Αναστάσιος (Πατρώνυμο: Κωνσταντίνος)
Ημερομηνία
2025
Ίδρυμα
Εθνικό Μετσόβιο Πολυτεχνείο (ΕΜΠ). Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Επικοινωνιών, Ηλεκτρονικής και Συστημάτων Πληροφορικής
Εξεταστική επιτροπή
Βαρβαρίγου Θεοδώρα
Βαρβαρίγος Εμμανουήλ
Παπαβασιλείου Συμεών
Τσερπές Κωνσταντίνος
Ασκούνης Δημήτριος
Λίτκε Αντώνιος
Δουλάμης Αναστάσιος
Επιστημονικό πεδίο
Επιστήμες Μηχανικού και ΤεχνολογίαΕπιστήμη Ηλεκτρολόγου Μηχανικού, Ηλεκτρονικού Μηχανικού, Μηχανικού Η/Υ ➨ Υπολογιστές, Υλικό (hardware) και Αρχιτεκτονική
Επιστήμες Μηχανικού και ΤεχνολογίαΆλλες Επιστήμες Μηχανικού και Τεχνολογίες ➨ Μηχανική, διεπιστημονική προσέγγιση
Λέξεις-κλειδιά
Επιστήμη δεδομένων; Ανάλυση δεδομένων; Μηχανική μάθηση; Τεχνητή νοημοσύνη; Μεγάλα γλωσσικά μοντέλα (LLMs)
Χώρα
Ελλάδα
Γλώσσα
Αγγλικά
Άλλα στοιχεία
πιν., σχημ., γραφ.
Στατιστικά χρήσης
ΠΡΟΒΟΛΕΣ
Αφορά στις μοναδικές επισκέψεις της διδακτορικής διατριβής για την χρονική περίοδο 07/2018 - 07/2023.
Πηγή: Google Analytics.
ΞΕΦΥΛΛΙΣΜΑΤΑ
Αφορά στο άνοιγμα του online αναγνώστη για την χρονική περίοδο 07/2018 - 07/2023.
Πηγή: Google Analytics.
ΜΕΤΑΦΟΡΤΩΣΕΙΣ
Αφορά στο σύνολο των μεταφορτώσων του αρχείου της διδακτορικής διατριβής.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.
ΧΡΗΣΤΕΣ
Αφορά στους συνδεδεμένους στο σύστημα χρήστες οι οποίοι έχουν αλληλεπιδράσει με τη διδακτορική διατριβή. Ως επί το πλείστον, αφορά τις μεταφορτώσεις.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.
Σχετικές εγγραφές (με βάση τις επισκέψεις των χρηστών)