Βελτίωση αναπαραστάσεων γλωσσικών μοντέλων για εξαγωγή βιοϊατρικών σχέσεων και γλώσσες χαμηλών πόρων

Περίληψη

Η παρούσα διατριβή παρουσιάζει σημαντικές συνεισφορές στα πεδία της Επεξεργασίας Φυσικής Γλώσσας (NLP) και της Μηχανικής Μάθησης (ML) σε τρεις διακριτούς τομείς. Η διατριβή ξεκινά με ένα εισαγωγικό μέρος, που αποτελείται από δύο κεφάλαια, ακολουθούμενα από τρία βασικά κεφάλαια, το καθένα από τα οποία εξετάζει συγκεκριμένα ερευνητικά προβλήματα και παρέχει νέες λύσεις. Το εισαγωγικό μέρος θέτει τις βάσεις για ολόκληρη τη διατριβή εισάγοντας βασικές έννοιες στο ML και το NLP. Καλύπτει τις βασικές αρχές των κατηγοριών Μηχανικής Μάθησης, συμπεριλαμβανομένων της μάθησης με επίβλεψη, χωρίς επίβλεψη και της ενισχυτικής μάθησης. Επιπλέον, εμβαθύνει στις έννοιες του NLP, όπως τη μοντελοποίηση γλώσσας, την εξαγωγή σχέσεων (RE) και τις προκλήσεις των γλωσσών χαμηλών πόρων (LRLs). Το κεφάλαιο εισάγει επίσης κρίσιμα αρχιτεκτονικά στοιχεία όπως τον Transformer και τους Γράφγους Γνώσης (KGs) στη δομημένη αναπαράσταση γνώσης. Το τρίτο κεφάλαιο εστιάζει στην προώθηση του πεδίου του βιοϊατρικού NLP προτ ...
περισσότερα

Περίληψη σε άλλη γλώσσα

This thesis presents significant contributions to the fields of Natural Language Processing (NLP) and Machine Learning (ML) in three distinct areas. The thesis begins with an introductory part, comprised of two chapters, followed by three core chapters, each addressing specific research problems and providing novel solutions. The introductory part lays the groundwork for the entire thesis by introducing key concepts in ML and NLP. It covers the fundamentals of Machine Learning paradigms, including Supervised, Unsupervised, and Reinforcement Learning. Additionally, it delves into NLP concepts, such as Language Modeling (LM), Relation Extraction (RE), and the challenges of Low-Resource Languages (LRLs). The chapter also introduces critical architectural elements like the Transformer and the significance of Knowledge Graphs (KGs) in structured knowledge representation. The third chapter focuses on advancing the field of biomedical NLP by proposing novel Language Model (LM)-based technique ...
περισσότερα
Η διατριβή είναι δεσμευμένη από τον συγγραφέα  (μέχρι και: 3/2024)
DOI
10.12681/eadd/55364
Διεύθυνση Handle
http://hdl.handle.net/10442/hedi/55364
ND
55364
Εναλλακτικός τίτλος
Improving language model representations for biomedical relation extraction and low-resource languages
Συγγραφέας
Ζαΐκης, Δημήτριος (Πατρώνυμο: Τραιανός)
Ημερομηνία
2023
Ίδρυμα
Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης (ΑΠΘ). Σχολή Θετικών Επιστημών. Τμήμα Πληροφορικής
Εξεταστική επιτροπή
Βλαχάβας Ιωάννης
Βασιλειάδης Νικόλαος
Τσουμάκας Γρηγόριος
Βακάλη Αθηνά
Μεδίτσκος Γεώργιος
Κουμπαράκης Μανόλης
Κερμανίδου Κάτια-Λήδα
Επιστημονικό πεδίο
Φυσικές ΕπιστήμεςΕπιστήμη Ηλεκτρονικών Υπολογιστών και Πληροφορική ➨ Τεχνητή νοημοσύνη
Λέξεις-κλειδιά
Γλωσσικά μοντέλα; Επεξεργασία φυσικής γλώσσας; Βαθιά μάθηση; Μηχανική μάθηση; Τεχνιτή νοημοσύνη; Τεχνιτά νευρωνικά δίκτυα
Χώρα
Ελλάδα
Γλώσσα
Αγγλικά
Άλλα στοιχεία
εικ., πιν., σχημ., γραφ.
Στατιστικά χρήσης
ΠΡΟΒΟΛΕΣ
Αφορά στις μοναδικές επισκέψεις της διδακτορικής διατριβής για την χρονική περίοδο 07/2018 - 07/2023.
Πηγή: Google Analytics.
ΞΕΦΥΛΛΙΣΜΑΤΑ
Αφορά στο άνοιγμα του online αναγνώστη για την χρονική περίοδο 07/2018 - 07/2023.
Πηγή: Google Analytics.
ΜΕΤΑΦΟΡΤΩΣΕΙΣ
Αφορά στο σύνολο των μεταφορτώσων του αρχείου της διδακτορικής διατριβής.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.
ΧΡΗΣΤΕΣ
Αφορά στους συνδεδεμένους στο σύστημα χρήστες οι οποίοι έχουν αλληλεπιδράσει με τη διδακτορική διατριβή. Ως επί το πλείστον, αφορά τις μεταφορτώσεις.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.