Επεξεργασία φυσικής γλώσσας σε επιχειρησιακά έγγραφα

Περίληψη

Η Επεξεργασία Φυσικής Γλώσσας (NLP) για επιχειρηματικά και χρηματοοικονομικά κείμενα (Hahn et al., 2018; Chen et al., 2022) αποτελεί ένα ταχέως αναπτυσσόμενο ερευνητικό πεδίο που εφαρμόζει υπολογιστικές τεχνικές σε κείμενα όπως εταιρικά έγγραφα, αναφορές αναλυτών και οικονομικές ειδήσεις. Τα έγγραφα αυτά παρουσιάζουν μοναδικές προκλήσεις λόγω του εξειδικευμένου λεξιλογίου (El-Haj et al., 2019), του κρίσιμου ρόλου των αριθμητικών δεδομένων, των ιδιαίτερων συντακτικών δομών και της σημασιολογίας του εκάστοτε πεδίου. Οι δυσκολίες αυτές εντείνονται από ευρύτερα προβλήματα, όπως η επεξεργασία μεγάλου όγκου μη δομημένων δημόσιων δεδομένων και η οικονομικά αποδοτική ανάπτυξη γλωσσικών μοντέλων, ιδίως για οργανισμούς με περιορισμένους πόρους όπως οι small-to-medium enterprises (SMEs). Η αντιμετώπιση αυτών των προκλήσεων είναι κρίσιμη για εφαρμογές που εκτείνονται από την ανίχνευση απάτης (Goel and Gangolly, 2012), τη long-form summarization (Cao et al., 2024) και την εξαγωγή πληροφορίας έως τη ...
περισσότερα

Περίληψη σε άλλη γλώσσα

Natural Language Processing (NLP) for business and finance-related documents (Hahn et al., 2018; Chen et al., 2022) is an expanding research area applying computational techniques to text such as company filings, analyst reports, and economic news. These documents present unique challenges due to specialized vocabulary (El-Haj et al., 2019), the critical role of numerical data, distinct syntactic structures, and domain-specific semantics. These issues are compounded by broader difficulties, including processing large volumes of unstructured public data and deploying language models cost-effectively, especially for resource-limited organizations like small-to-medium enterprises (SMEs). Addressing these challenges is crucial for applications ranging from fraud detection (Goel and Gangolly, 2012), long-form summarization (Cao et al., 2024), and information extraction to financial question answering (Maia et al., 2018). This thesis aims to advance applied NLP and the use of business docume ...
περισσότερα
Η διατριβή αυτή δεν είναι ακόμα διαθέσιμη ηλεκτρονικά
DOI
10.12681/eadd/60507
Διεύθυνση Handle
http://hdl.handle.net/10442/hedi/60507
ND
60507
Εναλλακτικός τίτλος
Natural language processing for business documents
Συγγραφέας
Λούκας, Ελευθέριος-Παναγιώτης (Πατρώνυμο: Ιωάννης)
Ημερομηνία
2025
Ίδρυμα
Οικονομικό Πανεπιστήμιο Αθηνών. Σχολή Επιστημών και Τεχνολογίας της Πληροφορίας. Τμήμα Πληροφορικής
Εξεταστική επιτροπή
Ανδρουτσόπουλος Ιωαννης
Κουτσόπουλος Ιορδάνης
Κωτίδης Ιωάννης
Λελεδάκης Γεώργιος
Παλιούρας Γεώργιος
Παυλόπουλος Ιωάννης
Σταφυλάκης Θέμος
Επιστημονικό πεδίο
Φυσικές ΕπιστήμεςΕπιστήμη Ηλεκτρονικών Υπολογιστών και Πληροφορική ➨ Τεχνητή νοημοσύνη
Λέξεις-κλειδιά
Επεξεργασία φυσικής γλώσσας; Μεγάλα γλωσσικά μοντέλα (LLMs); Εφαρμοσμένη Τεχνητή Νοημοσύνη; Επεξεργασία χρηματοοικονομικών κειμένων
Χώρα
Ελλάδα
Γλώσσα
Αγγλικά
Άλλα στοιχεία
εικ., πιν., σχημ., γραφ.
Στατιστικά χρήσης
ΠΡΟΒΟΛΕΣ
Αφορά στις μοναδικές επισκέψεις της διδακτορικής διατριβής για την χρονική περίοδο 07/2018 - 07/2023.
Πηγή: Google Analytics.
ΞΕΦΥΛΛΙΣΜΑΤΑ
Αφορά στο άνοιγμα του online αναγνώστη για την χρονική περίοδο 07/2018 - 07/2023.
Πηγή: Google Analytics.
ΜΕΤΑΦΟΡΤΩΣΕΙΣ
Αφορά στο σύνολο των μεταφορτώσων του αρχείου της διδακτορικής διατριβής.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.
ΧΡΗΣΤΕΣ
Αφορά στους συνδεδεμένους στο σύστημα χρήστες οι οποίοι έχουν αλληλεπιδράσει με τη διδακτορική διατριβή. Ως επί το πλείστον, αφορά τις μεταφορτώσεις.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.