Κατηγοριοποίηση και τμηματοποίηση κειμένων με χρήση μεθόδων υπολογιστικής νοημοσύνης

Περίληψη

Η παρούσα διδακτορική διατριβή πραγματεύεται την ανάπτυξη υπολογιστικών μεθόδων για την εμβάθυνση στο περιεχόμενο των κειμένων και την ανάδειξη του τρόπου δόμησής τους (με την εύρεση των υποθεμάτων από τα οποία αποτελούνται) άρα και κατ’ επέκταση τη βελτίωση πρόσβασης σε πληροφορία με τη βοήθεια γλωσσικής τεχνολογίας. Η εν λόγω διατριβή αφορά την χρήση του θησαυρού όρων Wordnet για την ακριβέστερη απόδοση της έννοιας των λέξεων μέσα στο περιεχόμενο στο οποίο απαντώνται, αλλά και την αποτελεσματικότερη πρόσβαση στην πληροφορία με την τμηματοποίηση μεγάλης έκτασης κειμένων σε μικρότερα τμήματα καθένα από τα οποία αναφέρεται σε ένα συγκεκριμένο θέμα. Μια τέτοιου είδους βελτιωμένη πρόσβαση είναι χρήσιμη στην ολοένα αυξανόμενη πληροφορία που απαντάται στις μέρες μας κυρίως στο Διαδίκτυο. Μετά από επισκόπηση των μοντέλων και μεθόδων για την εύρεση της εννοιολογικής δομής των κειμένων και τη βελτίωση πρόσβασης σε πληροφορία προτείνονται τρία μοντέλα. Το πρώτο από αυτά ακολουθεί την προσέγγιση ...
περισσότερα

Περίληψη σε άλλη γλώσσα

This dissertation deals with the development of computational methods which penetrate into the content of texts and reveal their structure, as the result of finding their topics and subtopics. The benefit of such methods is the improvement in accessing in information using a language technology. The dissertation uses Wordnet’s thesaurus in order to attribute -in a more accurate way- the sense of a word taking under consideration the content in which this word appears in the text. The dissertation achieves a more effective access in information using the result of the segmentation of large texts into smaller segments each of which refers to a specific topic. Such an improved access is extremely useful while searching the Web. After an overview of the models and methods that have been proposed in the literature for the problem of finding the semantic structure of a text, we propose and implement three models. The first of those follows the Machine Learning approach and classifies texts ...
περισσότερα
Πρέπει να είστε εγγεγραμένος χρήστης για έχετε πρόσβαση σε όλες τις υπηρεσίες του ΕΑΔΔ  Είσοδος /Εγγραφή

Όλα τα τεκμήρια στο ΕΑΔΔ προστατεύονται από πνευματικά δικαιώματα.

DOI
10.12681/eadd/15119
Διεύθυνση Handle
http://hdl.handle.net/10442/hedi/15119
Εναλλακτικός τίτλος
Classification and segimentation of texts using methods of computational linguistics
Συγγραφέας
Φράγκου, Παυλίνα
Ημερομηνία
2004
Ίδρυμα
Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης (ΑΠΘ). Σχολή Πολυτεχνική. Τμήμα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών
Εξεταστική επιτροπή
Πετρίδης Βασίλειος
Στρίντζης Μιχάλης-Γεράσιμος
Χασάπης Γεώργιος
Πέτρου Λουκάς
Θεοχάρης Ιωάννης
Μήτκας Περικλής
Κεχαγιάς Αθανάσιος
Επιστημονικό πεδίο
Μηχανική & Τεχνολογία
Επιστήμες Ηλεκτρολόγου Μηχανικού, Ηλεκτρονικού Μηχανικού & Μηχανικού Η/Υ
Λέξεις-κλειδιά
Τμηματοποίηση κειμένου; Κατηγοριοποίηση κειμένων; Επεξεργασία φυσικής γλώσσας
Χώρα
Ελλάδα
Γλώσσα
Ελληνικά
Άλλα στοιχεία
283 σ., εικ.