Κλιτικό σύστημα, στατιστική μορφοσυντακτική αναγνώριση, αυτόματη λημματοποίηση της ρηματικής κατηγορίας της νέας ελληνικής

Περίληψη

Στην παρούσα διατριβή παρουσιάζονται τα τελικά αποτελέσματα της 10ετούς έρευνάς μας στο ρηματικό σύνολο της Νέας Ελληνικής γλώσσας, στόχος της οποίας ήταν η δημιουργία αφενός μιας στατιστικής βάσης δεδομένων καταληκτικών γραφηματικών συνδυασμών, η οποία, με βάση το αντίστροφο μοντέλο MOSAIC της Koktova (1985), επιτρέπει την αυτόματη μορφοσυντακτική αναγνώριση όλων των μονολεκτικών ρηματικών τύπων της γλώσσας χωρίς την ενδιάμεση κλασσική μεσολάβηση ηλεκτρονικού λεξικού και αφετέρου ενός συστήματος μορφοφωνολογικών κανόνων λημματοποίησης των ρηματικών τύπων, με ποικίλες εφαρμογές στους τομείς της Αυτόματης Επεξεργασίας Κειμένων και Διδασκαλίας της Ελληνικής Γλώσσας. Στο πλαίσιο αυτό συνελέγησαν, παρήχθησαν και ταξινομήθηκαν αυτομάτως, ελέγχθηκαν και εμπλουτίσθηκαν 24 ΜΒ γλωσσικών δεδομένων (τα οποία έχουν κατατεθεί υπό μορφή παραρτήματος), δείγματα των οποίων περιέχονται στη διατριβή. Πιο συγκεκριμένα πρόκειται για: α) αρχείο 8.485 ρηματικών λημμάτων της Νέας Ελληνικής, σύμφωνο προς τα σ ...
περισσότερα

Περίληψη σε άλλη γλώσσα

In this dissertation we present the final results of our 10-year research on the Modern Greek verbal system. The objective of the research has been twofold: i) the development of a statistical database containing word-final grapheme sequences, which, on the basis of Koktova's (1985) retrograde analysis model MOSAIC, allow for the automatic morphosyntactic recognition (tagging) of all monolexical verbal forms of the language without any access to relevant electronic lexicons and ii) the development of a verb lemmatization morphophonological rule system, both providing various applications in all major areas of Text Processing as well as Teaching of Modern Greek Standard. Within this framework, 24Mb of verbal linguistic data have been collected, generated and classified automatically, and manually checked and enriched. These have been submitted to the University in the form of an appendix. Only representative extracts appear in the dissertation. More specifically, they consist of: a) a f ...
περισσότερα
Πρέπει να είστε εγγεγραμένος χρήστης για έχετε πρόσβαση σε όλες τις υπηρεσίες του ΕΑΔΔ  Είσοδος /Εγγραφή

Όλα τα τεκμήρια στο ΕΑΔΔ προστατεύονται από πνευματικά δικαιώματα.

DOI
10.12681/eadd/14060
Διεύθυνση Handle
http://hdl.handle.net/10442/hedi/14060
Εναλλακτικός τίτλος
Systeme de conjugaison, reconnaissance morphosyntaxique statistique, lemmatisation automatique de la classe verbale du grec moderne standard
Συγγραφέας
Λεμπέση, Ζαχαρούλα-Πηνελόπη
Ημερομηνία
2006
Ίδρυμα
Universite Marc Bloch. UFR de Philosophie, Linguistique, Informatique et Sciences de l' Education
Εξεταστική επιτροπή
Κλαίρης Χρήστος
Ιορδανίδου Άννα
Kleiber George
Rousselot Francois
Eytan Michel
Λέξεις-κλειδιά
Νεοελληνικό ρηματικό κλιτικό σύστημα; Στατιστική μορφοσυντακτική αναγνώριση; Λημματοποίηση νεοελληνικών ρηματικών τύπων; Μηχανική μετάφραση
Χώρα
Γαλλία
Γλώσσα
Γαλλικά
Άλλα στοιχεία
415 σ., εικ.