Αυτόματη παραγωγή περιλήψεων

Περίληψη

Η αυτόματη παραγωγή περιλήψεων έχει κερδίσει μεγάλο ενδιαφέρον τα τελευταία χρόνια μιας και θα μπορούσε να κάνει την αναζήτηση πληροφορίας σε μεγάλες συλλογές δεδομένων λιγότερο κουραστική και χρονοβόρα. Τα περισσότερα συστήματα παράγουν περιλήψεις εξάγοντας αρχικά τις προτάσεις που είναι πιο σχετικές με ένα ερώτημα του χρήστη από τα κείμενα που επέστρεψε μια μηχανή ανάκτησης πληροφορίας. Σε αυτή την διατριβή, παρουσιάζουμε μια νέα ανταγωνιστική μέθοδο για την εξαγωγή προτάσεων η οποία αναθέτει ένα βαθμό σχετικότητας σε κάθε πρόταση των κειμένων από τα οποία θα παραχθεί η περίληψη. Η μέθοδος αυτή συνδυασμένη με μια απλή τεχνική που επιχειρεί να εντοπίσει προτάσεις που περιέχουν παρόμοιες πληροφορίες έδωσε πολύ ανταγωνιστικά αποτελέσματα συγκρινόμενη με πολλές άλλες μεθόδους σε διάφορα σύνολα δεδομένων. Εκτός αυτού, προτείνουμε δύο πρωτότυπες μεθόδους συμπίεσης προτάσεων που ξαναγράφουν μια αρχική πρόταση σε συντομότερη μορφή διατηρώντας παράλληλα τις πιο σημαντικές πληροφορίες τ ...
περισσότερα

Περίληψη σε άλλη γλώσσα

Automatic text summarization has gained much interest in the last few years, since it could, at least in principle, make the process of information seeking in large document collections less tedious and time-consuming. Most existing summarization methods generate summaries by initially extracting the sentences that are most relevant to the user's query from documents returned by an information retrieval engine. In this thesis, we present a new competitive sentence extraction method that assigns relevance scores to the sentences of the texts to be summarized. Coupled with a simple method to avoid selecting redundant sentences, the resulting summarization system achieves state-of-the-art results on widely used benchmark datasets. Moreover, we propose two novel sentence compression methods, which rewrite a source sentence in a shorter form, retaining the most important information. The first method produces extractive compressions, i.e., it only deletes words, whereas the second o ...
περισσότερα

Όλα τα τεκμήρια στο ΕΑΔΔ προστατεύονται από πνευματικά δικαιώματα.

DOI
10.12681/eadd/28203
Διεύθυνση Handle
http://hdl.handle.net/10442/hedi/28203
ND
28203
Εναλλακτικός τίτλος
Automatic generation of natural language summaries
Συγγραφέας
Γαλάνης, Δημήτριος (Πατρώνυμο: Κωνσταντίνος)
Ημερομηνία
2012
Ίδρυμα
Οικονομικό Πανεπιστήμιο Αθηνών. Τμήμα Πληροφορικής
Εξεταστική επιτροπή
Ανδρουτσόπουλος Ιωάννης
Καλαμπούκης Θεόδωρος
Σιδέρη Μάρθα
Κωνσταντόπουλος Πάνος
Βαζιργιάννης Μιχάλης
Καρκαλέτσης Βαγγέλης
Παπαγεωργίου Χάρης
Επιστημονικό πεδίο
Φυσικές Επιστήμες
Επιστήμη Ηλεκτρονικών Υπολογιστών και Πληροφορική
Λέξεις-κλειδιά
Επεξεργασία φυσικής γλώσσας; Περιλήψεις, Παραγωγή; Συμπίεση προτάσεων; Μηχανική μάθηση
Χώρα
Ελλάδα
Γλώσσα
Αγγλικά
Άλλα στοιχεία
πιν., σχημ., γραφ.
Στατιστικά χρήσης
ΠΡΟΒΟΛΕΣ
Αφορά στις μοναδικές επισκέψεις της διδακτορικής διατριβής για την χρονική περίοδο 07/2018 - 07/2023.
Πηγή: Google Analytics.
ΞΕΦΥΛΛΙΣΜΑΤΑ
Αφορά στο άνοιγμα του online αναγνώστη για την χρονική περίοδο 07/2018 - 07/2023.
Πηγή: Google Analytics.
ΜΕΤΑΦΟΡΤΩΣΕΙΣ
Αφορά στο σύνολο των μεταφορτώσων του αρχείου της διδακτορικής διατριβής.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.
ΧΡΗΣΤΕΣ
Αφορά στους συνδεδεμένους στο σύστημα χρήστες οι οποίοι έχουν αλληλεπιδράσει με τη διδακτορική διατριβή. Ως επί το πλείστον, αφορά τις μεταφορτώσεις.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.
Σχετικές εγγραφές (με βάση τις επισκέψεις των χρηστών)