Εξαγωγή και αναπαράσταση γνώσης από αδόμητα κείμενα βασισμένη σε γράφους και τεχνικές μηχανικής μάθησης

Περίληψη

Η παρούσα διατριβή επεκτείνει υπάρχοντα μοντέλα αναπαράστασης κειμένου που βασίζονται σε γράφους και προτείνει ένα νέο μοντέλο, το ‘graph-of-docs’, για την αναπαράσταση πολλαπλών εγγράφων κειμένου σε έναν ενιαίο γράφο. Σε αντίθεση με τις υπάρχουσες προσεγγίσεις, το graph-of-docs επιτρέπει τη διερεύνηση της σημασίας ενός όρου στο σύνολο των εγγράφων, μειώνει τη συνολική πολυπλοκότητα ανάγοντας κάθε γράφο λέξεων σε έναν κόμβο, και υποστηρίζει την εισαγωγφέας