Περίληψη
Ο όρος «αναγνώριση χαρακτήρων» αφορά στην ‘ανάγνωση’ κειμένου από τον υπολογιστή ξεκινώντας από μία εικόνα κειμένου και στην μετατροπή της σε ηλεκτρονικό κείμενο. Στα πλαίσια της διδακτορικής διατριβής μελετήθηκε το στάδιο της κατάτμησης των χειρογράφων και αναπτύχθηκαν νέες μέθοδοι για την κατάτμηση τους στα βασικά στοιχεία που τα αποτελούν, δηλαδή στις γραμμές κειμένου και στις λέξεις. Αναφορικά με το πρόβλημα της κατάτμησης ενός εγγράφου σε γραμμές κειμένου, αναπτύχθηκε μία νέα μεθοδολογία η οποία στηρίζεται στον μετασχηματισμό Hough. Η καινοτομία της προτεινόμενης μεθοδολογίας συνίσταται στα εξής: (ι) εφαρμογή ενός τροποποιημένου μετασχηματισμού Hough στον οποίο η ψηφοφορία στον πίνακα συσσώρευσης γίνεται χρησιμοποιώντας σημεία από blocks ίσου πλάτους τα οποία προκύπτουν από διάσπαση των συνδεδεμένων τμημάτων (connected components), (ii) η διαμέριση του χώρου των συνδεδεμένων τμημάτων σε 3 υποχώρους τα συνδεδεμένα τμήματα των οποίων υπόκεινται σε διαφορετική επεξεργασία και (iii) α ...
Ο όρος «αναγνώριση χαρακτήρων» αφορά στην ‘ανάγνωση’ κειμένου από τον υπολογιστή ξεκινώντας από μία εικόνα κειμένου και στην μετατροπή της σε ηλεκτρονικό κείμενο. Στα πλαίσια της διδακτορικής διατριβής μελετήθηκε το στάδιο της κατάτμησης των χειρογράφων και αναπτύχθηκαν νέες μέθοδοι για την κατάτμηση τους στα βασικά στοιχεία που τα αποτελούν, δηλαδή στις γραμμές κειμένου και στις λέξεις. Αναφορικά με το πρόβλημα της κατάτμησης ενός εγγράφου σε γραμμές κειμένου, αναπτύχθηκε μία νέα μεθοδολογία η οποία στηρίζεται στον μετασχηματισμό Hough. Η καινοτομία της προτεινόμενης μεθοδολογίας συνίσταται στα εξής: (ι) εφαρμογή ενός τροποποιημένου μετασχηματισμού Hough στον οποίο η ψηφοφορία στον πίνακα συσσώρευσης γίνεται χρησιμοποιώντας σημεία από blocks ίσου πλάτους τα οποία προκύπτουν από διάσπαση των συνδεδεμένων τμημάτων (connected components), (ii) η διαμέριση του χώρου των συνδεδεμένων τμημάτων σε 3 υποχώρους τα συνδεδεμένα τμήματα των οποίων υπόκεινται σε διαφορετική επεξεργασία και (iii) αποδοτικός διαχωρισμός τμημάτων γειτονικών γραμμών που εφάπτονται. Αναφορικά με την κατάτμηση εικόνας εγγράφου στις λέξεις που την αποτελούν, αναπτύχθηκαν δύο μεθοδολογίες. Στην πρώτη μεθοδολογία, η απόφαση αν ένα κενό είναι μεταξύ λέξεων ή μεταξύ χαρακτήρων σε ίδια λέξη στηρίζεται στον προσδιορισμό ενός κατωφλίου το οποίο υπολογίζεται χρησιμοποιώντας βασικά γεωμετρικά χαρακτηριστικά της εικόνας. Σύμφωνα με τη δεύτερη μεθοδολογία, το πρόβλημα αυτό αντιμετωπίζεται χρησιμοποιώντας μία μέθοδο μη καθοδηγούμενης ομαδοποίησης (unsupervised clustering), που βασίζεται σε μοντελοποίηση με χρήση μίξης Gaussian κατανομών (Gaussian Mixture Modeling). Πειραματικά αποτελέσματα έδειξαν ότι οι τεχνικές αυτές έχουν καλύτερες επιδόσεις, σε σχέση με άλλες τεχνικές της βιβλιογραφίας. Επίσης, αναπτύχθηκε μία νέα μεθοδολογία αποτίμησης των μεθοδολογιών κατάτμησης λέξεων, δύο σταδίων. Η συγκεκριμένη μεθοδολογία αντιμετωπίζει το στάδιο υπολογισμού της απόστασης γειτονικών τμημάτων και το στάδιο ταξινόμησης των αποστάσεων ανεξάρτητα, σε αντίθεση με τις υπάρχουσες μεθοδολογίες αποτίμησης των μεθοδολογιών κατάτμησης λέξεων.
περισσότερα
Περίληψη σε άλλη γλώσσα
“Character recognition” refers to the procedure of ‘reading’ text using a computer, taking as input a document image as well as to the conversion of the document image to electronic text. This dissertation focuses on the segmentation of handwritten document images to the basic semantic units that comprise them, namely text lines and words. Concerning the problem of text line segmentation, we developed a new methodology whose novelties are: (i) an efficient block-based Hough transform in which voting occurs on the basis of equally spaced blocks after splitting of the connected components’ bounding box; (ii) a partitioning of the connected component domain into three spatial sub-domains, for which a different processing strategy of the corresponding connected components can be employed; and (iii) the efficient separation of vertically connected parts of text lines. The proposed text line segmentation methodology has been evaluated against other state-of-the-art text line segmentation met ...
“Character recognition” refers to the procedure of ‘reading’ text using a computer, taking as input a document image as well as to the conversion of the document image to electronic text. This dissertation focuses on the segmentation of handwritten document images to the basic semantic units that comprise them, namely text lines and words. Concerning the problem of text line segmentation, we developed a new methodology whose novelties are: (i) an efficient block-based Hough transform in which voting occurs on the basis of equally spaced blocks after splitting of the connected components’ bounding box; (ii) a partitioning of the connected component domain into three spatial sub-domains, for which a different processing strategy of the corresponding connected components can be employed; and (iii) the efficient separation of vertically connected parts of text lines. The proposed text line segmentation methodology has been evaluated against other state-of-the-art text line segmentation methodologies and has proven to achieve better results. Concerning the word segmentation stage, we developed two different methodologies. Concerning the first methodology, the decision on whether a gap is between two words or inside a single word, we proposed a threshold which is calculated making use of several characteristics of the document image. On the second approach, we make use of a well-known methodology in the field of unsupervised clustering, the Gaussian mixture modeling in order to classify the gaps into each class. Experimental results prove the efficiency of the proposed methodologies. Finally, a novel two stage evaluation methodology for word segmentation techniques is proposed. This methodology treats the distance computation stage and the gap classification stage independently, in contrast to current evaluation methodologies for word segmentation
περισσότερα