ΝΕΕΣ ΤΕΧΝΙΚΕΣ ΓΙΑ ΤΗΝ ΑΝΙΧΝΕΥΣΗ ΦΩΝΗΣ ΣΕ ΑΝΤΙΞΟΕΣ ΣΥΝΘΗΚΕΣ ΘΟΡΥΒΟΥ ΚΑΙ ΤΗΝ ΑΝΑΓΝΩΡΙΣΗ ΕΚΡΗΚΤΙΚΩΝ ΗΧΩΝ

Περίληψη

Η ΠΑΡΟΥΣΑ ΔΙΔΑΚΤΟΡΙΚΗ ΔΙΑΤΡΙΒΗ ΕΝΤΑΣΣΕΤΑΙ ΣΤΗΝ ΠΕΡΙΟΧΗ ΤΗΣ ΨΗΦΙΑΚΗΣ ΕΠΕΞΕΡΓΑΣΙΑΣ ΦΩΝΗΣ. ΣΥΓΚΕΚΡΙΜΕΝΑ, ΑΣΧΟΛΕΙΤΑΙ ΜΕ ΤΗΝ ΑΝΙΧΝΕΥΣΗ ΦΩΝΗΣ ΣΕ ΘΟΡΥΒΩΔΕΣ ΠΕΡΙΒΑΛΛΟΝ ΚΑΙ ΜΕ ΤΗΝ ΑΝΑΓΝΩΡΙΣΗ ΤΩΝ ΑΦΩΝΩΝ ΕΚΡΗΚΤΙΚΩΝ ΣΥΜΦΩΝΩΝ /K/, /P'/ ΚΑΙ /T/.ΓΙΑ ΤΟ ΠΡΟΒΛΗΜΑ ΤΗΣ ΑΝΙΧΝΕΥΣΗΣ ΠΡΟΤΕΙΝΟΝΤΑΙ ΝΕΕΣ ΜΕΘΟΔΟΙ ΠΟΥ ΧΡΗΣΙΜΟΠΟΙΟΥΝ ΤΗΝΑΝΑΛΥΣΗ ΙΔΙΑΖΟΥΣΩΝ ΤΙΜΩΝ ΤΟΥ ΘΟΡΥΒΩΔΟΥΣ ΣΗΜΑΤΟΣ ΦΩΝΗΣ, ΥΠΟ ΤΗΝ ΥΠΟΘΕΣΗ ΛΕΥΚΟΥΠΡΟΣΘΕΤΙΚΟΥ ΘΟΡΥΒΟΥ, ΚΑΙ ΤΙΣ ΣΩΡΕΥΟΥΣΕΣ ΤΡΙΤΗΣ ΤΑΞΗΣ ΤΟΥ ΙΔΙΟΥ ΣΗΜΑΤΟΣ, ΥΠΟ ΤΗΝ ΥΠΟΘΕΣΗ ΕΓΧΡΩΜΟΥ ΑΛΛΑ ΣΥΜΜΕΤΡΙΚΑ ΚΑΤΑΝΕΜΗΜΕΝΟΥ ΘΟΡΥΒΟΥ. ΟΙ ΠΡΟΤΕΙΝΟΜΕΝΟΙ ΑΝΙΧΝΕΥΤΕΣ ΥΛΟΠΟΙΟΥΝΤΑΙ ΜΕΣΩ ΑΛΓΟΡΙΘΜΩΝ ΕΠΕΞΕΡΓΑΣΙΑΣ ΚΑΤΑ ΠΛΑΙΣΙΑ ΚΑΙ ΑΝΑΔΡΟΜΙΚΗΣ ΩΣ ΠΡΟΣ ΤΟ ΧΡΟΝΟ ΜΟΡΦΗΣ. ΟΙ ΑΛΓΟΡΙΘΜΟΙ ΑΥΤΟΙ ΕΔΩΣΑΝ ΠΟΛΥ ΙΚΑΝΟΠΟΙΗΤΙΚΑ ΑΠΟΤΕΛΕΣΜΑΤΑ ΣΕ ΠΡΑΓΜΑΤΙΚΕΣ ΘΟΡΥΒΩΔΕΙΣ ΚΑΤΑΓΡΑΦΕΣ ΑΠΟ ΕΣΩΤΕΡΙΚΟ ΚΙΝΟΥΜΕΝΟΥ ΟΧΗΜΑΤΟΣ, ΚΑΙ ΣΕ SNR ΕΩΣ ΚΑΙ -6 DB. ΓΙΑ ΤΟ ΠΡΟΒΛΗΜΑ ΤΗΣ ΑΝΑΓΝΩΡΙΣΗΣ ΤΩΝ ΕΚΡΗΚΤΙΚΩΝ ΗΧΩΝ ΠΡΟΤΕΙΝΕΤΑΙ Η ΧΡΗΣΗ ΤΩΝ ΧΡΟΝΟΣΥΧΝΟΤΙΚΩΝ ΑΝΑΠΑΡΑΣΤΑΣΕΩΝ ΤΟΥ ΤΜΗΜΑΤΟΣ ΕΚΡΗΞΗΣ ΤΩΝ ΑΝΤΙΣΤΟΙΧΩΝ ΣΗΜΑΤΩΝ, ΚΑΙ ΣΥΓΚΕΚΡΙΜΕΝΑ ΜΙΑ ΕΞΟΜΑΛ ...
περισσότερα

Περίληψη σε άλλη γλώσσα

THE PRESENT THESIS DEALS WITH DIGITAL SPEECH PROCESSING AND MORE SPECIFICALLY WITH THE DETECTION OF SPEECH IN ADVERSE NOISE CONDITIONS AND WITH THE RECOGNITION OF THE UNVOICED PLOSIVES /K/, /P/ AND /T/. NEW METHODS ARE PROPOSED FOR THE DETECTION PROBLEM, WHICH ARE BASED ON THE SINGULAR VALUE DECOMPOSITION OF THE NOISY SPEECH SIGNAL, UNDER THE WHITE ADDITIVE NOISE ASSUMPTION, AND ON THE THIRD ORDER CUMULANTS OF THE SAME SIGNAL, UNDER THE COLORED BUT SYMMETRICALLY DISTRIBUTED NOISE ASSUMPTION. THE PROPOSED DETECTORS ARE IMPLEMENTED THROUGH ALGORITHMS THAT TAKE EITHER THE FRAME PROCESSING OR THE SAMPLE ADAPTIVE FORM. THESE ALGORITHMS HAVE SHOWN SATISFACTORY PERFORMANCE ON REAL CAR-INTERIOR SPEECH RECORDINGS AND DOWN TO -6 DB SNR. FOR THE PLOSIVES RECOGNITION PROBLEM, WE PROPOSE THE USE OF THE TIME-FREQUENCY REPRESENTATIONS OF THE EXPLOSION PART OFTHE CORRESPONDING SIGNALS, AND MORE SPECIFICALLY OF THE SMOOTHED AND SUBSAMPLED VERSION OF THE WIGNER-VILLE DISTRIBUTION. THE FEA ...
περισσότερα
Πρέπει να είστε εγγεγραμένος χρήστης για έχετε πρόσβαση σε όλες τις υπηρεσίες του ΕΑΔΔ  Είσοδος /Εγγραφή

Όλα τα τεκμήρια στο ΕΑΔΔ προστατεύονται από πνευματικά δικαιώματα.

DOI
10.12681/eadd/3275
Διεύθυνση Handle
http://hdl.handle.net/10442/hedi/3275
Εναλλακτικός τίτλος
NEW TECHNIQUES FOR THE DETECTION OF SPEECH IN ADVERSE NOISE CONDITIONS AND FOR THE RECOGNITION OF PLOSIVE SOUNDS
Συγγραφέας
ΡΑΓΚΟΥΣΗ, ΜΑΡΙΑ
Ημερομηνία
1995
Ίδρυμα
Εθνικό Μετσόβιο Πολυτεχνείο (ΕΜΠ). Τμήμα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών
Εξεταστική επιτροπή
ΘΕΟΔΩΡΟΥ ΝΙΚΟΛΑΟΣ
ΚΑΡΑΓΙΑΝΝΗΣ ΓΕΩΡΓΙΟΣ
ΚΟΛΛΙΑΣ ΣΤΕΦΑΝΟΣ
ΜΕΡΤΖΙΟΣ ΒΑΣΙΛΕΙΟΣ
ΠΑΠΑΚΩΝΣΤΑΝΤΙΝΟΥ ΓΕΩΡΓΙΟΣ
ΠΡΩΤΟΝΟΤΑΡΙΟΣ ΕΜΜΑΝΟΥΗΛ
ΧΑΛΚΙΑΣ ΧΡΗΣΤΟΣ
Επιστημονικό πεδίο
Μηχανική & Τεχνολογία
Επιστήμες Ηλεκτρολόγου Μηχανικού, Ηλεκτρονικού Μηχανικού & Μηχανικού Η/Υ
Λέξεις-κλειδιά
Αναγνωρίσεις; Ανάλυση ιδιαζουσών τιμών; Ανίχνευση; Κατηγοριοποίηση; ΣΩΡΕΥΟΥΣΕΣ ΤΡΙΤΗΣ ΤΑΞΗΣ; Δίκτυα, Τεχνητά νευρωνικά; ΧΡΟΝΟΣΥΧΝΟΤΙΚΕΣ ΑΝΑΠΑΡΑΣΤΑΣΕΙΣ; Ψηφιακή επεξεργασία φωνής
Χώρα
Ελλάδα
Γλώσσα
Ελληνικά