Μοντελοποίηση και ψηφιακή επεξεργασία προσωδιακών φαινομένων της ελληνικής γλώσσας με εφαρμογή στην σύνθεση ομιλίας

Περίληψη

Αντικείμενο της παρούσης εργασίας αποτελεί η μελέτη και μοντελοποίηση φαινομένων επιτονισμού της Ελληνικής γλωσσάς με εφαρμογές στη σύνθεση ομιλίας. Στα πλαίσια αυτής της κατεύθυνσης αναπτύχθηκαν γλωσσικοί πόροι ομιλίας και εργαλεία για την επεξεργασία και μελέτη προσωδιακών παραγόντων οι οποίοι επηρεάζουν την πληροφορία που μεταφέρεται μέσω του προφορικού λογού. Αρχικά σχεδιάζονται, αναπτύσσονται και ηχογραφούνται πόροι ομιλίας για την Ελληνική γλώσσα (WCL-1). Οι πόροι αυτοί αποτελούνται από τρία μέρη: (α) τη βάση διφώνων, (β) τη βάση προσωδιακής ομιλίας και, (γ) τη βάση συναισθηματικής ομιλίας. Η βάση διφώνων η οποία αποτελεί βασικό συστατικό ενός συστήματος σύνθεσης ομιλίας με συνένωση μονάδων προέκυψε από την ηχογράφηση και σχολιασμό ασυνάρτητων λέξεων οι οποίες λειτουργούν ως φορείς διφώνων. Όσον φορά τη προσωδιακή και την συναισθηματική βάση ομιλίας χρησιμοποιήθηκε αρχικά το ίδιο σώμα κειμένων όμως κατά την πορεία εκπόνησης της διατριβής το πρώτο εμπλουτίσθηκε με περισσότερες ηχο ...
περισσότερα

Περίληψη σε άλλη γλώσσα

In this thesis we cope with the task of studying and modeling prosodic phenomena encountered in Greek language with applications to the task of speech synthesis from text. For the achievement of this particular task, spoken corpora with various levels of morphosyntactical and linguistic representation as well as tools for their processing were constructed. With the success of concatenative speech synthesis as well as the shift from rule-based modeling of prosody to formal multivariate models that require the associated parameters to be statistically derived from a training corpus research in the area of synthetic speech production has come to rely on models produced from data driven methods. In particular concatenative speech synthesis heavily relies on the existence of an automatic selection procedure of candidate units from a recorded speech database. Furthermore construction of reliable data-driven prosodic event prediction models requires a well-designed annotated speech corpus and ...
περισσότερα

Όλα τα τεκμήρια στο ΕΑΔΔ προστατεύονται από πνευματικά δικαιώματα.

DOI
10.12681/eadd/26654
Διεύθυνση Handle
http://hdl.handle.net/10442/hedi/26654
ND
26654
Εναλλακτικός τίτλος
Modeling and signal processing of greek language prosodic events with application to speech synthesis
Συγγραφέας
Ζέρβας, Παναγιώτης (Πατρώνυμο: Γρηγόριος)
Ημερομηνία
2007
Ίδρυμα
Πανεπιστήμιο Πατρών. Σχολή Πολυτεχνική. Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών. Εργαστήριο Ενσύρματης Τηλεπικοινωνίας
Εξεταστική επιτροπή
Φακωτάκης Νικόλαος
Αβούρης Νικόλαος
Αναστασόπουλος Βασίλειος
Χριστοδουλάκης Δημήτριος
Μπερμπερίδης Κωνσταντίνος
Μουρτζόπουλος Ιωάννης
Δερματάς Ευάγγελος
Επιστημονικό πεδίο
Φυσικές Επιστήμες
Επιστήμη Ηλεκτρονικών Υπολογιστών και Πληροφορική
Λέξεις-κλειδιά
Προσωδία; Επιτονισμός; Επεξεργασία σήματος ομιλίας; Σύνθεση ομιλίας; Μηχανική μάθηση
Χώρα
Ελλάδα
Γλώσσα
Ελληνικά
Άλλα στοιχεία
179 σ., πιν., σχημ., γραφ.
Στατιστικά χρήσης
ΠΡΟΒΟΛΕΣ
Αφορά στις μοναδικές επισκέψεις της διδακτορικής διατριβής για την χρονική περίοδο 07/2018 - 07/2023.
Πηγή: Google Analytics.
ΞΕΦΥΛΛΙΣΜΑΤΑ
Αφορά στο άνοιγμα του online αναγνώστη για την χρονική περίοδο 07/2018 - 07/2023.
Πηγή: Google Analytics.
ΜΕΤΑΦΟΡΤΩΣΕΙΣ
Αφορά στο σύνολο των μεταφορτώσων του αρχείου της διδακτορικής διατριβής.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.
ΧΡΗΣΤΕΣ
Αφορά στους συνδεδεμένους στο σύστημα χρήστες οι οποίοι έχουν αλληλεπιδράσει με τη διδακτορική διατριβή. Ως επί το πλείστον, αφορά τις μεταφορτώσεις.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.
Σχετικές εγγραφές (με βάση τις επισκέψεις των χρηστών)