Περίληψη
Στην παρούσα διατριβή παρουσιάζονται προηγμένες τεχνικές απεικόνισης και επεξεργασίας ηχητικών σημάτων. Αφορμή και στόχος της εργασίας είναι η αναζήτηση τρόπων αξιολόγησης, χαρτογράφησης και ποσοτικοποίησης της ποιότητας αναπαραγωγής του ήχου σε δωμάτια όπως και η βελτίωση της ποιότητας αναπαραγωγής του ήχου σε ακουστικά. Στο Κεφάλαιο 1 παρουσιάζονται αναλυτικά η αφορμή και οι στόχοι της παρούσας εργασίας και γίνεται μια σύντομη περιγραφή της τεχνολογίας αιχμής επί των θεμάτων που διαπραγματεύεται. Στο τέλος αυτού του κεφαλαίου περιλαμβάνονται οι δημοσιεύσεις σε επιστημονικά περιοδικά και οι ανακοινώσεις σε επιστημονικά συνέδρια οι οποίες έγιναν κατά την διάρκεια εκπόνησης της παρούσας διατριβής. Στο Κεφάλαιο 2 παρουσιάζεται το θεωρητικό υπόβαθρο και οι βασικές αρχές πάνω στο οποίο βασίστηκε και στοιχειοθετήθηκε η παρούσα εργασία. Στο Κεφάλαιο 3 ορίζονται και παρουσιάζονται νέες μετρικές αξιολόγησης της ποιότητας αναπαραγωγής του ηχητικού ειδώλου το οποίο αναπαράγεται από στερεοφωνική ...
Στην παρούσα διατριβή παρουσιάζονται προηγμένες τεχνικές απεικόνισης και επεξεργασίας ηχητικών σημάτων. Αφορμή και στόχος της εργασίας είναι η αναζήτηση τρόπων αξιολόγησης, χαρτογράφησης και ποσοτικοποίησης της ποιότητας αναπαραγωγής του ήχου σε δωμάτια όπως και η βελτίωση της ποιότητας αναπαραγωγής του ήχου σε ακουστικά. Στο Κεφάλαιο 1 παρουσιάζονται αναλυτικά η αφορμή και οι στόχοι της παρούσας εργασίας και γίνεται μια σύντομη περιγραφή της τεχνολογίας αιχμής επί των θεμάτων που διαπραγματεύεται. Στο τέλος αυτού του κεφαλαίου περιλαμβάνονται οι δημοσιεύσεις σε επιστημονικά περιοδικά και οι ανακοινώσεις σε επιστημονικά συνέδρια οι οποίες έγιναν κατά την διάρκεια εκπόνησης της παρούσας διατριβής. Στο Κεφάλαιο 2 παρουσιάζεται το θεωρητικό υπόβαθρο και οι βασικές αρχές πάνω στο οποίο βασίστηκε και στοιχειοθετήθηκε η παρούσα εργασία. Στο Κεφάλαιο 3 ορίζονται και παρουσιάζονται νέες μετρικές αξιολόγησης της ποιότητας αναπαραγωγής του ηχητικού ειδώλου το οποίο αναπαράγεται από στερεοφωνική διάταξη ηχείων μέσα σε δωμάτιο. Αναπτύσσεται μεθοδολογία απεικόνισης και δημιουργίας χαρτών αξιόπιστης αναπαραγωγής του ηχητικού ειδώλου. Η μέθοδος αυτή μπορεί να χρησιμοποιηθεί για οποιαδήποτε μετρική επιθυμούμε και δεν περιορίζεται μόνο σε αυτή για την οποία ορίζεται και χρησιμοποιείται στην παρούσα εργασία. Το σχήμα αξιολόγησης εξετάζεται με τρεις διαφορετικούς τρόπους. Βασικός άξονας αποτελεί η εκτίμηση / εντοπισμός της διεύθυνσης άφιξης του ηχητικού ειδώλου (direction of arrival - DoA) με την χρήση αμφιωτικών παραμέτρων (binaural cues). Ο πρώτος τρόπος χρησιμοποιεί κλασική μοντελοποίηση του μηχανισμού ακοής του ανθρώπου για τον υπολογισμό και την εκτίμηση της γωνίας άφιξης. Έπειτα αναπτύσσεται ένας πρωτότυπος αλγόριθμος μηχανικής μάθησης τύπου «ταξινομητής τυχαίου δέντρου» (random tree classifier). Ο αλγόριθμος αυτός εκπαιδεύεται με ιδανικές συνθήκες ακρόασης και είναι πλέον ικανός να «εντοπίσει» το ηχητικό είδωλο σε χώρους με αντήχηση και ηχητικές πηγές διαφορετικές από τις ιδανικές με πολύ καλό βαθμό επιτυχίας. Στην τρίτη περίπτωση εκπαιδεύεται ένα νευρωνικό δίκτυο με πληθώρα διαφορετικών σημάτων διέγερσης και συνθηκών ακουστικής. Την ταχύτητα εκπαίδευσης μειώνει ένας πρωτότυπος τρόπος συμπίεσης των δεδομένων εισόδου. Η μέθοδος πετυχαίνει αντίστοιχα αν όχι καλύτερα αποτελέσματα συγκριτικά με άλλες αντίστοιχες υλοποιήσεις που έχουν προταθεί από την ερευνητική κοινότητα. Εκτενής περιγραφή και αποτελέσματα παρουσιάζονται στο Κεφάλαιο 4. Το Κεφάλαιο 5 ασχολείται με την διόρθωση φασματικών παραμορφώσεων σε ακουστικά ακρόασης μουσικής κυρίως προσανατολισμένα για την σύνδεσή και χρήση τους σε φορητές συσκευές αναπαραγωγής ήχου. Σκοπός είναι η δημιουργία φίλτρων τα οποία είναι «μικρά», «αποτελεσματικά» και που μπορούν να υλοποιηθούν απευθείας σε «μικρούς» επεξεργαστές σημάτων (DSP). Για τον σκοπό αυτό χρησιμοποιείται μια μέθοδος αιχμής για τον σχεδιασμό και την υλοποίηση των συντελεστών των φίλτρων η οποία υλοποιεί την δημιουργία φίλτρων με στόχο μια απόκριση αναφοράς (target frequency response). Η μέθοδος αυτή ενσωματώνεται σε έναν πρωτότυπο αλγόριθμο αυτόματου σχεδιασμού των φίλτρων όπου δίνεται η δυνατότητα ελέγχου της τάξης του φίλτρου, του προσδιορισμού της απόκρισης αναφοράς και του «βαθμού προσέγγισης» του στόχου. Πέρα από τις αντικειμενικές παραμέτρους και την εμφανή επιτυχία και βελτίωση της ηχητικής απόδοσης των συστημάτων, οι μέθοδοι που αναπτύσσονται στην παρούσα εργασία έχουν επικυρωθεί και από υποκειμενικά τεστ ακρόασης. Στο Κεφάλαιο 6 περιγράφονται αναλυτικά η μεθοδολογία και τα αποτελέσματα αυτών των τεστ ακρόασης. Στο τελευταίο κεφάλαιο (Κεφάλαιο 7) γίνεται μια σύντομη ανακεφαλαίωση των αποτελεσμάτων και των συμπερασμάτων και αποτυπώνονται μερικές ιδέες για πιθανή μελλοντική ανάπτυξη και προαγωγή των αντικειμένων που διαπραγματεύεται η παρούσα εργασία.
περισσότερα
Περίληψη σε άλλη γλώσσα
This dissertation presents advanced methodologies for the visualization and processing of audio signals. The primary motivation and objective of the work are to develop approaches for the evaluation, mapping, and quantification of sound reproduction quality in rooms, as well as to enhance reproduction quality in headphones. Chapter 1 presents in detail the motivation and objectives of this dissertation and provides a brief description of the state-of-the-art technology related to the addressed topics. At the end of this chapter, the publications in scientific journals and the conference presentations made during the course of this dissertation are listed. Chapter 2 presents the theoretical background and the fundamental principles on which this work is based. Novel evaluation metrics are defined and introduced for assessing the quality of the auditory image produced by a stereophonic loudspeaker configuration in a room. A visualization methodology is proposed for generating maps of rel ...
This dissertation presents advanced methodologies for the visualization and processing of audio signals. The primary motivation and objective of the work are to develop approaches for the evaluation, mapping, and quantification of sound reproduction quality in rooms, as well as to enhance reproduction quality in headphones. Chapter 1 presents in detail the motivation and objectives of this dissertation and provides a brief description of the state-of-the-art technology related to the addressed topics. At the end of this chapter, the publications in scientific journals and the conference presentations made during the course of this dissertation are listed. Chapter 2 presents the theoretical background and the fundamental principles on which this work is based. Novel evaluation metrics are defined and introduced for assessing the quality of the auditory image produced by a stereophonic loudspeaker configuration in a room. A visualization methodology is proposed for generating maps of reliable auditory image reproduction. This methodology is designed to be general and applicable to any evaluation metric, not solely to the one defined and employed in this study. These methods are described in detail in Chapter 3. The evaluation framework is investigated through three distinct approaches. Central to all three is the estimation and detection of the auditory image’s direction of arrival (DoA) using binaural cues. The first approach employs a classical model of the human auditory mechanism to calculate and estimate the angle of arrival. The second approach introduces an original machine learning algorithm based on a random tree classifier, trained under ideal listening conditions. Once trained, the classifier is capable of accurately localizing the auditory image in reverberant environments and with non-ideal sound sources, achieving a high level of performance. The third approach utilizes a neural network trained on a diverse set of excitation signals and acoustic conditions. Training efficiency is enhanced through a novel input data compression technique. The method yields results comparable to, or surpassing, those of other implementations proposed in the research literature. A comprehensive description of these methods and their results is provided in Chapter 4. Chapter 5 addresses the correction of spectral distortions in music-listening headphones, with a focus on devices designed for use with portable audio playback systems. The aim is to design filters that are compact, efficient, and directly implementable on low-power digital signal processors (DSPs). For this purpose, a state-of-the-art technique for filter coefficient design is employed, enabling the creation of filters targeted toward a specified reference frequency response. This technique is integrated into a novel automatic filter design algorithm, offering control over filter order, reference response specification, and the degree of approximation to the target response. In addition to the objective performance improvements, the proposed methods have been validated through subjective listening tests. Chapter 6 details the methodology and results of these evaluations. Finally, Chapter 7 provides a concise summary of the findings and conclusions and outlines potential directions for future research and development
περισσότερα