Περίληψη
Στην παρούσα διδακτορική διατριβή παρουσιάζεται γενική μεθοδολογία για την αυτόματη παραγωγή ασαφών μοντέλων λήψης απόφασης, η οποία αποτελείται από τρία στάδια. Αρχικά, ορίζεται ένα σύνολο σαφών κανόνων που αποτελεί το σαφές μοντέλο. Οι κανόνες μπορούν να προέρχονται είτε από ειδικούς του τομέα εφαρμογής ή εξάγονται απευθείας από τα δεδομένα με χρήση μεθόδων εξόρυξης δεδομένων. Στην συνέχεια, οι σαφείς κανόνες μετατρέπονται σε ασαφείς, με αποτέλεσμα τον ορισμό ενός ασαφούς μοντέλου. Τέλος, όλες οι τιμές των παραμέτρων που χρησιμοποιούνται στο ασαφές μοντέλο ορίζονται με μια διαδικασία βελτιστοποίησης, με αποτέλεσμα την παραγωγή του τελικού ασαφούς μοντέλου. Η μεθοδολογία είναι γενική και μπορεί να υλοποιηθεί με πολλούς διαφορετικούς τρόπους. Οι προσεγγίσεις που επιχειρήθηκαν είναι η γνωσιακή σαφής προσέγγιση, που αποτελεί προοίμιο της γενικής μεθοδολογίας καθώς περιλαμβάνει μόνο το πρώτο από τα στάδιά της, η γνωσιακή ασαφής προσέγγιση, στην οποία η αρχική γνώση προέρχεται από ειδικούς ...
Στην παρούσα διδακτορική διατριβή παρουσιάζεται γενική μεθοδολογία για την αυτόματη παραγωγή ασαφών μοντέλων λήψης απόφασης, η οποία αποτελείται από τρία στάδια. Αρχικά, ορίζεται ένα σύνολο σαφών κανόνων που αποτελεί το σαφές μοντέλο. Οι κανόνες μπορούν να προέρχονται είτε από ειδικούς του τομέα εφαρμογής ή εξάγονται απευθείας από τα δεδομένα με χρήση μεθόδων εξόρυξης δεδομένων. Στην συνέχεια, οι σαφείς κανόνες μετατρέπονται σε ασαφείς, με αποτέλεσμα τον ορισμό ενός ασαφούς μοντέλου. Τέλος, όλες οι τιμές των παραμέτρων που χρησιμοποιούνται στο ασαφές μοντέλο ορίζονται με μια διαδικασία βελτιστοποίησης, με αποτέλεσμα την παραγωγή του τελικού ασαφούς μοντέλου. Η μεθοδολογία είναι γενική και μπορεί να υλοποιηθεί με πολλούς διαφορετικούς τρόπους. Οι προσεγγίσεις που επιχειρήθηκαν είναι η γνωσιακή σαφής προσέγγιση, που αποτελεί προοίμιο της γενικής μεθοδολογίας καθώς περιλαμβάνει μόνο το πρώτο από τα στάδιά της, η γνωσιακή ασαφής προσέγγιση, στην οποία η αρχική γνώση προέρχεται από ειδικούς του τομέα εφαρμογής και η οδηγούμενη-από-τα-δεδομένα ασαφής προσέγγιση, στην οποία η αρχική γνώση εξάγεται από τα δεδομένα. Σε κάποιες από αυτές χρησιμοποιήθηκαν βάρη στο τελικό ασαφές μοντέλο. Η μεθοδολογία εφαρμόστηκε σε προβλήματα αυτόματης διάγνωσης καρδιαγγειακών παθήσεων και πιο συγκεκριμένα, την ταξινόμηση αρρυθμικών καρδιακών παλμών, την ταξινόμηση ισχαιμικών καρδιακών παλμών και την διάγνωση της στεφανιαίας νόσου. Επίσης, η μεθοδολογία εφαρμόστηκε σε γνωστά προβλήματα ταξινόμησης, για να είναι δυνατή η σύγκριση με υπάρχουσες προσεγγίσεις. Τόσο η ίδια η μεθοδολογία όσο και οι υλοποιήσεις που προέκυψαν από αυτή παρουσιάζουν πλεονεκτήματα σε σχέση με παρόμοιες προσεγγίσεις που έχουν παρουσιαστεί στην υπάρχουσα βιβλιογραφία. Η γνωσιακή ασαφής υλοποίηση αποτελεί πρωτότυπη προσέγγιση ενώ η οδηγούμενη-από-τα-δεδομένα ασαφής υλοποίηση με χρήση δέντρων απόφασης εισάγει την καινοτομία της μετατροπής του ασαφούς δέντρου σε σύνολο κανόνων. Και στις δύο περιπτώσεις, η χρήση βαρών κατηγορίας αποτελεί πρωτότυπο μεθοδολογικό στοιχείο ενώ η δυνατότητα τεκμηρίωσης των αποφάσεων που παράγονται είναι βασικό πλεονέκτημα. Η εφαρμογή σε συγκεκριμένα ιατρικά πεδία είναι επίσης πρωτότυπη, ενώ η συνολική αξιολόγηση με γνωστά προβλήματα ταξινόμησης αναδεικνύει την δυνατότητα της μεθοδολογίας να παράγει αυτόματα ασαφή μοντέλα που παρουσιάζουν υψηλή επίδοση.
περισσότερα
Περίληψη σε άλλη γλώσσα
In this thesis a generic methodology for the automated generation of fuzzy models is presented. The methodology includes three stages: (i) crisp model extraction, (ii) fuzzy model creation, and (iii) parameter optimization. In the first stage, a crisp model is created; depending on the approach, which will be employed for the crisp model creation, the methodology can be knowledge-based, if the initial crisp model is defined by experts, or data-driven, if the initial crisp model is mined from the available data. In the second stage, this crisp model is transformed to the corresponding fuzzy model; several new parameters are introduced due to the fuzzification of the decision boundaries. Finally (in the third stage), optimization is performed in order to optimally define all the parameters entering the fuzzy model. The methodology is generic, thus different realizations can be created. The realizations created are the crisp approach, which consists only from the first stage of the method ...
In this thesis a generic methodology for the automated generation of fuzzy models is presented. The methodology includes three stages: (i) crisp model extraction, (ii) fuzzy model creation, and (iii) parameter optimization. In the first stage, a crisp model is created; depending on the approach, which will be employed for the crisp model creation, the methodology can be knowledge-based, if the initial crisp model is defined by experts, or data-driven, if the initial crisp model is mined from the available data. In the second stage, this crisp model is transformed to the corresponding fuzzy model; several new parameters are introduced due to the fuzzification of the decision boundaries. Finally (in the third stage), optimization is performed in order to optimally define all the parameters entering the fuzzy model. The methodology is generic, thus different realizations can be created. The realizations created are the crisp approach, which consists only from the first stage of the methodology, the knowledge based approach, where the initial crisp set of rules is defined by experts, and the data-driven approach, where data mining techniques are employed in order to generate the initial crisp set of rules directly from the data. In some cases weights are included in the fuzzy model. The methodology is applied to the cardiovascular diseases domain. More specifically, the methodology is employed in order to automatically generate fuzzy models that deal with the problem of arrhythmic beat classification in ECG, the ischemic beat classification in ECG and the coronary artery disease diagnosis. In all cases, the fuzzy models present comparable or higher accuracy than other approaches presented in the literature. In addition, a large number of benchmark classification datasets is used for the evaluation and the reported results indicate high classification accuracy. The methodology presents several advantages and novelties: it is generic since it is not based on a specific technique for crisp model generation; expert knowledge or any rule-mining technique can be adapted to generate the crisp model. This offers flexibility, since the methodology does not depend on the domain of application. This is advantageous since it can integrate state-of-the-art rule mining methods, as well as future developments or even hybrid approaches, combining expert knowledge with the mined knowledge. Also, different approaches concerning the elements of the fuzzy model and alternative optimization techniques can be integrated. Another major advantage of the methodology is that the transformation of the crisp model to the respective fuzzy one, is straightforward, ensuring in this way the fully automated nature of the methodology. In the case of the data-driven approach, the generation of fuzzy models, based on the fuzzification and optimization of a set of rules extracted from the decision tree, instead of a fuzzy decision tree (widely proposed in the literature), is a novel feature which offers more flexibility and adaptation ability to a specific dataset, while keeping the complexity of the decision making process the same. Finally, the introduction of class weights is a novel feature which allows the fuzzy model to be more flexible and adaptable.
περισσότερα