Περίληψη
Η επιλογή μεταξύ διαφορετικών μοντέλων έχει αποκτήσει τις τελευταιες δεκαετίες σημαντικό επιστημονικό ενδιαφέρον. Αυτό πηγάζει από την ύπαρξη συνεχούς αυξανόμενης πολυπλοκότητας των φυσικών φαινομένων, και η ικανότητα μας να βγάλουμε νόημα από αυτά είναι εξαιρετικά σημαντική εφόσον αυτό προϋποθέτει την κατανόηση του μηχανισμού που παράγει αυτά τα φαινόμενα και επομένως την κατανόηση της αβεβαιότητας πίσω από αυτά. Μοντέλα που προσπαθούν να συλλάβουν την αβεβαιότητα των φυσικών φαινομένων μπορούν να παρθούν από μία μεγάλη γκάμα κατανομών που μπορούν να είναι απλές και σύνθετες ανάλογα με το πρόβλημα που μελετούμε. Για τα περισσότερα προβλήματα, η κανονική κατανομή αποτελεί την προεπιλεγμένη επιλογή λόγω της μαθηματικής ευκολίας και της ευρείας κατανόησης της συμπεριφοράς της. Επιπλέον, μπορεί να προσεγγιστεί μέσω του Κεντρικού Οριακού Θεωρήματος (ΚΟΘ) δεδομένου μεγάλου δείγματος. Ανάμεσα στα πραγματικά προβλήματα είναι η μοντελοποίηση του χρόνου μέχρι την εμφάνιση ενός γεγονότος. Αυτοί ...
Η επιλογή μεταξύ διαφορετικών μοντέλων έχει αποκτήσει τις τελευταιες δεκαετίες σημαντικό επιστημονικό ενδιαφέρον. Αυτό πηγάζει από την ύπαρξη συνεχούς αυξανόμενης πολυπλοκότητας των φυσικών φαινομένων, και η ικανότητα μας να βγάλουμε νόημα από αυτά είναι εξαιρετικά σημαντική εφόσον αυτό προϋποθέτει την κατανόηση του μηχανισμού που παράγει αυτά τα φαινόμενα και επομένως την κατανόηση της αβεβαιότητας πίσω από αυτά. Μοντέλα που προσπαθούν να συλλάβουν την αβεβαιότητα των φυσικών φαινομένων μπορούν να παρθούν από μία μεγάλη γκάμα κατανομών που μπορούν να είναι απλές και σύνθετες ανάλογα με το πρόβλημα που μελετούμε. Για τα περισσότερα προβλήματα, η κανονική κατανομή αποτελεί την προεπιλεγμένη επιλογή λόγω της μαθηματικής ευκολίας και της ευρείας κατανόησης της συμπεριφοράς της. Επιπλέον, μπορεί να προσεγγιστεί μέσω του Κεντρικού Οριακού Θεωρήματος (ΚΟΘ) δεδομένου μεγάλου δείγματος. Ανάμεσα στα πραγματικά προβλήματα είναι η μοντελοποίηση του χρόνου μέχρι την εμφάνιση ενός γεγονότος. Αυτοί οι χρόνοι μπορεί να είναι γενικού ενδιαφέροντος, από την μοντελοποίηση γεγονότων που αφορούν τον αθλητισμό ( χρόνοι μέχρι την πραγματοποίηση ενός γκολ) μέχρι την μοντελοποίηση χρόνων που σχετίζονται με την ιατρική (χρόνος μέχρι ο ενεργή θεραπεία να είναι αποτελεσματική, ή χρόνος μέχρι τον θάνατο ενός ασθενούς). Αυτά τα προβλήματα, από την φύση τους, μπορούν να είναι πολύπλοκα ειδικά λόγω του μεγάλου αριθμού των παραγόντων που μπορούν να επηρεάσουν την μεταβλητή απόκρισης και λόγω του γεγονότος ότι η μεταβλητή απόκρισης (χρόνος - μέχρι - το γεγονός) είναι αυστηρά μη αρνητικός, και από την ύπαρξη λογοκριμένων παρατηρήσεων. Σε αυτή τη δουλειά, επικεντρωνόμαστε στην κλάση των μοντέλων επιβίωσης που λέγονται μοντέλα Επιταχυνόμενου Χρόνου Αποτυχίας (ΕΧΑ) ως προς την πιθανοφάνεια των δεδομένων, ενώ ταυτόχρονα παραθέτουμε εκ των προτέρων κατανομές χαμηλής πληροφορίας για την επιλογή μεταβλητών ολοκληρώνοντας έτσι την Μπεϋζιανή μοντελοποίηση. Πιο συγκεκριμένα, επικεντρωνόμαστε σε δεδομένα Weibull κατανομής ανοίγοντας όμως και την συζήτηση για επεκτάσεις εφαρμογής της προτεινόμενης προσέγγισης σε πιο γενικές κατανομές. Η εκ των προτέρων κατανομές που προτείνουμε δοκιμάστηκαν σε προσομοιωμένα δεδομένα που προέρχονται απο μεγάλο αριθμό διαφορετικών σεναρίων για την πλήρη κατανόηση της γενικής και οριακής της συμπεριφοράς. Τέλος, μέσω προσομοιώσεων, η εκ των προτέρων κατανομή που προτείνουμε οδηγεί σε μια Μπεϋζιανή διαδικασία επιλογής μεταβλητών που ικανοποιεί την ιδιότητα της συνέπειας όσον αφορά την επιλογή του τελικού μοντέλου.
περισσότερα
Περίληψη σε άλλη γλώσσα
Selecting among different models has been gaining significant scientific concern over the last decades. This stems from the fact that due to the increased complexity of natural phenomena, the ability to understand and make sense of them is crucially important since this implies understanding the underlying mechanism that produces that phenomena and hence implies understanding and capturing the uncertainty behind them. Models that attempt to capture the uncertainty of natural phenomena can be drawn from a wide pool of distributions that can be both simple and complex depending on the problem under study. For a wide variety of problems, the Normal distribution has been used a default option due to its lack of complexity, the thorough understanding of its behavior, and the fact that it can be approximated under the Central Limit Theorem (CLT) provided a large enough sample. Unfortunately, such distributions, can be a useful modeling tool only for a small class of phenomena leading to the ...
Selecting among different models has been gaining significant scientific concern over the last decades. This stems from the fact that due to the increased complexity of natural phenomena, the ability to understand and make sense of them is crucially important since this implies understanding the underlying mechanism that produces that phenomena and hence implies understanding and capturing the uncertainty behind them. Models that attempt to capture the uncertainty of natural phenomena can be drawn from a wide pool of distributions that can be both simple and complex depending on the problem under study. For a wide variety of problems, the Normal distribution has been used a default option due to its lack of complexity, the thorough understanding of its behavior, and the fact that it can be approximated under the Central Limit Theorem (CLT) provided a large enough sample. Unfortunately, such distributions, can be a useful modeling tool only for a small class of phenomena leading to the need of more complex models to explain real world issues or concerns. Among the real world issues is the modeling of time-to-event data. These recorded times can be of general interest, from modeling sport events (goal arrival times) to modeling medically related times (time until an active treatment is effective, or time until the death of a patient). These problems, by nature, entail complexity especially due to the wide variety of factors that can affect the outcome variable, the fact that the response (time-to-event) is strictly non negative and due to the existence of censoring. In this thesis, we focus on the class of Accelerated Failure Time (AFT) survival models as the means of the likelihood of these data, while providing default priors for objective Bayesian variable selection problems that to complete the Bayesian setup of modeling such data. More specifically, we focus on modeling data using the Weibull distribution while also starting the conversation regarding how this methodology can be extended by using more general distributions. The proposed prior has been applied in a wide variety of simulated data to fully understand its general and limiting behavior. Finally, the model selection consistency property has been demonstrated through simulated data.
περισσότερα