Στατιστικές μέθοδοι εξόρυξης δεδομένων σε βάσεις δεδομένων γονιδιωματικής: ανάλυση εμπλουτισμού συνόλων γονιδίων

Περίληψη

Σε διάφορες εφαρμογές, όπως η έρευνα για τον καρκίνο, έχει ιδιαίτερο ενδιαφέρον ο εντοπισμός γονιδίων ή/και ομάδων γονιδίων με διαφορετική έκφραση. Αυτή η ανάγκη έχει οδηγήσει στην ανάπτυξη πολλών στατιστικών μεθόδων, προσαρμοσμένων στην επεξεργασία γονιδιωματικών δεδομένων. Αυτή η εργασία επικεντρώνεται σε μεθόδους σύγκρισης ενός διανύσματος αριθμητικών τιμών, όπως τα επίπεδα έκφρασης που συνδέονται με κάθε γονίδιο στο ανθρώπινο γονιδίωμα, με ένα δοθέν σύνολο γονιδίων, τα οποία είναι γνωστό ότι σχετίζονται, για παράδειγμα, με κάποιον τύπο καρκίνου, κυτταρική λειτουργία ή βιολογική διαδικασία. Μέθοδοι απόκτησης διανυσμάτων με αριθμητικά δεδομένα συζητούνται, και προτείνεται ένα σύνολο συναρτήσεων R που πραγματοποιούν τις κύριες λειτουργίες μορφοποίησης. Δίνεται μια επισκόπηση των στατιστικών ελέγχων που υπάρχουν, από την ανάλυση ενός γονιδίου έως την ανάλυση ενός συνόλου γονιδίων. Μεταξύ αυτών, το επονομαζόμενο Gene Set Enrichment Analysis (GSEA) είναι ίσως το πιο βασικό εργαλείο για τ ...
περισσότερα

Περίληψη σε άλλη γλώσσα

In different applications, such as cancer research, it is of particular interest to identify differentially expressed genes and/or groups of genes. This need has led to the development of many statistical methods, adapted to the treatment of genomic data. This work focuses on methods comparing a vector of numeric values, such as expression levels attached to each gene in the human genome, to a given set of genes, known to be associated for instance to some type of cancer, cellular function, or biological process. Acquisition methods for numeric data vectors are discussed, and a set of R functions realizing the main formatting operations is proposed. An overview of the existing statistical tests, from single-gene analysis to gene set analysis is given. Among those, Gene Set Enrichment Analysis (GSEA) is probably the most basic tool for genomic data treatment. However, from a statistical point of view, the centering of its test statistic does not allow the derivation of asymptotic result ...
περισσότερα

Περίληψη σε άλλη γλώσσα

Dans différents domaines d’application, tels que la cancérologie, il est crucial d’identifier des gènes ou des groupes de gènes, significativement sur- ou sous-exprimés. Ce besoin a conduit au développement de nombreuses méthodes statistiques, adaptées au traitement des données de génomique. Ce travail est centré sur les méthodes visant à comparer un vecteur de données numériques, telles que des niveaux d’expression liés à chacun des gènes du génome humain, à un ensemble donné de gènes, connus pour être associés par exemple à un type de cancer, à une fonction cellulaire, ou à un processus biologique. Les méthodes d’acquisition des vecteurs de données sont discutées, et un ensemble de fonctions R, réalisant les opérations de formatage principales, a été implémenté. Une revue des tests statistiques traitant les gènes individuellement ou par groupes, est proposée. Parmi ces méthodes, le test Gene Set Enrichment Analysis (GSEA) est probablement le plus largement utilisé pour le traitement ...
περισσότερα

Όλα τα τεκμήρια στο ΕΑΔΔ προστατεύονται από πνευματικά δικαιώματα.

DOI
10.12681/eadd/55672
Διεύθυνση Handle
http://hdl.handle.net/10442/hedi/55672
ND
55672
Εναλλακτικός τίτλος
Statistical methods for data mining in genomics databases: gene set enrichment analysis
Méthodes statistiques pour la fouille de données dans les bases de données de génomique: gene set enrichment analysis
Συγγραφέας
Χαρμπή, Κωνσταντίνα (Πατρώνυμο: Παναγιώτης)
Ημερομηνία
2015
Ίδρυμα
Université Grenoble Alpes
Εξεταστική επιτροπή
Ycart Bernard
Fournié Jean-Jacques
Genon-Catalot Valentine
Rousseaux Sophie
Samson Adeline
Van-Helden Jacques
Επιστημονικό πεδίο
Φυσικές ΕπιστήμεςΜαθηματικά ➨ Στατιστική και Πιθανότητες
Λέξεις-κλειδιά
Γονιδιωματική; Εξόρυξη δεδομένων; Βάσεις δεδομένων; Έλεγχοι υποθέσεων
Χώρα
Γαλλία
Γλώσσα
Αγγλικά
Άλλα στοιχεία
εικ., πιν., σχημ., γραφ.
Στατιστικά χρήσης
ΠΡΟΒΟΛΕΣ
Αφορά στις μοναδικές επισκέψεις της διδακτορικής διατριβής για την χρονική περίοδο 07/2018 - 07/2023.
Πηγή: Google Analytics.
ΞΕΦΥΛΛΙΣΜΑΤΑ
Αφορά στο άνοιγμα του online αναγνώστη για την χρονική περίοδο 07/2018 - 07/2023.
Πηγή: Google Analytics.
ΜΕΤΑΦΟΡΤΩΣΕΙΣ
Αφορά στο σύνολο των μεταφορτώσων του αρχείου της διδακτορικής διατριβής.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.
ΧΡΗΣΤΕΣ
Αφορά στους συνδεδεμένους στο σύστημα χρήστες οι οποίοι έχουν αλληλεπιδράσει με τη διδακτορική διατριβή. Ως επί το πλείστον, αφορά τις μεταφορτώσεις.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.