Τμήμα Α'. bioTextQuest: ένα διαδικτυακό εργαλείο εξόρυξης δεδομένων με στόχο την ανακάλυψη καινούργιας πληροφορίας. Τμήμα Β'. Κοινωνικοποίηση γονιδίων: μια μελέτη της γονιδιακής θέσης, της περιεκτικότητας σε GC και της σίγασης γονιδίων στη Salmonella

Περίληψη

Η παρούσα Διδακτορική διατριβή περιγράφει έρευνα που διεξήχθη στην Ιατρική Σχολή του Πανεπιστημίου Κρήτης υπό την επίβλεψη του Καθηγητή Χαράλαμπου Σαββάκη και σε συνεργασία με τον Λέκτορα Ιωάννη Ηλιόπουλο. Η διατριβή αποτελείται από 2 ξεχωριστά μέρη. Το πρώτο μέρος περιγράφει μια μέθοδο εξόρυξης κειμένου που ομαδοποιεί περιλήψεις (abstracts) της PubMed σε εννοιολογικά σαφείς ομάδες (clusters) και το δεύτερο μέρος περιγράφει την συγκριτική ανάλυση μεταξύ δύο βακτηριακών γονιδιωμάτων.Μέρος 1 : bioTextQuestΤο bioTextQuest είναι ένα διαδικτυακό εργαλείο που επιτρέπει μια εξειδικευμένη αναζήτηση στην PubMed. Οι περιλήψεις (που είναι τοπικά αποθηκευμένες σε βάση δεδομένων του bioTextQuest) συλλέγονται και αναλύονται αυτομάτως. Η ανάλυση πραγματοποιείται στα ακόλουθα στάδια:1. Προκαθορισμένες λέξεις (stoplist) εξαιρούνται από τις περιλήψεις.2. Κάθε λέξη της κάθε περίληψης σταθμίζεται (με βάση ένα λεξικό), χρησιμοποιώντας μια παραλλαγή ενός εξειδικευμένου αλγορίθμου που ονομάζεται TF.IDF. Οι λ ...
περισσότερα

Περίληψη σε άλλη γλώσσα

This thesis describes research carried out at the Medical School of the University of Crete under the supervision of Professor Charalambos Savakis and in collaboration with Dr Ioannis Iliopoulos. The thesis comprises of 2 distinct parts. The first part describes a text mining method that groups PubMed abstracts in meaningful clusters and the second part describes a whole genome comparison analysis between two bacterial genomes.Part 1: bioTextQuestbioTextQuest is an online tool that allows the user to perform a specialized keyword search in PubMed. The abstracts (that are locally stored in the bioTextQuest Database) are collected and analyzed. The analysis is performed in the following stages:1. Various predefined words (stoplist) are excluded from the abstracts.2. Each word of each abstract is weighted for its importance (based on a dictionary) using a variation of a specialized weight algorithm called TF.IDF. Less ‘important’ terms are pruned. Terms with high TF.IDF and terms not appe ...
περισσότερα

Όλα τα τεκμήρια στο ΕΑΔΔ προστατεύονται από πνευματικά δικαιώματα.

DOI
10.12681/eadd/35093
Διεύθυνση Handle
http://hdl.handle.net/10442/hedi/35093
ND
35093
Εναλλακτικός τίτλος
PartA: bioTextQuest: a data mining tool for concept discovery. Part B: Gene socialization: gene order, GC content and gene silencing in Salmonella
Συγγραφέας
Παπανικολάου, Νικόλαος (Πατρώνυμο: Σπυρίδων)
Ημερομηνία
2013
Ίδρυμα
Πανεπιστήμιο Κρήτης. Σχολή Θετικών και Τεχνολογικών Επιστημών. Τμήμα Βιολογίας
Εξεταστική επιτροπή
Σαββάκης Χαράλαμπος
Μαυροθαλασσίτης Γεώργιος
Ηλιόπουλος Ιωάννης
Καραγωγέος Δόμνα
Ηλιόπουλος Άρης
Ποϊράζη Παναγιώτα
Προμπονάς Βασίλειος
Επιστημονικό πεδίο
Φυσικές Επιστήμες
Επιστήμη Ηλεκτρονικών Υπολογιστών και Πληροφορική
Βιολογία
Λέξεις-κλειδιά
Βιοπληροφορική; Εξόρυξη κειμένου; Συγχώνευση γνώσης; Γονιδιωματική ανάλυση
Χώρα
Ελλάδα
Γλώσσα
Ελληνικά
Άλλα στοιχεία
134 σ., πιν., σχημ.
Στατιστικά χρήσης
ΠΡΟΒΟΛΕΣ
Αφορά στις μοναδικές επισκέψεις της διδακτορικής διατριβής για την χρονική περίοδο 07/2018 - 07/2023.
Πηγή: Google Analytics.
ΞΕΦΥΛΛΙΣΜΑΤΑ
Αφορά στο άνοιγμα του online αναγνώστη για την χρονική περίοδο 07/2018 - 07/2023.
Πηγή: Google Analytics.
ΜΕΤΑΦΟΡΤΩΣΕΙΣ
Αφορά στο σύνολο των μεταφορτώσων του αρχείου της διδακτορικής διατριβής.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.
ΧΡΗΣΤΕΣ
Αφορά στους συνδεδεμένους στο σύστημα χρήστες οι οποίοι έχουν αλληλεπιδράσει με τη διδακτορική διατριβή. Ως επί το πλείστον, αφορά τις μεταφορτώσεις.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.
Σχετικές εγγραφές (με βάση τις επισκέψεις των χρηστών)