Εξόρυξη γνώσης από μεγάλης διάστασης ταχείς ροές δεδομένων

Περίληψη

Ενώ η ομαδοποίηση δεδομένων έχει μια μακρά ιστορία και ένα μεγάλο κομμάτι της έρευνας έχει αφιερωθεί στην ανάπτυξη πολυάριθμων μεθόδων ομαδοποίησης, σημαντικές προκλήσεις παραμένουν ακόμα. Μία από τις πιο σημαντικές σχετίζεται με τη μεγάλη διάσταση των δεδομένων. Μία συγκεκριμένη κατηγορία αλγορίθμων ομαδοποίησης αντιμετωπίζει τέτοιου τύπου δεδομένα με μεγάλη επιτυχία χρησιμοποιώντας τεχνικές μείωσης της διάστασης. Οι μέθοδοι προβολών για την μείωση διάστασης μας έδωσαν τη δυνατότητα να ανακαλύψουμε τη δομή των δεδομένων εξαιρετικά μεγάλης διάστασης. Σε αυτή τη διατριβή, γίνεται μία προσπάθεια να εμβαθύνουμε την κατανόηση μας σχετικά με το τι μπορεί να επιτευχθεί από αυτού του είδους τις τεχνικές σε μία προσπάθεια να ανακαλύψουμε θεωρητικά τη σχέση των ομάδων στα δεδομένα και την κατανομή των προβολών τους. Βασισμένοι στα ευρήματα μας προτείνουμε μία σειρά από διαχωριστικούς ιεραρχικούς αλγορίθμους ομαδοποίησης. Οι προτεινόμενοι αλγόριθμοι απαιτούν ελάχιστες παραμέτρους εισόδου και επί ...
περισσότερα

Περίληψη σε άλλη γλώσσα

While data clustering has a long history and a large amount of research has been devoted to the development of numerous clustering techniques, significant challenges still remain. One of the most important of them is associated with high data dimensionality. A particular class of clustering algorithms has been very successful in dealing with such datasets, utilizing information driven by dimensionality reduction techniques. Projection methods for dimension reduction have enabled the discovery of otherwise unattainable structure in ultra high dimensional data. In this thesis, we try to deepen our understanding on what can be achieved by this kind of approaches in an attempt to theoretically discover the relationship between true clusters in the data and the distribution of their projection. Based on such findings, we propose a series of new hierarchical divisive clustering algorithms. The proposed algorithms require minimal user-defined parameters and have the desirable feature of being ...
περισσότερα

Όλα τα τεκμήρια στο ΕΑΔΔ προστατεύονται από πνευματικά δικαιώματα.

Διεύθυνση Handle
http://hdl.handle.net/10442/hedi/29920
ND
29920
Εναλλακτικός τίτλος
Knowledge discovery in high dimensional data
Συγγραφέας
Τασουλής, Σωτήριος του Κωνσταντίνος
Ημερομηνία
2013
Ίδρυμα
Πανεπιστήμιο Θεσσαλίας. Σχολή Θετικών Επιστημών. Τμήμα Πληροφορικής με Εφαρμογές στη Βιοϊατρική
Εξεταστική επιτροπή
Πλαγιανάκος Βασίλειος
Μαγκλογιάννης Ηλίας
Adams Niall
Αλετράς Αντώνιος
Βραχάτης Μιχαήλ
Γαλόπουλος Ευστράτιος
Παυλίδης Νικόλαος
Επιστημονικό πεδίο
Φυσικές Επιστήμες
Μαθηματικά
Επιστήμη Ηλεκτρονικών Υπολογιστών και Πληροφορική
Λέξεις-κλειδιά
Εξόρυξη δεδομένων; Ομαδοποίηση; Ιεραρχικοί αλγόριθμοι; Ανάλυση πρωτευουσών συνιστωσών; Τυχαίες προβολές; Εκτίμηση πυκνότητας πυρήνα
Χώρα
Ελλάδα
Γλώσσα
Αγγλικά
Άλλα στοιχεία
x, 161 , εικ., πιν., σχημ., γραφ., ευρ.
Στατιστικά χρήσης
ΠΡΟΒΟΛΕΣ
Αφορά στις μοναδικές επισκέψεις της διδακτορικής διατριβής.
Πηγή: Google Analytics.
ΞΕΦΥΛΛΙΣΜΑΤΑ
Αφορά στο άνοιγμα του online αναγνώστη.
Πηγή: Google Analytics.
ΜΕΤΑΦΟΡΤΩΣΕΙΣ
Αφορά στο σύνολο των μεταφορτώσων του αρχείου της διδακτορικής διατριβής.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.
ΧΡΗΣΤΕΣ
Αφορά στις μοναδικές επισκέψεις της διδακτορικής διατριβής.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.
Σχετικές εγγραφές (με βάση τις επισκέψεις των χρηστών)