Παραγωγή σημασιολογικού περιεχομένου από δομημένες και ημιδομημένες πηγές δεδομένων


Ο Παγκόσμιος Ιστός αποτελεί πλέον αναπόσπαστο κομμάτι της καθημερινότητας, έχοντας αλλάξει τον τρόπο με τον οποίο επικοινωνούμε με τους συνανθρώπους μας, δημιουργούμε, μοιραζόμαστε και αναζητούμε πληροφορία. Ο Σημασιολογικός Ιστός φιλοδοξεί να φέρει μια αντίστοιχη επανάσταση στη χρήση αυτού του τεράστιου όγκου διαθέσιμης πληροφορίας, επιτρέποντας σε προγραμματιστικές διαδικασίες να αξιοποιήσουν τη σημασία της, να εξάγουν συμπεράσματα από αυτήν και να τη συνδυάσουν με άλλη πληροφορία με τρόπο ωφέλιμο για τον ανθρώπινο χρήστη. Ωστόσο, το όραμα του Σημασιολογικού Ιστού δεν έχει ακόμα υλοποιηθεί στον επιθυμητό βαθμό και μια αιτία για αυτό αποτελεί η έλλειψη ικανής ποσότητας δεδομένων άμεσα αξιοποιήσιμων από σημασιολογικές εφαρμογές. Στην παρούσα διατριβή, εξετάζεται το πρόβλημα της παραγωγής σημασιολογικού περιεχομένου από υπάρχουσες δομημένες και ημιδομημένες πηγές δεδομένων, με απώτερο στόχο τη μεταφορά του πλούτου της πληροφορίας που ενυπάρχει σε αυτές στο Σημασιολογικό Ιστό. Αρχικά, εξ ...

Περίληψη σε άλλη γλώσσα

The World Wide Web has become a part of everyday life, having changed the way people communicate, as well as the way we create, share and search for information. The Semantic Web seeks to revolutionize the way this huge amount of available information is used, allowing automated procedures to make use of its meaning, infer new facts and integrate it with other information in a way that is meaningful to the end user. However, the Semantic Web vision has not been fully materialized yet and one of many possible reasons is the lack of an adequate critical mass of data that can be readily used by semantic applications. Therefore, this thesis investigates the issue of semantic content generation from existing structured and semistructured data sources, with the ultimate goal of bringing this entire wealth of information in the Semantic Web. First of all, an extended literature survey is carried out in order to clarify the various aspects of relational database usage in the Semantic Web context and identify all relevant issues, such as ontology generation from a relational schema, the export of relational database contents in the form of an RDF graph and the discovery of mappings between a relational database and an ontology. A simplified mapping system that merely uses SQL queries for the mapping definition is then proposed and the theoretical and practical shortcomings of this approach are pointed out. Furthermore, an algorithm for the rewriting of SPARQL queries to semantically equivalent SQL ones in the presence of an R2RML mapping is analysed, allowing for dynamic access of relational database contents via semantic queries. Finally, the problem of semantic annotation and processing of semistructured data from dynamic sources is investigated and an appropriate extension to an already implemented context-aware system is proposed. This extension applies windowing techniques in the incoming data stream in order to keep the response time of the system under acceptable levels.

Semantic content generation from structured and semistructured data sources
Σπανός, Δημήτριος-Εμμανουήλ (Πατρώνυμο: Αθανάσιος)
Εθνικό Μετσόβιο Πολυτεχνείο (ΕΜΠ). Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Επικοινωνιών, Ηλεκτρονικής και Συστημάτων Πληροφορικής
Μήτρου Νικόλαος
Σύκας Ευστάθιος
Βασιλείου Ιωάννης
Θεολόγου Μιχαήλ
Κοντογιάννης Κωνσταντίνος
Παπασπύρου Νικόλαος
Βαζιργιάννης Μιχαήλ
Φυσικές Επιστήμες
Επιστήμη Ηλεκτρονικών Υπολογιστών και Πληροφορική
Επιστήμες Μηχανικού και Τεχνολογία
Επιστήμη Ηλεκτρολόγου Μηχανικού, Ηλεκτρονικού Μηχανικού, Μηχανικού Η/Υ
Σημασιολογικός ιστός; Σχεσιακές βάσεις δεδομένων; Οντολογίες; Αντιστοιχία; Εικονική βάση γνώσης; Ροή δεδομένων; Δίκτυα αισθητήρων; Παράθυρο οντολογικών ατόμων
xviii, 236 σ., πιν., σχημ., γραφ., ευρ.
Το έργο παρέχεται υπό τους όρους της δημόσιας άδειας του νομικού προσώπου Creative Commons Corporation: