![]()
|
|
Universität Frankfurt am Main Fachbereich Biologie und Informatik (15) Institut für Informatik |
![]()
Diplomarbeit
vorgelegt von: Fabian Wleklinski
E-Mail:
fabian@wleklinski.de
Betreuer: Herr Karsten Tolle
Bearbeitungszeitraum: 2. Mai bis 3. November 2003
Erstprüfer: Herr Prof. Dott.-Ing. R. Zicari
Suche im Semantic Web
Erweiterung des VRP um eine intuitive und
RQL-basierte Anfrageschnittstelle
Datenflut im World Wide Web – ein Problem jedes Internetbenutzers. Klassische Internetsuchmaschinen sind überfordert und liefern immer seltener brauchbare Resultate. Das Semantic Web verspricht Hoffnung – maßgeblich basierend auf RDF. Das Licht der Öffentlichkeit erblickt das Semantic Web vermutlich zunächst in spezialisierten Informationsportalen, so genannten Infomediaries. Besucher von Informationsportalen benötigen eine Abfragesprache, welche ebenso einfach wie eine gewöhnliche Internetsuchmaschine anzuwenden ist. Eine derartige Abfragesprache existiert für RDF zur Zeit nicht. Diese Arbeit stellt eine neuartige Abfragesprache vor, welche dieser Anforderung genügt: eRQL. Bestandteil dieser Arbeit ist der mittels Java implementierte eRQL-Prozessor eRqlEngine, welcher unter http://www.wleklinski.de/rdf/ und unter http://www.dbis.informatik.uni-frankfurt.de/~tolle/RDF/eRQL/ bezogen werden kann.
Schlagwörter: Semantisches Web, RDF, RQL, eRQL, Informationsportal
Chaos
inside the World Wide Web – a problem of each internet user. Classical
internet search engines cannot handle the flood of web pages anymore, and often
deliver poor results. The Semantic Web raises hope – significantly based
on RDF. The Semantic Web will
probably gain popularity inside specialized information portals at first, so
called infomediaries. Visitors of information portals need a query language,
which can be used as easily as a common internet search-engine. But no such
query language does exist for RDF. This thesis presents a novel query language
which satisfies this requirement: eRQL. Part of this thesis is eRqlEngine – an eRQL processor for Java which can be
obtained at http://www.wleklinski.de/rdf/ and http://www.dbis.informatik.uni-frankfurt.de/~tolle/RDF/eRQL/.
Keywords: Semantic Web, RDF, RQL, eRQL, Infomediary
Ich versichere, dass ich diese Diplomarbeit selbstständig verfasst, und keine anderen als die angegebenen Quellen und Hilfsmittel benutzt habe.
Frankfurt am Main, 3. November 2003
Fabian Wleklinski
Ehrenwörtliche Erklärung zur Diplomarbeit
5 RQL – eine RDF Abfragesprache
6 eRQL – Ad Hoc-Abfragen für
Informationsportale
7 Umwandlung von eRQL- in
RQL-Abfragen
8 eRqlEngine – ein eRQL-Prozessor
9 RqlEngine – ein RQL-Prozessor
Ehrenwörtliche Erklärung zur Diplomarbeit
1.2 Information Overkill – die Herausforderung
1.3 Das Semantic Web – der
Hoffnungsträger
1.4 Inhalte und Struktur dieser Arbeit
2.2 Resource Description Framework (RDF)
2.2.1 Alles ist eine Ressource
2.2.2 Speicherung und Austausch von RDF
2.3.1 RDF ist nicht RDF Schema
2.3.2 Vordefinierte RDF Schemaklassen
2.3.4 Vergleich zu Typsystemen der OOP
4.1 Eignung existierender
Abfragesprachen für Ad Hoc-Abfragen
4.1.9 Resümee: existierende Abfragesprachen
4.2 Bedarf für eine neuartige RDF-Abfragesprache
4.2.1 Verwendung von RQL als Zwischensprache
4.2.2 Verwendung von RQL für Schemaabfragen
5 RQL – eine
RDF Abfragesprache
5.1 Szenario: Ein
Kultur-Informationsportal
5.2.1 Selektion und Projektion
5.2.2 RQL Vergleichsoperatoren
5.3 RQL Datenmodell und
Schemaoperationen
5.3.1 Daten-, Schema- und Metaschemaebene
5.3.3.1 subClassOf() und superClassOf()
5.3.3.2 subPropertyOf() und superPropertyOf()
5.3.3.7 topclass und leafclass
5.3.3.8 topproperty und leafproperty
5.4.2 Ableitungen einer bestimmten Klasse
5.4.3 Verwendungen eines bestimmten
Prädikates
5.4.4 Definitions- und Wertebereich eines
Prädikates
5.4.6 Schemaklassen und abgeleitete
Schemaklassen
5.4.7 Zusammengesetzte Pfadausdrücke
5.5 Kurz und bündig – die RQL
Kurzschreibweise
5.5.1 Instanzen einer Klasse finden
5.5.2 Verwendungen eines Prädikates finden
6 eRQL –
Ad Hoc-Abfragen für Informationsportale
6.1.1 Kurz und knapp: Ein-Wort-Abfragen
6.1.2 Umgebung und Abfragemodus
6.1.2.2 Point Of Interest-Modus
(POI-Modus)
6.1.3 Boolesche Verknüpfungen und Klammerung
6.2.1 Alle Informationen zu „Picasso“
6.2.2 Titel von „http://www.louvre.fr“
6.2.3 „Ort und Öffnungszeiten des Louvre“
6.2.4 Informationen über das „Reina Sofia
Museum“
6.2.5 Suche nach „http://www.louvre.fr“
6.2.6 „Vorname von Rodin“ finden
6.2.7 „Kunstwerke des Louvre“ ermitteln (nur
URIs)
6.2.8 Kunstwerke des Louvre samt
Metainformationen ermitteln
6.3.1.5 Ressourcen und Literale
6.3.2.2 Boolesche Verknüpfungen und Klammerung
6.3.2.3 Umschaltung des Modus’ mittels
Klammerung
6.4 Vorverarbeitung einer Anfrage
6.4.1 POI-Modus-Operatoren einfügen