Automatisches Erzeugen semantischer Netze

Wir alle haben schon mit den riesigen Datenmengen, die Webdokumente und Notesdatenbanken zur Verfügung stellen, zu tun gehabt und haben dort die Informationen, die wir gerade benötigen entweder nicht gefunden oder nicht sinnvoll nutzen können.

Der Schlüssel zur Optimierung der Informationsqualität - und für ein wirksames Wissensmanagement – liegt in der sinnhaften Vernetzung von Informationen. Damit erkennt der Benutzer die Informationsbedeutung innerhalb einer konkreten Situationen leichter. Eine entsprechende Visualisierung verbessert diesen Erkennprozess und ermöglicht außerdem ein intuitiveres Navigieren in den Informationen.

Diese Anforderungen können durch semantische Netze, die auf semantischen (d.h. inhaltlichen) Assoziationen beziehungsweise Verknüpfungen zwischen Information basieren gelöst werden. Semantische Netze können mit Hilfe des ISO-standardisierten Konzepts der Topic Maps implementiert werden. Topic Maps nehmen eine Trennung zwischen Informationen, ihren Quellen und den Assoziationen zwischen ihnen vor. Informationen werden durch Begriffe, sog. Topics repräsentiert. Topic Maps bilden eine zusätzliche Schicht über dem Datenlevel, so das aus verschiedenen Datenquellen eine Topic Map gebildet werden kann.

Nachteilig wirkt sich in diesem Konzept jedoch die aufwändige manuelle Erstellung der Topic Maps aus. Die semantischen Verknüpfungen und Datenquellen müssen für jede Information einzeln festgelegt werden.

Viele Unternehmen und Interessenten haben uns auf dieses Problem angesprochen und mit uns über mögliche Lösungen diskutiert. Daraufhin haben wir uns intensiv mit diesem Problem beschäftigt und folgende Lösung erarbeitet:

Als Ergebnis ist die Anwendung TopicSearch entstanden, die als Servlet oder eigenständige Java-Applikation eingesetzt werden kann.

Dabei klassifiziert die Anwendung automatisch aus einem HTML-basierten Datenbestand die Komponenten des semantischen Netzes. Durch eine Suchanfrage in einem webbasierten Dialog erhält der Nutzer eine Topic Map zu seinem Suchbegriff. In dieser Topic Map sind alle Informationen enthalten, die semantisch mit der Sucheingabe in Beziehung stehen.

Online-Test von TopicSearch
Lassen Sie sich eine TopicMap anzeigen, die aus einem eingebenen Suchbegriff und den semantisch assoziierten Inhalten von jNotes besteht.

Aufgaben von TopicSearch

Wie ist TopicSearch aufgebaut?

Die Anwendung besteht aus zwei Hauptkomponenten – zum einen der Crawler und zum anderen der Sucher.

Wie kann man TopicSearch nutzen?

Ehe Suchanfragen gestellt werden können, muss der Crawler die Quelldokumente durchlaufen. Dazu wird eine http-Connection zu einer Startseite aufgebaut, die den Inhalt des Dokumentes zurückgibt. Alle Links des Dokumentes werden wiederum für einen neuen Aufruf des Crawlers genutzt. Aus den Dokumenten werden anhand der Html-Tags Topics und Occurrences (den Vorkommensangaben eines Topics) klassifiziert. Später werden anhand verschiedener Regeln die Assoziationen zwischen den Topics errechnet. Dieser Prozess wird periodisch durchgeführt um die Aktualität des Datenbestandes sicherzustellen.

Der Benutzer gibt in einem Webdialog seine Suchanfrage ein und wählt den gewünschten Ansichtstyp für das Ergebnis. Dabei werden Anfragen an die Datenbank generiert, die letztendlich eine Topic Map über den Suchbegriff im XTM-Format (XML-Format speziell für Topic Maps) zurückliefert. Dieses XTM-Dokument wird abhängig vom gewählten Ansichtstyp entweder zum Exportieren untransformiert angezeigt oder durch eine XSL-Transformation in eine Liste umgewandelt. Außerdem kann das Ergebnis mit Hilfe eines Applets grafisch als Netz dargestellt werden. In den verschiedenen Ergebnisansichten kann der Nutzer navigieren.

Welche Funktionalitäten bietet TopicSearch?

Wo kann TopicSearch eingesetzt werden?

Der Einsatz der Anwendung ist überall dort denkbar, wo größere Mengen unstruktierter Daten, möglicherweise sogar aus heterogenen oder verteilten Quellen dem Benutzer bequem zur Verfügung gestellt werden sollen. Wir haben TopicSearch bereits für den Einsatz in einer Portallösung angepasst.

Für weiterführende Informationen steht Ihnen das Team von jnotes jederzeit zur Verfügung.