Institut für Informationssysteme



'Adaptive Sitemaps' durch Landmarkenbestimmung

Beschreibung des Projektes:

Mit dem Begriff 'Sitemaps' werden im Internet-Umfeld übersichtliche Zusammenfassungen bzw. Karten von Web-Angeboten bezeichnet. Diese Karten stellen einen Service dar, der von den Anbietern eines Web-Angebotes zur Verfügung gestellt wird und dienen dem Nutzer dazu, ähnlich wie eine Inhaltsangabe in einem Buch, Orientierung im Informationsraum zu finden. Gerade bei Web-Angeboten ist ein Verlust der Übersicht durch die Heterogenität der Information ein bekanntes Problem, das meist als 'lost in hyperspace'-Problem bezeichnet wird. Sitemaps sind aktuell auf der Mehrzahl von Webangeboten (Websites) verfügbar und kaum ein Universität, Firma oder andere Organisation bietet keine Sitemap an. Das Erstellen solcher Sitemaps wird in der Regel manuell, z.B. durch den Webadministrator, durchgeführt und stellt ein schwieriges und zeitaufwendiges Problem dar, weil zu entscheiden ist, welche Daten für den zu erwartenden Nutzer voraussichtlich relevant sind und dagestellt werden sollten bzw. welche Daten irrelevant sind und weggelassen werden können. Eine weitere Schwierigkeit stellt die Generierung eines Layouts für eine Sitemap dar.
Ziel des Projektes ist es, den Prozess der Generierung von Sitemaps durch automatische Verfahren wesentlich zu vereinfachen. Eine automatische Erstellung von Sitemaps ist eine sehr komplexe Aufgabenstellung, weil sowohl die Struktur der Information als auch semantische und schliesslich Layout-Aspekte berücksichtigt werden müssen. Eine wesentlich Aufgabenstellung ist die effektive, komprimierte Darstellung des Informationsraumes, weil die darzustellende Datenmenge in der Regel sehr umfangreich ist. Der Fokus der Forschung bei diesem Projekt ist die Entwicklung einer neuen Methode, Sitemaps effizient und komprimiert darzustellen, insbesondere dadurch dass die Information einerseits durch die Struktur des Datenangebotes und andererseits durch Berücksichtigung des Verhaltens eines Nutzers gefiltert wird. Sitemaps werden dabei durch die Gewinnung von sogenannten Landmarks und durch die Auswertung von Anfragen eines Nutzers dynamisch generiert bzw. gefiltert.
Mit Landmarks werden dabei wichtige Datenobjekte auf einer Web-Site bezeichnet, die mit Hilfe von 'Information Retrieval' bzw. 'Pagerank'-Methoden bestimmt werden. Auf Basis der Kenntnis dieser Landmarks kann der Web-Site Graph, der die Grundlage für die Sitemap Generierung darstellt, wesentlich vereinfacht werden. Die betreffenden wichtigen Objekte werden hervorgehoben, andere Objekte werden verkleinert bzw. weggelassen. Zusätzlich dazu wird die Struktur unter Berücksichtigung der Positionen der Landmarks im Webgraph vereinfacht.
Eine zweite Methode für die automatisierte Darstellung von Sitemaps ist die Anpassung der Sitemap-Darstellung an Nutzer-Anfragen. Ein Nutzer kann dem System Suchterme bekanntgeben. Diese Suchterme werden dazu verwendet, den Anteil einer Sitemap zu gewinnen, der eine Relevanz für einen Nutzer darstellt. In der Darstellung besteht dabei z.B. die Möglichkeit, die betreffenden Datenobjekte hervorzuheben. Insbesondere bei einer mehrdeutigen Anwort von Suchergebnissen (der überwiegende Anteil von Anfragen an eine Suchmaschine ist semantisch mehrdeutig) kann eine Darstellung der Suchergebnisse in der Sitemap von Vorteil sein, weil auf diese Weise die semantische Mehrdeutigkeit leicht aufgedeckt wird.

Publications

webmaster 25.06.2004