Themen für Diplom-/Masterarbeiten

Die hier aufgeführten Themen für Diplom-/Masterarbeiten stellen keine abschliessende Liste dar, sondern sind Ideen für interessante und in sich abgeschlossene Aufgaben, die im Rahmen einer Diplom-/Masterarbeit behandelt werden könnten. Diese Liste richtet sich vornehmlich an Absolventen meiner Vorlesungen, aber auch andere interessierte Studierende sind eingeladen, mit mir Kontakt aufzunehmen, wenn sie Interesse an Diplom-/Masterarbeiten im Bereich der XML-Technologien haben.

Um eine Vorstellung von Umfang und Niveau einer Diplom-/Masterarbeit und des abschliessenden Berichtes zu bekommen, empfiehlt sich ein Blick auf die abgeschlossenen Master-, Diplom- und Semesterarbeiten. Je nach Hochschule und Art der Arbeit (Master-, Diplom- oder Semesterarbeit) fällt der Umfang der Arbeit natürlich jeweils anders aus.

Die folgenden Arbeiten sind momentan als Themenvorschläge auf der vorliegenden Seite beschrieben:

Visualisierung von XML Modellen und deren Abbildung auf Schemasprachen

XML definiert eine Repräsentation für baum-strukturierte Daten. XML Schemasprachen (z.B. DTDs oder XML Schema) definieren Dokumentenklassen oder Typen, indem man mit ihnen definieren kann, welche Bäme korrekt sind und welche nicht. Aus Sicht der klassischen Datenmodellierung bewegen sich XML Schemasprachen auf der Ebene eines logischen Modells, das bereits viele Implementierungsdetails berücksichtigen muss. Auf der Ebende eines konzeptuellen Modells gibt es für XML im Moment noch kein etabliertes Verfahren, und Ziel dieser Arbeit ist es, in diesem Bereich Konzepte zu erstellen und zu implementieren. Konkret ist das Ziel, einen ersten Entwurf einer graphischen Notation für XML Schemas weiterzuentwickeln, und anhand geeigneter Werkzeuge (z.B. Microsoft Visio oder freier Tools wie Graphviz) dafür zu sorgen, dass graphische Modelle von XML Schema visualisiert werden können. Ausgehend von einem visualisierten Schema sollen aus diesem konzeptuellen Modell dann semi-automatisch logische Modelle (z.B. DTDs oder XML Schemas) erzeugt werden, wobei zu beachten ist, dass sich verschiedene XML Schemasprachen in ihrer Mächtigkeit unterscheiden.

XML/XSL-basiertes System für Help-Information und Dokumentation

Die Erzeugung von Dokumentation für Help-Systeme und gedruckte Dokumentation ist ein typischen Problem der Dokumentenverarbeitung. XML eignet sich ideal für diese Anwendung, da es ermöglicht, strukturierte Dokumente zu erstellen, die zu verschiedenen Ausgabeformaten transformiert werden können. In dieser Arbeit soll ein System komplettiert und implementiert werden, um Help-Informationen und andere Dokumentation zu erstellen. Die Inhalte werden dabei in XHTML erstellt, dass durch einige spezielle XML-Elemente (z.B. zur Indexierung) angereichert wird. Aus diesen Quellen sollen per XSLT 2.0 (das wesentlich leistungsfähiger ist als die aktuelle Version 1.0) die folgenden Dokumente erzeugt werden: HTML für Web-basierte Dokumentation, verschiedene Fileformate für Help-Systeme (z.B. JavaHelp, Eclipse Help und MacOS Help), sowie XSL-FO, aus dem dann PDF für Dokumentation in Papierform erzeugt werden kann. Diese Arbeit ist ideal für alle, die daran interessiert sind, sich schon jetzt intensiv mit dem kommenden XSLT 2.0 Standard auseinanderzusetzen und konkrete Implementierungserfahrungen zu sammeln. Eine erste einfache Implementierung des Systems wird bereits im ShaRef Projekt benutzt, um die Dokumentation zu erstellen.

XPath-Unterstützung in einer Linux Shell

Mit XPath gibt es eine Sprache, mit der man auf Bäumen (genauer gesagt Infosets, der Abstraktion von XML-Dokumenten) Knoten selektieren kann. XPath funktioniert ähnlich Pfaden in Filesystemen, bietet aber einen deutlich grösseren Funktionsumfang. Überträgt man einige oder alle der Konzepte von XPath aus der Welt von XML-Dokumenten in die Welt von Filesystemen, so könnte die Leistungsfähigkeit gängiger Pfadausdrücke in Unix Shells massiv gesteigert werden. Für viele Problemstellungen wären Tools wie das find Kommando dann überflüssig, sie könnten direkt in "XPath" gelöst werden. In dieser Arbeit soll untersucht werden, inwieweit XPath für dieses Ziel verwendet werden kann, und anhand einer Implementierung in einer Linux-Shell der Wahl soll das Konzept getestet werden.

Anbindung an Bibliotheks-Kataloge

Im ShaRef Projekt wird eine Software und ein Dienst realisiert, der dem Verwalten, gemeinsamen Nutzen und dem Veröffentlichen von Referenzen (Literaturreferenzen und Web Bookmarks) dient. Eine denkbare und nützliche Zusatzfunktion ist das Anbinden von ShaRef an Online-Bibliotheks-Kataloge, so dass Abfragen an den Katalog direkt aus ShaRef heraus gemacht werden können, und Resultate, falls gewünscht, direkt in die Sammlung eigener Referenzen übernommen werden können. Dazu müssen zunächst die Eigenschaften bestehender Technologien (Z39.50, OAI, SRU, SRW) untersucht sowie deren Unterstützung in bestehenden Systemen betrachtet werden. Anschliessend ist ein Konzept für die Einbindung in die Benutzerschnittstelle zu erstellen, das dann im Rahmen des bestehenden ShaRef Prototypen zu implementieren ist. Besonderer Schwerpunkt von ShaRef und der angestrebten Lösung ist, dass sie einfach und intuitiv zu benutzen sein soll, der Regel folgend dass 80% der Benutzer mit 20% der Funktionen zufriedengestellt werden können. Diese Arbeit ermöglicht die intensive Beschäftigung mit verschiedenen XML und Web Service Technologien, die die Basis des ShaRef Projektes darstellen.

Extraktion von Referenzdaten aus statischen oder dynamischen Informationen

Im ShaRef Projekt wird eine Software und ein Dienst realisiert, der dem Verwalten, gemeinsamen Nutzen und dem Veröffentlichen von Referenzen (Literaturreferenzen und Web Bookmarks) dient. Benutzer sollen in ihrem individuellen Arbeiten mit Referenzen unterstützt werden, es soll jedoch auch eine Sammlung bestehender Standardreferenzen angeboten werden. Ein Beispiel dafür ist die RFC Database, die die Standards der Internet Engineering Task Force (IETF) enthält und im Bereich der Comupter Communmications sehr häfig benötigt wird. Es ist eine Methode zu entwickeln, wie für diese Datenbank und ähnliche Angebote auf dem Netz im Sinne einer ständigen Aktualisierung eine ShaRef Bibliography erstellt werden kann, die dann von verschiedenen Benutzern verwendet werden kann. Dabei geht es um die Integration verschiedener Technologien, z.B. HTTP um die Daten zu holen, XSLT um die XML-Daten zu verarbeiten, und Text-basierte Technologien (wie z.B. Perl), um aus den RFC Fulltexts die Crossreferenzen zu extrahieren (diese sind leider in den XML-Daten nicht enthalten). Ausgehend von der Erfahrung mit den RFC-Daten sind vergleichbare Methoden für andere Referenzdaten anzuwenden.

Fragment Identifiers für den `text/plain` MIME Type

Eine der weniger beachteten, aber für bessere Web-Seiten sehr interessanten Funktionen von HTML-Seiten und modernen Browsern ist die Unterstützung von Fragment Identifiers in HTML, mit Hilfe derer Web-Links nicht nur auf Dokumente, sondern in Dokumente hinein zeigen können. Bei HTML geschieht dies durch das ID Attribut, das auf sehr vielen Elementen von HTML verwendet werden darf, und dann durch eine URI Referenz der Form http://...#fragment-name referenziert werden kann. Fragment Identifiers sind spezifisch für den Typ einer Ressource, und für viele Ressource-Typen gibt es keine Fragment Identifiers (so kann man z.B. nicht in Bilder der Typen JPEG oder GIF hineinzeigen). Im Rahmen dieser Arbeit soll ein Mechanismus für Fragment Identifiers für den text/plain MIME Type implementiert werden, also für normale Text-Dokumente. Die Implementierung soll in den Open Source Browser Mozilla/Firefox integriert werden und sich an bestehenden Vorarbeiten orientieren (kann diese aber durchaus erweitern oder abändern). Die interessantesten Aspekte dieser Arbeit sind zum einen die Mitarbeit ein einem grossen Open Source Projekt, und zum anderen das Ziel, die geleistete Arbeit zu dokumentieren und in der Internet-Gemeinde als RFC zu standardisieren.