Index Zurück Weiter Literatur


7. XML

Das World Wide Web ist heute längst nicht mehr nur ein Medium für wissenschaftliche Publikationen, sondern auch für virtuelle Banken und Geschäfte, für Börsenkurse, Zeitschriften und vieles mehr. Die Strukturen, die vom Browser dargestellt werden sollen, sind äußerst vielfältig. Nur die wenigsten bestehen aus den Elementen: Kapitel, Überschrift, Absatz. Man betrachte etwa die Bahnauskunft. Hier wird nicht von Kapiteln und Absätzen gesprochen, sondern von Verbindungen, Bahnhöfen, Aukunfts- und Abfahrtszeiten, Preisen, Zugnummern. HTML verlangt, daß alle Strukturen mit Hilfe desselben, fixen Satzes von Tags notiert werden. Alles muß irgendwie eine Überschrift, ein Absatz, eine Liste sein. Das Ergebnis sind Dokumente, deren Inhalt in einer Unzahl nichtssagender Tags verschwindet. Hier stößt die Sprache offensichtlich an ihre Grenzen. Ihr fehlt die Möglichkeit, den Befehlssatz an die Bedürfnisse bestimmter Benutzergruppen anzupassen.

Für eine Sprache wie SGML existiert ein solches Problem nicht. Die Kombination aus einer Metasprache und DTD macht es möglich, für jeden Zweck passende Auszeichnungselemente zu definieren. Für die Bahnauskunft etwa <ARRIVAL>, <DEPARTURE>. Für Mathematiker <NUMERATOR>, <DENOMINATOR> usw. Solche Daten sind sehr übersichtlich. Sie können nicht nur von WWW-Browsern benutzt werden, sondern auch von anderen Anwendungen wie etwa Datenbanksystemen. Das erspart oft doppelte Arbeit.

Warum sich SGML für das WWW dennoch nicht eignet, wurde bereits erläutert. Die Sprache ist zu komplex. Die Endanwender können sie nicht schnell erlernen, die Werkzeuge sind schwierig zu programmieren. Das W3-Konsortium entschloß sich deshalb, eine vereinfachte Version von SGML zu schaffen. Unter der Leitung von Jon Bosak (Sun Microsystems) entwarf eine Arbeitsgruppe die XML (Extensible Markup Language).

XML ist eine Teilmenge von SGML. Die Sprache verzichtet auf komplexe und selten benutzte Merkmale von SGML und ist damit wesentlich einfacher. Sie zeichnet sich aber dennoch durch große Flexibilität aus:

Für kleine XML-Dokumente ist eine DTD nicht zwingend (man spricht in dem Fall von "gültigen" Dokumenten). Für komplexe Dokumente sollte sie vorhanden sein ("wohlgeformte" Dokumente). Wohlgeformte Dokumente können auf Integrität überprüft werden.

Wichtige Softwarehersteller kündigten bereits ihre Unterstützung an: Softquad (HoTMetaL), Microsoft, Sun und kürzlich auch Netscape. Für Mathematik, Technik und Chemie existieren schon die ersten XML-Sprachen sowie prototypische Anwendungen (z.B. das XML-Dialekt Chemical Markup Language und der zugehörige Browser Jumbo). XML ist allerdings nicht als HTML-Ersatz zu sehen. Die gewöhnliche Web-Homepage wird sicherlich auch in der Zukunft auf HTML zurückgreifen, doch Spezialanwendungen können von der neuen Entwicklung nur profitieren.


Index Zurück Weiter Literatur