Index Zurück Weiter Literatur


1.Wie alles begann

Das World Wide Web ist ein Informationsdienst im Internet. Es wurde 1990 von Tim Berners-Lee und Robert Cailliau am CERN (dem europäischen Forschungszentrum für Teilchenphysik) in Genf entwickelt und beruhte ursprünglich auf der Philosophie, daß akademische Informationen für jedermann frei verfügbar sein sollten. Das große Problem bei der Informationsbeschaffung am CERN bestand in der Inkompatibilität der dort verwendeten Hard- und Software. Berners-Lee und Mitarbeiter konzipierten deshalb ihr System als einen hersteller-, plattform- und anwendungsunabhängigen Informationsdienst. Die Öffentlichkeit erfuhr von WWW im Dezember 1991. Mitte 1992 wurde im Internet ein Paket veröffentlicht, das Serversoftware und zwei Browser umfaßte, die weder Farbe noch Grafik unterstützten.

Ein wichtiger Aspekt des hersteller- und anwendungsunabhängigen Datenaustausches ist die Wahl des Datenformats. Insbesondere wenn die Datenübertragung über das Netz erfolgen soll, müssen mehrere Ziele erreicht werden. Das Format muß leicht zu interpretieren sein, denn es muß auch für leistungsschwache Rechner einen Parser geben. Die übertragene Datenmenge muß klein sein, damit das Netz nicht mit Dokumenten "überflutet" wird. Die Darstellung der Dokumente sollte immer möglich sein, unabhängig von der Grafikfähigkeit des Ausgabegerätes (etwa auf einem zeichenorietierten Terminal und auf einer Workstation mit hoher Bildschirmauslösung in "True-Color").

Das im WWW benutzte Format HTML (HyperText Markup Language) ist keine absolute Neuentwicklung, denn die Idee eines hersteller- und anwendungsunabhängigen Datenaustausches hat eine lange Geschichte. Bereits ab Ende der 60er Jahre wurde bei IBM unter den Namen GML an einem solchen Format gearbeitet. Im Auftrag des American National Standards Institute entstand auf dieser Basis das Standard Generalized Markup Language (SGML). Seit 1986 ist SGML ein ISO-Standard (ISO-8879) und wird weltweit in vielen Bereichen eingesetzt. HTML geht auf SGML zurück.

SGML ist kein konkretes Format, sondern eine Metasprache. Das bedeutet, mit Hilfe von SGML wird je nach Bedarf erst eine konkrete Sprache spezifiziert. Im Falle der Bücher muß z.B. möglich sein, die erste Seite genau zu beschreiben. Anders bei Briefen - hier sind die Adresse und das Datum sehr wichtig. SGML erlaubt, für beide Arten von Dokumenten ein eigenes Format zu definieren. Die Sprachdefinition wird in einer DTD (Document Type Definition) niedergelegt. Sie beschreibt den syntaktisch korrekten Aufbau eines Dokuments. Damit ist SGML einerseits offen für künftige Datenformate (praktisch unbegrenzte Zahl der DTDs), ein Dokument kann aber auch auf seine strukturelle Richtigkeit überprüft werden (auf Basis der entsprechenden DTD).

Die große Flexibilität von SGML hat eine hohe Komplexität der Sprache zufolge. Das Erstellen und Analysieren von Dokumenten in einem konkreten Format ist dagegen einfach. Hierfür reicht die Kenntnis der jeweiligen DTD aus. HTML ist ein solches in SGML definiertes Format (es existiert also eine HTML-DTD). Dabei wurden nur die unerläßlichen Elemente von SGML übernommen. Dadurch konnte die Komplexität besonders stark rediziert werden und die Belastung bei der Übertragung von Dokumenten über das Netz in Grenzen gehalten werden.

Bis zur Erscheinung des ersten grafikfähigen Browsers Mosaic im Jahre 1993 spielte das World Wide Web keine überragende Rolle unter den Internetdiensten. Anfang 1993 gab es weltweit gerade 50 WWW-Server. Danach folgte eine explosionsartige Entwicklung, so daß heute für viele Anwender WWW und Internet zu Synonimen geworden sind. HTML erfuhr in dieser Zeit eine ganze Reihe von Erweiterungen. Aus dem zunächst lediglich für Textdokumente vorgesehenen Format sind heutzutage Bilder, Tabellen und Formulare nicht mehr wegzudenken. Auch multimediale Elemente - Audio, Video und Animation - sind ein Bestandteil von HTML. Daß das Potential der Sprache noch lange nicht erschöpft ist, verdankt sie ihrer einfachen und doch sehr flexiblen Syntax.

CERN und MIT (Massachusetts Intsitute of Technologie, Cambrige) gründeten 1994 die World Wide Web Organization (W3O). Das Gremium kümmert sich unter anderem um die Einheitlichkeit und Weiterentwicklung von HTML. Nach dem Beitritt des französischen INRIA (Institut National de Recherche en Informatique et en Automatique, Le Chesnay Cedex) in selben Jahr wurde die W3O in das World Wide Web Consortium (W3C) umbenannt. Auf den WWW-Seiten des W3C läßt sich der Entwicklungsstand von HTML gut verfolgen.


Index Zurück Weiter Literatur