Dokumente, die in einer Auszeichnungssprache verfaßt wurden, enthalten zwei Arten von Informationen: den eigentlichen Text sowie die sog. Auszeichnungselemente oder Befehle. Die Befehle bestimmen, wie einzelne Textabschnitte zu interpretieren sind. In HTML werden die Auszeichnungselemente Tags genannt. Sowohl der Text als auch die Auszeichnungselemente bestehen ausschließlich aus ASCII-Zeichen. Da ASCII-Dateien auf praktisch jeder Rechnerarchitektur problemlos verwendet werden können, eignet sich das Konzept besonders gut für die anwendungs- und herstellerunabhängige Übertragung von Dokumenten.
Die Syntax eines HTML-Befehls ist sehr einfach. Der Text, der ausgezeichnet werden soll, wird in zwei Tags eingeschlossen. Die Tags stehen in spitzen Klammern, dabei ist das schließende Tag immer am Schrägstrich zu erkennen:
Es möglich, zu den Tags Argumente anzugeben und die Befehle zu verschachteln. Die Tags können groß oder klein geschrieben werden. Die folgende Tabelle stellt die wichtigsten Auszeichnungselemente dar:
Tag-Name | Beschreibung | Art |
---|---|---|
H1, H2, H3, ... | Überschrift der Ebene 1, 2, 3, ... | logische Formatierung |
P | Absatz | logische Formatierung |
EM | hervorgehoben | logische Formatierung |
U1 | ungeordnete Liste | logische Formatierung |
O1 | geordnete Liste | logische Formatierung |
LI | Listenelement | logische Formatierung |
B | Fettschrift | physikalische Formatierung |
I | Kursivschrift | physikalische Formatierung |
U | unterstrichen | physikalische Formatierung |
TT | nicht-proportionale Schrift | physikalische Formatierung |
Es gibt einige Tags, die keinen Text auszeichnen und deshalb kein abschließendes Pendant haben:
Tag-Name | Beschreibung |
---|---|
HR | erzeugt eine horizontale Linie |
BR | erzeugt einen Zeilenumbruch |
HTML bietet die Möglichkeit, an beliebigen Stellen innerhalb einer HTML-Datei Kommentare einzufügen. Diese werden bei der Präsentation nicht angezeigt. Auf diese Weise ist es möglich, interne Angaben zu Autor, Erstelldatum sowie andere Anmerkungen zu machen. Kommentare werden durch die Zeichenfolge <!- eingeleitet und mit der Zeichenfolge -> abgeschlossen:
Obwohl die Dateien ausschließlich ASCII-Zeichen enthalten, kennt HTML eine Reihe von Sonderzeichen, die nicht zum klassischen ASCII-Zeichensatz gehören (z.B. Sprachspezifische Zeichen wie die deutschen Umlaute). Für jedes solche Sonderzeichen existiert eine ASCII-Folge, mit der das Zeichen im Text kodiert wird. Die Kodierung der deutschen Umlaute gibt die folgende Tabelle an:
Sonderzeichen | Kodierung |
---|---|
Ä | Ä |
ä | ä |
Ö | Ö |
ö | ö |
Ü | Ü |
ü | ü |
ß | ß |
Der Browser setzt den Code in die entsprechende Darstellung um.
Eine gemeinsame Eigenschaft aller WWW-Browser ist - sie ignorieren Zeilenumbrüche, Absatzschaltungen sowie mehrfache Leerzeichen. Für diese Zwecke müssen immer die entsprechenden HTML-Befehle verwendet werden. Ferner ignorieren alle Browser Tags, die sie nicht kennen.