Tim Berners-Lee est l'inventeur du WWW en 1991. Il utilisait
le
maillage de l'internet, non pas uniquement à travers ses
différents chemins (gain en tolérance de panne) mais pour ses
noeuds. Il proposait une
ramification de documents stockés sur des serveurs et
accessibles par des
clics (liens). Il a créé un système
basé sur HTML, http et l'hypertexte. HTML est un dialecte du langage
très complexe SGML (Standard Generalized
Markup Language). HTML est lui simple : il structure
grossièrement un document, intègre des hyperliens, permet une
représentation à l'aide d'un
navigateur. La conception de sites progressait, le langage HTML
devenait plus
fourni et flexible. Les tableaux, dans lesquels on peut afficher
des données, furent vite détournés de leur objectif
initial et utilisés comme moyen de mise
en page.
A quoi sert HTML ?
Pour produire et publier de l'information avec
la distribution la plus
large possible, on a besoin d'un langage universel
que les ordinateurs
puissent interpréter : c'est HTML.
Il donne les moyens de :
- produire des pages web
- retrouver de l'information en ligne via un dispositif de
cliquage et de
liens
- concevoir des formulaires pour conduire des transactions
avec des services éloignés (réservation)
- inclure des applications directement dans un document
(téléchargement par exemple)
Le langage HTML a considérablement
évolué depuis sa première formalisation (1992) et a
montré ses limites : il a méprisé la notion de classes de
documents, il a sous-estimé la complexité des informations
à représenter dans un document, il est tombé dans le
piège de la compatibilité pour devenir ... trop tolérant.
Concluant que la meilleure façon d'avancer avec HTML (qui restera
longtemps présent sur le web) consiste à le reconstruire en tant
qu'application du langage XML, le W3C a créé la norme XHTML en
2000. Sa version 1.0 étend HTML
97
98
4.0 et c'est sa syntaxe que nous retiendrons pour
l'écriture d?un code
correct :
Le document commence par une DTD «
déclaration de type de document » : DOCTYPE ....
- les attributs ont toujours une valeur suivant un signe = et
placée entre guillemets
- les attributs sont séparés du nom de la
balise, et séparés entre eux, par un espace
- les balises sont bien imbriquées (derrière,
il y a la construction d'un
arbre)
- les balises et les attributs sont écrits de
préférence en minuscules
- toute balise ouverte doit être fermée. Celle
qui est «vide» s'auto-ferme (<img .... />)
Les syntaxes de HTML et XHTML sont très proches, celle
de XHTML héritant de XML l'obligation de réaliser des documents
bien formés, vérifiant en particulier les règles
énoncées ci-dessus et la conformité à une DTD
(définition de Type de Document).
Ce qui implique la déclaration suivante (toujours la
même) en haut du document
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN"
http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">
suivi d'un élément racine précisant un
espace de nom et une langue. <html xmlns="
http://www.w3.org/1999/xhtml"
xml:lang="fr" lang="fr">
Ossature d'un document HTML :
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0
Strict//EN"
http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">
<html
xmlns="
http://www.w3.org/1999/xhtml"
xml:lang="fr"
lang="fr">
<head>
<title>Ossature d'un document html</title>
<meta name="keywords" content="HTML, balise, tableau"
/>
<meta http-equiv="content-type" content="text/html" ;
charset="ISO-8859-1" />
<meta name="keywords" content="html, head, body" />
<script>function ...</script><link
type="text/css" href="style.css" />
</head>
<body>... ici le contenu du document détaillé
par la suite </body>
</html>
Ce qui donne à l'affichage dans le navigateur
98
99