Les caractères spéciaux évoluent avec les principaux navigateurs
Lors de la conception d’un site Internet, il arrive que l'on rencontre des problèmes d’affichage et de reconnaissance des caractères spéciaux. Cela peut varier en fonction du langage d'encodage du site, en fonction des différents navigateurs et des systèmes d’exploitation des ordinateurs utilisés.
Il se peut que les caractères spéciaux soient remplacés par des carrés, des points d’interrogation ou d’étranges séries de lettres. Le problème vient de l’encodage des caractères. Le navigateur ne sait pas quel encodage est utilisé pour afficher la page.
Evolution de ASCII vers UNICODE
Pour afficher correctement une page HTML, le navigateur doit savoir le jeu de caractères employé. En HTML, tous les caractères spéciaux peuvent être remplacés par un code qui commence par « & » et qui se termine par « ; ». Il faut savoir que les lettres avec cédilles et les caractères accentués sont également des caractères spéciaux.
Initialement, le jeu de caractères utilisé était le système ASCII. Ce dernier prenait en charge les chiffres compris entre 0 et 9, les majuscules et les minuscules de l’alphabet en anglais ainsi que certains caractères spéciaux. Mais ce jeu de caractères s'est vite trouvé limité dans un environnement multilingue. Ceci étant, le Consortium Unicode a créé le standard « Unicode ». Ce dernier couvre tous les caractères, les symboles et les ponctuations. Il permet de traiter, de stocker et d’échanger les données texte qu’importent la langue, la plateforme et le programme employé.
Tableau de Caractères Spéciaux Unicode
L’encodage des caractères spéciaux
Les codages les plus utilisés sont UTF-8 qui est compris par tous les navigateurs courant, pour encoder toutes les langues, et UTF-16 qui est employé par les systèmes d’exploitation et d’environnement comme Microsoft Windows, Java…
À noter que pour la plupart des navigateurs, le jeu de caractères par défaut est l’ISO-8859-1, les 128 premiers caractères représentent la version originale de l’ASCII et les codes 160 à 255 sont les caractères utilisés en Europe occidentale et certains caractères spéciaux communément employés. Mais pour éviter les mauvaises surprises, l’idéal est d’utiliser la table de conversion des caractères spéciaux.
Une fois qu’on sait l’encodage à utiliser sur les pages Internet, il faut s’assurer que l’information sera transmise aux navigateurs Web sinon, ils utiliseront des codes par défaut. Pour s’assurer que tous les caractères des pages HTML sont bien encodés, il est possible de faire la vérification dans les paramètres de configuration de l’éditeur.