Les codes de caractères et caractères de balise (spéciale) en HTML5

Encodages pour le jeu de caractères ISO Latin-1 sont fournis par défaut dans tous les navigateurs web modernes. (Rechercher “ ISO Latin-1 set ” de trouver une table complète des valeurs.) Ainsi, les entités de caractères dans ce jeu peuvent être utilisées directement dans le balisage HTML sans passer par des contorsions spéciales.

Cependant, en utilisant d'autres encodages exige l'inclusion des balises spéciales pour indiquer au navigateur d'interpréter les codes de caractères Unicode. (Unicode est une norme internationale - la norme ISO 10645, en fait - qui englobe suffisamment de codes pour gérer la plupart des alphabets humains, ainsi que beaucoup de symboles et de caractères non alphabétiques, aussi.) Cette balise spéciale prend cette forme:

Parce que le charset valeur lit UTF-8, vous pouvez référencer toutes les valeurs Unicode communes. (UTF-8 signifie UCS Transformation Format 8 bits, un format de codage qui représente tous les caractères Unicode. Rechercher “ Unicode UTF-8 caractères la table ” à survoler ses codes d'un million-plus caractères.)

Bien que les navigateurs d'aujourd'hui supportent UTF-8 plus ou moins universellement, attendre à voir un soutien pour UTF-16 codes de caractères très bientôt. UTF-16 codes de caractères permettent de navigateurs traitent plus efficacement avec des alphabets non-romains comme l'arabe, katakana (des idéogrammes japonais), et Hangul (Les idéogrammes coréens), qui certains navigateurs luttent pour rendre correctement et complètement aujourd'hui.




Logiciel de HTML-savvy suppose que certains caractères HTML, tels que les crochets gauche et droit (moins-que et de signes supérieur en notation mathématique) sont destinés à être caché et non affichés sur vos pages web finis. Si vous voulez vraiment afficher ces caractères sur vos pages, vous devez faire vos souhaits clair pour le navigateur.

Ces entités permettent affichage des caractères qui sont normalement partie de balisage HTML caché:

  • équerre gauche (lt;): lt;

  • équerre droite (>): >

  • esperluette (): Amp

Si vous avez besoin de ces symboles pour apparaître, d'inclure leurs entités dans votre balisage comme ceci:

L'élément de paragraphe identifie un texte comme un paragraphe:

Ceci est un paragraphe

Cette figure montre comment ces entités apparaissent dans une fenêtre de navigateur.

image0.jpg

» » » » Les codes de caractères et caractères de balise (spéciale) en HTML5