test: add French UTF-8 test.

Text from:
https://fr.wikipedia.org/wiki/UTF-8
This commit is contained in:
Jehan 2015-11-30 20:03:33 +01:00
parent 4f1c3ff85e
commit 9dd6b34e93

14
test/fr/utf-8.txt Normal file
View File

@ -0,0 +1,14 @@
UTF-8 (abréviation de langlais Universal Character Set Transformation Format -
8 bits) est un codage de caractères informatiques conçu pour coder lensemble
des caractères du « répertoire universel de caractères codés », initialement
développé par lISO dans la norme internationale ISO/CEI 10646, aujourdhui
totalement compatible avec le standard Unicode, en restant compatible avec la
norme ASCII limitée à langlais de base (et quelques autres langues beaucoup
moins fréquentes), mais très largement répandue depuis des décennies.
LUTF-8 est utilisé par 82,2 % des sites web en décembre 20141. De par sa
nature, UTF-8 est dun usage de plus en plus courant sur Internet, et dans les
systèmes devant échanger de l'information. Il sagit également du codage le plus
utilisé dans les systèmes GNU, Linux et compatibles pour gérer le plus
simplement possible des textes et leurs traductions dans tous les systèmes
décritures et tous les alphabets du monde.