Add test files for ISO-8859-[12].

Taken from French page about ISO-8859-1:
https://fr.wikipedia.org/wiki/ISO_8859-1
... and Hungarian Wikipedia page about ISO-8859-2:
https://hu.wikipedia.org/wiki/ISO/IEC_8859-2
We don't have support for ISO-8859-1, and both these files are detected
as "WINDOWS-1252" (which is acceptable for iso-8859-1.txt since
Windows-1252 is a superset of ISO-8859-1). ISO-8859-2 support is
disabled because the ISO-8859-1 file would be detected as ISO-8859-2,
which would in turn be a clear error.
This commit is contained in:
Jehan 2015-11-17 19:35:08 +01:00
parent 3f3f4b8011
commit 192b0e7d51
2 changed files with 8 additions and 0 deletions

5
test/iso-8859-1.txt Normal file
View File

@ -0,0 +1,5 @@
La norme ISO 8859-1, dont le nom complet est ISO/CEI 8859-1, et qui est souvent appelée Latin-1 ou Europe occidentale, forme la première partie de la norme internationale ISO/CEI 8859, qui est une norme de l'Organisation internationale de normalisation pour le codage des caractères en informatique.
Elle définit ce qu'elle appelle l'alphabet latin numéro 1, qui consiste en 191 caractères de l'alphabet latin, chacun d'entre eux étant codé par un octet (soit 8 bits). ISO 8859-1 reprend le codage des caractères imprimables d'US-ASCII.
Dans les pays occidentaux, cette norme était utilisée par de nombreux systèmes d'exploitation, dont UNIX, Windows ou AmigaOS. Elle a donné lieu à quelques extensions et adaptations, dont Windows-1252 et ISO 8859-15. La distinction entre ASCII, ISO 8859-1, ISO 8859-15, Windows-1252 et MacRoman est une source de confusion parmi les développeurs de programmes informatiques. Le Multinational Character Set créé par Digital Equipment Corporation pour le terminal informatique VT220 est considéré comme à la fois l'ancêtre de l'ISO 8859-1 et de l'Unicode2. Aujourd'hui, son utilisation tend à décroître au profit de l'Unicode.

3
test/iso-8859-2.txt Normal file
View File

@ -0,0 +1,3 @@
Az ISO 8859-2 (hivatalosan ISO/IEC 8859-2, röviden és nem hivatalosan Latin-2) az ISO/IEC 8859-es karakterkódolási szabvány második része. Az ISO által kettes számú latin ábécének nevezett 191 karakter mindegyikének egybájtos (nyolcbites) kódját adja meg. A 191 karakter között minden magyar ékezetes betű megtalálható (a sok más készletből hiányzó ő és ű is).
Az ISO_8859-2:1987 (mime rövidítéséből ismertebb nevén ISO-8859-2 (az "ISO" után kötőjellel)) az IANA-nak erre a szabványra épülő karakterkészletének neve, melyben a C0 (0x00-0x1F) és a C1 (0x80-0x9F) rész az ISO/IEC 6429-ben meghatározott vezérlőkódokat tartalmazza. Az ISO/IEC 6429-ben és 2022-ben megadott escape szekvenciákat nem használja. További ismert nevei: ISO_8859-2, latin2, l2 és csISOLatin2.