mirror of
https://gitlab.freedesktop.org/uchardet/uchardet.git
synced 2025-12-06 16:56:40 +08:00
I realize that the language information a text has been written in is very important since it would completely change the character distribution. Our test files should take this into account, and we should create several test files in different languages for encoding used in various languages.
4 lines
358 B
Plaintext
4 lines
358 B
Plaintext
Windows-1251 е 8-битов (еднобайтов) набор символи, проектиран от Майкрософт за езиците, използващи кирилица като български, руски и други.
|
||
|
||
Windows-1251 и KOI8-R (или украинският му вариант KOI8-U) са много по-разпространени от ISO 8859-5, който не се използва масово. Те постепенно се изместват от двубайтовата кодировка Уникод, с която работи и Уикипедия.
|