Add a Windows-1251 test files.

Texts taken from Bulgarian Wikipedia page about Windows-1251:
https://bg.wikipedia.org/wiki/Windows-1251
... and Russian Wikipedia page about Windows-1251:
https://ru.wikipedia.org/wiki/Windows-1251
The Bulgarian file detection is right, but the Russian detection
returns "MAC-CYRILLIC", which is an error and should be fixed.
This commit is contained in:
Jehan 2015-11-17 19:09:37 +01:00
parent 41f3b757f1
commit bafccfcea8
2 changed files with 7 additions and 0 deletions

View File

@ -0,0 +1,3 @@
Windows-1251 е 8-битов (еднобайтов) набор символи, проектиран от Майкрософт за езиците, използващи кирилица като български, руски и други.
Windows-1251 и KOI8-R (или украинският му вариант KOI8-U) са много по-разпространени от ISO 8859-5, който не се използва масово. Те постепенно се изместват от двубайтовата кодировка Уникод, с която работи и Уикипедия.

View File

@ -0,0 +1,4 @@
Windows-1251
набор символов и кодировка, являющаяся стандартной 8-битной кодировкой для всех русских версий Microsoft Windows. Пользуется довольно большой популярностью. Была создана на базе кодировок, использовавшихся в ранних «самопальных» русификаторах Windows в 1990—1991 гг. совместно представителями «Параграфа», «Диалога» и российского отделения Microsoft. Первоначальный вариант кодировки сильно отличался от представленного ниже в таблице (в частности, там было значительное число «белых пятен»).
Windows-1251 выгодно отличается от других 8-битных кириллических кодировок (таких как CP866, KOI8-R и ISO 8859-5) наличием практически всех символов, использующихся в русской типографике для обычного текста (отсутствует только значок ударения); она также содержит все символы для других славянских языков: украинского, белорусского, сербского, македонского и болгарского.