mirror of
https://gitlab.freedesktop.org/uchardet/uchardet.git
synced 2025-12-14 15:40:06 +08:00
Texts from Hebrew Wikipedia: https://he.wikipedia.org/wiki/עברית https://he.wikipedia.org/wiki/ISO_8859 https://he.wikipedia.org/wiki/UTF-8 uchardet fails to detect the ISO-8859-8 files and detects it as Windows-1255, which is probably acceptable since it is apparently an "almost compatible superset". It may be worth trying to make more complete test files in the future to demonstrate the differences.
2 lines
152 B
Plaintext
2 lines
152 B
Plaintext
ע<EFBFBD>ב<EFBFBD>ר<EFBFBD>ית היא שפה שמית, ממשפחת השפות האפרו-אסיאתיות, הידועה כשפתם של היהודים ושל השומרונים, אשר ניב מודרני שלה משמש כשפה הרשמית והעיקרית של מדינת ישראל.
|