mirror of
https://gitlab.freedesktop.org/uchardet/uchardet.git
synced 2025-12-06 16:56:40 +08:00
tests: update Window-1250 test file for Hungarian.
ISO-8859-2 and Windows-1250 are absolutely similar for all letters in the Hungarian alphabet. So for most texts, it is not an error to return one charset or the other. What could make the difference is for instance that Windows-1250 has some symbols where ISO-8859-2 has control characters, like quotes, dashes, the euro symbol… Since control characters have a negative impact on confidence now, texts with such symbols would tend towards Windows-1250 decision. The new test file has such quote symbols.
This commit is contained in:
parent
a251753db8
commit
2bade77bf9
@ -37,7 +37,6 @@ foreach(dir ${dirs})
|
||||
if ("${lang}:${charset}" STREQUAL "el:windows-1253" OR
|
||||
"${lang}:${charset}" STREQUAL "ja:utf-16le" OR
|
||||
"${lang}:${charset}" STREQUAL "ja:utf-16be" OR
|
||||
"${lang}:${charset}" STREQUAL "hu:windows-1250" OR
|
||||
"${lang}:${charset}" STREQUAL "he:iso-8859-8")
|
||||
message(STATUS "Skipping test ${lang}:${charset} (known broken)")
|
||||
else()
|
||||
|
||||
@ -1,5 +1 @@
|
||||
A magyar nyelv az uráli nyelvcsalád tagja, a finnugor nyelvek közé tartozó ugor
|
||||
nyelvek egyike. A legnagyobb finnugor (és egyben uráli) nyelv. Legközelebbi
|
||||
rokonai a manysi és a hanti nyelv, majd utánuk az udmurt, a komi, a mari és a
|
||||
mordvin nyelvek. Vannak olyan vélemények, melyek szerint a csángó önálló nyelv,
|
||||
így ez volna a magyar legközelebbi rokonnyelve.
|
||||
Jellemző rá az első szótagra eső hangsúly (ebben a finnugor nyelvek és a szlovák nyelv hasonlítanak hozzá), a magánhangzó-harmónia (barnulásotokról – zöldülésetekről), valamint a magánhangzó-hosszúság és a hangsúly egymástól független volta (amely szinte egyedüliként lehetővé teszi az antik Időmértékes verselés alkalmazását). Hangrendszerére ezenkívül a lágy mássalhangzók (ny, ty, gy), az aspirálatlan zárhangok (h nélkül ejtett p, t, k, szemben például a germán nyelvekkel) és a palatális magánhangzók előtti kemény mássalhangzók jelenléte jellemző (azaz lehetséges ne, ti stb. hangkapcsolat, nye, tyi helyett; szemben például az orosszal). Nincsenek benne valódi diftongusok (mint például a finnben vagy németben) és redukált, vagyis „elnyelt” magánhangzók (mint például az angolban, németben). A speciális magyar a hang (mely a svédben és a perzsában is megvan) nehézséget okozhat a nyelvünket tanulóknak.
|
||||
|
||||
Loading…
x
Reference in New Issue
Block a user