mirror of
https://gitlab.freedesktop.org/uchardet/uchardet.git
synced 2025-12-14 23:50:05 +08:00
ISO-8859-2 and Windows-1250 are absolutely similar for all letters in the Hungarian alphabet. So for most texts, it is not an error to return one charset or the other. What could make the difference is for instance that Windows-1250 has some symbols where ISO-8859-2 has control characters, like quotes, dashes, the euro symbol… Since control characters have a negative impact on confidence now, texts with such symbols would tend towards Windows-1250 decision. The new test file has such quote symbols.
2 lines
912 B
Plaintext
2 lines
912 B
Plaintext
Jellemző rá az első szótagra eső hangsúly (ebben a finnugor nyelvek és a szlovák nyelv hasonlítanak hozzá), a magánhangzó-harmónia (barnulásotokról – zöldülésetekről), valamint a magánhangzó-hosszúság és a hangsúly egymástól független volta (amely szinte egyedüliként lehetővé teszi az antik Időmértékes verselés alkalmazását). Hangrendszerére ezenkívül a lágy mássalhangzók (ny, ty, gy), az aspirálatlan zárhangok (h nélkül ejtett p, t, k, szemben például a germán nyelvekkel) és a palatális magánhangzók előtti kemény mássalhangzók jelenléte jellemző (azaz lehetséges ne, ti stb. hangkapcsolat, nye, tyi helyett; szemben például az orosszal). Nincsenek benne valódi diftongusok (mint például a finnben vagy németben) és redukált, vagyis „elnyelt” magánhangzók (mint például az angolban, németben). A speciális magyar a hang (mely a svédben és a perzsában is megvan) nehézséget okozhat a nyelvünket tanulóknak.
|