uchardet

mirror of https://gitlab.freedesktop.org/uchardet/uchardet.git synced 2026-06-17 01:16:41 +08:00

History

Jehan 71ca5a7cd5 script, src: generate the Hebrew models. The Hebrew Model had never been regenerated by my scripts. I now added the base generation files. Note that I added 2 charsets: ISO-8859-8 and WINDOWS-1255 but they are nearly identical. One of the difference is that the generic currency sign is replaced by the sheqel sign (Israel currency) in Windows-1255. And though this one lost the "double low line", apparently some Yiddish characters were added. Basically it looks like most Hebrew text would work fine with the same confidence on both charsets and detecting both is likely irrelevant. So I keep the charset file for ISO-8859-8, but won't actually use it. The good part is now that Hebrew is also recognized in UTF-8 text thanks to the new code and newly generated language model.		2021-03-17 23:22:50 +01:00
..
LangArabicModel.log	Rebuild a bunch of language models.	2021-03-16 12:35:18 +01:00
LangCroatianModel.log	src, script: regenerate all existing language models.	2021-03-17 02:07:17 +01:00
LangCzechModel.log	src, script: regenerate all existing language models.	2021-03-17 02:07:17 +01:00
LangDanishModel.log	Rebuild a bunch of language models.	2021-03-16 12:35:18 +01:00
LangEsperantoModel.log	src, script: regenerate all existing language models.	2021-03-17 02:07:17 +01:00
LangEstonianModel.log	src, script: regenerate all existing language models.	2021-03-17 02:07:17 +01:00
LangFinnishModel.log	src, script: regenerate all existing language models.	2021-03-17 02:07:17 +01:00
LangFrenchModel.log	Rebuild a bunch of language models.	2021-03-16 12:35:18 +01:00
LangGermanModel.log	Rebuild a bunch of language models.	2021-03-16 12:35:18 +01:00
LangGreekModel.log	src, script: regenerate all existing language models.	2021-03-17 02:07:17 +01:00
LangHebrewModel.log	script, src: generate the Hebrew models.	2021-03-17 23:22:50 +01:00
LangHungarianModel.log	src, script: regenerate all existing language models.	2021-03-17 02:07:17 +01:00
LangIrishModel.log	src, script: regenerate all existing language models.	2021-03-17 02:07:17 +01:00
LangItalianModel.log	Rebuild a bunch of language models.	2021-03-16 12:35:18 +01:00
LangLatvianModel.log	src, script: regenerate all existing language models.	2021-03-17 02:07:17 +01:00
LangLithuanianModel.log	src, script: regenerate all existing language models.	2021-03-17 02:07:17 +01:00
LangMalteseModel.log	src, script: regenerate all existing language models.	2021-03-17 02:07:17 +01:00
LangPolishModel.log	src, script: regenerate all existing language models.	2021-03-17 02:07:17 +01:00
LangPortugueseModel.log	src, script: regenerate all existing language models.	2021-03-17 02:07:17 +01:00
LangRomanianModel.log	src, script: regenerate all existing language models.	2021-03-17 02:07:17 +01:00
LangSlovakModel.log	src, script: regenerate all existing language models.	2021-03-17 02:07:17 +01:00
LangSloveneModel.log	src, script: regenerate all existing language models.	2021-03-17 02:07:17 +01:00
LangSpanishModel.log	Rebuild a bunch of language models.	2021-03-16 12:35:18 +01:00
LangSwedishModel.log	src, script: regenerate all existing language models.	2021-03-17 02:07:17 +01:00
LangThaiModel.log	src, script: regenerate all existing language models.	2021-03-17 02:07:17 +01:00
LangTurkishModel.log	src, script: regenerate all existing language models.	2021-03-17 02:07:17 +01:00
LangVietnameseModel.log	src, script: regenerate all existing language models.	2021-03-17 02:07:17 +01:00