uchardet/script/BuildLangModelLogs/LangCzechModel.log
Jehan eb8308d50a src, script: regenerate all existing language models.
Now making sure that we have a generic language model working with UTF-8
for all 26 supported models which had single-byte encoding support until
now.
2022-12-14 00:23:13 +01:00

159 lines
5.2 KiB
Plaintext

= Logs of language model for Czech (cs) =
- Generated by BuildLangModel.py
- Started: 2021-03-16 18:42:56.950279
- Maximum depth: 4
- Max number of pages: 100
== Parsed pages ==
Sociální fobie (revision 19562865)
Adaptace (revision 18611473)
Agorafobie (revision 19426793)
Alkoholismus (revision 19586776)
Alprazolam (revision 19373957)
Americká psychiatrická společnost (revision 18200634)
Antidepresivum (revision 19057482)
Asertivita (revision 19469246)
Atenolol (revision 12051880)
Benzodiazepiny (revision 19464603)
Beta-blokátor (revision 19342461)
Blud (revision 18085659)
Bohatství (revision 16529725)
Bupropion (revision 12028550)
Citalopram (revision 17641873)
Clonazepam (revision 19414205)
Crohnova nemoc (revision 19441068)
DSM-IV (revision 18200634)
Deprese (psychologie) (revision 19554049)
Diagnostický a statistický manuál mentálních poruch (revision 18200634)
Diagnóza (medicína) (revision 18672900)
Dichotomické myšlení (revision 19472610)
Digital object identifier (revision 19452419)
Dopamin (revision 19339677)
Dystymie (revision 17683683)
Důkaz kruhem (revision 16799597)
Elektivní mutismus (revision 19334050)
Emoce (revision 19268819)
Escitalopram (revision 19342010)
Fluoxetin (revision 19342014)
Fluvoxamin (revision 19342014)
Gen (revision 18766924)
Generalizovaná úzkostná porucha (revision 19465410)
Halucinace (revision 19181320)
Hněv (revision 19602111)
Inteligence (revision 19472417)
International Standard Book Number (revision 19411852)
International Standard Serial Number (revision 17477154)
Interpersonální psychoterapie (revision 17446502)
Introverze (revision 19273893)
Iracionalita (revision 16731536)
Jana Vyskočilová (revision 19609212)
Ján Praško (revision 18740907)
Ján Praško Pavlov (revision 18740907)
Kognitivní omyl (revision 19618239)
Kognitivní psychologie (revision 16289048)
Kognitivní restrukturalizace (revision 19284546)
Kognitivně behaviorální terapie (revision 19475205)
Komorbidita (revision 17525950)
Lymská borelióza (revision 19051205)
Medical Subject Headings (revision 18009832)
Meditace (revision 18651670)
Mezinárodní klasifikace nemocí (revision 19575331)
Michael Liebowitz (revision 17336961)
Moclobemid (revision 19562865)
Moritova terapie (revision 16391634)
Musturbace (revision 19562865)
NDRI (revision 19412768)
Nervozita (revision 18799061)
Noradrenalin (revision 19376674)
Obsedantně kompulzivní porucha (revision 19461977)
Panická ataka (revision 18158083)
Panická porucha (revision 18158083)
Paranoia (revision 19271797)
Paroxetin (revision 19342014)
Pohlavnost (revision 19553039)
Pravděpodobnost (revision 19370061)
Predestinace (revision 15390515)
Profese (revision 19148432)
Propanolol (revision 19342521)
Psychiatr (revision 18661359)
Psychické trauma (revision 17566056)
Psychoaktivní droga (revision 19150920)
Psychodynamická léčba (revision 19562865)
Psychofarmaka (revision 19341820)
Psycholog (revision 18812730)
Psychoterapie (revision 18403501)
PubMed (revision 17045891)
RIMA (revision 13950874)
Remise (revision 19427721)
Richard Heimberg (revision 19562865)
Schizofrenie (revision 19507435)
Sebevražda (revision 19464374)
Selektivní abstrakce (revision 17523049)
Selektivní inhibitor zpětného vychytávání serotoninu (revision 19342041)
Serotonin (revision 19186450)
Sertralin (revision 19342014)
Skupinová psychoterapie (revision 15430379)
Skupinová terapie (revision 15430379)
Sociální chování (revision 18867179)
== End of Parsed pages ==
- Wikipedia parsing ended at: 2021-03-16 18:50:25.563305
48 characters appeared 495093 times.
First 41 characters:
[ 0] Char o: 8.197651754316865 %
[ 1] Char e: 8.02455296277669 %
[ 2] Char n: 6.99807914876599 %
[ 3] Char a: 6.436164518585397 %
[ 4] Char i: 5.469477451711093 %
[ 5] Char t: 5.3903004082061345 %
[ 6] Char s: 4.630443169263149 %
[ 7] Char v: 3.9471372045252107 %
[ 8] Char r: 3.7742403952388743 %
[ 9] Char p: 3.6326508352976106 %
[10] Char l: 3.626389385428596 %
[11] Char k: 3.4845978432334936 %
[12] Char í: 3.306247513093499 %
[13] Char d: 3.2319180436806825 %
[14] Char c: 3.084269016124243 %
[15] Char u: 3.0539716780483666 %
[16] Char m: 2.917835638960761 %
[17] Char h: 2.260989349475755 %
[18] Char z: 2.074559729182194 %
[19] Char á: 2.05597736182899 %
[20] Char y: 2.00184611780009 %
[21] Char j: 1.8560149305282037 %
[22] Char b: 1.743510815139782 %
[23] Char ě: 1.2797595603250298 %
[24] Char é: 1.2238104760115776 %
[25] Char č: 0.9543661493901145 %
[26] Char ž: 0.9283104386448606 %
[27] Char ř: 0.8905397571769345 %
[28] Char ý: 0.7972239559032344 %
[29] Char š: 0.6172577677325269 %
[30] Char g: 0.5201043036358826 %
[31] Char f: 0.5120250134823154 %
[32] Char ů: 0.5093992441824061 %
[33] Char ú: 0.18077411718606404 %
[34] Char x: 0.1575461579945586 %
[35] Char w: 0.07291559363594315 %
[36] Char ň: 0.052313403744347016 %
[37] Char ó: 0.050495563459794425 %
[38] Char ť: 0.027469586522128164 %
[39] Char q: 0.010301094945798063 %
[40] Char ď: 0.010099112691958885 %
The first 41 characters have an accumulated ratio of 0.9999353656787715.
1037 sequences found.
First 512 (typical positive ratio): 0.9751874547460189
Next 512 (512-1024): 0.009283104386448606
Rest: 3.158667139656693e-05
- Processing end: 2021-03-16 18:50:26.412061