uchardet/script/BuildLangModelLogs/LangCzechModel.log

239 lines
8.2 KiB
Plaintext

= Logs of language model for Czech (cs) =
- Generated by BuildLangModel.py
- Started: 2022-12-14 20:21:08.161564
- Maximum depth: 4
- Max number of pages: 200
== Parsed pages ==
Sociální fobie (revision 22020472)
Alkoholismus (revision 22196482)
Obsedantně kompulzivní porucha (revision 22207124)
Beta-blokátor (revision 21048224)
Tréma (revision 22031372)
Národní parlamentní knihovna Japonska (revision 21018639)
Alprazolam (revision 21750289)
Schizofrenie (revision 21709687)
Predestinace (revision 22029350)
Šógunát Tokugawa (revision 22213068)
Serotonin (revision 21724759)
Národní knihovna Španělska (revision 21819713)
Národnost (revision 22181364)
Mytí rukou (revision 21428406)
Národní knihovna České republiky (revision 22177708)
Kalvinismus (revision 21693188)
Delirium tremens (revision 21223330)
Library of Congress Control Number (revision 19355161)
Příčně pruhovaná svalovina (revision 20442240)
Japonština (revision 22023125)
Virtual International Authority File (revision 21184542)
Jan Kalvín (revision 21942173)
Zinkový prst (revision 21309616)
Vražda (revision 21956156)
Pivo (revision 22181432)
Univerzitní systém dokumentace (revision 21061529)
Starořečtina (revision 22071115)
Tulip (revision 21245729)
Hraniční porucha osobnosti (revision 21373755)
Polská národní knihovna (revision 21273191)
Autorita (knihovnictví) (revision 21919206)
Tony Shalhoub (revision 22120821)
Lotyšská národní knihovna (revision 21809399)
Národní knihovna Izraele (revision 20491004)
Mezinárodní klasifikace nemocí (revision 21565517)
Latina (revision 21868129)
Kyselina gama-aminomáselná (revision 19923822)
Gemeinsame Normdatei (revision 20842200)
International Standard Book Number (revision 21443136)
Játra (revision 21732676)
Vatikánská apoštolská knihovna (revision 20529679)
Hladká svalovina (revision 21837789)
Psychoterapie (revision 21818892)
Církev (revision 21907627)
Tokio (revision 21751763)
Hypothalamus (revision 21171603)
Tachykardie (revision 20455710)
Japonský parlament (revision 19000717)
Psychika (revision 21886751)
James W. Black (revision 22073892)
WorldCat (revision 21510754)
Bezvědomí (revision 22201907)
Čeština (revision 21883072)
Emoce (revision 21879452)
Library of Congress (revision 20205897)
Sympatikus (revision 20346074)
Kognitivně behaviorální terapie (revision 21301071)
Náboženství (revision 21691676)
Katecholamin (revision 20335142)
Francouzská národní knihovna (revision 20503017)
Poruchy příjmu potravy (revision 21792957)
Polytematický strukturovaný heslář (revision 20359962)
Křesťanství (revision 22184649)
Lékař (revision 21531442)
Kvašení (revision 21159147)
Lék (revision 22208230)
Očekávaná délka života (revision 22203408)
Svatý Augustin (revision 22029348)
Kouření (revision 22186960)
Národní a univerzitní knihovna v Záhřebu (revision 21291658)
Midazolam (revision 20745654)
Tkáň (revision 21701830)
Středověk (revision 22180362)
Barvoslepost (revision 21425886)
Strach (revision 20549071)
Indikace (lékařství) (revision 20833751)
Histidin (revision 21686432)
Václav Šubert (revision 21971945)
Francouzština (revision 22166917)
Noradrenalin (revision 21238417)
1545 (revision 22181825)
1648 (revision 21425329)
Hydroxyl (revision 20606297)
Řecká národní knihovna (revision 21292640)
Curych (revision 22173470)
Sčítání lidu 2011 (revision 21412557)
Muzikoterapie (revision 21861522)
Uhersko (revision 22059638)
1619 (revision 20732281)
Národní knihovna Chile (revision 22189619)
Biodostupnost (revision 20289543)
Prostata (revision 21774332)
Rakovina (revision 21909777)
Erving Goffman (revision 22055829)
Adrenalin (revision 21886991)
Beta-skládaný list (revision 20282664)
Vazivo (revision 22209213)
Benzo(a)pyren (revision 21798637)
Přízvuk (revision 20671123)
Český jazykový atlas (revision 18945974)
Plusquamperfektum (revision 20879161)
Psychiatrie (revision 20502746)
Psychologie (revision 21840396)
Alveolární laterální aproximanta (revision 20285060)
Opožděná bolest svalů (revision 21738585)
Pověst (revision 21934490)
Infúze (revision 21275511)
Behaviorální psychoterapie (revision 11059677)
Deponentní sloveso (revision 20295633)
28. srpen (revision 21626735)
Fakulta (revision 19416104)
Panoráma (revision 21210018)
Zákaz kouření (revision 20956994)
Sval krejčovský (revision 20367825)
Varolův most (revision 20352546)
Česká tisková kancelář (revision 21721395)
Michael S. Brown (revision 22090607)
1800 (revision 20878320)
Mozek (revision 22201687)
Lékařská fakulta Univerzity Palackého (revision 21371716)
Tyrosin (revision 20778060)
Opilost (revision 21376325)
Glotální souhláska (revision 20310894)
Neurony (revision 21791635)
Duševní porucha (revision 21595942)
Lidské oko (revision 21948364)
Peníze (revision 21410625)
Spolek (revision 21018723)
1834 (revision 22194449)
Elektronická cigareta (revision 21411137)
Svatý Ambrož (revision 21924230)
Státní ústav pro kontrolu léčiv (revision 20915059)
Bibliografie (revision 21639559)
České stavovské povstání (revision 21921182)
Che Guevara (revision 22065779)
Varixy (revision 20668715)
Výjimečný trest (revision 20574730)
1618 (revision 20732127)
Česko (revision 22170403)
2001 (revision 21769254)
Bílkovina (revision 21864645)
Centrální nervová soustava (revision 18275861)
Spojené státy americké (revision 22179989)
Judaismus (revision 22206394)
Halucinace (revision 21860029)
Martin Heidegger (revision 22038120)
Léčivý přípravek (revision 20846808)
Ethnologue (revision 20305961)
Kůže (revision 21989451)
Mezenchym (revision 21046685)
Obec křesťanů (revision 21682273)
1898 (revision 21630487)
Osteoporóza (revision 20589463)
Mezinárodní standardní číslo audiovizuálního díla (revision 22211957)
Česká terminologická databáze knihovnictví a informační vědy (revision 22188254)
Chromozom (revision 21601734)
Simple Knowledge Organization System (revision 20365379)
MARC (revision 15943911)
Fénické písmo (revision 20690142)
Adenosinmonofosfát (revision 21921144)
Oxytocin (revision 20194250)
Izrael (revision 21909756)
Nizozemská královská knihovna (revision 21819389)
Washington, D.C. (revision 22030685)
Evropská unie (revision 22219884)
Harry Stack Sullivan (revision 22011659)
Vazal (revision 22189033)
Diktatura (revision 21684808)
== End of Parsed pages ==
- Wikipedia parsing ended at: 2022-12-14 20:34:20.075639
72 characters appeared 1422585 times.
Most Frequent characters:
[ 0] Char o: 8.036567234998259 %
[ 1] Char e: 7.506967949191084 %
[ 2] Char a: 6.896037846596161 %
[ 3] Char n: 6.845496051202564 %
[ 4] Char t: 5.167424090651877 %
[ 5] Char i: 5.077236158120605 %
[ 6] Char s: 4.775391277146884 %
[ 7] Char v: 4.340267892603957 %
[ 8] Char r: 4.24143372803734 %
[ 9] Char k: 4.069001149316209 %
[10] Char l: 4.035330050576943 %
[11] Char u: 3.1477908174204003 %
[12] Char p: 3.1040675952579284 %
[13] Char d: 3.044106327565664 %
[14] Char í: 3.042841025316589 %
[15] Char m: 2.978029432336205 %
[16] Char c: 2.8064403884477906 %
[17] Char h: 2.3411606336352486 %
[18] Char z: 2.1364628475627114 %
[19] Char á: 2.125004832751646 %
[20] Char j: 1.8273073313721147 %
[21] Char y: 1.7880126670814047 %
[22] Char b: 1.5920314076136046 %
[23] Char ě: 1.2533521722779308 %
[24] Char é: 1.2440732891180493 %
[25] Char ř: 1.0416249292660895 %
[26] Char č: 0.9885525293743431 %
[27] Char ý: 0.9577635079801909 %
[28] Char ž: 0.792008913351399 %
[29] Char š: 0.6496624103304899 %
[30] Char g: 0.561723904019795 %
[31] Char ů: 0.5182115655655023 %
[32] Char f: 0.49466288481883336 %
[33] Char ú: 0.15443716895651224 %
[34] Char x: 0.1142286752636925 %
[35] Char w: 0.11120600877979171 %
[36] Char ň: 0.06663925178460338 %
[37] Char ť: 0.044004400440044 %
[38] Char ó: 0.039786726276461515 %
[39] Char ď: 0.012442138782568354 %
[40] Char q: 0.011317425672279688 %
The first 41 characters have an accumulated ratio of 0.999801066368618.
The first 7 characters have an accumulated ratio of 0.4430512060790744.
All characters whose order is over 27 have an accumulated ratio of 0.035703314740419725.
1372 sequences found.
First 749 (typical positive ratio): 0.995023909981167
Next 205 (954-749): 0.003983584242635896
Rest: 0.000992505776197139
- Processing end: 2022-12-14 20:34:20.424560