mirror of
https://gitlab.freedesktop.org/uchardet/uchardet.git
synced 2025-12-07 01:06:40 +08:00
239 lines
8.2 KiB
Plaintext
239 lines
8.2 KiB
Plaintext
= Logs of language model for Czech (cs) =
|
|
|
|
- Generated by BuildLangModel.py
|
|
- Started: 2022-12-14 20:21:08.161564
|
|
- Maximum depth: 4
|
|
- Max number of pages: 200
|
|
|
|
== Parsed pages ==
|
|
|
|
Sociální fobie (revision 22020472)
|
|
Alkoholismus (revision 22196482)
|
|
Obsedantně kompulzivní porucha (revision 22207124)
|
|
Beta-blokátor (revision 21048224)
|
|
Tréma (revision 22031372)
|
|
Národní parlamentní knihovna Japonska (revision 21018639)
|
|
Alprazolam (revision 21750289)
|
|
Schizofrenie (revision 21709687)
|
|
Predestinace (revision 22029350)
|
|
Šógunát Tokugawa (revision 22213068)
|
|
Serotonin (revision 21724759)
|
|
Národní knihovna Španělska (revision 21819713)
|
|
Národnost (revision 22181364)
|
|
Mytí rukou (revision 21428406)
|
|
Národní knihovna České republiky (revision 22177708)
|
|
Kalvinismus (revision 21693188)
|
|
Delirium tremens (revision 21223330)
|
|
Library of Congress Control Number (revision 19355161)
|
|
Příčně pruhovaná svalovina (revision 20442240)
|
|
Japonština (revision 22023125)
|
|
Virtual International Authority File (revision 21184542)
|
|
Jan Kalvín (revision 21942173)
|
|
Zinkový prst (revision 21309616)
|
|
Vražda (revision 21956156)
|
|
Pivo (revision 22181432)
|
|
Univerzitní systém dokumentace (revision 21061529)
|
|
Starořečtina (revision 22071115)
|
|
Tulip (revision 21245729)
|
|
Hraniční porucha osobnosti (revision 21373755)
|
|
Polská národní knihovna (revision 21273191)
|
|
Autorita (knihovnictví) (revision 21919206)
|
|
Tony Shalhoub (revision 22120821)
|
|
Lotyšská národní knihovna (revision 21809399)
|
|
Národní knihovna Izraele (revision 20491004)
|
|
Mezinárodní klasifikace nemocí (revision 21565517)
|
|
Latina (revision 21868129)
|
|
Kyselina gama-aminomáselná (revision 19923822)
|
|
Gemeinsame Normdatei (revision 20842200)
|
|
International Standard Book Number (revision 21443136)
|
|
Játra (revision 21732676)
|
|
Vatikánská apoštolská knihovna (revision 20529679)
|
|
Hladká svalovina (revision 21837789)
|
|
Psychoterapie (revision 21818892)
|
|
Církev (revision 21907627)
|
|
Tokio (revision 21751763)
|
|
Hypothalamus (revision 21171603)
|
|
Tachykardie (revision 20455710)
|
|
Japonský parlament (revision 19000717)
|
|
Psychika (revision 21886751)
|
|
James W. Black (revision 22073892)
|
|
WorldCat (revision 21510754)
|
|
Bezvědomí (revision 22201907)
|
|
Čeština (revision 21883072)
|
|
Emoce (revision 21879452)
|
|
Library of Congress (revision 20205897)
|
|
Sympatikus (revision 20346074)
|
|
Kognitivně behaviorální terapie (revision 21301071)
|
|
Náboženství (revision 21691676)
|
|
Katecholamin (revision 20335142)
|
|
Francouzská národní knihovna (revision 20503017)
|
|
Poruchy příjmu potravy (revision 21792957)
|
|
Polytematický strukturovaný heslář (revision 20359962)
|
|
Křesťanství (revision 22184649)
|
|
Lékař (revision 21531442)
|
|
Kvašení (revision 21159147)
|
|
Lék (revision 22208230)
|
|
Očekávaná délka života (revision 22203408)
|
|
Svatý Augustin (revision 22029348)
|
|
Kouření (revision 22186960)
|
|
Národní a univerzitní knihovna v Záhřebu (revision 21291658)
|
|
Midazolam (revision 20745654)
|
|
Tkáň (revision 21701830)
|
|
Středověk (revision 22180362)
|
|
Barvoslepost (revision 21425886)
|
|
Strach (revision 20549071)
|
|
Indikace (lékařství) (revision 20833751)
|
|
Histidin (revision 21686432)
|
|
Václav Šubert (revision 21971945)
|
|
Francouzština (revision 22166917)
|
|
Noradrenalin (revision 21238417)
|
|
1545 (revision 22181825)
|
|
1648 (revision 21425329)
|
|
Hydroxyl (revision 20606297)
|
|
Řecká národní knihovna (revision 21292640)
|
|
Curych (revision 22173470)
|
|
Sčítání lidu 2011 (revision 21412557)
|
|
Muzikoterapie (revision 21861522)
|
|
Uhersko (revision 22059638)
|
|
1619 (revision 20732281)
|
|
Národní knihovna Chile (revision 22189619)
|
|
Biodostupnost (revision 20289543)
|
|
Prostata (revision 21774332)
|
|
Rakovina (revision 21909777)
|
|
Erving Goffman (revision 22055829)
|
|
Adrenalin (revision 21886991)
|
|
Beta-skládaný list (revision 20282664)
|
|
Vazivo (revision 22209213)
|
|
Benzo(a)pyren (revision 21798637)
|
|
Přízvuk (revision 20671123)
|
|
Český jazykový atlas (revision 18945974)
|
|
Plusquamperfektum (revision 20879161)
|
|
Psychiatrie (revision 20502746)
|
|
Psychologie (revision 21840396)
|
|
Alveolární laterální aproximanta (revision 20285060)
|
|
Opožděná bolest svalů (revision 21738585)
|
|
Pověst (revision 21934490)
|
|
Infúze (revision 21275511)
|
|
Behaviorální psychoterapie (revision 11059677)
|
|
Deponentní sloveso (revision 20295633)
|
|
28. srpen (revision 21626735)
|
|
Fakulta (revision 19416104)
|
|
Panoráma (revision 21210018)
|
|
Zákaz kouření (revision 20956994)
|
|
Sval krejčovský (revision 20367825)
|
|
Varolův most (revision 20352546)
|
|
Česká tisková kancelář (revision 21721395)
|
|
Michael S. Brown (revision 22090607)
|
|
1800 (revision 20878320)
|
|
Mozek (revision 22201687)
|
|
Lékařská fakulta Univerzity Palackého (revision 21371716)
|
|
Tyrosin (revision 20778060)
|
|
Opilost (revision 21376325)
|
|
Glotální souhláska (revision 20310894)
|
|
Neurony (revision 21791635)
|
|
Duševní porucha (revision 21595942)
|
|
Lidské oko (revision 21948364)
|
|
Peníze (revision 21410625)
|
|
Spolek (revision 21018723)
|
|
1834 (revision 22194449)
|
|
Elektronická cigareta (revision 21411137)
|
|
Svatý Ambrož (revision 21924230)
|
|
Státní ústav pro kontrolu léčiv (revision 20915059)
|
|
Bibliografie (revision 21639559)
|
|
České stavovské povstání (revision 21921182)
|
|
Che Guevara (revision 22065779)
|
|
Varixy (revision 20668715)
|
|
Výjimečný trest (revision 20574730)
|
|
1618 (revision 20732127)
|
|
Česko (revision 22170403)
|
|
2001 (revision 21769254)
|
|
Bílkovina (revision 21864645)
|
|
Centrální nervová soustava (revision 18275861)
|
|
Spojené státy americké (revision 22179989)
|
|
Judaismus (revision 22206394)
|
|
Halucinace (revision 21860029)
|
|
Martin Heidegger (revision 22038120)
|
|
Léčivý přípravek (revision 20846808)
|
|
Ethnologue (revision 20305961)
|
|
Kůže (revision 21989451)
|
|
Mezenchym (revision 21046685)
|
|
Obec křesťanů (revision 21682273)
|
|
1898 (revision 21630487)
|
|
Osteoporóza (revision 20589463)
|
|
Mezinárodní standardní číslo audiovizuálního díla (revision 22211957)
|
|
Česká terminologická databáze knihovnictví a informační vědy (revision 22188254)
|
|
Chromozom (revision 21601734)
|
|
Simple Knowledge Organization System (revision 20365379)
|
|
MARC (revision 15943911)
|
|
Fénické písmo (revision 20690142)
|
|
Adenosinmonofosfát (revision 21921144)
|
|
Oxytocin (revision 20194250)
|
|
Izrael (revision 21909756)
|
|
Nizozemská královská knihovna (revision 21819389)
|
|
Washington, D.C. (revision 22030685)
|
|
Evropská unie (revision 22219884)
|
|
Harry Stack Sullivan (revision 22011659)
|
|
Vazal (revision 22189033)
|
|
Diktatura (revision 21684808)
|
|
|
|
== End of Parsed pages ==
|
|
|
|
- Wikipedia parsing ended at: 2022-12-14 20:34:20.075639
|
|
|
|
72 characters appeared 1422585 times.
|
|
|
|
Most Frequent characters:
|
|
[ 0] Char o: 8.036567234998259 %
|
|
[ 1] Char e: 7.506967949191084 %
|
|
[ 2] Char a: 6.896037846596161 %
|
|
[ 3] Char n: 6.845496051202564 %
|
|
[ 4] Char t: 5.167424090651877 %
|
|
[ 5] Char i: 5.077236158120605 %
|
|
[ 6] Char s: 4.775391277146884 %
|
|
[ 7] Char v: 4.340267892603957 %
|
|
[ 8] Char r: 4.24143372803734 %
|
|
[ 9] Char k: 4.069001149316209 %
|
|
[10] Char l: 4.035330050576943 %
|
|
[11] Char u: 3.1477908174204003 %
|
|
[12] Char p: 3.1040675952579284 %
|
|
[13] Char d: 3.044106327565664 %
|
|
[14] Char í: 3.042841025316589 %
|
|
[15] Char m: 2.978029432336205 %
|
|
[16] Char c: 2.8064403884477906 %
|
|
[17] Char h: 2.3411606336352486 %
|
|
[18] Char z: 2.1364628475627114 %
|
|
[19] Char á: 2.125004832751646 %
|
|
[20] Char j: 1.8273073313721147 %
|
|
[21] Char y: 1.7880126670814047 %
|
|
[22] Char b: 1.5920314076136046 %
|
|
[23] Char ě: 1.2533521722779308 %
|
|
[24] Char é: 1.2440732891180493 %
|
|
[25] Char ř: 1.0416249292660895 %
|
|
[26] Char č: 0.9885525293743431 %
|
|
[27] Char ý: 0.9577635079801909 %
|
|
[28] Char ž: 0.792008913351399 %
|
|
[29] Char š: 0.6496624103304899 %
|
|
[30] Char g: 0.561723904019795 %
|
|
[31] Char ů: 0.5182115655655023 %
|
|
[32] Char f: 0.49466288481883336 %
|
|
[33] Char ú: 0.15443716895651224 %
|
|
[34] Char x: 0.1142286752636925 %
|
|
[35] Char w: 0.11120600877979171 %
|
|
[36] Char ň: 0.06663925178460338 %
|
|
[37] Char ť: 0.044004400440044 %
|
|
[38] Char ó: 0.039786726276461515 %
|
|
[39] Char ď: 0.012442138782568354 %
|
|
[40] Char q: 0.011317425672279688 %
|
|
|
|
The first 41 characters have an accumulated ratio of 0.999801066368618.
|
|
The first 7 characters have an accumulated ratio of 0.4430512060790744.
|
|
All characters whose order is over 27 have an accumulated ratio of 0.035703314740419725.
|
|
|
|
1372 sequences found.
|
|
|
|
First 749 (typical positive ratio): 0.995023909981167
|
|
Next 205 (954-749): 0.003983584242635896
|
|
Rest: 0.000992505776197139
|
|
|
|
- Processing end: 2022-12-14 20:34:20.424560
|