= Logs of language model for Hungarian (hu) = - Generated by BuildLangModel.py - Started: 2021-03-16 19:18:56.191449 - Maximum depth: 4 - Max number of pages: 100 == Parsed pages == Kezdőlap (revision 21016160) 1621 (revision 19051984) 1771 (revision 21393041) 1821 (revision 23636828) 1831 (revision 22164941) 1848–49-es forradalom és szabadságharc (revision 23685544) 1858 (revision 22166952) 1871 (revision 23533908) 1921 (revision 23662365) 1924 (revision 23246889) 1941 (revision 23564803) 1946 (revision 23682260) 1971 (revision 23593882) 2003 (revision 23647007) 2021 (revision 23686129) A Nyugat lánya (revision 21595643) A magyar zászló és címer napja (revision 23134982) A párizsi Notre-Dame (revision 23521460) Abja-Paluoja (revision 23589245) Antoine-Jean Gros (revision 23684575) Arina Szjarhejevna Szabalenka (revision 23614779) Aun Szan Szu Kji (revision 23588064) Barbora Krejčíková (revision 23683559) Bebe Daniels (revision 23684693) Berlini Nemzetközi Filmfesztivál (revision 23601008) Bohémélet (revision 23533579) Borel–Lebesgue-tétel (revision 20175177) Brüsszel (revision 23681873) Claude Debussy (revision 23666304) Covid19-koronavírus-járvány Magyarországon (revision 23684719) Covid19-pandémia (revision 23672833) Császár Angela (revision 23405485) December 22. (revision 23636644) EastEnders (revision 23674461) Eigel Ernő (revision 23678820) Elise Mertens (revision 23668277) Első világháború (revision 23681284) Enciklopédia (revision 23257786) Fahd szaúdi király (revision 23684688) Filip Polášek (revision 20343200) Finnugor Kulturális Főváros (revision 23593480) Georg Neumark (revision 23419386) Giacomo Puccini (revision 23685245) Gianni Schicchi (revision 21500522) Gonda János (revision 23672147) Halálozások 2021-ben (revision 23686337) Heine-tétel (revision 15274788) Heller Bernát (revision 21796754) Henrietta (keresztnév) (revision 23599183) Hmelnickiji terület (revision 21540657) Ivan Dodig (revision 19700630) Jankovics József (revision 23686084) Jean Frydman (revision 23684355) Jászai Mari-díj (revision 23683756) Katona Gyula (matematikus) (revision 23651033) Kew Gardens (revision 23635430) Klasszikus gitár (revision 23640016) Kombinatorika (revision 23457078) Kurucz György (motorversenyző) (revision 23682502) Landerer Lajos (revision 20960777) Lucca (revision 22052809) Lítium (revision 23671148) Magyar Tudományos Akadémia (revision 23644040) Magyar Wikipédia (revision 23672081) Magyar nyelv (revision 21426463) Magyarország (revision 23674944) Magyarország címere (revision 23623029) Magyarország nemzetiségei (revision 23600289) Magyarország zászlaja (revision 23056847) Mars (bolygó) (revision 23667637) Mercury–Atlas–6 (revision 23639047) Mianmar (revision 23673840) Michael Jordan (revision 23621635) Michal Polák (revision 23684810) Mustárgáz (revision 23682684) Március 16. (revision 23685754) NASA (revision 23080317) Nagy Dénes (filmrendező) (revision 23656475) Newbery Medal (revision 23594588) Nobel-békedíj (revision 23517207) Novak Đoković (revision 23685551) November 29. (revision 23652299) Nyílt tartalom (revision 22335123) Olaszország (revision 23657820) Országos Rabbiképző – Zsidó Egyetem (revision 23624676) Perseverance (revision 23666738) Pillangókisasszony (revision 23430673) Pánczél Lajos (revision 23532037) Rajeev Ram (revision 23615665) Richard Strauss (revision 23674657) Révész László László (revision 23685649) Spinosaurus (revision 23680682) Szomszédok (revision 23682854) Széchenyi-díj (revision 23683451) Természetes fény (film) (revision 22147530) Tiltott Város (revision 23663664) Tosca (revision 23580069) Ukrajna (revision 23683387) == End of Parsed pages == - Wikipedia parsing ended at: 2021-03-16 19:23:30.841696 56 characters appeared 1168905 times. First 32 characters: [ 0] Char e: 9.498462236024313 % [ 1] Char a: 9.06651952040585 % [ 2] Char t: 7.768381519456244 % [ 3] Char s: 6.3276314157266835 % [ 4] Char l: 5.860613137936787 % [ 5] Char n: 5.5261120450336 % [ 6] Char r: 5.029493414777077 % [ 7] Char i: 4.7589838352988485 % [ 8] Char k: 4.502162280082642 % [ 9] Char o: 4.291794457205675 % [10] Char z: 4.136777582438265 % [11] Char á: 3.7318687147372973 % [12] Char é: 3.275287555447192 % [13] Char m: 3.2307159264439798 % [14] Char g: 3.089215975635317 % [15] Char b: 2.120103857884088 % [16] Char d: 2.0372913110988486 % [17] Char y: 2.0071776577223983 % [18] Char v: 1.8980156642327648 % [19] Char u: 1.421757970066002 % [20] Char h: 1.3363789187316335 % [21] Char p: 1.229868979942767 % [22] Char j: 1.147227533460803 % [23] Char c: 1.0305371266270569 % [24] Char ö: 1.0298527254139558 % [25] Char f: 0.9665456132020994 % [26] Char ó: 0.9550818928826551 % [27] Char ő: 0.8821931636873827 % [28] Char í: 0.6613026721589864 % [29] Char ü: 0.46162861823672585 % [30] Char ú: 0.293950321026944 % [31] Char ű: 0.23611841851989682 % The first 32 characters have an accumulated ratio of 0.998090520615448. 1122 sequences found. First 512 (typical positive ratio): 0.9736098834669349 Next 512 (512-1024): 0.0023611841851989683 Rest: 0.00010464608288375879 - Processing end: 2021-03-16 19:23:30.943714