uchardet/script/BuildLangModelLogs/LangGermanModel.log

256 lines
9.0 KiB
Plaintext

= Logs of language model for German (de) =
- Generated by BuildLangModel.py
- Started: 2022-12-14 23:56:29.651754
- Maximum depth: 4
- Max number of pages: 200
== Parsed pages ==
Deutschland (revision 228606777)
Ungarneinfälle (revision 228768784)
Äthiopien (revision 228777266)
Italienische Sprache (revision 228106913)
Stadtstaat (revision 228606500)
Mais (revision 228729828)
Peter Walther (revision 214205285)
Elektrizitätsversorgung (revision 227608161)
Bundesagentur für Arbeit (revision 228474893)
Anton von Werner (revision 228255869)
Richard Dedekind (revision 227920744)
Eisschild (revision 227400370)
Jemen (revision 228753034)
Berufsbild (revision 222871013)
Leonhard Euler (revision 228416765)
Gelände (revision 228649514)
Michael Hamburger (revision 226393373)
Provinz Schleswig-Holstein (revision 223299120)
Primärenergie (revision 228433024)
Organisation für eine solidarische Welt (revision 208279359)
Gefrierpunktserniedrigung (revision 224283903)
Wolf Biermann (revision 228717194)
Gemeinsame Normdatei (revision 228265239)
Allgemeine Erklärung der Menschenrechte (revision 228825596)
Bundesagentur (revision 220221314)
Früchte (revision 225710699)
Kuwaitische Streitkräfte (revision 225186439)
Afrika (revision 228805304)
Mesopotamien (revision 226452374)
Deutsch-Französischer Krieg (revision 228373530)
James E. Hansen (revision 228130584)
Nunatak (revision 226004806)
1965 (revision 228809670)
Emilianische Sprache (revision 228018609)
Internet Archive (revision 228865464)
Bangladesch (revision 228807193)
Sklavenhandel (revision 228087869)
Braunschweig (revision 228220012)
Ostfrankenreich (revision 228685819)
Medina von Zabid (revision 224779101)
Anschlag auf die Nord-Stream-Pipelines (revision 228851766)
Bernd Rill (revision 215827055)
Kubikkilometer (revision 224503101)
Martina Kaller-Dietrich (revision 208159206)
Normaldruck (revision 220716910)
Deutsche 3. Armee (Deutsch-Französischer Krieg) (revision 228764651)
Endemit (revision 225834805)
Ferdinand Opll (revision 227609827)
Süditalienisch (revision 183453109)
Angola (revision 228787863)
Brasilien (revision 228663551)
Burgenordnung (revision 228769701)
Lehrstuhl (revision 227634509)
Brandenburg (revision 228781446)
Kayser & von Großheim (revision 220121048)
Leistungsmissbrauch (revision 195597228)
Jean Cavaillès (revision 202181070)
Kangerlussuaq (revision 224574132)
Rimini (revision 227046826)
Jimma (revision 206733769)
Académie des sciences (revision 227860750)
Ibrahim al-Hamdi (revision 211147927)
Nilotische Sprachen (revision 198831990)
Abdallah ibn Husain al-Ahmar (revision 211150675)
Modulares Gesetz von Dedekind (revision 212467071)
Frank-Jürgen Weise (revision 228738039)
Algebraischer Zahlkörper (revision 207023222)
Zeitzone (revision 228207191)
Rio de Janeiro (revision 228611675)
Schlacht bei Riade (revision 228766987)
Fajsz (revision 215292800)
Basel (revision 228844409)
Römischer Dialekt (revision 224726203)
Eritrea (revision 228647055)
Schwaben (revision 226441292)
27. Dezember (revision 228505321)
Kursan (revision 221194924)
Gebiet (revision 227478187)
Max Liebermann (revision 228825219)
Marcel Reich-Ranicki (revision 227818012)
6. Oktober (revision 228177719)
Vereinigtes Königreich (revision 228830889)
Freie Hansestadt Bremen (revision 228393052)
Wilhelminer (revision 184639586)
Sorghumhirsen (revision 227421041)
Waadt (revision 228637190)
Spanien (revision 228606765)
Nigeria (revision 228860955)
Theodor Fontane (revision 228446109)
August zu Eulenburg (revision 221742465)
Wirtschaftswachstum (revision 228334614)
Sendeanlage (revision 223637854)
Bergpredigt (revision 228386490)
Emmy Noether (revision 228699911)
Europa (revision 228865802)
Arbeitgeber (revision 203029719)
Kraftwerkseinsatzoptimierung (revision 217324853)
Alte Nationalgalerie (revision 228284855)
Dr. phil. (revision 228312094)
Hans Mayer (Literaturwissenschaftler) (revision 226080621)
Strukturanpassungsmaßnahme (revision 154677279)
Neue Deutsche Biographie (revision 228241293)
Kernkraftwerk (revision 228305057)
Mechthild Schulze-Dörrlamm (revision 226743261)
Günter de Bruyn (revision 228690339)
Aostatal (revision 226405922)
Quadratkilometer (revision 223099015)
Oberflächenwasser (revision 228810839)
Süßgräser (revision 225517154)
Florenz (revision 228438880)
Menelik I. (revision 220657570)
American Sign Language (revision 225955248)
Handelssprache (revision 223923299)
Kyrillisches Alphabet (revision 226270962)
Adolf Rosenberg (revision 217941753)
Georg Cantor (revision 227767731)
Akademie der Künste (Berlin) (revision 228718084)
Eiszeitalter (revision 228423862)
Hybride (revision 224939585)
Ideal (Ringtheorie) (revision 227062102)
Malawi (revision 227979262)
Realismus (Kunst) (revision 228665978)
Elektromagnet (revision 215856084)
Bedingungsloses Grundeinkommen (revision 228319519)
CryoSat-2 (revision 222991606)
Steinkohlenbergbau (revision 227136570)
Flughafen Sai'ūn (revision 218085552)
Kanada (revision 228843319)
Tätigkeitsschlüssel (revision 206985116)
Arnulf I. (Bayern) (revision 219794310)
Äthiopischer Birr (revision 218043169)
Dachsprache (revision 217492262)
Regierungsbezirk (revision 225453571)
Altgriechische Sprache (revision 226388919)
Heiliges Römisches Reich (revision 228549579)
Mangan (revision 227356461)
Tomate (revision 228788761)
Liste der Außenminister Äthiopiens (revision 222986689)
David Archer (revision 208114022)
Schlacht von Pressburg (revision 218874493)
Eswatini (revision 227460982)
Explorix (revision 222971601)
Verbraucher (revision 224557437)
Umspannwerk (revision 222823940)
Eugène Delacroix (revision 228537433)
Statistische Systematik der Wirtschaftszweige in der Europäischen Gemeinschaft (revision 225614083)
Gemeinde (Deutschland) (revision 228003605)
Klimaschutz (revision 228365985)
Energiewandler (revision 226533635)
Günter Eich (revision 227865826)
Arik Brauer (revision 228858852)
Olympus (Satellit) (revision 222991938)
Hochspannungs-Gleichstrom-Übertragung (revision 227996489)
AS Roma (revision 227513080)
Ali Abdullah Salih (revision 228737840)
Pirelli-Hochhaus (revision 225174330)
Beschäftigung (revision 220327973)
Windenergie (revision 228833811)
Carnot-Kreisprozess (revision 224094562)
Umweltverschmutzung (revision 223785003)
Camille Le Tellier de Louvois (revision 224753378)
Salzburggau (revision 225169888)
Karl Friedrich Schimper (revision 225862938)
Staatsreligion (revision 226365106)
Kilogramm (revision 227055964)
Kulturhistorisches Museum Magdeburg (revision 228122358)
Wasserversorgung (revision 219277006)
Energiewirtschaft (revision 224577593)
Gebrauchssprache (revision 222726670)
Roggenbrot (revision 223590572)
Mekka (revision 228406949)
Kultusministerium (revision 228012512)
Indiana University Bloomington (revision 225883504)
Kyros-Zylinder (revision 228414898)
Regeln für die alphabetische Katalogisierung (revision 213780375)
Thailändische Streitkräfte (revision 220673813)
Deutsche Nationalstiftung (revision 219900629)
Persistenz (Informatik) (revision 211098342)
Altewiek (revision 217193242)
Distributivgesetz (revision 227632200)
Örterbau (revision 214830939)
Webanwendung (revision 228408636)
ISO 3166-2 (revision 224408291)
Magneteisen (revision 226103474)
Wilhelm Hauff (revision 224019493)
Reichsfreiheit (revision 223024255)
Mödling (revision 228813084)
N-tv (revision 228248458)
Island (revision 228455598)
Deutsches Archäologisches Institut (revision 228802778)
Fajsz (Ort) (revision 203896222)
Innu (revision 219609498)
AEG (revision 228810033)
Abgabenordnung (revision 228397042)
Gentechnik (revision 228859989)
Bajuwaren (revision 224140177)
== End of Parsed pages ==
- Wikipedia parsing ended at: 2022-12-14 23:59:59.485394
61 characters appeared 3973938 times.
Most Frequent characters:
[ 0] Char e: 15.586378046159755 %
[ 1] Char n: 9.613788639883158 %
[ 2] Char i: 8.167163151513687 %
[ 3] Char r: 7.78381544956162 %
[ 4] Char s: 6.370834170034863 %
[ 5] Char t: 6.198536564989187 %
[ 6] Char a: 6.0610407107508975 %
[ 7] Char d: 5.036314104548183 %
[ 8] Char h: 4.10476962650147 %
[ 9] Char u: 3.901092568630915 %
[10] Char l: 3.8286707039717283 %
[11] Char g: 3.025563056091967 %
[12] Char o: 2.9347715037325695 %
[13] Char c: 2.801981309220224 %
[14] Char m: 2.6123709026159943 %
[15] Char b: 2.136419843490261 %
[16] Char f: 1.5972065995996918 %
[17] Char k: 1.4957958579122272 %
[18] Char w: 1.3413646614516885 %
[19] Char z: 1.1560572912813436 %
[20] Char p: 1.0669013960459373 %
[21] Char v: 0.9756568924829728 %
[22] Char ä: 0.569409990795025 %
[23] Char ü: 0.531311761783903 %
[24] Char ö: 0.30601886592090766 %
[25] Char j: 0.2797728600697847 %
[26] Char y: 0.18633909235624713 %
[27] Char ß: 0.15126053803557077 %
[28] Char x: 0.07903998502241354 %
[29] Char q: 0.03792208132084597 %
The first 30 characters have an accumulated ratio of 0.9993756822577502.
The first 4 characters have an accumulated ratio of 0.41151145287118224.
All characters whose order is over 20 have an accumulated ratio of 0.031167320677876705.
1313 sequences found.
First 511 (typical positive ratio): 0.9950430213396004
Next 186 (697-511): 0.0039634314878256305
Rest: 0.0009935471725739387
- Processing end: 2022-12-14 23:59:59.567695