uchardet/script/BuildLangModelLogs/LangGreekModel.log

256 lines
11 KiB
Plaintext
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

= Logs of language model for Greek (el) =
- Generated by BuildLangModel.py
- Started: 2022-12-14 18:02:21.368215
- Maximum depth: 4
- Max number of pages: 200
== Parsed pages ==
Πύλη:Κύρια (revision 9720674)
Ελληνική γλώσσα (revision 9770893)
Μεσαιωνική ελληνική γλώσσα (revision 9633519)
Ελλάδα (revision 9814581)
Λογοτεχνία (revision 9710342)
Αμπέμπε Μπικίλα (revision 9629134)
Σι Τζινπίνγκ (revision 9813216)
Αναγέννηση (revision 9814535)
1927 (revision 9796714)
Ρίσι Σούνακ (revision 9807035)
Χιτζάμπ (revision 9689462)
Προφορά της κλασικής αρχαίας ελληνικής γλώσσας (revision 9656423)
Σουηδικές γενικές εκλογές 2022 (revision 9744475)
24 Φεβρουαρίου (revision 9778301)
Σουηδία (revision 9724663)
Système universitaire de documentation (revision 9519040)
17 Φεβρουαρίου (revision 9792444)
National Diet Library (revision 9533181)
Σουηδικές γενικές εκλογές (2018) (revision 9722309)
Σαν Φρανσίσκο (revision 9695407)
Αθλητισμός (revision 9775022)
Sveriges Television (revision 8951040)
Ελληνικό σύστημα αρίθμησης (revision 8810370)
Ανανεώστε την Ευρώπη (revision 9774364)
Μάρμαρο (revision 9388577)
Ελληνικό φωνητικό αλφάβητο (revision 9069946)
Φιλελεύθεροι (Σουηδία) (revision 9744487)
Αιθιοπία (revision 9690129)
Κατάλογος χωρών κατά δείκτη ανθρώπινης ανάπτυξης (revision 9782519)
Ινδία (revision 9739007)
Νικόλαος Κουζάνος (revision 8518280)
ISO 639-1 (revision 9336842)
Κομμουνιστικό Κόμμα της Κίνας (revision 9172509)
Αττική διάλεκτος (revision 8901811)
1908 (revision 9742502)
Περιφέρεια Βορείου Αιγαίου (revision 9621030)
Γένοβα (revision 9771381)
Κίνα (revision 9794230)
Φουμίο Κισίντα (revision 9559868)
Μεσόγειος (revision 9815947)
The New York Times (revision 9532084)
Χοντρός και Λιγνός (revision 9758430)
Ελληνικό Ίδρυμα Πολιτισμού (revision 9772666)
Αρχαία ελληνική λογοτεχνία (revision 8735369)
Ξενοφών Στρατηγός (revision 8585203)
Χριστιανοδημοκράτες (Σουηδία) (revision 9745040)
Ντονάτο Μπραμάντε (revision 9502757)
Γλωσσικό ζήτημα (revision 9715638)
Θεοτόκος (revision 9620713)
Νόρλαντ (revision 9701764)
Αθηναϊκή δημοκρατία (revision 9752241)
Μονή Οσίου Λουκά (revision 9745951)
Σαρία (revision 9196257)
Θερινή Ώρα Κεντρικής Ευρώπης (revision 9158347)
Φρυγική γλώσσα (revision 9496315)
Τονισμός (revision 8997917)
Διεθνής πρότυπος αριθμός βιβλίου (revision 9525547)
International Standard Serial Number (revision 9426410)
Βόρεια Κορέα (revision 9781851)
Αργεντινή (revision 9722648)
Ιαπωνία (revision 9738909)
Μωάμεθ (revision 9582333)
Πανελλήνιο Σοσιαλιστικό Κίνημα - Κίνημα Αλλαγής (revision 9815357)
Νι (revision 8925493)
Επιστήμη (revision 9447489)
Άηχο ουρανικό κλειστό (revision 9359209)
Ιωτακισμός (revision 9177317)
Μέγαρα (revision 9815572)
Μάχη του Μαντζικέρτ (revision 9451708)
Τόκιο (revision 9785709)
Βραβείο Φραντς Κάφκα (revision 7803694)
Χειμαρριώτικη διάλεκτος της ελληνικής γλώσσας (revision 9814483)
20 Ιανουαρίου (revision 9568511)
Έθνος κράτος (revision 9565285)
Εμανουέλ Ριβά (revision 9560857)
Ιδιωτικότητα (revision 9543906)
Μαγκνταλένα Άντερσον (revision 9724325)
G7 (revision 9708501)
Ιταλία (revision 9814442)
Αντίς Αμπέμπα (revision 9703571)
1964 (revision 9811809)
Μύκονος (revision 9769477)
Πυκνότητα πληθυσμού (revision 8112343)
Μαραθώνιος στους Ολυμπιακούς Αγώνες (revision 9644285)
Ομηρική διάλεκτος (revision 8274384)
Βραβεία Νόμπελ Λογοτεχνίας (revision 9704908)
International Standard Name Identifier (revision 6861942)
Ουλφ Κρίστερσον (revision 9804758)
Καππαδοκική διάλεκτος (revision 9776884)
Θανάσης Βέγγος (revision 9807820)
Library of Congress Control Number (revision 9767699)
Αγγλική γλώσσα (revision 9779698)
Ab urbe condita (revision 9523077)
Πινγίν (revision 9679522)
Ρότζερ Μουρ (revision 9814722)
Index Librorum Prohibitorum (revision 9760596)
Νοσταλγία (revision 9734746)
Τουρκία (revision 9804483)
Ωδή (revision 8960684)
Αρχαϊκά ελληνικά αλφάβητα (revision 9512358)
21 Οκτωβρίου (revision 9123772)
Μυστικό Συμβούλιο (Ηνωμένο Βασίλειο) (revision 9717054)
Κολούτσιο Σαλουτάτι (revision 7531799)
Αφγανιστάν (revision 9704097)
Ολυμπιακοί Αγώνες (revision 9767748)
Μάο Τσετούνγκ (revision 9685825)
Γλώσσα (revision 9625715)
Ελληνιστική περίοδος (revision 9683985)
Σονέτο (revision 9736846)
Ουίλιαμ Χέιγκ (revision 9655093)
Ιράν (revision 9804479)
Γιάννης Μιχαλόπουλος (revision 9334986)
Διεθνής Αερολιμένας Αθηνών «Ελευθέριος Βενιζέλος» (revision 9805318)
Γαλλία (revision 9809487)
Πανεπιστήμιο της Οξφόρδης (revision 9496775)
Μεταφυσική (revision 9716423)
Κλασικισμός (revision 8324313)
Φικχ (revision 8308138)
Ποίηση (revision 9750581)
Παμφυλιακή διάλεκτος (revision 9496240)
Ιωάννης Φουντούλης (revision 9326532)
Χέγκελ (revision 9658098)
13 Σεπτεμβρίου (revision 9331818)
Λοκρική διάλεκτος (revision 7574882)
Λειτουργία (μουσική) (revision 8677674)
Οργανισμός για την Ασφάλεια και τη Συνεργασία στην Ευρώπη (revision 9794797)
Bibliothèque nationale de France (revision 9636186)
Αστικοποίηση (revision 9718574)
Σουηδικές γενικές εκλογές 2014 (revision 9042837)
Δέλτα (revision 7065781)
Integrated Authority File (revision 8518544)
Σκυρόδεμα (revision 9415646)
Ρωσικός φορμαλισμός (revision 8011923)
Γάμμα (revision 9541292)
Τζιχαντισμός (revision 9239251)
Ντόμινικ Ράαμπ (revision 9735261)
Νεοελληνική λογοτεχνία (revision 9660986)
Σχέδιο Μάρσαλ (revision 9590277)
Μεξικό (revision 9672139)
1929 (revision 9808487)
Φι (revision 8977317)
PubMed Identifier (revision 6403885)
Ισλαμισμός (revision 9710191)
Τζορτζ Μπέρκλεϋ (revision 9115917)
Γιέστρικλαντ (revision 8835873)
Βυζαντινή αυτοκρατορία (revision 9724182)
Αρχαία Αθήνα (revision 9791090)
Αλέξανδρος Πάλλης (revision 9452344)
Σιδηροδρομικός σταθμός Μεγάρων (revision 9788113)
Σιμπούγια (revision 9448722)
Άγιος Κήρυκος Ικαρίας (revision 9379289)
Ελληνική φιλοσοφία (revision 9012645)
Πτολεμαίοι (revision 9760181)
Φιλελεύθερο Δημοκρατικό Κόμμα (Ιαπωνία) (revision 9562975)
Χιόνι (revision 9366620)
1188 (revision 7906380)
Σλοβενική γλώσσα (revision 9736905)
Μιχάλης Παπακωνσταντίνου (revision 9228156)
Ιερές συντομογραφίες (revision 9636386)
Virtual International Authority File (revision 9547787)
Οστρακισμός (revision 9758182)
Λετονία (revision 9810145)
Κατάλογος χωρών ανά κατά κεφαλήν ΑΕΠ (ονομαστικό) (revision 9707678)
Τριττύα (revision 8997097)
Ώρα Κεντρικής Ευρώπης (revision 9158323)
Βασιλική του Αγίου Πέτρου (revision 9746265)
Αντέλ Ενέλ (revision 9781473)
Τουρκμενιστάν (revision 9786546)
Νέα ελληνική γλώσσα (revision 9741111)
Ξι (revision 8385158)
Ίαν Φλέμινγκ (revision 9814725)
Ελένη Βιτάλη (revision 9664460)
Μεγαρικό ψήφισμα (revision 9614286)
Τσου Εν Λάι (revision 8409932)
Κάρλος Μένεμ (revision 9734248)
Αλεξάνδρεια (revision 9806897)
1409 (revision 8687955)
Λιοντάρι (revision 9715144)
Κατωιταλική διάλεκτος (revision 9712613)
Χερσόνησος η Ταυρική (revision 9764259)
Περιφέρεια των λαών του νότου (revision 9641762)
Θερινοί Ολυμπιακοί Αγώνες 2012 (revision 9675153)
Δημοκρατία της Ιρλανδίας (revision 9672626)
Νόβι Σαντ (revision 9793157)
== End of Parsed pages ==
- Wikipedia parsing ended at: 2022-12-14 18:05:43.615460
63 characters appeared 1890130 times.
Most Frequent characters:
[ 0] Char α: 9.080327808140181 %
[ 1] Char ο: 8.038970864437896 %
[ 2] Char τ: 8.01706760910625 %
[ 3] Char ι: 6.784189447286694 %
[ 4] Char ν: 6.04582753567215 %
[ 5] Char ε: 5.970330083115976 %
[ 6] Char κ: 4.376312740393518 %
[ 7] Char ρ: 4.336050959457815 %
[ 8] Char σ: 4.289493315274611 %
[ 9] Char η: 3.964806653510605 %
[10] Char ς: 3.6513890578954884 %
[11] Char π: 3.44119187569109 %
[12] Char μ: 3.2560723336490085 %
[13] Char υ: 3.0358758392279896 %
[14] Char λ: 2.856734721950342 %
[15] Char ί: 2.368461428578987 %
[16] Char ό: 1.9997037240824707 %
[17] Char ά: 1.8429420198610678 %
[18] Char γ: 1.7440070259717586 %
[19] Char έ: 1.6751228751461538 %
[20] Char δ: 1.4865115097903319 %
[21] Char ή: 1.4056176030220144 %
[22] Char ω: 1.3927613444577887 %
[23] Char χ: 1.180553718527297 %
[24] Char ύ: 0.9674995899752927 %
[25] Char θ: 0.9332162338040242 %
[26] Char ώ: 0.7774068450318232 %
[27] Char φ: 0.7632808325353283 %
[28] Char β: 0.6926507700528536 %
[29] Char ξ: 0.37256696629332375 %
[30] Char ζ: 0.32436922328093837 %
[31] Char e: 0.2777057662700449 %
[32] Char a: 0.25241650045234987 %
[33] Char i: 0.24442763196182274 %
[34] Char n: 0.20702279737372561 %
[35] Char o: 0.19522466708639089 %
[36] Char r: 0.19321422336029795 %
[37] Char t: 0.17660160941310915 %
[38] Char s: 0.17363885023781434 %
[39] Char l: 0.12708120605461 %
[40] Char c: 0.11030987286588753 %
[41] Char ψ: 0.10856396120901737 %
The first 42 characters have an accumulated ratio of 0.9913751964150612.
The first 5 characters have an accumulated ratio of 0.3796638326464317.
All characters whose order is over 27 have an accumulated ratio of 0.03455794045912186.
1629 sequences found.
First 850 (typical positive ratio): 0.9950192468921002
Next 252 (1102-850): 0.003986534258695218
Rest: 0.0009942188492045867
- Processing end: 2022-12-14 18:05:43.760018