uchardet/script/BuildLangModelLogs/LangFrenchModel.log

264 lines
9.1 KiB
Plaintext

= Logs of language model for French (fr) =
- Generated by BuildLangModel.py
- Started: 2022-12-14 20:35:28.078254
- Maximum depth: 4
- Max number of pages: 200
== Parsed pages ==
Bœuf (animal) (revision 197762352)
Hongre (revision 192403538)
Mésopotamie (revision 199078207)
Canada (revision 199464527)
Promenade du Bœuf Gras au Carnaval de Paris (revision 198921694)
Labour (revision 196168038)
Testicule (revision 199482540)
Taureau (revision 197805532)
Bien-être animal (revision 197276347)
Traîneau (revision 192374700)
Bœuf de Kobe (revision 192878601)
Marché des Blancs-Manteaux (revision 180317195)
Art rupestre du Valcamonica (revision 194978083)
Arme à feu (revision 197634282)
Inondation (revision 197820876)
Élevage équin (revision 193185231)
Turquie (revision 199420925)
Paronymie (revision 199270951)
Parlement de Paris (revision 199191505)
Animal domestique en droit français (revision 195719387)
Veau d'or (revision 196918081)
Appareil génital féminin (revision 198910395)
Tendreté (revision 194393321)
Hygiène (revision 196930859)
Apis (revision 197792729)
Ordre des serviteurs de la Sainte Vierge (revision 183370520)
Neige (revision 199283662)
Alcurrucén (revision 196358906)
Période Yayoi (revision 196966397)
Baltasar Ibán (revision 165418210)
Care (gemmage) (revision 179398144)
Néoplatonisme (revision 199045013)
INSL3 (revision 194404910)
Monarchie lucienne (revision 197410562)
Ordre mendiant (revision 199436160)
Rate (revision 199394518)
Marché couvert (revision 192688251)
Baleine (revision 199327939)
Le Cheval (nouvelle) (revision 193840091)
Le Marais (quartier parisien) (revision 199292776)
Vous avez deux vaches (revision 194794493)
Jean-Marie Pourquier (revision 184883025)
Palha (revision 197762586)
Jacques Hillairet (revision 198554519)
Parasitisme (revision 197447846)
Viande (revision 199230345)
Fourche (revision 198888946)
Québec bashing (revision 199195942)
Préfecture de police (revision 194841953)
Musée national des arts et traditions populaires (Paris) (revision 197374487)
Samoyède (chien) (revision 195852684)
Hippolyte Bayard (revision 197131584)
Lazy bed (revision 129995180)
Traction bovine (revision 179198458)
Bile d'ours (revision 196853037)
Agriculture de conservation (revision 197781198)
Viande bovine (revision 198200168)
Phénotype (revision 198078277)
Castration (revision 199351966)
Enjambeur (revision 185177634)
Autonomie provinciale (revision 199376762)
Empire ottoman (revision 199325394)
Semis direct (revision 197965033)
Crosse (sport) (revision 198259303)
Endogé (revision 188797617)
Rue des Hospitalières-Saint-Gervais (revision 188012948)
Rue du Marché-des-Blancs-Manteaux (revision 197761214)
Bulbe du vestibule (revision 198487397)
Allemagne nazie (revision 199375588)
Pioche (revision 199117113)
Cœur (revision 199311128)
Okanagan (revision 191726303)
Stimulation sexuelle (revision 190390283)
Tract (revision 192402962)
IIe siècle av. J.-C. (revision 192067750)
Mer du Labrador (revision 172314988)
Époque d'Edo (revision 195213554)
Chatt-el-Arab (revision 192696405)
Route des Grands Crus (revision 198871159)
Louis-Philippe Ier (revision 199381721)
Internet Archive (revision 196621011)
1824 (revision 199087297)
Cabestro (revision 192846627)
Immunologique (revision 192718418)
Pierre-Jules Delespine (revision 150590520)
Mulet (revision 199468728)
Griffon (mythologie) (revision 199398127)
Tukulti-Ninurta II (revision 198978146)
Régiment du train français (revision 176508922)
Reproduction du cheval (revision 196596865)
Paillis (revision 195545586)
Jeux olympiques d'hiver de 1988 (revision 196401973)
Prix de l'Arc de Triomphe (revision 199113863)
Mi-Carême au Carnaval de Paris (revision 198316382)
Camillien Houde (revision 196170671)
Rectum (revision 198256154)
Appellation d'origine (revision 196356478)
Éthique (revision 197675343)
Monarchie bélizienne (revision 197578724)
Japon (revision 199440474)
Teppanyaki (revision 196061220)
Grenier (revision 198635007)
Taureau Osborne (revision 193322732)
Viande de bœuf (revision 198200168)
Élevage bovin (revision 198420240)
Tubulidentata (revision 141739462)
Arabes (revision 199107906)
France (revision 199348136)
Ve millénaire av. J.-C. (revision 197832201)
Course de taureaux (revision 196352587)
Zalduendo (élevage) (revision 180445009)
Alimentation humaine (revision 197838990)
Conseil fédéral (Suisse) (revision 199396637)
Torrestrella (revision 170532693)
Aqueduc (revision 199286061)
Napoléon (revision 199381695)
Binette (outil) (revision 189825683)
Royaume-Uni (revision 199157233)
Journal d'agriculture pratique (revision 198002826)
Véhicule (transport physique) (revision 196078387)
Char réclame (revision 191386926)
Earthlings (revision 199150202)
Jean-Jacques Glassner (revision 181386691)
Adolf Portmann (revision 197210182)
Pierre naturelle (revision 199467513)
Centre équestre (revision 196870774)
Sperme (revision 197533836)
Site web (revision 199318333)
Jerf el Ahmar (revision 199170363)
28 février (revision 198228456)
Batteuse (revision 196001423)
Période d'Uruk (revision 199006250)
Elias Canetti (revision 199075881)
Argile (revision 199107823)
Antoine Antignac (revision 185029059)
Abattage d'un arbre (revision 197239365)
Alexisonfire (revision 197203952)
Riz (revision 199431799)
Liste lexicale (revision 194757836)
Colonne de la liberté (Québec) (revision 181281869)
Éditions de Minuit (revision 194713174)
Pedigree (revision 180077221)
Drapeau de l'Espagne (revision 199373078)
Autorité (sciences de l'information) (revision 199134298)
Carnaval de Paris (revision 198965123)
Jument (revision 192426506)
Immunoglobuline G (revision 195943996)
Chasse à la palombe (revision 194440835)
Europe (revision 199248008)
Dominique de Guzmán (revision 198851982)
Droit commercial (revision 195666376)
.fr (revision 193628283)
Anthroponymie (revision 193904253)
Tell el-Amarna (revision 197374713)
Aviculture (revision 197913491)
Universalisme (philosophie) (revision 199000629)
Moissonneuse (revision 198209470)
4 novembre (revision 199233694)
Montréal (revision 198767676)
Substantif (revision 194987031)
Mars 1813 (revision 174524777)
Homo sapiens (revision 199051865)
Antonomase (revision 197771312)
Censure en France (revision 198329267)
Griffe de jardin (revision 190033885)
Alexandre IV (pape) (revision 197191302)
Poulain (revision 196365805)
Liste du patrimoine mondial en Suisse (revision 194058035)
1979 (revision 199084851)
Pilosa (revision 188056955)
Additif alimentaire (revision 196477352)
Islero (revision 177295684)
Œillet rouge sur le sable (revision 180973401)
Mezzavia (revision 137003979)
Corne (matière) (revision 196535097)
1913 (revision 199086121)
Suisse (revision 199273297)
Halle aux Grains de Toulouse (revision 197773169)
Paul Gaffarel (revision 195679573)
Himiko (reine) (revision 199049471)
Sylvain Gaudreault (revision 197631213)
Académie des beaux-arts (France) (revision 199189321)
Poulinière (revision 187497518)
Cruauté (revision 198910746)
Liste des quartiers administratifs de Paris (revision 196613235)
Révolution française (revision 199249888)
Michael Greger (revision 190001227)
Produit phytosanitaire (revision 199128753)
Chien finnois de Laponie (revision 184586704)
1941 en littérature (revision 193870278)
Iwashimizu Hachiman-gū (revision 193554753)
Cultivateur (outil) (revision 194054028)
Pakistan (revision 199314711)
Noblesse (revision 198900738)
Suave (corrida) (revision 178500444)
Phorésie (revision 193292867)
== End of Parsed pages ==
- Wikipedia parsing ended at: 2022-12-14 20:39:17.167123
60 characters appeared 3423485 times.
Most Frequent characters:
[ 0] Char e: 14.33974444170195 %
[ 1] Char s: 7.990629431704827 %
[ 2] Char a: 7.761126454475484 %
[ 3] Char i: 7.4210052037616645 %
[ 4] Char n: 7.372516602234273 %
[ 5] Char t: 6.9224196980562205 %
[ 6] Char r: 6.772163453323149 %
[ 7] Char l: 5.904684845997572 %
[ 8] Char u: 5.404697260247963 %
[ 9] Char o: 5.389975419784226 %
[10] Char d: 4.168763701316056 %
[11] Char c: 3.3637652859586065 %
[12] Char p: 2.967998983491968 %
[13] Char m: 2.8252789189962857 %
[14] Char é: 2.495118278596226 %
[15] Char v: 1.2636830598060165 %
[16] Char g: 1.192731967571057 %
[17] Char f: 1.0616374834415807 %
[18] Char b: 0.9595485302257787 %
[19] Char h: 0.9245257391225608 %
[20] Char q: 0.8608479371167101 %
[21] Char x: 0.47942374510184793 %
[22] Char è: 0.38802565222280805 %
[23] Char à: 0.3858056921528793 %
[24] Char y: 0.3632555714425505 %
[25] Char j: 0.29528389930144283 %
[26] Char ê: 0.13754989433282166 %
[27] Char k: 0.1343075842306889 %
[28] Char z: 0.10606151334093766 %
[29] Char ç: 0.06426200202425306 %
[30] Char w: 0.05123434161388176 %
[31] Char ô: 0.04477893141053634 %
[32] Char î: 0.0410108412918415 %
[33] Char â: 0.04057269127803977 %
[34] Char œ: 0.030203140951398942 %
[35] Char ù: 0.020008850630278796 %
[36] Char ï: 0.017117060539187406 %
[37] Char û: 0.016065500506063264 %
The first 38 characters have an accumulated ratio of 0.9997782960930166.
The first 5 characters have an accumulated ratio of 0.448850221338782.
All characters whose order is over 19 have an accumulated ratio of 0.03475814849488167.
1187 sequences found.
First 450 (typical positive ratio): 0.9950352320661208
Next 168 (618-450): 0.003966397970469049
Rest: 0.000998369963410184
- Processing end: 2022-12-14 20:39:17.243824