mirror of
https://gitlab.freedesktop.org/uchardet/uchardet.git
synced 2025-12-06 16:56:40 +08:00
117 lines
4.0 KiB
Plaintext
117 lines
4.0 KiB
Plaintext
= Logs of language model for French (fr) =
|
|
|
|
- Generated by BuildLangModel.py
|
|
- Started: 2015-12-03 21:07:37.508739
|
|
- Maximum depth: 2
|
|
- Max number of pages: 50
|
|
|
|
== Parsed pages ==
|
|
|
|
Wikipédia:Accueil_principal (revision 115957655)
|
|
Bœuf (animal) (revision 115500130)
|
|
1500 av. J.-C. (revision 110583603)
|
|
1898 dans les chemins de fer (revision 106801806)
|
|
1913 dans les chemins de fer (revision 112852042)
|
|
1974 dans les chemins de fer (revision 90170756)
|
|
1er décembre (revision 121012781)
|
|
2009 dans les chemins de fer (revision 107042206)
|
|
2011 dans les chemins de fer (revision 109560866)
|
|
24 novembre (revision 120782024)
|
|
26 novembre (revision 120833172)
|
|
29 novembre (revision 120918160)
|
|
2 décembre (revision 121025437)
|
|
30 novembre (revision 120947714)
|
|
3 décembre (revision 121030621)
|
|
Amphibien (revision 120332329)
|
|
Angleterre (revision 120784240)
|
|
Anne-Josèphe Théroigne de Méricourt (revision 121009789)
|
|
Années 1930 (revision 120558236)
|
|
Antonio Troyo Calderón (revision 121028881)
|
|
António Costa (revision 120993829)
|
|
Attentat du 24 novembre 2015 à Tunis (revision 121015161)
|
|
Balard (métro de Paris) (revision 118979088)
|
|
Bois de Vincennes (revision 120822909)
|
|
Buse à tête blanche (revision 121009499)
|
|
Californie (revision 120922479)
|
|
Charenton-le-Pont (revision 120210025)
|
|
Charenton - Écoles (métro de Paris) (revision 108644873)
|
|
Chronique médiévale (revision 100253272)
|
|
Concorde (métro de Paris) (revision 120856751)
|
|
Conférence de Paris de 2015 sur le climat (revision 121029398)
|
|
Crise de la dette publique grecque (revision 120905208)
|
|
Crise entre la Colombie et le Venezuela de 2015 (revision 120857143)
|
|
Crise migratoire en Europe (revision 121002308)
|
|
Crise russo-turque de 2015 (revision 121030214)
|
|
Créteil (revision 120684618)
|
|
Créteil - Préfecture (métro de Paris) (revision 113486387)
|
|
Deuxième guerre civile libyenne (revision 121027704)
|
|
Devise (monnaie) (revision 121015771)
|
|
Droits de tirage spéciaux (revision 121009135)
|
|
Décembre 2015 (revision 121010045)
|
|
Département français (revision 120993190)
|
|
Eldar Riazanov (revision 120996396)
|
|
Enfants verts de Woolpit (revision 121002303)
|
|
Ernst Larsen (revision 121026772)
|
|
Fatima Mernissi (revision 120992271)
|
|
Fejervarya cancrivora (revision 120353807)
|
|
Fonds monétaire international (revision 120754406)
|
|
Français (revision 120883858)
|
|
Freyja (revision 121028677)
|
|
Fusillade du 2 décembre 2015 en Californie (revision 121030353)
|
|
|
|
== End of Parsed pages ==
|
|
|
|
- Wikipedia parsing ended at: 2015-12-03 21:10:27.682316
|
|
|
|
56 characters appeared 728239 times.
|
|
|
|
First 38 characters:
|
|
[ 0] Char e: 14.339660468609894 %
|
|
[ 1] Char s: 7.954806045817375 %
|
|
[ 2] Char a: 7.864176458552756 %
|
|
[ 3] Char n: 7.572102015959047 %
|
|
[ 4] Char i: 7.34154583866011 %
|
|
[ 5] Char r: 7.020222756540091 %
|
|
[ 6] Char t: 6.833608197308851 %
|
|
[ 7] Char l: 5.9446143367768 %
|
|
[ 8] Char o: 5.386418469760614 %
|
|
[ 9] Char u: 5.024861343597363 %
|
|
[10] Char d: 4.169235649285468 %
|
|
[11] Char c: 3.4240132703686568 %
|
|
[12] Char p: 2.8882001650557028 %
|
|
[13] Char m: 2.803063280049544 %
|
|
[14] Char é: 2.498355622261373 %
|
|
[15] Char g: 1.277739862874688 %
|
|
[16] Char v: 1.1729665672945284 %
|
|
[17] Char f: 1.1614318925517584 %
|
|
[18] Char b: 0.9925312981040565 %
|
|
[19] Char h: 0.8580974103282026 %
|
|
[20] Char q: 0.7740590657737364 %
|
|
[21] Char x: 0.43570860665248634 %
|
|
[22] Char y: 0.41044217626356183 %
|
|
[23] Char è: 0.4100302235941771 %
|
|
[24] Char à: 0.363479571953713 %
|
|
[25] Char j: 0.29591933417463223 %
|
|
[26] Char k: 0.1359443808969308 %
|
|
[27] Char ç: 0.11685724054877589 %
|
|
[28] Char ê: 0.11218844362908331 %
|
|
[29] Char z: 0.10738232915292918 %
|
|
[30] Char w: 0.08239053387692777 %
|
|
[31] Char ô: 0.04792382720507965 %
|
|
[32] Char â: 0.03364280133307884 %
|
|
[33] Char î: 0.029385957082770905 %
|
|
[34] Char û: 0.024854477719539875 %
|
|
[35] Char œ: 0.021146903695078125 %
|
|
[36] Char ï: 0.017851282340001016 %
|
|
[37] Char ù: 0.015242248767231636 %
|
|
|
|
The first 38 characters have an accumulated ratio of 0.999621003544166.
|
|
|
|
914 sequences found.
|
|
|
|
First 512 (typical positive ratio): 0.997057879992383
|
|
Next 512 (512-1024): 1.3731755646154627e-06
|
|
Rest: 3.8163916471489756e-17
|
|
|
|
- Processing end: 2015-12-03 21:10:27.987730
|