uchardet/script/BuildLangModelLogs/LangHindiModel.log

276 lines
13 KiB
Plaintext
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

= Logs of language model for Hindi (hi) =
- Generated by BuildLangModel.py
- Started: 2022-12-14 20:20:15.059984
- Maximum depth: 4
- Max number of pages: 200
== Parsed pages ==
मुखपृष्ठ (revision 5590190)
भारत की स्वतंत्रता (revision 5658303)
हिन्दी विकिपीडिया (revision 5671058)
सेंट विंसेंट एंड ग्रेनाडाइन्स (revision 5559154)
प्रोकैरियोटिक कोशिका (revision 5680074)
कतिकी मेला (revision 4822652)
कनाडा (revision 5715323)
मुखपृष्ठ/अन्य भाषाओं में (revision 4949624)
मोन्टाना (revision 5656758)
कार्तिक पूर्णिमा (revision 5685731)
श्रीविजय एयर उड़ान 182 (revision 5385509)
कालीकट अंतर्राष्ट्रीय विमानक्षेत्र (revision 5053097)
श्रद्धा कपूर (revision 5715102)
द्वीप चाप (revision 5051722)
ब्रिटिश कोलम्बिया (revision 5601415)
न्यू मेक्सिको (revision 5476551)
कॅण्टकी (revision 4910514)
हवाई (revision 4924959)
इंडोनेशिया (revision 5633388)
सुन्दरवन (revision 5637997)
आशिकी (revision 5715605)
नीपोलिटाई विकिपीडिया (revision 4562757)
बुन्देलखण्ड (revision 5714881)
साहनिवाल विमानक्षेत्र (revision 4801866)
लॉर्ड कॉर्नवालिस (revision 5450877)
अगाति विमानक्षेत्र (revision 5377793)
न्यूफाउंडलैंड (द्वीप) (revision 5193294)
सृष्टि (revision 5709072)
बिठूर (revision 5622562)
सम्प्रभु राज्य (revision 5315656)
वासीनाम (revision 5613691)
भारत में समाजवाद (revision 5350981)
जनसंख्या घनत्व के अनुसार देशों और अधीन क्षेत्रों की सूची (revision 5598563)
भारत के प्रसिद्ध मेले (revision 5696005)
लेह कुशोक बकुला रिम्पोची विमानक्षेत्र (revision 5398134)
शिंजो आबे (revision 5704870)
कार्तिक शुक्ल अष्टमी (revision 5680290)
विकिपीडिया (revision 5709682)
बेरियम (revision 5569495)
योगिनी एकादशी (revision 5398349)
बांदा जिला (revision 5381573)
जावा सागर (revision 5152752)
अलाबामा (revision 5656049)
पूर्णिमा (revision 5638603)
भारत गणराज्य का इतिहास (revision 5704342)
१४ मार्च (revision 4808978)
मुम्बई (revision 5668953)
गुजरात (revision 5712277)
हरतालिका व्रत (revision 5620766)
किंग खालिद हवाई अड्डा (revision 3497420)
फ़्रान्सीसी विकिपीडिया (revision 5684016)
अलकनन्दा नदी (revision 5460363)
अस्पताल दुर्घटना, बगदाद (revision 5664521)
छत्तीसगढ़ (revision 5712261)
अल्बर्टा (revision 5477015)
फ़िल्मफ़ेयर पुरस्कार (revision 5658392)
औपनिवेशिक भारत (revision 5613904)
त्रिशूल पर्वत (revision 5544055)
स्त्री (revision 5667699)
जकार्ता (revision 5244613)
जोस मारती हवाई अड्डा (revision 2467543)
मासेचुसेट्स (revision 5596477)
सकल घरेलू उत्पाद (revision 5642814)
ए फ़्लाइंग जट्ट (revision 4966138)
पश्चिम कालिमंतान (revision 5414352)
ओटावा (revision 5422563)
कलिंजर (revision 5671122)
हैदराबाद (revision 5683737)
कालिंजर दुर्ग (revision 5671122)
कानपुर (revision 5626845)
अभिनेत्री (revision 5628024)
उर्दू विकिपीडिया (revision 5234893)
एयर इंडिया एक्सप्रेस उड़ान ८१२ (revision 4821073)
रोड आइलैण्ड (revision 3532775)
उत्तराखंड (revision 5714067)
२००३ (revision 5163976)
कॅरीबियाई सागर (revision 4826292)
कॉलोराडो (revision 4534558)
८ सितम्बर (revision 5633733)
शक्ति कपूर (revision 5473336)
बास्क विकिपीडिया (revision 5092568)
हैतियाई क्रियोल विकिपीडिया (revision 5161239)
मकर संक्रांति (revision 5481015)
गंगा नदी (revision 5703207)
उत्तर-पश्चिम (revision 5592378)
एबीसीडी 2 (revision 5216546)
फेसबुक (revision 5691471)
अंग्रेज़ी भाषा (revision 5681103)
बत्ती गुल मीटर चालू (revision 5567871)
नॉर्थ कैरोलीना (revision 3530544)
अलास्का (revision 5450294)
सिद्धान्त कपूर (revision 5385513)
फ़्लोरिडा (revision 5441902)
इमरान ख़ान (अभिनेता) (revision 5614601)
गोलमेज सम्मेलन (भारत) (revision 5673517)
फेरीहेगी हवाई अड्डा (revision 2482999)
सिंधु-गंगा-ब्रह्मपुत्र का मैदान (revision 4962707)
उत्तरी अमेरिका (revision 5472773)
सोमवती अमावस्या (revision 5593417)
आंग्ल-मैसूर युद्ध (revision 4018741)
दोआब (revision 5684817)
१७ जनवरी (revision 4809344)
सकल घरेलू उत्पाद के अनुसार देशों की सूची (पीपीपी) (revision 5560304)
जर्मन विकिपीडिया (revision 4757076)
भारत में कम्पनी शासन (revision 5506915)
वर्ग संघर्ष (revision 5676082)
चार्ल्स तृतीय (revision 5672055)
मुत्तुलक्ष्मी रेड्डी (revision 5628933)
उत्तर प्रदेश (revision 5711856)
शिंजो आबे की हत्या (revision 5705526)
स्ट्रीट डांसर (revision 5111042)
जनसंख्या के अनुसार देशों की सूची (revision 5713053)
हलवारा एयर फ़ोर्स स्टेशन (revision 4951493)
अहमदाबाद (revision 5711144)
सरस्वती नदी (revision 5688450)
मीका सिंह (revision 5594882)
मंगलवार व्रत कथा (revision 5686278)
सेबुआनो विकिपीडिया (revision 4611299)
ख़िलजी वंश (revision 5682608)
नेब्रास्का (revision 4584163)
कंगना रनौत (revision 5680317)
स्कॉटलैंड (revision 5556244)
केन्सास (revision 4826538)
टोंस नदी (revision 5610286)
गाम्बिया (revision 5105416)
कज़ाख़ विकिपीडिया (revision 4518946)
१९२६ (revision 4538959)
यतीन्द्र मोहन सेनगुप्त (revision 5284794)
शुंग राजवंश (revision 5713142)
कोटोका हवाई अड्डा (revision 4725941)
पापुआ न्यू गिनी (revision 5599432)
प्रिन्स एड्वर्ड आइलैण्ड (revision 4773952)
होमी वाडिया (revision 5199599)
स्पेनी भाषा (revision 5599387)
क्रोएशियाई विकिपीडिया (revision 5075650)
ग्रह (revision 5688287)
भारतीय रुपया (revision 5668341)
१८९१ (revision 4554755)
सन्त पियर और मिकलान (revision 4544887)
उत्तराखण्ड (revision 5714067)
सीसा (revision 5605646)
झारखण्ड (revision 5706129)
फ़िल्मफ़ेयर महिला प्रथम अभिनय पुरस्कार (revision 5381963)
हरिद्वार जिला (revision 5597326)
शाहिद कपूर (revision 5598756)
उर्दू (revision 5674668)
४ मार्च (revision 5486757)
जनसंख्या (revision 5669984)
रमा एकादशी (revision 5358633)
सरोजिनी नायडू (revision 4940524)
दक्षिणी केरोलाइना (revision 4962382)
शनिवार व्रत कथा (revision 5143692)
डीडी सह्याद्री (revision 5593159)
कुर्नूल जिला (revision 5115081)
अलीगढ़ जिला (revision 5703336)
७ जनवरी (revision 5381367)
इंग्लैण्ड (revision 5685229)
विकिडाटा (revision 5414193)
New York City (revision 5698022)
पापुआ (प्रांत) (revision 5295334)
म्यान्मार (revision 5715413)
कॉलेज (revision 5657658)
चीनी विकिपीडिया (revision 4755371)
== End of Parsed pages ==
- Wikipedia parsing ended at: 2022-12-14 20:23:15.737540
83 characters appeared 832927 times.
Most Frequent characters:
[ 0] Char ा: 8.632209065140161 %
[ 1] Char र: 6.632393955292601 %
[ 2] Char क: 6.426133382637373 %
[ 3] Char ्: 6.190098291927144 %
[ 4] Char े: 5.538180416771218 %
[ 5] Char ि: 4.2936535854882845 %
[ 6] Char स: 4.009715137100851 %
[ 7] Char न: 3.86132278098801 %
[ 8] Char ं: 3.6268484513048564 %
[ 9] Char त: 3.5399260679507325 %
[10] Char ी: 3.4780959195703827 %
[11] Char म: 3.2890037182130007 %
[12] Char ह: 2.9841750837708467 %
[13] Char य: 2.831460620198409 %
[14] Char ल: 2.57129376283876 %
[15] Char प: 2.498538287268872 %
[16] Char व: 2.2905968950460243 %
[17] Char ो: 2.1803831548262935 %
[18] Char द: 1.9969337048744966 %
[19] Char ज: 1.7171973054061163 %
[20] Char ग: 1.5075750936156471 %
[21] Char ै: 1.3684272451247228 %
[22] Char ब: 1.325926521772016 %
[23] Char ु: 1.2974726476630005 %
[24] Char श: 1.0392267269520619 %
[25] Char ।: 1.0391066684115176 %
[26] Char अ: 0.894676244136641 %
[27] Char ट: 0.8455723010539938 %
[28] Char भ: 0.8257626418641729 %
[29] Char थ: 0.8191594221342327 %
[30] Char ड: 0.7635723178621896 %
[31] Char ू: 0.7341579754288191 %
[32] Char च: 0.6675254854266941 %
[33] Char ए: 0.6664449585617948 %
[34] Char ष: 0.6245445279118098 %
[35] Char ध: 0.62070265461439 %
[36] Char उ: 0.5550306329366199 %
[37] Char इ: 0.5436250715849048 %
[38] Char ख: 0.5100086802324814 %
[39] Char ण: 0.5062868654756059 %
[40] Char औ: 0.4841960940154419 %
[41] Char आ: 0.4615050298525561 %
[42] Char ़: 0.4564625711496926 %
[43] Char फ: 0.337004323308045 %
[44] Char ई: 0.3067495710908639 %
[45] Char ँ: 0.22174812438545033 %
[46] Char ौ: 0.16676131281612913 %
[47] Char ृ: 0.16676131281612913 %
[48] Char ॉ: 0.15523569292386968 %
[49] Char छ: 0.14719177070739695 %
[50] Char : 0.13110392627445142 %
[51] Char घ: 0.13074375065281832 %
[52] Char ओ: 0.12065883324709127 %
[53] Char १: 0.11321520373334037 %
[54] Char ठ: 0.10865297919265433 %
[55] Char ढ: 0.08608197357031289 %
[56] Char २: 0.08320056859724802 %
[57] Char ५: 0.04994435286645769 %
[58] Char ऑ: 0.048863826001558364 %
[59] Char ९: 0.04838359183938088 %
[60] Char ऊ: 0.046942889352848446 %
[61] Char झ: 0.045021952704138536 %
[62] Char ६: 0.04166031356889619 %
[63] Char ८: 0.04069984524454124 %
[64] Char ७: 0.03721814756875452 %
[65] Char ऐ: 0.03721814756875452 %
[66] Char ३: 0.03685797194712142 %
[67] Char ॰: 0.03325621573079033 %
[68] Char ४: 0.032535864487524116 %
[69] Char ञ: 0.028934108271193033 %
[70] Char : 0.028453874109015558 %
[71] Char ऋ: 0.012125912594981313 %
[72] Char ऍ: 0.003961931837964191 %
[73] Char ॅ: 0.0024011708108873887 %
[74] Char ङ: 0.0022811122703430193 %
[75] Char ऽ: 0.0007203512432662167 %
[76] Char ॥: 0.0006002927027218472 %
[77] Char ऎ: 0.00048023416217747773 %
[78] Char ॆ: 0.00036017562163310834 %
[79] Char ळ: 0.00036017562163310834 %
[80] Char ॄ: 0.00024011708108873886 %
[81] Char ॠ: 0.00012005854054436943 %
[82] Char ऱ: 0.00012005854054436943 %
The first 83 characters have an accumulated ratio of 0.9999999999999998.
The first 7 characters have an accumulated ratio of 0.4172238383435763.
All characters whose order is over 41 have an accumulated ratio of 0.033113346067542536.
2239 sequences found.
First 1379 (typical positive ratio): 0.9950003274894658
Next 426 (1805-1379): 0.004003168850449601
Rest: 0.0009965036600846355
- Processing end: 2022-12-14 20:23:16.458133