mirror of
https://gitlab.freedesktop.org/uchardet/uchardet.git
synced 2025-12-06 16:56:40 +08:00
276 lines
13 KiB
Plaintext
276 lines
13 KiB
Plaintext
= Logs of language model for Hindi (hi) =
|
||
|
||
- Generated by BuildLangModel.py
|
||
- Started: 2022-12-14 20:20:15.059984
|
||
- Maximum depth: 4
|
||
- Max number of pages: 200
|
||
|
||
== Parsed pages ==
|
||
|
||
मुखपृष्ठ (revision 5590190)
|
||
भारत की स्वतंत्रता (revision 5658303)
|
||
हिन्दी विकिपीडिया (revision 5671058)
|
||
सेंट विंसेंट एंड ग्रेनाडाइन्स (revision 5559154)
|
||
प्रोकैरियोटिक कोशिका (revision 5680074)
|
||
कतिकी मेला (revision 4822652)
|
||
कनाडा (revision 5715323)
|
||
मुखपृष्ठ/अन्य भाषाओं में (revision 4949624)
|
||
मोन्टाना (revision 5656758)
|
||
कार्तिक पूर्णिमा (revision 5685731)
|
||
श्रीविजय एयर उड़ान 182 (revision 5385509)
|
||
कालीकट अंतर्राष्ट्रीय विमानक्षेत्र (revision 5053097)
|
||
श्रद्धा कपूर (revision 5715102)
|
||
द्वीप चाप (revision 5051722)
|
||
ब्रिटिश कोलम्बिया (revision 5601415)
|
||
न्यू मेक्सिको (revision 5476551)
|
||
कॅण्टकी (revision 4910514)
|
||
हवाई (revision 4924959)
|
||
इंडोनेशिया (revision 5633388)
|
||
सुन्दरवन (revision 5637997)
|
||
आशिकी (revision 5715605)
|
||
नीपोलिटाई विकिपीडिया (revision 4562757)
|
||
बुन्देलखण्ड (revision 5714881)
|
||
साहनिवाल विमानक्षेत्र (revision 4801866)
|
||
लॉर्ड कॉर्नवालिस (revision 5450877)
|
||
अगाति विमानक्षेत्र (revision 5377793)
|
||
न्यूफाउंडलैंड (द्वीप) (revision 5193294)
|
||
सृष्टि (revision 5709072)
|
||
बिठूर (revision 5622562)
|
||
सम्प्रभु राज्य (revision 5315656)
|
||
वासीनाम (revision 5613691)
|
||
भारत में समाजवाद (revision 5350981)
|
||
जनसंख्या घनत्व के अनुसार देशों और अधीन क्षेत्रों की सूची (revision 5598563)
|
||
भारत के प्रसिद्ध मेले (revision 5696005)
|
||
लेह कुशोक बकुला रिम्पोची विमानक्षेत्र (revision 5398134)
|
||
शिंजो आबे (revision 5704870)
|
||
कार्तिक शुक्ल अष्टमी (revision 5680290)
|
||
विकिपीडिया (revision 5709682)
|
||
बेरियम (revision 5569495)
|
||
योगिनी एकादशी (revision 5398349)
|
||
बांदा जिला (revision 5381573)
|
||
जावा सागर (revision 5152752)
|
||
अलाबामा (revision 5656049)
|
||
पूर्णिमा (revision 5638603)
|
||
भारत गणराज्य का इतिहास (revision 5704342)
|
||
१४ मार्च (revision 4808978)
|
||
मुम्बई (revision 5668953)
|
||
गुजरात (revision 5712277)
|
||
हरतालिका व्रत (revision 5620766)
|
||
किंग खालिद हवाई अड्डा (revision 3497420)
|
||
फ़्रान्सीसी विकिपीडिया (revision 5684016)
|
||
अलकनन्दा नदी (revision 5460363)
|
||
अस्पताल दुर्घटना, बगदाद (revision 5664521)
|
||
छत्तीसगढ़ (revision 5712261)
|
||
अल्बर्टा (revision 5477015)
|
||
फ़िल्मफ़ेयर पुरस्कार (revision 5658392)
|
||
औपनिवेशिक भारत (revision 5613904)
|
||
त्रिशूल पर्वत (revision 5544055)
|
||
स्त्री (revision 5667699)
|
||
जकार्ता (revision 5244613)
|
||
जोस मारती हवाई अड्डा (revision 2467543)
|
||
मासेचुसेट्स (revision 5596477)
|
||
सकल घरेलू उत्पाद (revision 5642814)
|
||
ए फ़्लाइंग जट्ट (revision 4966138)
|
||
पश्चिम कालिमंतान (revision 5414352)
|
||
ओटावा (revision 5422563)
|
||
कलिंजर (revision 5671122)
|
||
हैदराबाद (revision 5683737)
|
||
कालिंजर दुर्ग (revision 5671122)
|
||
कानपुर (revision 5626845)
|
||
अभिनेत्री (revision 5628024)
|
||
उर्दू विकिपीडिया (revision 5234893)
|
||
एयर इंडिया एक्सप्रेस उड़ान ८१२ (revision 4821073)
|
||
रोड आइलैण्ड (revision 3532775)
|
||
उत्तराखंड (revision 5714067)
|
||
२००३ (revision 5163976)
|
||
कॅरीबियाई सागर (revision 4826292)
|
||
कॉलोराडो (revision 4534558)
|
||
८ सितम्बर (revision 5633733)
|
||
शक्ति कपूर (revision 5473336)
|
||
बास्क विकिपीडिया (revision 5092568)
|
||
हैतियाई क्रियोल विकिपीडिया (revision 5161239)
|
||
मकर संक्रांति (revision 5481015)
|
||
गंगा नदी (revision 5703207)
|
||
उत्तर-पश्चिम (revision 5592378)
|
||
एबीसीडी 2 (revision 5216546)
|
||
फेसबुक (revision 5691471)
|
||
अंग्रेज़ी भाषा (revision 5681103)
|
||
बत्ती गुल मीटर चालू (revision 5567871)
|
||
नॉर्थ कैरोलीना (revision 3530544)
|
||
अलास्का (revision 5450294)
|
||
सिद्धान्त कपूर (revision 5385513)
|
||
फ़्लोरिडा (revision 5441902)
|
||
इमरान ख़ान (अभिनेता) (revision 5614601)
|
||
गोलमेज सम्मेलन (भारत) (revision 5673517)
|
||
फेरीहेगी हवाई अड्डा (revision 2482999)
|
||
सिंधु-गंगा-ब्रह्मपुत्र का मैदान (revision 4962707)
|
||
उत्तरी अमेरिका (revision 5472773)
|
||
सोमवती अमावस्या (revision 5593417)
|
||
आंग्ल-मैसूर युद्ध (revision 4018741)
|
||
दोआब (revision 5684817)
|
||
१७ जनवरी (revision 4809344)
|
||
सकल घरेलू उत्पाद के अनुसार देशों की सूची (पीपीपी) (revision 5560304)
|
||
जर्मन विकिपीडिया (revision 4757076)
|
||
भारत में कम्पनी शासन (revision 5506915)
|
||
वर्ग संघर्ष (revision 5676082)
|
||
चार्ल्स तृतीय (revision 5672055)
|
||
मुत्तुलक्ष्मी रेड्डी (revision 5628933)
|
||
उत्तर प्रदेश (revision 5711856)
|
||
शिंजो आबे की हत्या (revision 5705526)
|
||
स्ट्रीट डांसर (revision 5111042)
|
||
जनसंख्या के अनुसार देशों की सूची (revision 5713053)
|
||
हलवारा एयर फ़ोर्स स्टेशन (revision 4951493)
|
||
अहमदाबाद (revision 5711144)
|
||
सरस्वती नदी (revision 5688450)
|
||
मीका सिंह (revision 5594882)
|
||
मंगलवार व्रत कथा (revision 5686278)
|
||
सेबुआनो विकिपीडिया (revision 4611299)
|
||
ख़िलजी वंश (revision 5682608)
|
||
नेब्रास्का (revision 4584163)
|
||
कंगना रनौत (revision 5680317)
|
||
स्कॉटलैंड (revision 5556244)
|
||
केन्सास (revision 4826538)
|
||
टोंस नदी (revision 5610286)
|
||
गाम्बिया (revision 5105416)
|
||
कज़ाख़ विकिपीडिया (revision 4518946)
|
||
१९२६ (revision 4538959)
|
||
यतीन्द्र मोहन सेनगुप्त (revision 5284794)
|
||
शुंग राजवंश (revision 5713142)
|
||
कोटोका हवाई अड्डा (revision 4725941)
|
||
पापुआ न्यू गिनी (revision 5599432)
|
||
प्रिन्स एड्वर्ड आइलैण्ड (revision 4773952)
|
||
होमी वाडिया (revision 5199599)
|
||
स्पेनी भाषा (revision 5599387)
|
||
क्रोएशियाई विकिपीडिया (revision 5075650)
|
||
ग्रह (revision 5688287)
|
||
भारतीय रुपया (revision 5668341)
|
||
१८९१ (revision 4554755)
|
||
सन्त पियर और मिकलान (revision 4544887)
|
||
उत्तराखण्ड (revision 5714067)
|
||
सीसा (revision 5605646)
|
||
झारखण्ड (revision 5706129)
|
||
फ़िल्मफ़ेयर महिला प्रथम अभिनय पुरस्कार (revision 5381963)
|
||
हरिद्वार जिला (revision 5597326)
|
||
शाहिद कपूर (revision 5598756)
|
||
उर्दू (revision 5674668)
|
||
४ मार्च (revision 5486757)
|
||
जनसंख्या (revision 5669984)
|
||
रमा एकादशी (revision 5358633)
|
||
सरोजिनी नायडू (revision 4940524)
|
||
दक्षिणी केरोलाइना (revision 4962382)
|
||
शनिवार व्रत कथा (revision 5143692)
|
||
डीडी सह्याद्री (revision 5593159)
|
||
कुर्नूल जिला (revision 5115081)
|
||
अलीगढ़ जिला (revision 5703336)
|
||
७ जनवरी (revision 5381367)
|
||
इंग्लैण्ड (revision 5685229)
|
||
विकिडाटा (revision 5414193)
|
||
New York City (revision 5698022)
|
||
पापुआ (प्रांत) (revision 5295334)
|
||
म्यान्मार (revision 5715413)
|
||
कॉलेज (revision 5657658)
|
||
चीनी विकिपीडिया (revision 4755371)
|
||
|
||
== End of Parsed pages ==
|
||
|
||
- Wikipedia parsing ended at: 2022-12-14 20:23:15.737540
|
||
|
||
83 characters appeared 832927 times.
|
||
|
||
Most Frequent characters:
|
||
[ 0] Char ा: 8.632209065140161 %
|
||
[ 1] Char र: 6.632393955292601 %
|
||
[ 2] Char क: 6.426133382637373 %
|
||
[ 3] Char ्: 6.190098291927144 %
|
||
[ 4] Char े: 5.538180416771218 %
|
||
[ 5] Char ि: 4.2936535854882845 %
|
||
[ 6] Char स: 4.009715137100851 %
|
||
[ 7] Char न: 3.86132278098801 %
|
||
[ 8] Char ं: 3.6268484513048564 %
|
||
[ 9] Char त: 3.5399260679507325 %
|
||
[10] Char ी: 3.4780959195703827 %
|
||
[11] Char म: 3.2890037182130007 %
|
||
[12] Char ह: 2.9841750837708467 %
|
||
[13] Char य: 2.831460620198409 %
|
||
[14] Char ल: 2.57129376283876 %
|
||
[15] Char प: 2.498538287268872 %
|
||
[16] Char व: 2.2905968950460243 %
|
||
[17] Char ो: 2.1803831548262935 %
|
||
[18] Char द: 1.9969337048744966 %
|
||
[19] Char ज: 1.7171973054061163 %
|
||
[20] Char ग: 1.5075750936156471 %
|
||
[21] Char ै: 1.3684272451247228 %
|
||
[22] Char ब: 1.325926521772016 %
|
||
[23] Char ु: 1.2974726476630005 %
|
||
[24] Char श: 1.0392267269520619 %
|
||
[25] Char ।: 1.0391066684115176 %
|
||
[26] Char अ: 0.894676244136641 %
|
||
[27] Char ट: 0.8455723010539938 %
|
||
[28] Char भ: 0.8257626418641729 %
|
||
[29] Char थ: 0.8191594221342327 %
|
||
[30] Char ड: 0.7635723178621896 %
|
||
[31] Char ू: 0.7341579754288191 %
|
||
[32] Char च: 0.6675254854266941 %
|
||
[33] Char ए: 0.6664449585617948 %
|
||
[34] Char ष: 0.6245445279118098 %
|
||
[35] Char ध: 0.62070265461439 %
|
||
[36] Char उ: 0.5550306329366199 %
|
||
[37] Char इ: 0.5436250715849048 %
|
||
[38] Char ख: 0.5100086802324814 %
|
||
[39] Char ण: 0.5062868654756059 %
|
||
[40] Char औ: 0.4841960940154419 %
|
||
[41] Char आ: 0.4615050298525561 %
|
||
[42] Char ़: 0.4564625711496926 %
|
||
[43] Char फ: 0.337004323308045 %
|
||
[44] Char ई: 0.3067495710908639 %
|
||
[45] Char ँ: 0.22174812438545033 %
|
||
[46] Char ौ: 0.16676131281612913 %
|
||
[47] Char ृ: 0.16676131281612913 %
|
||
[48] Char ॉ: 0.15523569292386968 %
|
||
[49] Char छ: 0.14719177070739695 %
|
||
[50] Char ०: 0.13110392627445142 %
|
||
[51] Char घ: 0.13074375065281832 %
|
||
[52] Char ओ: 0.12065883324709127 %
|
||
[53] Char १: 0.11321520373334037 %
|
||
[54] Char ठ: 0.10865297919265433 %
|
||
[55] Char ढ: 0.08608197357031289 %
|
||
[56] Char २: 0.08320056859724802 %
|
||
[57] Char ५: 0.04994435286645769 %
|
||
[58] Char ऑ: 0.048863826001558364 %
|
||
[59] Char ९: 0.04838359183938088 %
|
||
[60] Char ऊ: 0.046942889352848446 %
|
||
[61] Char झ: 0.045021952704138536 %
|
||
[62] Char ६: 0.04166031356889619 %
|
||
[63] Char ८: 0.04069984524454124 %
|
||
[64] Char ७: 0.03721814756875452 %
|
||
[65] Char ऐ: 0.03721814756875452 %
|
||
[66] Char ३: 0.03685797194712142 %
|
||
[67] Char ॰: 0.03325621573079033 %
|
||
[68] Char ४: 0.032535864487524116 %
|
||
[69] Char ञ: 0.028934108271193033 %
|
||
[70] Char ः: 0.028453874109015558 %
|
||
[71] Char ऋ: 0.012125912594981313 %
|
||
[72] Char ऍ: 0.003961931837964191 %
|
||
[73] Char ॅ: 0.0024011708108873887 %
|
||
[74] Char ङ: 0.0022811122703430193 %
|
||
[75] Char ऽ: 0.0007203512432662167 %
|
||
[76] Char ॥: 0.0006002927027218472 %
|
||
[77] Char ऎ: 0.00048023416217747773 %
|
||
[78] Char ॆ: 0.00036017562163310834 %
|
||
[79] Char ळ: 0.00036017562163310834 %
|
||
[80] Char ॄ: 0.00024011708108873886 %
|
||
[81] Char ॠ: 0.00012005854054436943 %
|
||
[82] Char ऱ: 0.00012005854054436943 %
|
||
|
||
The first 83 characters have an accumulated ratio of 0.9999999999999998.
|
||
The first 7 characters have an accumulated ratio of 0.4172238383435763.
|
||
All characters whose order is over 41 have an accumulated ratio of 0.033113346067542536.
|
||
|
||
2239 sequences found.
|
||
|
||
First 1379 (typical positive ratio): 0.9950003274894658
|
||
Next 426 (1805-1379): 0.004003168850449601
|
||
Rest: 0.0009965036600846355
|
||
|
||
- Processing end: 2022-12-14 20:23:16.458133
|