mirror of
https://gitlab.freedesktop.org/uchardet/uchardet.git
synced 2025-12-09 18:36:41 +08:00
287 lines
14 KiB
Plaintext
287 lines
14 KiB
Plaintext
= Logs of language model for Hindi (hi) =
|
||
|
||
- Generated by BuildLangModel.py
|
||
- Started: 2022-12-14 18:05:53.770737
|
||
- Maximum depth: 4
|
||
- Max number of pages: 200
|
||
|
||
== Parsed pages ==
|
||
|
||
मुखपृष्ठ (revision 5590190)
|
||
योशिहिडे सुगा (revision 5152776)
|
||
शिंजो आबे की हत्या (revision 5705526)
|
||
शिंजो आबे (revision 5704870)
|
||
मुखपृष्ठ/पूर्व प्रदर्शित (revision 5716128)
|
||
चार्ल्स पंचम (revision 5696826)
|
||
इंग्लैंड के चार्ल्स द्वितीय (revision 5166999)
|
||
बांदा जिला (revision 5381573)
|
||
शक्ति कपूर (revision 5473336)
|
||
श्रद्धा कपूर (revision 5715102)
|
||
काबुल बम धमाका 2021 (revision 5637967)
|
||
कालीकट अंतर्राष्ट्रीय विमानक्षेत्र (revision 5053097)
|
||
जापान (revision 5701019)
|
||
महाराष्ट्र (revision 5710908)
|
||
ग्लेशियर नेशनल पार्क (revision 5699185)
|
||
लिबरल डेमोक्रेटिक पार्टी (एलडीपी) (revision 5442181)
|
||
२ फ़रवरी (revision 4809849)
|
||
ए फ़्लाइंग जट्ट (revision 4966138)
|
||
एलिज़ाबेथ द्वितीय (revision 5688702)
|
||
यूनाइटेड किंगडम (revision 5677146)
|
||
साहित्य संगीत कला 2010 (revision 4802600)
|
||
सिलसिला है प्यार का (revision 4931261)
|
||
कौशम्बी जिला (revision 5598225)
|
||
आशा भोसले (revision 5362585)
|
||
बीस साल बाद (1988 फ़िल्म) (revision 5534510)
|
||
ओके जानू (revision 4955578)
|
||
कोमिटो (revision 4827585)
|
||
गौतम बुद्ध नगर जिला (revision 5329211)
|
||
आजमगढ़ जिला (revision 5713931)
|
||
वीर सावरकर अन्तर्राष्ट्रीय विमानक्षेत्र (revision 5714529)
|
||
आगरा मंडल (revision 4135962)
|
||
जूनीचीरो कोईजूमी (revision 5578694)
|
||
दोमोदेदोव हवाई अड्डा (revision 2474312)
|
||
मैरी १, इंग्लैंड की रानी (revision 5640329)
|
||
शिवा का इन्साफ (1985 फ़िल्म) (revision 4551691)
|
||
जॉर्ज द्वितीय, इंगलैंड (revision 4667449)
|
||
भारत (revision 5709618)
|
||
हिण्डौन एयर फ़ोर्स स्टेशन (revision 4807592)
|
||
उच्च सदन (revision 3981865)
|
||
खजुराहो (revision 5666589)
|
||
सिंहासन (1986 फ़िल्म) (revision 4887666)
|
||
द्वितीय विश्वयुद्ध (revision 5665367)
|
||
बुन्देलखण्ड (revision 5714881)
|
||
जवाहरलाल नेहरू विश्वविद्यालय (revision 5681612)
|
||
संयुक्त राज्य अमेरिका (revision 5682248)
|
||
एडवर्ड ७ (revision 5171217)
|
||
अभिनेत्री (revision 5628024)
|
||
महामहिम (revision 5700470)
|
||
हाइकु (revision 5293767)
|
||
मैरी प्रथम, इंग्लैंड की रानी (revision 5640329)
|
||
इराक (revision 5629115)
|
||
नागोर्नो-काराबाख़ (revision 4767627)
|
||
मुरादाबाद मंडल (revision 5567434)
|
||
हैब्सबर्ग राजवंश (revision 5396215)
|
||
इंटरनेशनल स्टैण्डर्ड नाम पहचानकर्ता (revision 5600788)
|
||
कैथोलिक कलीसिया (revision 5305904)
|
||
अकिता प्रीफ़ेक्चर (revision 4813195)
|
||
वर्चुअल अंतरराष्ट्रीय प्राधिकरण फ़ाइल (revision 5456330)
|
||
बस्ती मंडल (revision 4135986)
|
||
हेनरी ५ (revision 4834757)
|
||
मिनिस्ट्रो पिस्तारिनी हवाई अड्डा (revision 2496563)
|
||
एक विलन (revision 4820472)
|
||
जापानी संसद (revision 5661277)
|
||
जॉर्ज़ १, ग्रेट ब्रिटेन का महाराजा (revision 4832306)
|
||
हृदयाघात (revision 5628643)
|
||
फ्रांसिस प्रथम (फ्रांस का राजा) (revision 4531330)
|
||
जर्मन भाषा (revision 5641881)
|
||
जेम्स द्वितीय (revision 4832194)
|
||
अंग्रेजी गृहयुद्ध (revision 5377351)
|
||
खतरों के खिलाड़ी (1988 फ़िल्म) (revision 4575162)
|
||
हेनरी ७, इंग्लैंड का राजा (revision 5240329)
|
||
फुकुओका (revision 3614978)
|
||
रूढ़िवाद (revision 5639114)
|
||
नफ़रत की आँधी (1989 फ़िल्म) (revision 4601273)
|
||
गोरी तेरे प्यार में (revision 5509849)
|
||
The New York Times (revision 4764426)
|
||
सत्ता (revision 5172391)
|
||
तेजू विमानक्षेत्र (revision 3954126)
|
||
जापान के प्रधानमंत्री (revision 5579915)
|
||
संयुक्त प्रांत (revision 4531945)
|
||
शिंतो (revision 4661419)
|
||
महाराजगंज जिला (revision 5712666)
|
||
कुवैत (revision 5058032)
|
||
होक्काइदो (revision 5310896)
|
||
बेंगलुरु (revision 5694548)
|
||
आग और शोला (1986 फ़िल्म) (revision 5059482)
|
||
कालिंजर दुर्ग (revision 5671122)
|
||
वैदिक काल (revision 5714445)
|
||
अभिनेता (revision 5664417)
|
||
बिग बॉस 5 (revision 4489586)
|
||
तौहीन (1989 फ़िल्म) (revision 4556795)
|
||
जम्मू विमानक्षेत्र (revision 5441442)
|
||
जैन धर्म (revision 5707269)
|
||
रूस (revision 5661473)
|
||
तहसील (revision 5705360)
|
||
फैजाबाद जिला (revision 5673228)
|
||
भारत की स्वतंत्रता (revision 5658303)
|
||
मैरी ट्यूडर, फ्रांस की रानी (revision 4843021)
|
||
इतालवी भाषा (revision 5688238)
|
||
फेसबुक (revision 5691471)
|
||
जूहू (revision 2449125)
|
||
इसाबेला, पवित्र रोमन साम्राज्ञी (revision 5296814)
|
||
जोमो केन्याटा हवाई अड्डा (revision 4944242)
|
||
डच भाषा (revision 4551746)
|
||
लोकनायक जयप्रकाश विमानक्षेत्र (revision 5686951)
|
||
वफ़ादार (1985 फ़िल्म) (revision 4560799)
|
||
एकीकृत प्राधिकरण फ़ाइल (revision 5649772)
|
||
इज़राइल भगदड़ 2021 (revision 5517074)
|
||
गग्गल विमानक्षेत्र (revision 4730318)
|
||
जापानी आम चुनाव, 2017 (revision 4247626)
|
||
मानव विकास सूचकांक के अनुसार देशों की सूची (revision 5661118)
|
||
विलियम ४, युनाईटेड किंगडम का महाराजा (revision 5268152)
|
||
सच्चाई की ताकत (1989 फ़िल्म) (revision 4564022)
|
||
भारत के प्रधानमंत्री (revision 5710314)
|
||
बहरीन (revision 5441928)
|
||
येलहंका विमानक्षेत्र (revision 4579587)
|
||
नारुहितो (revision 4200571)
|
||
श्याम बेनेगल (revision 5477440)
|
||
शमशाद बेगम (revision 5698307)
|
||
कोकोस (कीलिंग) द्वीपसमूह (revision 4827218)
|
||
भौगोलिक निर्देशांक प्रणाली (revision 4781862)
|
||
डोरवल हवाई अड्डा (revision 3492688)
|
||
डैबोलिम विमानक्षेत्र (revision 5358770)
|
||
विशाल डडलानी (revision 4966043)
|
||
जेम्स ६ (revision 5299965)
|
||
बिग बॉस 6 (revision 5646933)
|
||
सांता क्रूज़ (revision 4541208)
|
||
चतुरभुज मन्दिर, ओरछा (revision 5715198)
|
||
तुलनात्मक राजनीति (revision 5633428)
|
||
गुड्डी मारुति (revision 5666173)
|
||
हिन्दी (revision 5678876)
|
||
क्षेत्रफल के अनुसार देशों की सूची (revision 5656111)
|
||
असेनबोना हवाई अड्डा (revision 2493424)
|
||
भारत के राज्य एवं केन्द्र शासित प्रदेश (revision 5715498)
|
||
मैदान (भूगोल) (revision 4910306)
|
||
वेस्टमिंस्टर ऐबी (revision 5017772)
|
||
राजनीति विज्ञान (revision 5693061)
|
||
अर्कोणम विमानक्षेत्र (revision 5379798)
|
||
सुपार्श्वनाथ (revision 4578861)
|
||
मेसिडोनियन भाषा (revision 4604616)
|
||
अक्ष शक्तियाँ (revision 5180714)
|
||
पुणे (revision 5690750)
|
||
बग़दाद (revision 5385579)
|
||
आगरा (revision 5692993)
|
||
पत्थर (revision 5614386)
|
||
शिव (revision 5714098)
|
||
विधवा (revision 5203038)
|
||
रूसी (revision 5574460)
|
||
फ़िरोज़ाबाद जिला (revision 5471871)
|
||
क्षेत्रफल के आधार पर भारत के राज्य और संघ क्षेत्र (revision 5646343)
|
||
उदयपुर हवाई अड्डा (revision 5442059)
|
||
बेल्जियम (revision 5684029)
|
||
शंकर महादेवन (revision 5669138)
|
||
महानगर (revision 5644444)
|
||
भारत–इराक़ सम्बन्ध (revision 5607175)
|
||
डाक सूचक संख्या (revision 5478479)
|
||
के के मेनन (revision 5382483)
|
||
इंटरनेट मूवी डेटाबेस (revision 5664809)
|
||
राजवंश (revision 5667109)
|
||
कीव-बोरिस्पिल (revision 5496443)
|
||
तमिल (revision 5381910)
|
||
लेडी जेन ग्रे (revision 4794538)
|
||
दैनिक भास्कर (revision 5564945)
|
||
स्विट्ज़रलैंड (revision 4806409)
|
||
१९८९ (revision 4566809)
|
||
अफ़्गानिस्तान (revision 5700573)
|
||
करिश्मा कपूर (revision 5647269)
|
||
विश्वविद्यालय अनुदान आयोग (भारत) (revision 5699560)
|
||
ब्रुनेई (revision 5451329)
|
||
भोपाल विमानक्षेत्र (revision 5023511)
|
||
लोकसभा के सभापति (revision 5692302)
|
||
|
||
== End of Parsed pages ==
|
||
|
||
- Wikipedia parsing ended at: 2022-12-14 18:09:07.192046
|
||
|
||
86 characters appeared 754011 times.
|
||
|
||
Most Frequent characters:
|
||
[ 0] Char ा: 8.678918477316644 %
|
||
[ 1] Char र: 6.941145420955397 %
|
||
[ 2] Char क: 6.453088880666197 %
|
||
[ 3] Char ्: 6.20932585864132 %
|
||
[ 4] Char े: 5.404960935583168 %
|
||
[ 5] Char ि: 4.359087599517779 %
|
||
[ 6] Char न: 4.126730246640964 %
|
||
[ 7] Char स: 4.0563068708546695 %
|
||
[ 8] Char त: 3.6816439017467917 %
|
||
[ 9] Char ं: 3.5459694885087885 %
|
||
[10] Char ी: 3.479524834518329 %
|
||
[11] Char म: 3.342126308502131 %
|
||
[12] Char ह: 2.8874910312979516 %
|
||
[13] Char य: 2.7628244150284282 %
|
||
[14] Char प: 2.517602528345077 %
|
||
[15] Char ल: 2.4003628594277804 %
|
||
[16] Char व: 2.308719634063694 %
|
||
[17] Char ो: 2.187501243350561 %
|
||
[18] Char द: 1.9950637324919664 %
|
||
[19] Char ज: 1.7482503570902812 %
|
||
[20] Char ग: 1.359131365457533 %
|
||
[21] Char ै: 1.352367538404612 %
|
||
[22] Char ब: 1.3327391775451551 %
|
||
[23] Char ु: 1.327168967030985 %
|
||
[24] Char ।: 1.0637775841466504 %
|
||
[25] Char श: 1.0494541856816413 %
|
||
[26] Char अ: 0.8652393665344404 %
|
||
[27] Char थ: 0.8141791034878801 %
|
||
[28] Char ट: 0.814046479428019 %
|
||
[29] Char भ: 0.7987947125439815 %
|
||
[30] Char ध: 0.7616599757828466 %
|
||
[31] Char ू: 0.7194855247469865 %
|
||
[32] Char ष: 0.6787699383695994 %
|
||
[33] Char ए: 0.6718734872568172 %
|
||
[34] Char च: 0.6639160436651454 %
|
||
[35] Char ड: 0.6478685324219408 %
|
||
[36] Char इ: 0.5391168033357603 %
|
||
[37] Char औ: 0.5350054574800633 %
|
||
[38] Char आ: 0.5262522695292243 %
|
||
[39] Char उ: 0.47214165310585654 %
|
||
[40] Char ण: 0.46763243507057584 %
|
||
[41] Char ख: 0.40357501415761843 %
|
||
[42] Char ़: 0.3995962923617825 %
|
||
[43] Char फ: 0.34336369098063557 %
|
||
[44] Char ई: 0.3083509391772799 %
|
||
[45] Char ृ: 0.17851198457316936 %
|
||
[46] Char ँ: 0.16339284174899305 %
|
||
[47] Char ौ: 0.15861837559399 %
|
||
[48] Char ओ: 0.13302193204077925 %
|
||
[49] Char ॉ: 0.128114841825915 %
|
||
[50] Char छ: 0.12652335310758064 %
|
||
[51] Char ठ: 0.11631130049826859 %
|
||
[52] Char घ: 0.11604605237854619 %
|
||
[53] Char १: 0.11127158622354315 %
|
||
[54] Char ०: 0.09429570656131012 %
|
||
[55] Char २: 0.05822196227906489 %
|
||
[56] Char ढ: 0.0547737367226738 %
|
||
[57] Char ञ: 0.05464111266281261 %
|
||
[58] Char ९: 0.05411061642336783 %
|
||
[59] Char ५: 0.044826932233084135 %
|
||
[60] Char झ: 0.043765939754194565 %
|
||
[61] Char ऐ: 0.03660424052169001 %
|
||
[62] Char ॰: 0.036206368342106415 %
|
||
[63] Char ऑ: 0.03607374428224522 %
|
||
[64] Char ६: 0.03607374428224522 %
|
||
[65] Char ८: 0.035012751803355655 %
|
||
[66] Char ४: 0.0336865112047437 %
|
||
[67] Char ७: 0.03328863902516011 %
|
||
[68] Char ३: 0.03156452624696457 %
|
||
[69] Char ः: 0.030503533768075 %
|
||
[70] Char ऊ: 0.02785105257085109 %
|
||
[71] Char ऋ: 0.013262405986119566 %
|
||
[72] Char ऍ: 0.004111345855697065 %
|
||
[73] Char ॅ: 0.002387233077501522 %
|
||
[74] Char ळ: 0.0013262405986119567 %
|
||
[75] Char ॥: 0.0006631202993059783 %
|
||
[76] Char ॠ: 0.0005304962394447826 %
|
||
[77] Char ॄ: 0.000397872179583587 %
|
||
[78] Char ॆ: 0.000397872179583587 %
|
||
[79] Char ङ: 0.000397872179583587 %
|
||
[80] Char ऽ: 0.0002652481197223913 %
|
||
[81] Char ॓: 0.0002652481197223913 %
|
||
[82] Char ऎ: 0.00013262405986119564 %
|
||
[83] Char ॑: 0.00013262405986119564 %
|
||
[84] Char ॊ: 0.00013262405986119564 %
|
||
[85] Char ऱ: 0.00013262405986119564 %
|
||
|
||
The first 86 characters have an accumulated ratio of 0.9999999999999999.
|
||
The first 0 characters have an accumulated ratio of 0.
|
||
All characters whose order is over 41 have an accumulated ratio of 0.030491597602687492.
|
||
|
||
2165 sequences found.
|
||
|
||
First 1351 (typical positive ratio): 0.9950085486567504
|
||
Next 387 (1738-1351): 0.003992816717832359
|
||
Rest: 0.0009986346254172718
|
||
|
||
- Processing end: 2022-12-14 18:09:07.547746
|