uchardet/script/BuildLangModelLogs/LangHindiModel.log
2021-03-19 22:36:30 +01:00

191 lines
7.5 KiB
Plaintext
Raw Permalink Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

= Logs of language model for Hindi (hi) =
- Generated by BuildLangModel.py
- Started: 2021-03-19 22:26:39.897264
- Maximum depth: 4
- Max number of pages: 100
== Parsed pages ==
मुखपृष्ठ (revision 5072364)
2020 विशाखपट्नम गैस रिसाव (revision 4964453)
अंग्रेज़ी विकिपीडिया (revision 4812878)
अंशुन बस दुर्घटना (revision 5080233)
अभिनव बिंद्रा (revision 5066925)
अम्फान महाचक्रवात (revision 4974141)
अल्बर्टा (revision 4815865)
अस्तित्ववाद (revision 5095575)
आज का आलेख १८ मार्च २०२१ (revision 5119127)
इंडोनेशिया (revision 5137321)
उत्तर प्रदेश (revision 5137498)
एयर इंडिया एक्सप्रेस उड़ान 1344 (revision 4958774)
कतिकी मेला (revision 4822652)
कनाडा (revision 5092431)
कश्मीर (revision 5101264)
कार्तिक पूर्णिमा (revision 5039499)
कालिंजर दुर्ग (revision 5070202)
कालीकट अंतर्राष्ट्रीय विमानक्षेत्र (revision 5053097)
किलर व्हेल (revision 4922729)
कोड़िकोड (revision 5106489)
कोरोनावायरस महामारी (revision 5118212)
कोसला (revision 4901745)
खजुराहो (revision 5123204)
गायक (revision 5128003)
गुइझोऊ (revision 4579091)
गुप्त वंश (revision 5101672)
ग्लेशियर नेशनल पार्क (revision 5135892)
घुम रेलवे स्टेशन (revision 4973755)
जापान के प्रधानमंत्री (revision 4960597)
जावा सागर (revision 3325350)
जुलाई (revision 4367726)
डल झील (revision 5109477)
तिरहुत (revision 5056746)
दरभंगा (revision 5139550)
धर्मराय स्वामी मंदिर (revision 5080095)
नेपाल (revision 5119140)
पक्षी (revision 4905207)
पाकिस्तान इंटरनेशनल एयरलाइंस उड़ान 8303 (revision 4972163)
पारिस्थितिकी तंत्र (revision 4960487)
पूर्वी भारत (revision 5008841)
पृथ्वीराज चौहान (revision 5141495)
प्रजातियां (revision 5084721)
प्रणब मुखर्जी (revision 5026060)
फल (revision 4887332)
फूल (revision 4985648)
बज्जिका (revision 5052110)
बांदा जिला (revision 5066719)
बिहार (revision 5141557)
बुन्देलखण्ड (revision 5142668)
बुलबुल (revision 4959703)
बेयरूत धमाका 2020 (revision 5128013)
बैटमैन (revision 5093040)
ब्रिटिश कोलम्बिया (revision 5134714)
भारत (revision 5112806)
भारत की स्वतंत्रता (revision 5102484)
भारत में कोरोनावायरस महामारी का आर्थिक प्रभाव (revision 5105591)
भालचंद्र नेमाडे (revision 5069123)
मधुबनी (revision 5127643)
मुखपृष्ठ/अन्य भाषाओं में (revision 4949624)
मुखपृष्ठ/आज का आलेख (revision 5072364)
मुखपृष्ठ/पिछला आलेख (revision 5072364)
मुखपृष्ठ/पूर्व प्रदर्शित (revision 4427327)
मुखपृष्ठ/बन्धु प्रकल्प (revision 4786332)
मुखपृष्ठ/वर्तमान (revision 5072364)
मुजफ्फरपुर (revision 5112424)
मैथिली (revision 5048285)
मोन्टाना (revision 4530336)
मोहम्मद ग़ोरी (revision 5053528)
योशिहिडे सुगा (revision 5131517)
राजपूत (revision 5142481)
राजीव गांधी खेल रत्न (revision 5035806)
रॉकी पर्वत शृंखला (revision 5063055)
लेबनान (revision 5087028)
विंध्य पर्वत (revision 4998895)
विधु विनोद चोपड़ा (revision 4920989)
विश्व धरोहर स्थल (revision 5050725)
वैशाली (revision 5134349)
शिंजो अबे (revision 4959991)
शिकारा (revision 4959995)
शिकारा (२०२० फ़िल्म) (revision 5110981)
शिवहर (revision 5002252)
श्रीनगर, जम्मू और कश्मीर (revision 5103394)
श्रीविजय एयर उड़ान 182 (revision 5112969)
संयुक्त राज्य अमेरिका (revision 5122291)
समस्तीपुर (revision 5137150)
सीतामढी (revision 5125137)
स्पेन के फ़िलिप पंचम (revision 4969865)
हाल की घटनाएँ (revision 2774346)
हिन्दी विकिपीडिया (revision 5131026)
हैब्सबर्ग राजवंश (revision 5036757)
२०२१ में निधन (revision 5077158)
2020 कोरोनावायरस महामारी (revision 5118212)
Chevron Phillips Chemical (revision 4964453)
Deccan Chronicle (revision 4976246)
Indian Standard Time (revision 5132803)
The Hindu (revision 5046686)
UTC+05:30 (revision 4947123)
अन्तर्राष्ट्रीय मानक क्रम संख्या (revision 4951625)
आंध्र प्रदेश (revision 5118459)
== End of Parsed pages ==
- Wikipedia parsing ended at: 2021-03-19 22:31:01.818311
80 characters appeared 80 times.
Most Frequent characters:
[ 0] Char व: 1.25 %
[ 1] Char ि: 1.25 %
[ 2] Char श: 1.25 %
[ 3] Char ा: 1.25 %
[ 4] Char ख: 1.25 %
[ 5] Char प: 1.25 %
[ 6] Char त: 1.25 %
[ 7] Char ्: 1.25 %
[ 8] Char न: 1.25 %
[ 9] Char म: 1.25 %
[10] Char ग: 1.25 %
[11] Char ै: 1.25 %
[12] Char स: 1.25 %
[13] Char र: 1.25 %
[14] Char ज: 1.25 %
[15] Char े: 1.25 %
[16] Char भ: 1.25 %
[17] Char ी: 1.25 %
[18] Char क: 1.25 %
[19] Char ह: 1.25 %
[20] Char ई: 1.25 %
[21] Char ो: 1.25 %
[22] Char आ: 1.25 %
[23] Char ध: 1.25 %
[24] Char द: 1.25 %
[25] Char ं: 1.25 %
[26] Char ट: 1.25 %
[27] Char ु: 1.25 %
[28] Char ए: 1.25 %
[29] Char ल: 1.25 %
[30] Char ॉ: 1.25 %
[31] Char उ: 1.25 %
[32] Char य: 1.25 %
[33] Char ष: 1.25 %
[34] Char घ: 1.25 %
[35] Char थ: 1.25 %
[36] Char ।: 1.25 %
[37] Char इ: 1.25 %
[38] Char ौ: 1.25 %
[39] Char ृ: 1.25 %
[40] Char औ: 1.25 %
[41] Char ँ: 1.25 %
[42] Char फ: 1.25 %
[43] Char ू: 1.25 %
[44] Char ठ: 1.25 %
[45] Char ड: 1.25 %
[46] Char ब: 1.25 %
[47] Char च: 1.25 %
[48] Char अ: 1.25 %
[49] Char ण: 1.25 %
[50] Char छ: 1.25 %
[51] Char ़: 1.25 %
[52] Char ऊ: 1.25 %
[53] Char ऐ: 1.25 %
[54] Char ढ: 1.25 %
[55] Char ञ: 1.25 %
[56] Char ओ: 1.25 %
[57] Char : 1.25 %
[58] Char ऑ: 1.25 %
[59] Char १: 1.25 %
[60] Char ५: 1.25 %
[61] Char २: 1.25 %
[62] Char : 1.25 %
[63] Char ७: 1.25 %
The first 64 characters have an accumulated ratio of 0.7999999999999992.
2113 sequences found.
First 1356 (typical positive ratio): 0.9950083796268726
Next 397 (1753-1356): 0.00399414702204226
Rest: 0.000997473351085132
- Processing end: 2021-03-19 22:31:02.178353