mirror of
https://gitlab.freedesktop.org/uchardet/uchardet.git
synced 2025-12-06 16:56:40 +08:00
234 lines
11 KiB
Plaintext
234 lines
11 KiB
Plaintext
= Logs of language model for Thai (th) =
|
|
|
|
- Generated by BuildLangModel.py
|
|
- Started: 2022-12-15 00:20:40.435765
|
|
- Maximum depth: 4
|
|
- Max number of pages: 200
|
|
|
|
== Parsed pages ==
|
|
|
|
หน้าหลัก (revision 9904032)
|
|
สาธารณรัฐจีน (revision 10416930)
|
|
ธงชาติเอสโตเนีย (revision 10179603)
|
|
ประชากรโลก (revision 10416810)
|
|
คนญี่ปุ่น (revision 9865034)
|
|
การอักเสบ (revision 10108520)
|
|
เจียง เจ๋อหมิน (revision 10459105)
|
|
เดลี (revision 10005684)
|
|
ทาลลินน์ (revision 10365090)
|
|
แมโครไลด์ (revision 10250756)
|
|
พรรคนาซี (revision 10397981)
|
|
นาซา (revision 10421933)
|
|
รายชื่อประเทศเรียงตามความหนาแน่นประชากร (revision 9864334)
|
|
ไทกีไซคลีน (revision 10469110)
|
|
ธงชาติจอร์เจีย (revision 10357912)
|
|
ศรีลังกา (revision 10388909)
|
|
อุตตรประเทศ (revision 10151167)
|
|
ค.ศ. 1981 (revision 10216412)
|
|
ไอล์ออฟแมน (revision 10287539)
|
|
ผู้หญิง (revision 10358580)
|
|
พ.ศ. 2488 (revision 10439390)
|
|
สีดำ (revision 10145506)
|
|
สตาวังเงอร์ (revision 10098117)
|
|
เลขาธิการพรรคคอมมิวนิสต์จีน (revision 10311137)
|
|
บอร์เนน (revision 9371312)
|
|
ประเทศเยอรมนี (revision 10435832)
|
|
ธงชาติโมนาโก (revision 10377768)
|
|
เซี่ยงไฮ้ (revision 10069809)
|
|
มาเลเซีย (revision 10434631)
|
|
ฟลอเรนซ์ (revision 10216249)
|
|
สหราชอาณาจักร (revision 10440822)
|
|
International Monetary Fund (revision 10182310)
|
|
ประชากร (revision 9907304)
|
|
สัทอักษรสากล (revision 10135934)
|
|
ไนจีเรีย (revision 9842110)
|
|
เติ้งเสี่ยวผิง (revision 10347197)
|
|
เรคยาวิก (revision 10218000)
|
|
ทวีปแอฟริกา (revision 10433059)
|
|
เยอรมนี (revision 10435832)
|
|
Government of India (revision 9042357)
|
|
ดาวเทียมสปุตนิค 1 (revision 10015824)
|
|
โมนาโก (revision 10373340)
|
|
แบดมินตัน (revision 10235522)
|
|
สันนิบาติชาติสังคมนิยมแห่งไรซ์สำหรับการออกกำลังทางกายภาพ (revision 10297912)
|
|
ค.ศ. 1975 (revision 10127987)
|
|
Encarta (revision 10246589)
|
|
มิถุนายน (revision 9444949)
|
|
อินโดนีเซีย (revision 10435811)
|
|
Central Intelligence Agency (revision 10246925)
|
|
บังกลาเทศ (revision 10476965)
|
|
ธงชาติอาเซอร์ไบจาน (revision 9569706)
|
|
วิทยาเซรุ่ม (revision 10324917)
|
|
อียิปต์ (revision 10467051)
|
|
ธงชาติสาธารณรัฐสังคมนิยมโซเวียตเอสโตเนีย (revision 8471180)
|
|
อักษรโรมัน (revision 10279083)
|
|
Literacy in India (revision 10430004)
|
|
ปารากวัย (revision 10086617)
|
|
ฝรั่งเศส (revision 10470508)
|
|
แพฟอส (revision 9443297)
|
|
รายชื่อประธานาธิบดีสาธารณรัฐประชาชนจีน (revision 9839306)
|
|
การคว่ำบาตรธุรกิจชาวยิวของนาซี (revision 8140635)
|
|
โบลิเวีย (revision 10086745)
|
|
พ.ศ. 2545 (revision 10363737)
|
|
ทวีปยุโรป (revision 10454257)
|
|
สิงคโปร์ (revision 10413782)
|
|
ลักเซมเบิร์ก (revision 10435795)
|
|
สงครามโลกครั้งที่สอง (revision 10451166)
|
|
โรคท่อเลือดแดงและหลอดเลือดแดงแข็ง (revision 9907967)
|
|
หู จิ่นเทา (revision 10428652)
|
|
ทวีปอเมริกาเหนือ (revision 10418313)
|
|
อักษรจีนตัวย่อ (revision 9702441)
|
|
22 กันยายน (revision 10469604)
|
|
ธงชาติทรานส์นีสเตรีย (revision 9569668)
|
|
ริเยกา (revision 10297085)
|
|
ประเทศอินเดีย (revision 10435810)
|
|
ซินจู๋ (revision 10443351)
|
|
พยาธิกายวิภาค (revision 5458586)
|
|
ประเทศแคนาดา (revision 10433247)
|
|
Coagulative necrosis (revision 7462805)
|
|
เม็กซิโก (revision 10435830)
|
|
การต่อต้านยิว (revision 10096394)
|
|
มหาอำนาจกลาง (revision 10194476)
|
|
ชาวยิว (revision 10209235)
|
|
สหรัฐ (revision 10452486)
|
|
ไทย (revision 10479597)
|
|
กองทุนประชากรแห่งสหประชาชาติ (revision 10049856)
|
|
ธงชาติยูเครน (revision 10310962)
|
|
พินอิน (revision 10344015)
|
|
ประธานาธิบดีไต้หวัน (revision 10470458)
|
|
เมกะซิตี (revision 10278263)
|
|
ออกซาซิลลิน (revision 9349240)
|
|
เดมะนิม (revision 9117585)
|
|
นิวแคลิโดเนีย (revision 9854958)
|
|
สกู๊ตเตอร์ (จักรยานยนต์) (revision 9667079)
|
|
ISBN (identifier) (revision 10474803)
|
|
พรรคแอร์โรว์ครอสส์ (revision 9330061)
|
|
ออร์ฮูส (revision 8961150)
|
|
ภาษาแต้จิ๋ว (revision 10373510)
|
|
เวอร์นอน แอล สมิธ (revision 10319937)
|
|
โกตดาซูร์ (revision 10067696)
|
|
ประเทศคอสตาริกา (revision 10470553)
|
|
กอลเวย์ (revision 10347140)
|
|
ธงชาตินอร์เทิร์นไอร์แลนด์ (revision 9119794)
|
|
สันนิบาตชาติ (revision 10365681)
|
|
อักษรตงปา (revision 9353571)
|
|
โทคิโอโฮเทล (revision 10237521)
|
|
การตายเฉพาะส่วน (revision 10149625)
|
|
ประเทศเซเนกัล (revision 9763478)
|
|
อับฮาเซีย (revision 10393097)
|
|
สัมประสิทธิ์จีนี (revision 9672933)
|
|
ญี่ปุ่น (revision 10454334)
|
|
ชัมมูและกัศมีร์ (ดินแดนสหภาพ) (revision 10236177)
|
|
4 กุมภาพันธ์ (revision 10267773)
|
|
ไมโครซอฟท์ (revision 10469284)
|
|
สีไซอัน (revision 8689665)
|
|
ซาเกร็บ (revision 10352620)
|
|
ทะเลเมดิเตอร์เรเนียน (revision 10069175)
|
|
เกรกอร์ ชตรัสเซอร์ (revision 10167753)
|
|
อลัน ทัวริง (revision 10436603)
|
|
เนเธอร์แลนด์ (revision 10356667)
|
|
ธงชาติไอซ์แลนด์ (revision 9569769)
|
|
ธงชาติสวีเดน (revision 9029892)
|
|
ลิแวนต์ (revision 8766864)
|
|
มุมไบ (revision 10460080)
|
|
สหภาพแอฟริกา (revision 10037662)
|
|
สิงหาคม (revision 10267979)
|
|
กระทรวงเศรษฐกิจและพลังงานสหพันธ์ (revision 9711813)
|
|
นิติเวชคลินิก (revision 4249372)
|
|
อันชลุสส์ (revision 9966952)
|
|
อักษรซาบาเอียน (revision 1799108)
|
|
สารานุกรม (revision 10359896)
|
|
จอร์เจีย (revision 10466198)
|
|
ประเทศเบลีซ (revision 10356670)
|
|
ธงชาติญี่ปุ่น (revision 10123028)
|
|
แรน (revision 9688385)
|
|
|
|
== End of Parsed pages ==
|
|
|
|
- Wikipedia parsing ended at: 2022-12-15 00:23:34.344450
|
|
|
|
69 characters appeared 1063822 times.
|
|
|
|
Most Frequent characters:
|
|
[ 0] Char า: 7.033695486650962 %
|
|
[ 1] Char น: 6.100926658783142 %
|
|
[ 2] Char ร: 5.938117467019858 %
|
|
[ 3] Char ก: 4.492104882207737 %
|
|
[ 4] Char อ: 4.258419171628336 %
|
|
[ 5] Char เ: 3.990141207833641 %
|
|
[ 6] Char ง: 3.8734863539201108 %
|
|
[ 7] Char ่: 3.8162399348763234 %
|
|
[ 8] Char ั: 3.4642073579978603 %
|
|
[ 9] Char ม: 3.4400491811600062 %
|
|
[10] Char ี: 2.9371454999050592 %
|
|
[11] Char ย: 2.802630515255372 %
|
|
[12] Char ล: 2.7274299647873423 %
|
|
[13] Char ้: 2.4708080863151918 %
|
|
[14] Char ิ: 2.3827294415795124 %
|
|
[15] Char ว: 2.3490771952450693 %
|
|
[16] Char ท: 2.2903267651919212 %
|
|
[17] Char ส: 2.267390597299172 %
|
|
[18] Char ต: 2.224150280780055 %
|
|
[19] Char ป: 2.1304315947592736 %
|
|
[20] Char ด: 2.1304315947592736 %
|
|
[21] Char ะ: 2.074783187412932 %
|
|
[22] Char ค: 1.6853383366766246 %
|
|
[23] Char แ: 1.6731182472255697 %
|
|
[24] Char บ: 1.6530961006634568 %
|
|
[25] Char ห: 1.6071297641898736 %
|
|
[26] Char จ: 1.1870406891378444 %
|
|
[27] Char ใ: 1.1792386320267865 %
|
|
[28] Char ช: 1.1505684221608503 %
|
|
[29] Char ข: 1.0856139466940897 %
|
|
[30] Char พ: 1.0046793542528731 %
|
|
[31] Char ์: 0.9819311877362942 %
|
|
[32] Char ุ: 0.9342728388771806 %
|
|
[33] Char ื: 0.9291028010325035 %
|
|
[34] Char ศ: 0.9121826771771969 %
|
|
[35] Char โ: 0.8589782877210661 %
|
|
[36] Char ไ: 0.8107559347334422 %
|
|
[37] Char ็: 0.782367726931761 %
|
|
[38] Char ู: 0.7527575101849746 %
|
|
[39] Char ำ: 0.5811122537416974 %
|
|
[40] Char ซ: 0.5105177369898348 %
|
|
[41] Char ึ: 0.5069457108426034 %
|
|
[42] Char ธ: 0.45674934340519374 %
|
|
[43] Char ษ: 0.44744327528477507 %
|
|
[44] Char ภ: 0.44152123193541776 %
|
|
[45] Char ถ: 0.38446281426780043 %
|
|
[46] Char ญ: 0.37243072619291573 %
|
|
[47] Char ณ: 0.36209065050356165 %
|
|
[48] Char ฐ: 0.35842462366824523 %
|
|
[49] Char ผ: 0.3104842727448765 %
|
|
[50] Char ฟ: 0.18057532181135566 %
|
|
[51] Char ฝ: 0.12389290689607847 %
|
|
[52] Char ฤ: 0.09494069496588715 %
|
|
[53] Char ฮ: 0.08394261445993785 %
|
|
[54] Char ๆ: 0.07426054358717907 %
|
|
[55] Char ฉ: 0.07397854152292395 %
|
|
[56] Char ฒ: 0.06222845551229435 %
|
|
[57] Char ฏ: 0.04916235986847423 %
|
|
[58] Char ฎ: 0.04709434473060343 %
|
|
[59] Char ฑ: 0.026696195416150443 %
|
|
[60] Char ๊: 0.017672129359986917 %
|
|
[61] Char ฬ: 0.01692012385530662 %
|
|
[62] Char ๋: 0.010058073625098937 %
|
|
[63] Char ฆ: 0.009306068120418641 %
|
|
[64] Char ฯ: 0.007614055734887979 %
|
|
[65] Char ฌ: 0.0032900240829762876 %
|
|
[66] Char ฺ: 0.0031020227068062137 %
|
|
[67] Char ฃ: 9.400068808503678e-05 %
|
|
[68] Char ํ: 9.400068808503678e-05 %
|
|
|
|
The first 69 characters have an accumulated ratio of 1.0.
|
|
The first 9 characters have an accumulated ratio of 0.4296733852091798.
|
|
All characters whose order is over 43 have an accumulated ratio of 0.031143367969453536.
|
|
|
|
2458 sequences found.
|
|
|
|
First 1634 (typical positive ratio): 0.9950175671509007
|
|
Next 347 (1981-1634): 0.003986731842203994
|
|
Rest: 0.0009957010068952776
|
|
|
|
- Processing end: 2022-12-15 00:23:35.424483
|