diff --git a/README.md b/README.md index 39375be..25a036a 100644 --- a/README.md +++ b/README.md @@ -40,6 +40,8 @@ Techniques used by universalchardet are described at http://www.mozilla.org/proj * Hebrew * ISO-8859-8 * WINDOWS-1255 + * Thai + * TIS-620 * Others * WINDOWS-1252 diff --git a/test/tis-620.txt b/test/tis-620.txt new file mode 100644 index 0000000..0439613 --- /dev/null +++ b/test/tis-620.txt @@ -0,0 +1,5 @@ +TIS-620 + +มาตรฐานผลิตภัณฑ์อุตสาหกรรม 620-2533, มอก.620-2533, หรือที่รู้จักกันทั่วไปว่า TIS-620 เป็นชุดอักขระมาตรฐานอุตสาหกรรมของไทย มีชื่อเต็มว่า รหัสสำหรับอักขระไทยที่ใช้กับคอมพิวเตอร์ + +รหัส TIS-620 มีรายละเอียดคล้ายรหัส ISO-8859-11 มาก แตกต่างกันแค่เพียงที่ ISO-8859-11 กำหนดให้ A0 เป็น "เว้นวรรคแบบไม่ตัดคำ" (no-break space) ส่วน TIS-620 นั้นแม้จะสงวนตำแหน่ง A0 เอาไว้ แต่ก็ไม่ได้กำหนดค่าใด ๆ ให้