From f303a4173599a7fae1f9453c86e05c4668bb589b Mon Sep 17 00:00:00 2001 From: Jehan Date: Wed, 18 Nov 2015 03:26:34 +0100 Subject: [PATCH] Add Thai test file for UTF-8. MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit Text from Thai Wikipedia: https://th.wikipedia.org/wiki/ยูนิโคด --- test/th/utf-8.txt | 1 + 1 file changed, 1 insertion(+) create mode 100644 test/th/utf-8.txt diff --git a/test/th/utf-8.txt b/test/th/utf-8.txt new file mode 100644 index 0000000..73a9c1a --- /dev/null +++ b/test/th/utf-8.txt @@ -0,0 +1 @@ +ยูนิโคด (อังกฤษ: Unicode) คือมาตรฐานอุตสาหกรรมที่ช่วยให้คอมพิวเตอร์แสดงผลและจัดการข้อความธรรมดาที่ใช้ในระบบการเขียนของภาษาส่วนใหญ่ในโลกได้อย่างสอดคล้องกัน ยูนิโคดประกอบด้วยรายการอักขระที่แสดงผลได้มากกว่า 100,000 ตัว พัฒนาต่อยอดมาจากมาตรฐานชุดอักขระสากล (Universal Character Set: UCS) และมีการตีพิมพ์ลงในหนังสือ The Unicode Standard เป็นแผนผังรหัสเพื่อใช้เป็นรายการอ้างอิง นอกจากนั้นยังมีการอธิบายวิธีการที่ใช้เข้ารหัสและการนำเสนอมาตรฐานของการเข้ารหัสอักขระอีกจำนวนหนึ่ง การเรียงลำดับอักษร กฎเกณฑ์ของการรวมและการแยกอักขระ รวมไปถึงลำดับการแสดงผลของอักขระสองทิศทาง (เช่นอักษรอาหรับหรืออักษรฮีบรูที่เขียนจากขวาไปซ้าย)