From 601e59bd83d4c2359c9d14fad2c66fc535d9b05d Mon Sep 17 00:00:00 2001 From: Jehan Date: Wed, 18 Nov 2015 02:40:50 +0100 Subject: [PATCH] Add Greek test files. MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit Taken from Greek Wikipedia: https://el.wikipedia.org/wiki/UTF-8 https://el.wikipedia.org/wiki/ISO_8859-7 https://el.wikipedia.org/wiki/ISO_8859-7#Windows-1253 Windows-1253 test fails and returns "ISO-8859-7". They are actually fairly close for main letters, except for Ά, which make them difficult to differentiate. --- test/el/iso-8859-7.txt | 3 +++ test/el/utf-8.txt | 3 +++ test/el/windows-1253.txt | 5 +++++ 3 files changed, 11 insertions(+) create mode 100644 test/el/iso-8859-7.txt create mode 100644 test/el/utf-8.txt create mode 100644 test/el/windows-1253.txt diff --git a/test/el/iso-8859-7.txt b/test/el/iso-8859-7.txt new file mode 100644 index 0000000..9b036c6 --- /dev/null +++ b/test/el/iso-8859-7.txt @@ -0,0 +1,3 @@ + ISO 8859-7, , 8- , ISO 8859. . + + 1987 ELOT 928, 1986. 2003, , . diff --git a/test/el/utf-8.txt b/test/el/utf-8.txt new file mode 100644 index 0000000..688779f --- /dev/null +++ b/test/el/utf-8.txt @@ -0,0 +1,3 @@ +Το UTF-8 (8-bit Unicode Transformation Format) είναι ένα μη-απωλεστικό σχήμα κωδικοποίησης χαρακτήρων μεταβλητού μήκους για το πρότυπο Unicode που δημιουργήθηκε από τους Ken Thompson και Rob Pike. Χρησιμοποιεί ομάδες από byte για να αναπαραστήσει τα κωδικά σημεία του Unicode. Είναι ιδιαίτερα χρήσιμο για μετάδοση δεδομένων σε 8bit συστήματα ηλεκτρονικού ταχυδρομείου. + +Συγκεκριμένα χρησιμοποιεί ένα μέχρι τέσσερα byte ανά χαρακτήρα ανάλογα με το σύμβολο και το κωδικό του σημείο. Για παράδειγμα χρειάζεται μόνο ένα byte του UTF-8 για την κωδικοποίηση των 128 ASCII χαρακτήρες στο διάστημα του Unicode U+0000 μέχρι U+007F. diff --git a/test/el/windows-1253.txt b/test/el/windows-1253.txt new file mode 100644 index 0000000..3ccac7b --- /dev/null +++ b/test/el/windows-1253.txt @@ -0,0 +1,5 @@ +Windows-1253 + + Windows-1253. ( Windows-1253) "A2". ( ), , . + +