mirror of
https://gitlab.freedesktop.org/uchardet/uchardet.git
synced 2025-12-08 01:36:41 +08:00
Taken from Greek Wikipedia: https://el.wikipedia.org/wiki/UTF-8 https://el.wikipedia.org/wiki/ISO_8859-7 https://el.wikipedia.org/wiki/ISO_8859-7#Windows-1253 Windows-1253 test fails and returns "ISO-8859-7". They are actually fairly close for main letters, except for Ά, which make them difficult to differentiate.
4 lines
1.0 KiB
Plaintext
4 lines
1.0 KiB
Plaintext
Το UTF-8 (8-bit Unicode Transformation Format) είναι ένα μη-απωλεστικό σχήμα κωδικοποίησης χαρακτήρων μεταβλητού μήκους για το πρότυπο Unicode που δημιουργήθηκε από τους Ken Thompson και Rob Pike. Χρησιμοποιεί ομάδες από byte για να αναπαραστήσει τα κωδικά σημεία του Unicode. Είναι ιδιαίτερα χρήσιμο για μετάδοση δεδομένων σε 8bit συστήματα ηλεκτρονικού ταχυδρομείου.
|
||
|
||
Συγκεκριμένα χρησιμοποιεί ένα μέχρι τέσσερα byte ανά χαρακτήρα ανάλογα με το σύμβολο και το κωδικό του σημείο. Για παράδειγμα χρειάζεται μόνο ένα byte του UTF-8 για την κωδικοποίηση των 128 ASCII χαρακτήρες στο διάστημα του Unicode U+0000 μέχρι U+007F.
|