diff --git a/test/ja/euc-jp.txt b/test/ja/euc-jp.txt new file mode 100644 index 0000000..4bd0c16 --- /dev/null +++ b/test/ja/euc-jp.txt @@ -0,0 +1,10 @@ +Extended Unix Code(EUC)は、UNIX上でよく使われる文字コードの符号化方式である。 + + 日本語EUC + JIS X 0208ベース (EUC-JP) + JIS X 0213ベース (EUC-JIS-2004) + 韓国語EUC (EUC-KR) + 簡体字中国語EUC (EUC-CN) + 繁体字中国語EUC (EUC-TW) + +などがある。 diff --git a/test/ja/iso-2022-jp.txt b/test/ja/iso-2022-jp.txt new file mode 100644 index 0000000..c0dc891 --- /dev/null +++ b/test/ja/iso-2022-jp.txt @@ -0,0 +1,8 @@ +ISO/IEC 2022$B!J5l>N(B ISO 2022$B!K$O!"(B + + $BJ8;z=89g$r(B7$B%S%C%HId9f$^$?$O(B8$B%S%C%HId9f$GI=8=$9$k$?$a$N5;=Q!"$*$h$S(B + $BJ#?t$NJ8;z=89g$rC10l$NJ8;zId9f2=J}<0$K4^$a$k5;=Q(B + +$B$r5,Dj$9$k(BISO$B5,3J$G$"$k!#(BJIS$B$NBP1~5,3J$O(BJIS X 0202 $B!V>pJs5;=Q(B-$BJ8;zId9f$N9=B$5Z$S3HD%K!!W(B[1]$B!#(BEcma International$B$NBP1~5,3J$O(BECMA-35$B!#(B + +ISO/IEC 2022 $B$NId9f2=J}<0$O!"0lHL$K!"(B1$BJ8;z$K(B1$B%P%$%H$+(B2$B%P%$%H0J>e$r;H$&2DJQD9$NJ8;zId9f2=J}<0$G$"$k!#$$$/$D$+$NId9f2=I=8=$,(BISO/IEC 2022$B$N5!9=$r;H$C$F$$$k!#$?$H$($P!"(BISO-2022-JP$B$OF|K\8l$G9-$/;H$o$l$F$$$kId9f2=I=8=$G$"$j!"$$$o$f$k!V(BJIS$B%3!<%I!W$H$$$&$N$b$3$l$r;X$9$3$H$,0lHLE*$G$"$k!#(B diff --git a/test/ja/utf-8.txt b/test/ja/utf-8.txt new file mode 100644 index 0000000..cd4b312 --- /dev/null +++ b/test/ja/utf-8.txt @@ -0,0 +1,9 @@ +UTF-8鐚若c若<若c若ゃ鐚ISO/IEC 10646 (UCS) Unicodeт戎8膃垸篏絖膃垸綵√恰絖膃垸鴻若 + +罩e腱違ISO/IEC 10646с UCS Transformation Format 8Unicodeс Unicode Transformation Format-8 筝∴ISO/IEC 10646Unicode潟若茲膀蚊тсRFC篁罕[1] + +2ゃ篁ラ/ASCII絖憗綏ュかUTF-FSS (File System Safe) у腱違UTF-2 + +若推困劫<ゃ綵√筝UTF-8篏帥上 + +綵腥倶Plan 9х潟潟若祉ゃ荐荐宴潟祉潟純潟c罅