java.io.InputStreamReader
、java.io.OutputStreamWriter
、java.lang.String
、および java.nio.charset
パッケージのクラスを使用すると、Unicode とその他のいくつかの文字エンコーディング間の変換を行うことができます。サポートされるエンコーディングは、Java Platform, Standard Edition 7 (Java SE 7) の実装によって異なります。Java Platform, Standard Edition 7 の各実装によるサポートが必要なエンコーディングの一覧は、 java.nio.charset.Charset
のクラスの説明を参照してください。
Oracle の Java SE Development Kit 7 (Java SE 7) の全プラットフォーム (Solaris、Linux、Microsoft Windows) 版と Java SE Runtime Environment 7 (JRE 7) の Solaris および Linux 版は、このページに掲載されているすべてのエンコーディングをサポートしています。Oracle の JRE 7 の Microsoft Windows 版は、完全な国際版とヨーロッパ言語版のどちらのバージョンでもインストールすることができます。JRE 7 のインストールプログラムは、ホストオペレーティングシステムがヨーロッパ言語だけをサポートしていることを識別すると、デフォルトでヨーロッパ言語版をインストールします。インストールプログラムがほかの言語の必要性を識別した場合、またはカスタマイズされたインストールでユーザーがヨーロッパ言語以外のサポートを要求した場合は、完全な国際化版がインストールされます。ヨーロッパ言語版では、次の基本エンコーディングセットの表に掲載されているエンコーディングだけがサポートされます。lib/charsets.jar ファイルを含む国際化版では、このページに示すエンコーディングがすべてサポートされています。
次の各表は、Java SE 7 でサポートされているエンコーディングセットを示します。新しい java.nio
API で使用される正準名は、多くの場合、java.io
API および java.lang
API で使用される名前とは異なります。
|
|
説明 |
---|---|---|
IBM00858 |
Cp858 |
Cp850 の拡張機能でユーロ文字を含む |
IBM437 |
Cp437 |
MS-DOS 米国、オーストラリア、ニュージーランド、南アフリカ |
IBM775 |
Cp775 |
PC バルト諸語 |
IBM850 |
Cp850 |
MS-DOS ラテン文字-1 |
IBM852 |
Cp852 |
MS-DOS ラテン文字-2 |
IBM855 |
Cp855 |
IBM キリル文字 |
IBM857 |
Cp857 |
IBM トルコ語 |
IBM862 |
Cp862 |
PC ヘブライ語 |
IBM866 |
Cp866 |
MS-DOS ロシア語 |
ISO-8859-1 |
ISO8859_1 |
ISO -8859-1、ラテンアルファベット No. 1 |
ISO-8859-2 |
ISO8859_2 |
ラテンアルファベット No. 2 |
ISO-8859-4 |
ISO8859_4 |
ラテンアルファベット No. 4 |
ISO-8859-5 |
ISO8859_5 |
ラテン/キリル文字アルファベット |
ISO-8859-7 |
ISO8859_7 |
ラテン/ギリシャ文字アルファベット (ISO-8859-7:2003) |
ISO-8859-9 |
ISO8859_9 |
ラテンアルファベット No. 5 |
ISO-8859-13 |
ISO8859_13 |
ラテンアルファベット No. 7 |
ISO-8859-15 |
ISO8859_15 |
ラテンアルファベット No. 9 |
KOI8-R |
KOI8_R |
KOI8-R、ロシア語 |
KOI8-U |
KOI8_U |
KOI8-U、ウクライナ語 |
US-ASCII |
ASCII |
American Standard Code for Information Interchange |
UTF-8 |
UTF8 |
8 ビット Unicode (UCS) Transformation Format |
UTF-16 |
UTF-16 |
16 ビット Unicode (UCS) Transformation Format、オプションのバイト順マークによって識別されるバイト順 |
UTF-16BE |
UnicodeBigUnmarked |
16 ビット Unicode (UCS) Transformation Format、ビッグエンディアンバイト順 |
UTF-16LE |
UnicodeLittleUnmarked |
16 ビット Unicode (UCS) Transformation Format、リトルエンディアンバイト順 |
UTF-32 |
UTF_32 |
32 ビット Unicode (UCS) Transformation Format、オプションのバイト順マークによって識別されるバイト順 |
UTF-32BE |
UTF_32BE |
32 ビット Unicode (UCS) Transformation Format、ビッグエンディアンバイト順 |
UTF-32LE |
UTF_32LE |
32 ビット Unicode (UCS) Transformation Format、リトルエンディアンバイト順 |
x-UTF-32BE-BOM |
UTF_32BE_BOM |
32 ビット Unicode (UCS) Transformation Format、ビッグエンディアンバイト順、バイト順マーク付き |
x-UTF-32LE-BOM |
UTF_32LE_BOM |
32 ビット Unicode (UCS) Transformation Format、リトルエンディアンバイト順、バイト順マーク付き |
windows-1250 |
Cp1250 |
Windows 東欧 |
windows-1251 |
Cp1251 |
Windows キリル文字 |
windows-1252 |
Cp1252 |
Windows ラテン文字-1 |
windows-1253 |
Cp1253 |
Windows ギリシャ文字 |
windows-1254 |
Cp1254 |
Windows トルコ語 |
windows-1257 |
Cp1257 |
Windows バルト諸語 |
利用できない |
UnicodeBig |
16 ビット Unicode (UCS) Transformation Format、ビッグエンディアンバイト順、バイト順マーク付き |
x-IBM737 |
Cp737 |
PC ギリシャ文字 |
x-IBM874 |
Cp874 |
IBM タイ |
x-UTF-16LE-BOM |
UnicodeLittle |
16 ビット Unicode (UCS) Transformation Format、リトルエンディアンバイト順、バイト順マーク付き |
|
|
説明 |
---|---|---|
Big5 |
Big5 |
Big5、中国語 (繁体字) |
Big5-HKSCS |
Big5_HKSCS |
Big5 (香港の拡張付き)、中国語 (繁体字、2001 改訂を組み込み) |
EUC-JP |
EUC_JP |
JISX 0201、0208、0212、EUC エンコーディング、日本語 |
EUC-KR |
EUC_KR |
KS C 5601、EUC エンコーディング、韓国語 |
GB18030 |
GB18030 |
中国語 (簡体字)、中華人民共和国標準 |
GB2312 |
EUC_CN |
GB2312、EUC エンコーディング、中国語 (簡体字) |
GBK |
GBK |
GBK、中国語 (簡体字) |
IBM-Thai |
Cp838 |
IBM タイ拡張 SBCS |
IBM01140 |
Cp1140 |
Cp037 の拡張機能でユーロ文字を含む |
IBM01141 |
Cp1141 |
Cp273 の拡張機能でユーロ文字を含む |
IBM01142 |
Cp1142 |
Cp277 の拡張機能でユーロ文字を含む |
IBM01143 |
Cp1143 |
Cp278 の拡張機能でユーロ文字を含む |
IBM01144 |
Cp1144 |
Cp280 の拡張機能でユーロ文字を含む |
IBM01145 |
Cp1145 |
Cp284 の拡張機能でユーロ文字を含む |
IBM01146 |
Cp1146 |
Cp285 の拡張機能でユーロ文字を含む |
IBM01147 |
Cp1147 |
Cp297 の拡張機能でユーロ文字を含む |
IBM01148 |
Cp1148 |
Cp500 の拡張機能でユーロ文字を含む |
IBM01149 |
Cp1149 |
Cp871 の拡張機能でユーロ文字を含む |
IBM037 |
Cp037 |
米国、カナダ (2 か国語、フランス語)、オランダ、ポルトガル、ブラジル、オーストラリア |
IBM1026 |
Cp1026 |
IBM ラテン文字-5、トルコ |
IBM1047 |
Cp1047 |
ラテン文字-1 (EBCDIC ホスト用) |
IBM273 |
Cp273 |
IBM オーストリア、ドイツ |
IBM277 |
Cp277 |
IBM デンマーク、ノルウェー |
IBM278 |
Cp278 |
IBM フィンランド、スウェーデン |
IBM280 |
Cp280 |
IBM イタリア |
IBM284 |
Cp284 |
IBM カタロニア語/スペイン、スペイン語圏ラテンアメリカ |
IBM285 |
Cp285 |
IBM 英国、アイルランド |
IBM297 |
Cp297 |
IBM フランス |
IBM420 |
Cp420 |
IBM アラビア語 |
IBM424 |
Cp424 |
IBM ヘブライ語 |
IBM500 |
Cp500 |
EBCDIC 500V1 |
IBM860 |
Cp860 |
MS-DOS ポルトガル語 |
IBM861 |
Cp861 |
MS-DOS アイスランド語 |
IBM863 |
Cp863 |
MS-DOS カナダ系フランス語 |
IBM864 |
Cp864 |
PC アラビア語 |
IBM865 |
Cp865 |
MS-DOS 北欧 |
IBM868 |
Cp868 |
MS-DOS パキスタン |
IBM869 |
Cp869 |
IBM 近代ギリシャ語 |
IBM870 |
Cp870 |
IBM 多言語ラテン文字-2 |
IBM871 |
Cp871 |
IBM アイスランド |
IBM918 |
Cp918 |
IBM パキスタン (ウルドゥー語) |
ISO-2022-CN |
ISO2022CN |
ISO 2022 CN 形式の GB2312 および CNS11643、簡体字および繁体字中国語 (Unicode への変換のみ) |
ISO-2022-JP |
ISO2022JP |
ISO 2022 形式の JIS X 0201、0208、日本語 |
ISO-2022-KR |
ISO2022KR |
ISO 2022 KR、韓国語 |
ISO-8859-3 |
ISO8859_3 |
ラテンアルファベット No. 3 |
ISO-8859-6 |
ISO8859_6 |
ラテン/アラビア語アルファベット |
ISO-8859-8 |
ISO8859_8 |
ラテン/ヘブライ語アルファベット |
JIS_X0201 |
JIS_X0201 |
JIS X 0201 |
JIS_X0212-1990 |
JIS_X0212-1990 |
JIS X 0212 |
Shift_JIS |
SJIS |
Shift-JIS、日本語 |
TIS-620 |
TIS620 |
TIS620、タイ |
windows-1255 |
Cp1255 |
Windows ヘブライ語 |
windows-1256 |
Cp1256 |
Windows アラビア語 |
windows-1258 |
Cp1258 |
Windows ベトナム語 |
windows-31j |
MS932 |
Windows 日本語 |
x-Big5-Solaris |
Big5_Solaris |
Big5 (Solaris zh_TW.BIG5 ロケール用の 7 つの追加 Hanzi 表意文字マッピング付き) |
x-euc-jp-linux |
EUC_JP_LINUX |
JISX 0201、0208、EUC エンコーディング、日本語 |
x-EUC-TW |
EUC_TW |
CNS11643 (Plane 1-7,15)、EUC エンコーディング、中国語 (繁体字) |
x-eucJP-Open |
EUC_JP_Solaris |
JISX 0201、0208、0212、EUC エンコーディング、日本語 |
x-IBM1006 |
Cp1006 |
IBM AIX パキスタン (ウルドゥー語) |
x-IBM1025 |
Cp1025 |
IBM 多言語キリル文字: ブルガリア、ボスニア、ヘルツェゴビナ、マケドニア (旧ユーゴスラビアマケドニア共和国) |
x-IBM1046 |
Cp1046 |
IBM アラビア語 - Windows |
x-IBM1097 |
Cp1097 |
IBM イラン (現代ペルシャ語)/ペルシャ語 |
x-IBM1098 |
Cp1098 |
IBM イラン (現代ペルシャ語)/ペルシャ語 (PC) |
x-IBM1112 |
Cp1112 |
IBM ラトビア、リトアニア |
x-IBM1122 |
Cp1122 |
IBM エストニア |
x-IBM1123 |
Cp1123 |
IBM ウクライナ |
x-IBM1124 |
Cp1124 |
IBM AIX ウクライナ |
x-IBM1381 |
Cp1381 |
IBM OS/2、DOS 中国 (中華人民共和国) |
x-IBM1383 |
Cp1383 |
IBM AIX 中国 (中華人民共和国) |
x-IBM33722 |
Cp33722 |
IBM-eucJP - 日本語 (5050 のスーパーセット) |
x-IBM834 |
Cp834 |
IBM EBCDIC DBCS 専用韓国語 |
x-IBM856 |
Cp856 |
IBM ヘブライ語 |
x-IBM875 |
Cp875 |
IBM ギリシャ語 |
x-IBM921 |
Cp921 |
IBM ラトビア、リトアニア (AIX、DOS) |
x-IBM922 |
Cp922 |
IBM エストニア (AIX、DOS) |
x-IBM930 |
Cp930 |
UDC 4370 文字を含む日本語カタカナ漢字、5026 のスーパーセット |
x-IBM933 |
Cp933 |
UDC 1880 文字を含む韓国語、5029 のスーパーセット |
x-IBM935 |
Cp935 |
UDC 1880 文字を含む簡体字中国語ホスト、5031 のスーパーセット |
x-IBM937 |
Cp937 |
UDC 6204 文字を含む繁体字中国語ホスト、5033 のスーパーセット |
x-IBM939 |
Cp939 |
UDC 4370 文字を含む日本語ラテン文字漢字、5035 のスーパーセット |
x-IBM942 |
Cp942 |
IBM OS/2 日本語、Cp932 のスーパーセット |
x-IBM942C |
Cp942C |
Cp942 の拡張機能 |
x-IBM943 |
Cp943 |
IBM OS/2 日本語、Cp932 および Shift-JIS のスーパーセット |
x-IBM943C |
Cp943C |
Cp943 の拡張機能 |
x-IBM948 |
Cp948 |
OS/2 中国語 (台湾)、938 のスーパーセット |
x-IBM949 |
Cp949 |
PC 韓国語 |
x-IBM949C |
Cp949C |
Cp949 の拡張機能 |
x-IBM950 |
Cp950 |
PC 中国語 (香港、台湾) |
x-IBM964 |
Cp964 |
AIX 中国語 (台湾) |
x-IBM970 |
Cp970 |
AIX 韓国語 |
x-ISCII91 |
ISCII91 |
インド語派 ISCII91 エンコーディング |
x-ISO2022-CN-CNS |
ISO2022_CN_CNS |
ISO 2022 CN 形式の CNS11643、繁体字中国語 (Unicode からの変換のみ) |
x-ISO2022-CN-GB |
ISO2022_CN_GB |
ISO 2022 CN 形式の GB2312、簡体字中国語 (Unicode からの変換のみ) |
x-iso-8859-11 |
x-iso-8859-11 |
ラテン/タイ語アルファベット |
x-JIS0208 |
x-JIS0208 |
JIS X 0208 |
x-JISAutoDetect |
JISAutoDetect |
Shift-JIS、EUC-JP、ISO 2022 JP の検出および変換 (Unicode への変換のみ) |
x-Johab |
x-Johab |
韓国語、Johab 文字セット |
x-MacArabic |
MacArabic |
Macintosh アラビア語 |
x-MacCentralEurope |
MacCentralEurope |
Macintosh ラテン文字-2 |
x-MacCroatian |
MacCroatian |
Macintosh クロアチア語 |
x-MacCyrillic |
MacCyrillic |
Macintosh キリル文字 |
x-MacDingbat |
MacDingbat |
Macintosh Dingbat |
x-MacGreek |
MacGreek |
Macintosh ギリシャ語 |
x-MacHebrew |
MacHebrew |
Macintosh ヘブライ語 |
x-MacIceland |
MacIceland |
Macintosh アイスランド語 |
x-MacRoman |
MacRoman |
Macintosh Roman |
x-MacRomania |
MacRomania |
Macintosh ルーマニア |
x-MacSymbol |
MacSymbol |
Macintosh シンボル |
x-MacThai |
MacThai |
Macintosh タイ |
x-MacTurkish |
MacTurkish |
Macintosh トルコ語 |
x-MacUkraine |
MacUkraine |
Macintosh ウクライナ |
x-MS950-HKSCS |
MS950_HKSCS |
Windows 繁体字中国語 (香港の拡張付き) |
x-mswin-936 |
MS936 |
Windows 簡体字中国語 |
x-PCK |
PCK |
Solaris 版の Shift_JIS |
x-SJIS_0213 |
x-SJIS_0213 |
Shift_JISX0213 |
x-windows-50220 |
Cp50220 |
Windows Codepage 50220 (7 ビット実装) |
x-windows-50221 |
Cp50221 |
Windows Codepage 50221 (7 ビット実装) |
x-windows-874 |
MS874 |
Windows タイ語 |
x-windows-949 |
MS949 |
Windows 韓国語 |
x-windows-950 |
MS950 |
Windows 繁体字中国語 |
x-windows-iso2022jp |
x-windows-iso2022jp |
拡張 ISO-2022-JP (MS932 ベース) |