java.io.InputStreamReader、java.io.OutputStreamWriter、java.lang.String、および java.nio.charset パッケージのクラスを使用すると、Unicode とその他のいくつかの文字エンコーディング間の変換を行うことができます。サポートされるエンコーディングは、Java Platform, Standard Edition 7 (Java SE 7) の実装によって異なります。Java Platform, Standard Edition 7 の各実装によるサポートが必要なエンコーディングの一覧は、 java.nio.charset.Charset のクラスの説明を参照してください。
Oracle の Java SE Development Kit 7 (Java SE 7) の全プラットフォーム (Solaris、Linux、Microsoft Windows) 版と Java SE Runtime Environment 7 (JRE 7) の Solaris および Linux 版は、このページに掲載されているすべてのエンコーディングをサポートしています。Oracle の JRE 7 の Microsoft Windows 版は、完全な国際版とヨーロッパ言語版のどちらのバージョンでもインストールすることができます。JRE 7 のインストールプログラムは、ホストオペレーティングシステムがヨーロッパ言語だけをサポートしていることを識別すると、デフォルトでヨーロッパ言語版をインストールします。インストールプログラムがほかの言語の必要性を識別した場合、またはカスタマイズされたインストールでユーザーがヨーロッパ言語以外のサポートを要求した場合は、完全な国際化版がインストールされます。ヨーロッパ言語版では、次の基本エンコーディングセットの表に掲載されているエンコーディングだけがサポートされます。lib/charsets.jar ファイルを含む国際化版では、このページに示すエンコーディングがすべてサポートされています。
次の各表は、Java SE 7 でサポートされているエンコーディングセットを示します。新しい java.nio API で使用される正準名は、多くの場合、java.io API および java.lang API で使用される名前とは異なります。
| 
 
  | 
 
  | 
 説明  | 
|---|---|---|
| 
 IBM00858  | 
 Cp858  | 
 Cp850 の拡張機能でユーロ文字を含む  | 
| 
 IBM437  | 
 Cp437  | 
 MS-DOS 米国、オーストラリア、ニュージーランド、南アフリカ  | 
| 
 IBM775  | 
 Cp775  | 
 PC バルト諸語  | 
| 
 IBM850  | 
 Cp850  | 
 MS-DOS ラテン文字-1  | 
| 
 IBM852  | 
 Cp852  | 
 MS-DOS ラテン文字-2  | 
| 
 IBM855  | 
 Cp855  | 
 IBM キリル文字  | 
| 
 IBM857  | 
 Cp857  | 
 IBM トルコ語  | 
| 
 IBM862  | 
 Cp862  | 
 PC ヘブライ語  | 
| 
 IBM866  | 
 Cp866  | 
 MS-DOS ロシア語  | 
| 
 ISO-8859-1  | 
 ISO8859_1  | 
 ISO -8859-1、ラテンアルファベット No. 1  | 
| 
 ISO-8859-2  | 
 ISO8859_2  | 
 ラテンアルファベット No. 2  | 
| 
 ISO-8859-4  | 
 ISO8859_4  | 
 ラテンアルファベット No. 4  | 
| 
 ISO-8859-5  | 
 ISO8859_5  | 
 ラテン/キリル文字アルファベット  | 
| 
 ISO-8859-7  | 
 ISO8859_7  | 
 ラテン/ギリシャ文字アルファベット (ISO-8859-7:2003)  | 
| 
 ISO-8859-9  | 
 ISO8859_9  | 
 ラテンアルファベット No. 5  | 
| 
 ISO-8859-13  | 
 ISO8859_13  | 
 ラテンアルファベット No. 7  | 
| 
 ISO-8859-15  | 
 ISO8859_15  | 
 ラテンアルファベット No. 9  | 
| 
 KOI8-R  | 
 KOI8_R  | 
 KOI8-R、ロシア語  | 
| 
 KOI8-U  | 
 KOI8_U  | 
 KOI8-U、ウクライナ語  | 
| 
 US-ASCII  | 
 ASCII  | 
 American Standard Code for Information Interchange  | 
| 
 UTF-8  | 
 UTF8  | 
 8 ビット Unicode (UCS) Transformation Format  | 
| 
 UTF-16  | 
 UTF-16  | 
 16 ビット Unicode (UCS) Transformation Format、オプションのバイト順マークによって識別されるバイト順  | 
| 
 UTF-16BE  | 
 UnicodeBigUnmarked  | 
 16 ビット Unicode (UCS) Transformation Format、ビッグエンディアンバイト順  | 
| 
 UTF-16LE  | 
 UnicodeLittleUnmarked  | 
 16 ビット Unicode (UCS) Transformation Format、リトルエンディアンバイト順  | 
| 
 UTF-32  | 
 UTF_32  | 
 32 ビット Unicode (UCS) Transformation Format、オプションのバイト順マークによって識別されるバイト順  | 
| 
 UTF-32BE  | 
 UTF_32BE  | 
 32 ビット Unicode (UCS) Transformation Format、ビッグエンディアンバイト順  | 
| 
 UTF-32LE  | 
 UTF_32LE  | 
 32 ビット Unicode (UCS) Transformation Format、リトルエンディアンバイト順  | 
| 
 x-UTF-32BE-BOM  | 
 UTF_32BE_BOM  | 
 32 ビット Unicode (UCS) Transformation Format、ビッグエンディアンバイト順、バイト順マーク付き  | 
| 
 x-UTF-32LE-BOM  | 
 UTF_32LE_BOM  | 
 32 ビット Unicode (UCS) Transformation Format、リトルエンディアンバイト順、バイト順マーク付き  | 
| 
 windows-1250  | 
 Cp1250  | 
 Windows 東欧  | 
| 
 windows-1251  | 
 Cp1251  | 
 Windows キリル文字  | 
| 
 windows-1252  | 
 Cp1252  | 
 Windows ラテン文字-1  | 
| 
 windows-1253  | 
 Cp1253  | 
 Windows ギリシャ文字  | 
| 
 windows-1254  | 
 Cp1254  | 
 Windows トルコ語  | 
| 
 windows-1257  | 
 Cp1257  | 
 Windows バルト諸語  | 
| 
 利用できない  | 
 UnicodeBig  | 
 16 ビット Unicode (UCS) Transformation Format、ビッグエンディアンバイト順、バイト順マーク付き  | 
| 
 x-IBM737  | 
 Cp737  | 
 PC ギリシャ文字  | 
| 
 x-IBM874  | 
 Cp874  | 
 IBM タイ  | 
| 
 x-UTF-16LE-BOM  | 
 UnicodeLittle  | 
 16 ビット Unicode (UCS) Transformation Format、リトルエンディアンバイト順、バイト順マーク付き  | 
| 
 
  | 
 
  | 
 説明  | 
|---|---|---|
| 
 Big5  | 
 Big5  | 
 Big5、中国語 (繁体字)  | 
| 
 Big5-HKSCS  | 
 Big5_HKSCS  | 
 Big5 (香港の拡張付き)、中国語 (繁体字、2001 改訂を組み込み)  | 
| 
 EUC-JP  | 
 EUC_JP  | 
 JISX 0201、0208、0212、EUC エンコーディング、日本語  | 
| 
 EUC-KR  | 
 EUC_KR  | 
 KS C 5601、EUC エンコーディング、韓国語  | 
| 
 GB18030  | 
 GB18030  | 
 中国語 (簡体字)、中華人民共和国標準  | 
| 
 GB2312  | 
 EUC_CN  | 
 GB2312、EUC エンコーディング、中国語 (簡体字)  | 
| 
 GBK  | 
 GBK  | 
 GBK、中国語 (簡体字)  | 
| 
 IBM-Thai  | 
 Cp838  | 
 IBM タイ拡張 SBCS  | 
| 
 IBM01140  | 
 Cp1140  | 
 Cp037 の拡張機能でユーロ文字を含む  | 
| 
 IBM01141  | 
 Cp1141  | 
 Cp273 の拡張機能でユーロ文字を含む  | 
| 
 IBM01142  | 
 Cp1142  | 
 Cp277 の拡張機能でユーロ文字を含む  | 
| 
 IBM01143  | 
 Cp1143  | 
 Cp278 の拡張機能でユーロ文字を含む  | 
| 
 IBM01144  | 
 Cp1144  | 
 Cp280 の拡張機能でユーロ文字を含む  | 
| 
 IBM01145  | 
 Cp1145  | 
 Cp284 の拡張機能でユーロ文字を含む  | 
| 
 IBM01146  | 
 Cp1146  | 
 Cp285 の拡張機能でユーロ文字を含む  | 
| 
 IBM01147  | 
 Cp1147  | 
 Cp297 の拡張機能でユーロ文字を含む  | 
| 
 IBM01148  | 
 Cp1148  | 
 Cp500 の拡張機能でユーロ文字を含む  | 
| 
 IBM01149  | 
 Cp1149  | 
 Cp871 の拡張機能でユーロ文字を含む  | 
| 
 IBM037  | 
 Cp037  | 
 米国、カナダ (2 か国語、フランス語)、オランダ、ポルトガル、ブラジル、オーストラリア  | 
| 
 IBM1026  | 
 Cp1026  | 
 IBM ラテン文字-5、トルコ  | 
| 
 IBM1047  | 
 Cp1047  | 
 ラテン文字-1 (EBCDIC ホスト用)  | 
| 
 IBM273  | 
 Cp273  | 
 IBM オーストリア、ドイツ  | 
| 
 IBM277  | 
 Cp277  | 
 IBM デンマーク、ノルウェー  | 
| 
 IBM278  | 
 Cp278  | 
 IBM フィンランド、スウェーデン  | 
| 
 IBM280  | 
 Cp280  | 
 IBM イタリア  | 
| 
 IBM284  | 
 Cp284  | 
 IBM カタロニア語/スペイン、スペイン語圏ラテンアメリカ  | 
| 
 IBM285  | 
 Cp285  | 
 IBM 英国、アイルランド  | 
| 
 IBM297  | 
 Cp297  | 
 IBM フランス  | 
| 
 IBM420  | 
 Cp420  | 
 IBM アラビア語  | 
| 
 IBM424  | 
 Cp424  | 
 IBM ヘブライ語  | 
| 
 IBM500  | 
 Cp500  | 
 EBCDIC 500V1  | 
| 
 IBM860  | 
 Cp860  | 
 MS-DOS ポルトガル語  | 
| 
 IBM861  | 
 Cp861  | 
 MS-DOS アイスランド語  | 
| 
 IBM863  | 
 Cp863  | 
 MS-DOS カナダ系フランス語  | 
| 
 IBM864  | 
 Cp864  | 
 PC アラビア語  | 
| 
 IBM865  | 
 Cp865  | 
 MS-DOS 北欧  | 
| 
 IBM868  | 
 Cp868  | 
 MS-DOS パキスタン  | 
| 
 IBM869  | 
 Cp869  | 
 IBM 近代ギリシャ語  | 
| 
 IBM870  | 
 Cp870  | 
 IBM 多言語ラテン文字-2  | 
| 
 IBM871  | 
 Cp871  | 
 IBM アイスランド  | 
| 
 IBM918  | 
 Cp918  | 
 IBM パキスタン (ウルドゥー語)  | 
| 
 ISO-2022-CN  | 
 ISO2022CN  | 
 ISO 2022 CN 形式の GB2312 および CNS11643、簡体字および繁体字中国語 (Unicode への変換のみ)  | 
| 
 ISO-2022-JP  | 
 ISO2022JP  | 
 ISO 2022 形式の JIS X 0201、0208、日本語  | 
| 
 ISO-2022-KR  | 
 ISO2022KR  | 
 ISO 2022 KR、韓国語  | 
| 
 ISO-8859-3  | 
 ISO8859_3  | 
 ラテンアルファベット No. 3  | 
| 
 ISO-8859-6  | 
 ISO8859_6  | 
 ラテン/アラビア語アルファベット  | 
| 
 ISO-8859-8  | 
 ISO8859_8  | 
 ラテン/ヘブライ語アルファベット  | 
| 
 JIS_X0201  | 
 JIS_X0201  | 
 JIS X 0201  | 
| 
 JIS_X0212-1990  | 
 JIS_X0212-1990  | 
 JIS X 0212  | 
| 
 Shift_JIS  | 
 SJIS  | 
 Shift-JIS、日本語  | 
| 
 TIS-620  | 
 TIS620  | 
 TIS620、タイ  | 
| 
 windows-1255  | 
 Cp1255  | 
 Windows ヘブライ語  | 
| 
 windows-1256  | 
 Cp1256  | 
 Windows アラビア語  | 
| 
 windows-1258  | 
 Cp1258  | 
 Windows ベトナム語  | 
| 
 windows-31j  | 
 MS932  | 
 Windows 日本語  | 
| 
 x-Big5-Solaris  | 
 Big5_Solaris  | 
 Big5 (Solaris zh_TW.BIG5 ロケール用の 7 つの追加 Hanzi 表意文字マッピング付き)  | 
| 
 x-euc-jp-linux  | 
 EUC_JP_LINUX  | 
 JISX 0201、0208、EUC エンコーディング、日本語  | 
| 
 x-EUC-TW  | 
 EUC_TW  | 
 CNS11643 (Plane 1-7,15)、EUC エンコーディング、中国語 (繁体字)  | 
| 
 x-eucJP-Open  | 
 EUC_JP_Solaris  | 
 JISX 0201、0208、0212、EUC エンコーディング、日本語  | 
| 
 x-IBM1006  | 
 Cp1006  | 
 IBM AIX パキスタン (ウルドゥー語)  | 
| 
 x-IBM1025  | 
 Cp1025  | 
 IBM 多言語キリル文字: ブルガリア、ボスニア、ヘルツェゴビナ、マケドニア (旧ユーゴスラビアマケドニア共和国)  | 
| 
 x-IBM1046  | 
 Cp1046  | 
 IBM アラビア語 - Windows  | 
| 
 x-IBM1097  | 
 Cp1097  | 
 IBM イラン (現代ペルシャ語)/ペルシャ語  | 
| 
 x-IBM1098  | 
 Cp1098  | 
 IBM イラン (現代ペルシャ語)/ペルシャ語 (PC)  | 
| 
 x-IBM1112  | 
 Cp1112  | 
 IBM ラトビア、リトアニア  | 
| 
 x-IBM1122  | 
 Cp1122  | 
 IBM エストニア  | 
| 
 x-IBM1123  | 
 Cp1123  | 
 IBM ウクライナ  | 
| 
 x-IBM1124  | 
 Cp1124  | 
 IBM AIX ウクライナ  | 
| 
 x-IBM1381  | 
 Cp1381  | 
 IBM OS/2、DOS 中国 (中華人民共和国)  | 
| 
 x-IBM1383  | 
 Cp1383  | 
 IBM AIX 中国 (中華人民共和国)  | 
| 
 x-IBM33722  | 
 Cp33722  | 
 IBM-eucJP - 日本語 (5050 のスーパーセット)  | 
| 
 x-IBM834  | 
 Cp834  | 
 IBM EBCDIC DBCS 専用韓国語  | 
| 
 x-IBM856  | 
 Cp856  | 
 IBM ヘブライ語  | 
| 
 x-IBM875  | 
 Cp875  | 
 IBM ギリシャ語  | 
| 
 x-IBM921  | 
 Cp921  | 
 IBM ラトビア、リトアニア (AIX、DOS)  | 
| 
 x-IBM922  | 
 Cp922  | 
 IBM エストニア (AIX、DOS)  | 
| 
 x-IBM930  | 
 Cp930  | 
 UDC 4370 文字を含む日本語カタカナ漢字、5026 のスーパーセット  | 
| 
 x-IBM933  | 
 Cp933  | 
 UDC 1880 文字を含む韓国語、5029 のスーパーセット  | 
| 
 x-IBM935  | 
 Cp935  | 
 UDC 1880 文字を含む簡体字中国語ホスト、5031 のスーパーセット  | 
| 
 x-IBM937  | 
 Cp937  | 
 UDC 6204 文字を含む繁体字中国語ホスト、5033 のスーパーセット  | 
| 
 x-IBM939  | 
 Cp939  | 
 UDC 4370 文字を含む日本語ラテン文字漢字、5035 のスーパーセット  | 
| 
 x-IBM942  | 
 Cp942  | 
 IBM OS/2 日本語、Cp932 のスーパーセット  | 
| 
 x-IBM942C  | 
 Cp942C  | 
 Cp942 の拡張機能  | 
| 
 x-IBM943  | 
 Cp943  | 
 IBM OS/2 日本語、Cp932 および Shift-JIS のスーパーセット  | 
| 
 x-IBM943C  | 
 Cp943C  | 
 Cp943 の拡張機能  | 
| 
 x-IBM948  | 
 Cp948  | 
 OS/2 中国語 (台湾)、938 のスーパーセット  | 
| 
 x-IBM949  | 
 Cp949  | 
 PC 韓国語  | 
| 
 x-IBM949C  | 
 Cp949C  | 
 Cp949 の拡張機能  | 
| 
 x-IBM950  | 
 Cp950  | 
 PC 中国語 (香港、台湾)  | 
| 
 x-IBM964  | 
 Cp964  | 
 AIX 中国語 (台湾)  | 
| 
 x-IBM970  | 
 Cp970  | 
 AIX 韓国語  | 
| 
 x-ISCII91  | 
 ISCII91  | 
 インド語派 ISCII91 エンコーディング  | 
| 
 x-ISO2022-CN-CNS  | 
 ISO2022_CN_CNS  | 
 ISO 2022 CN 形式の CNS11643、繁体字中国語 (Unicode からの変換のみ)  | 
| 
 x-ISO2022-CN-GB  | 
 ISO2022_CN_GB  | 
 ISO 2022 CN 形式の GB2312、簡体字中国語 (Unicode からの変換のみ)  | 
| 
 x-iso-8859-11  | 
 x-iso-8859-11  | 
 ラテン/タイ語アルファベット  | 
| 
 x-JIS0208  | 
 x-JIS0208  | 
 JIS X 0208  | 
| 
 x-JISAutoDetect  | 
 JISAutoDetect  | 
 Shift-JIS、EUC-JP、ISO 2022 JP の検出および変換 (Unicode への変換のみ)  | 
| 
 x-Johab  | 
 x-Johab  | 
 韓国語、Johab 文字セット  | 
| 
 x-MacArabic  | 
 MacArabic  | 
 Macintosh アラビア語  | 
| 
 x-MacCentralEurope  | 
 MacCentralEurope  | 
 Macintosh ラテン文字-2  | 
| 
 x-MacCroatian  | 
 MacCroatian  | 
 Macintosh クロアチア語  | 
| 
 x-MacCyrillic  | 
 MacCyrillic  | 
 Macintosh キリル文字  | 
| 
 x-MacDingbat  | 
 MacDingbat  | 
 Macintosh Dingbat  | 
| 
 x-MacGreek  | 
 MacGreek  | 
 Macintosh ギリシャ語  | 
| 
 x-MacHebrew  | 
 MacHebrew  | 
 Macintosh ヘブライ語  | 
| 
 x-MacIceland  | 
 MacIceland  | 
 Macintosh アイスランド語  | 
| 
 x-MacRoman  | 
 MacRoman  | 
 Macintosh Roman  | 
| 
 x-MacRomania  | 
 MacRomania  | 
 Macintosh ルーマニア  | 
| 
 x-MacSymbol  | 
 MacSymbol  | 
 Macintosh シンボル  | 
| 
 x-MacThai  | 
 MacThai  | 
 Macintosh タイ  | 
| 
 x-MacTurkish  | 
 MacTurkish  | 
 Macintosh トルコ語  | 
| 
 x-MacUkraine  | 
 MacUkraine  | 
 Macintosh ウクライナ  | 
| 
 x-MS950-HKSCS  | 
 MS950_HKSCS  | 
 Windows 繁体字中国語 (香港の拡張付き)  | 
| 
 x-mswin-936  | 
 MS936  | 
 Windows 簡体字中国語  | 
| 
 x-PCK  | 
 PCK  | 
 Solaris 版の Shift_JIS  | 
| 
 x-SJIS_0213  | 
 x-SJIS_0213  | 
 Shift_JISX0213  | 
| 
 x-windows-50220  | 
 Cp50220  | 
 Windows Codepage 50220 (7 ビット実装)  | 
| 
 x-windows-50221  | 
 Cp50221  | 
 Windows Codepage 50221 (7 ビット実装)  | 
| 
 x-windows-874  | 
 MS874  | 
 Windows タイ語  | 
| 
 x-windows-949  | 
 MS949  | 
 Windows 韓国語  | 
| 
 x-windows-950  | 
 MS950  | 
 Windows 繁体字中国語  | 
| 
 x-windows-iso2022jp  | 
 x-windows-iso2022jp  | 
 拡張 ISO-2022-JP (MS932 ベース)  |