JavaTM Platform
Standard Ed. 6

java.lang
クラス Character

java.lang.Object
  上位を拡張 java.lang.Character
すべての実装されたインタフェース:
Serializable, Comparable<Character>

public final class Character
extends Object
implements Serializable, Comparable<Character>

Character クラスは、プリミティブ型 char の値をオブジェクトにラップします。Character 型のオブジェクトには、型が char の単一フィールドが含まれます。

また、このクラスは、文字のカテゴリ (小文字、数字など) を決定したり、大文字から小文字 (およびその逆) の変換を行ういくつかのメソッドも提供します。

文字情報は、Unicode Standard、バージョン 4.0 に基づきます。

Character クラスのメソッドおよびデータは、UnicodeData ファイル内の情報により定義されます。 このファイルは、Unicode Consortium がメンテナンスを行っている Unicode Character Database の一部です。このファイルは、定義済みの Unicode コードポイントまたは文字範囲ごとの名前やカテゴリを含むさまざまなプロパティーを指定します。

ファイルおよびその説明は、次のサイトの Unicode Consortium から入手できます。

Unicode 文字表現

 

char データ型 (Character オブジェクトにカプセル化される値) は、本来の Unicode 仕様に基づいています。 Unicode 仕様は、固定幅 16 ビットエンティティーとして定義されています。Unicode 標準は、16 ビット以上の表現を必要とする文字を許容するように変更されています。適正な「コードポイント」の範囲は、現在 U+0000 〜 U+10FFFF であり、「Unicode スカラー値」として知られています(Unicode 標準の U+n 表記の定義を参照)。  

U+0000 〜 U+FFFF の文字セットは、「基本多言語面 (BMP)」と呼ばれる場合もあります。U+FFFF よりも大きいコードポイントを持つ文字は、「補助文字」と呼ばれています。 Java 2 プラットフォームは、char 配列、String クラスおよび StringBuffer クラスで UTF-16 表現を使います。UTF-16 表現では、補助文字は char 値のペアとして表現され、「上位サロゲート」範囲 (\uD800-\uDBFF) からの最初の値と、「下位サロゲート」範囲 (\uDC00-\uDFFF) からの第 2 の値から構成されています。  

したがって、 char 値は、サロゲートコードポイントや UTF-16 エンコーディングのコード単位を含む基本多言語面 (BMP) コードポイントを表します。int 値は、補助コードポイントを含むすべての Unicode コードポイントを表します。int の下位 (最下位) 21 ビットは、Unicode コードポイントを表すために使用され、上位 (最上位) 11 ビットはゼロである必要があります。特に指定されないかぎり、補助文字とサロゲート char 値に関する動作は次のとおりです。

 

Java SE API ドキュメンテーションでは、U+0000 〜 U+10FFFF の範囲の文字値に「Unicode コードポイント」を使用し、「UTF-16」エンコーディングのコード単位である 16 ビット char 値に「Unicode コード単位」を使用します。Unicode 用語の詳細は、「Glossary of Unicode Terms」を参照してください。

導入されたバージョン:
1.0
関連項目:
直列化された形式

入れ子のクラスの概要
static class Character.Subset
          このクラスのインスタンスは、Unicode 文字セットの特定のサブセットを表します。
static class Character.UnicodeBlock
          Unicode 仕様で定義されている文字ブロックを表す文字サブセットのファミリ。
 
フィールドの概要
static byte COMBINING_SPACING_MARK
          Unicode 仕様の汎用カテゴリ「Mc」
static byte CONNECTOR_PUNCTUATION
          Unicode 仕様の汎用カテゴリ「Pc」
static byte CONTROL
          Unicode 仕様の汎用カテゴリ「Cc」
static byte CURRENCY_SYMBOL
          Unicode 仕様の汎用カテゴリ「Sc」
static byte DASH_PUNCTUATION
          Unicode 仕様の汎用カテゴリ「Pd」
static byte DECIMAL_DIGIT_NUMBER
          Unicode 仕様の汎用カテゴリ「Nd」
static byte DIRECTIONALITY_ARABIC_NUMBER
          Unicode 仕様の弱い双方向文字タイプ「AN」
static byte DIRECTIONALITY_BOUNDARY_NEUTRAL
          Unicode 仕様の弱い双方向文字タイプ「BN」
static byte DIRECTIONALITY_COMMON_NUMBER_SEPARATOR
          Unicode 仕様の弱い双方向文字タイプ「CS」
static byte DIRECTIONALITY_EUROPEAN_NUMBER
          Unicode 仕様の弱い双方向文字タイプ「EN」
static byte DIRECTIONALITY_EUROPEAN_NUMBER_SEPARATOR
          Unicode 仕様の弱い双方向文字タイプ「ES」
static byte DIRECTIONALITY_EUROPEAN_NUMBER_TERMINATOR
          Unicode 仕様の弱い双方向文字タイプ「ET」
static byte DIRECTIONALITY_LEFT_TO_RIGHT
          Unicode 仕様の強力な双方向文字タイプ「L」
static byte DIRECTIONALITY_LEFT_TO_RIGHT_EMBEDDING
          Unicode 仕様の強力な双方向文字タイプ「LRE」
static byte DIRECTIONALITY_LEFT_TO_RIGHT_OVERRIDE
          Unicode 仕様の強力な双方向文字タイプ「LRO」
static byte DIRECTIONALITY_NONSPACING_MARK
          Unicode 仕様の弱い双方向文字タイプ「NSM」
static byte DIRECTIONALITY_OTHER_NEUTRALS
          Unicode 仕様のニュートラルな双方向文字タイプ「ON」
static byte DIRECTIONALITY_PARAGRAPH_SEPARATOR
          Unicode 仕様のニュートラルな双方向文字タイプ「B」
static byte DIRECTIONALITY_POP_DIRECTIONAL_FORMAT
          Unicode 仕様の弱い双方向文字タイプ「PDF」
static byte DIRECTIONALITY_RIGHT_TO_LEFT
          Unicode 仕様の強力な双方向文字タイプ「R」
static byte DIRECTIONALITY_RIGHT_TO_LEFT_ARABIC
          Unicode 仕様の強力な双方向文字タイプ「AL」
static byte DIRECTIONALITY_RIGHT_TO_LEFT_EMBEDDING
          Unicode 仕様の強力な双方向文字タイプ「RLE」
static byte DIRECTIONALITY_RIGHT_TO_LEFT_OVERRIDE
          Unicode 仕様の強力な双方向文字タイプ「RLO」
static byte DIRECTIONALITY_SEGMENT_SEPARATOR
          Unicode 仕様のニュートラルな双方向文字タイプ「S」
static byte DIRECTIONALITY_UNDEFINED
          未定義の双方向文字タイプ。
static byte DIRECTIONALITY_WHITESPACE
          Unicode 仕様のニュートラルな双方向文字タイプ「WS」
static byte ENCLOSING_MARK
          Unicode 仕様の汎用カテゴリ「Me」
static byte END_PUNCTUATION
          Unicode 仕様の汎用カテゴリ「Pe」
static byte FINAL_QUOTE_PUNCTUATION
          Unicode 仕様の汎用カテゴリ「Pf」
static byte FORMAT
          Unicode 仕様の汎用カテゴリ「Cf」
static byte INITIAL_QUOTE_PUNCTUATION
          Unicode 仕様の汎用カテゴリ「Pi」
static byte LETTER_NUMBER
          Unicode 仕様の汎用カテゴリ「Nl」
static byte LINE_SEPARATOR
          Unicode 仕様の汎用カテゴリ「Zl」
static byte LOWERCASE_LETTER
          Unicode 仕様の汎用カテゴリ「Ll」
static byte MATH_SYMBOL
          Unicode 仕様の汎用カテゴリ「Sm」
static int MAX_CODE_POINT
          Unicode コードポイントの最大値
static char MAX_HIGH_SURROGATE
          UTF-16 エンコーディングでの Unicode 上位サロゲートコード単位の最大値。
static char MAX_LOW_SURROGATE
          UTF-16 エンコーディングでの Unicode 下位サロゲートコード単位の最大値。
static int MAX_RADIX
          文字列との変換に使用可能な最大基数です。
static char MAX_SURROGATE
          UTF-16 エンコーディングでの Unicode サロゲートコード単位の最大値
static char MAX_VALUE
          このフィールドの定数値は、char 型の最大値 '\uFFFF' です。
static int MIN_CODE_POINT
          Unicode コードポイントの最小値
static char MIN_HIGH_SURROGATE
          UTF-16 エンコーディングでの Unicode 上位サロゲートコード単位の最小値。
static char MIN_LOW_SURROGATE
          UTF-16 エンコーディングでの Unicode 下位サロゲートコード単位の最小値。
static int MIN_RADIX
          文字列との変換に使用可能な最小基数です。
static int MIN_SUPPLEMENTARY_CODE_POINT
          補助コードポイントの最小値
static char MIN_SURROGATE
          UTF-16 エンコーディングでの Unicode サロゲートコード単位の最小値
static char MIN_VALUE
          このフィールドの定数値は、char 型の最小値 '\u0000' です。
static byte MODIFIER_LETTER
          Unicode 仕様の汎用カテゴリ「Lm」
static byte MODIFIER_SYMBOL
          Unicode 仕様の汎用カテゴリ「Sk」
static byte NON_SPACING_MARK
          Unicode 仕様の汎用カテゴリ「Mn」
static byte OTHER_LETTER
          Unicode 仕様の汎用カテゴリ「Lo」
static byte OTHER_NUMBER
          Unicode 仕様の汎用カテゴリ「No」
static byte OTHER_PUNCTUATION
          Unicode 仕様の汎用カテゴリ「Po」
static byte OTHER_SYMBOL
          Unicode 仕様の汎用カテゴリ「So」
static byte PARAGRAPH_SEPARATOR
          Unicode 仕様の汎用カテゴリ「Zp」
static byte PRIVATE_USE
          Unicode 仕様の汎用カテゴリ「Co」
static int SIZE
          符号なしバイナリ形式で char 値を表すのに使用されるビット数
static byte SPACE_SEPARATOR
          Unicode 仕様の汎用カテゴリ「Zs」
static byte START_PUNCTUATION
          Unicode 仕様の汎用カテゴリ「Ps」
static byte SURROGATE
          Unicode 仕様の汎用カテゴリ「Cs」
static byte TITLECASE_LETTER
          Unicode 仕様の汎用カテゴリ「Lt」
static Class<Character> TYPE
          char のプリミティブ型を表す Class インスタンス
static byte UNASSIGNED
          Unicode 仕様の汎用カテゴリ「Cn」
static byte UPPERCASE_LETTER
          Unicode 仕様の汎用カテゴリ「Lu」
 
コンストラクタの概要
Character(char value)
          指定された char 値を表す、新しく割り当てられた Character オブジェクトを構築します。
 
メソッドの概要
static int charCount(int codePoint)
          指定された文字 (Unicode コードポイント) を表すのに必要な char 値の数を判定します。
 char charValue()
          この Character オブジェクトの値を返します。
static int codePointAt(char[] a, int index)
          char 配列の指定されたインデックスにあるコードポイントを返します。
static int codePointAt(char[] a, int index, int limit)
          limit の長さ未満の index を持つ配列要素のみを使用可能な、char 配列の指定されたインデックスにあるコードポイントを返します。
static int codePointAt(CharSequence seq, int index)
          CharSequence の指定されたインデックスにあるコードポイントを返します。
static int codePointBefore(char[] a, int index)
          char 配列の指定されたインデックスの前にあるコードポイントを返します。
static int codePointBefore(char[] a, int index, int start)
          start 以上の index を持つ配列要素のみを使用可能な、char 配列の指定されたインデックスの前にあるコードポイントを返します。
static int codePointBefore(CharSequence seq, int index)
          CharSequence の指定されたインデックスの前にあるコードポイントを返します。
static int codePointCount(char[] a, int offset, int count)
          char 配列引数の部分配列内の Unicode コードポイントの数を返します。
static int codePointCount(CharSequence seq, int beginIndex, int endIndex)
          指定された char シーケンスのテキスト範囲内の Unicode コードポイントの数を返します。
 int compareTo(Character anotherCharacter)
          2 つの Character オブジェクトを数値的に比較します。
static int digit(char ch, int radix)
          指定された基数での、文字 ch の数値としての値を返します。
static int digit(int codePoint, int radix)
          指定された基数の指定された文字 (Unicode コードポイント) の数値を返します。
 boolean equals(Object obj)
          オブジェクトと指定されたオブジェクトを比較します。
static char forDigit(int digit, int radix)
          指定された基数での、指定された数字の文字表現を判定します。
static byte getDirectionality(char ch)
          指定された文字の Unicode 方向性プロパティーを返します。
static byte getDirectionality(int codePoint)
          所定の文字 (Unicode コードポイント) の Unicode 方向性プロパティーを返します。
static int getNumericValue(char ch)
          指定された Unicode 文字の表す int 値を返します。
static int getNumericValue(int codePoint)
          指定された文字 (Unicode コードポイント) が表す int 値を返します。
static int getType(char ch)
          文字の汎用カテゴリを示す値を返します。
static int getType(int codePoint)
          文字の汎用カテゴリを示す値を返します。
 int hashCode()
          Character のハッシュコードを返します。
static boolean isDefined(char ch)
          文字が Unicode で定義されているかどうかを判定します。
static boolean isDefined(int codePoint)
          文字 (Unicodeコードポイント) が Unicode で定義されているかどうかを判定します。
static boolean isDigit(char ch)
          指定された文字が数字かどうかを判定します。
static boolean isDigit(int codePoint)
          指定された文字 (Unicode コードポイント) が数字かどうかを判定します。
static boolean isHighSurrogate(char ch)
          指定された char 値が上位サロゲートコード単位 (「リーディングサロゲートコード単位」ともいう) であるかどうかを判定します。
static boolean isIdentifierIgnorable(char ch)
          指定された文字が、Java 識別子または Unicode 識別子内で無視可能な文字かどうかを判定します。
static boolean isIdentifierIgnorable(int codePoint)
          指定された文字 (Unicode コードポイント) が、Java 識別子または Unicode 識別子内で無視可能な文字かどうかを判定します。
static boolean isISOControl(char ch)
          指定された文字が ISO 制御文字かどうかを判定します。
static boolean isISOControl(int codePoint)
          参照された文字 (Unicode コードポイント) が ISO 制御文字かどうかを判定します。
static boolean isJavaIdentifierPart(char ch)
          指定された文字を Java 識別子の最初の文字以外に使用可能かどうかを判定します。
static boolean isJavaIdentifierPart(int codePoint)
          文字 (Unicode コードポイント) を Java 識別子の最初の文字以外に使用可能かどうかを判定します。
static boolean isJavaIdentifierStart(char ch)
          指定された文字を Java 識別子の最初の文字として指定可能かどうかを判定します。
static boolean isJavaIdentifierStart(int codePoint)
          指定された文字 (Unicode コードポイント) を Java 識別子の最初の文字として指定可能かどうかを判定します。
static boolean isJavaLetter(char ch)
          推奨されていません。 isJavaIdentifierStart(char) に置き換えられました。
static boolean isJavaLetterOrDigit(char ch)
          推奨されていません。 isJavaIdentifierPart(char) に置き換えられました。
static boolean isLetter(char ch)
          指定された文字が汎用文字かどうかを判定します。
static boolean isLetter(int codePoint)
          指定された文字 (Unicode コードポイント) が汎用文字かどうかを判定します。
static boolean isLetterOrDigit(char ch)
          指定された文字が汎用文字または数字かどうかを判定します。
static boolean isLetterOrDigit(int codePoint)
          指定された文字 (Unicode コードポイント) が汎用文字または数字かどうかを判定します。
static boolean isLowerCase(char ch)
          指定された文字が小文字かどうかを判定します。
static boolean isLowerCase(int codePoint)
          指定された文字 (Unicode コードポイント) が小文字かどうかを判定します。
static boolean isLowSurrogate(char ch)
          指定された char 値が下位サロゲートコード単位 (「トレーリングサロゲートコード単位」ともいう) であるかどうかを判定します。
static boolean isMirrored(char ch)
          Unicode 仕様に従って文字をミラー化するかどうかを判定します。
static boolean isMirrored(int codePoint)
          Unicode 仕様に従って、指定された文字 (Unicode コードポイント) をミラー化するかどうかを判定します。
static boolean isSpace(char ch)
          推奨されていません。 isWhitespace(char) に置き換えられました。
static boolean isSpaceChar(char ch)
          指定された文字が Unicode の空白文字かどうかを判定します。
static boolean isSpaceChar(int codePoint)
          指定された文字 (Unicode コードポイント) が Unicode の空白文字かどうかを判定します。
static boolean isSupplementaryCodePoint(int codePoint)
          指定された文字 (Unicode コードポイント) が補助文字の範囲にあるかどうかを判定します。
static boolean isSurrogatePair(char high, char low)
          指定された char 値のペアが有効なサロゲートペアであるかどうかを判定します。
static boolean isTitleCase(char ch)
          指定された文字がタイトルケース文字かどうかを判定します。
static boolean isTitleCase(int codePoint)
          指定された文字 (Unicode コードポイント) がタイトルケース文字かどうかを判定します。
static boolean isUnicodeIdentifierPart(char ch)
          指定された文字を Unicode 識別子の最初の文字以外に使用可能かどうかを判定します。
static boolean isUnicodeIdentifierPart(int codePoint)
          指定された文字 (Unicode コードポイント) を Unicode 識別子の最初の文字以外に使用可能かどうかを判定します。
static boolean isUnicodeIdentifierStart(char ch)
          指定された文字を Unicode 識別子の最初の文字として指定可能かどうかを判定します。
static boolean isUnicodeIdentifierStart(int codePoint)
          指定された文字 (Unicode コードポイント) を Unicode 識別子の最初の文字として指定可能かどうかを判定します。
static boolean isUpperCase(char ch)
          指定された文字が大文字がどうかを判定します。
static boolean isUpperCase(int codePoint)
          指定された文字 (Unicode コードポイント) が大文字かどうかを判定します。
static boolean isValidCodePoint(int codePoint)
          指定されたコードポイントが、0x0000 から 0x10FFFF までの範囲の有効な Unicode コードポイントであるかどうかを判定します。
static boolean isWhitespace(char ch)
          指定された文字が Java の基準に従った空白かどうかを判定します。
static boolean isWhitespace(int codePoint)
          指定された文字 (Unicode コードポイント) が Java の基準に従った空白かどうかを判定します。
static int offsetByCodePoints(char[] a, int start, int count, int index, int codePointOffset)
          codePointOffset コードポイントによって指定された index からのオフセットである、指定された char 部分配列内のインデックスを返します。
static int offsetByCodePoints(CharSequence seq, int index, int codePointOffset)
          codePointOffset コードポイントによって指定された index からのオフセットである、char シーケンス内のインデックスを返します。
static char reverseBytes(char ch)
          指定された char 値でバイト順を逆にして取得した値を返します。
static char[] toChars(int codePoint)
          指定された文字 (Unicode コードポイント) を char 配列に格納される UTF-16 表現に変換します。
static int toChars(int codePoint, char[] dst, int dstIndex)
          指定された文字 (Unicode コードポイント) を UTF-16 表現に変換します。
static int toCodePoint(char high, char low)
          指定されたサロゲートペアをその補助コードポイント値に変換します。
static char toLowerCase(char ch)
          UnicodeData ファイル内のケースマッピング情報を使用して、文字引数を小文字に変換します。
static int toLowerCase(int codePoint)
          UnicodeData ファイル内のケースマッピング情報を使用して、文字 (Unicode コードポイント) 引数を小文字に変換します。
 String toString()
          Character の値を表す String オブジェクトを返します。
static String toString(char c)
          指定された char を表す String オブジェクトを返します。
static char toTitleCase(char ch)
          UnicodeData ファイル内のケースマッピング情報を使用して、文字引数をタイトルケースに変換します。
static int toTitleCase(int codePoint)
          UnicodeData ファイル内のケースマッピング情報を使用して、文字 (Unicode コードポイント) 引数をタイトルケースに変換します。
static char toUpperCase(char ch)
          UnicodeData ファイル内のケースマッピング情報を使用して、文字引数を大文字に変換します。
static int toUpperCase(int codePoint)
          UnicodeData ファイル内のケースマッピング情報を使用して、文字 (Unicode コードポイント) 引数を大文字に変換します。
static Character valueOf(char c)
          指定した char 値を表す Character インスタンスを返します。
 
クラス java.lang.Object から継承されたメソッド
clone, finalize, getClass, notify, notifyAll, wait, wait, wait
 

フィールドの詳細

MIN_RADIX

public static final int MIN_RADIX
文字列との変換に使用可能な最小基数です。このフィールドの定数値は、Integer クラスの digit メソッド、forDigit メソッド、および toString メソッドなどの基数変換メソッドの最小許容値です。

関連項目:
digit(char, int), forDigit(int, int), Integer.toString(int, int), Integer.valueOf(java.lang.String), 定数フィールド値

MAX_RADIX

public static final int MAX_RADIX
文字列との変換に使用可能な最大基数です。このフィールドの定数値は、Integer クラスの digit メソッド、forDigit メソッド、および toString メソッドなどの基数変換メソッドの最大許容値です。

関連項目:
digit(char, int), forDigit(int, int), Integer.toString(int, int), Integer.valueOf(java.lang.String), 定数フィールド値

MIN_VALUE

public static final char MIN_VALUE
このフィールドの定数値は、char 型の最小値 '\u0000' です。

導入されたバージョン:
1.0.2
関連項目:
定数フィールド値

MAX_VALUE

public static final char MAX_VALUE
このフィールドの定数値は、char 型の最大値 '\uFFFF' です。

導入されたバージョン:
1.0.2
関連項目:
定数フィールド値

TYPE

public static final Class<Character> TYPE
char のプリミティブ型を表す Class インスタンス

導入されたバージョン:
1.1

UNASSIGNED

public static final byte UNASSIGNED
Unicode 仕様の汎用カテゴリ「Cn」

導入されたバージョン:
1.1
関連項目:
定数フィールド値

UPPERCASE_LETTER

public static final byte UPPERCASE_LETTER
Unicode 仕様の汎用カテゴリ「Lu」

導入されたバージョン:
1.1
関連項目:
定数フィールド値

LOWERCASE_LETTER

public static final byte LOWERCASE_LETTER
Unicode 仕様の汎用カテゴリ「Ll」

導入されたバージョン:
1.1
関連項目:
定数フィールド値

TITLECASE_LETTER

public static final byte TITLECASE_LETTER
Unicode 仕様の汎用カテゴリ「Lt」

導入されたバージョン:
1.1
関連項目:
定数フィールド値

MODIFIER_LETTER

public static final byte MODIFIER_LETTER
Unicode 仕様の汎用カテゴリ「Lm」

導入されたバージョン:
1.1
関連項目:
定数フィールド値

OTHER_LETTER

public static final byte OTHER_LETTER
Unicode 仕様の汎用カテゴリ「Lo」

導入されたバージョン:
1.1
関連項目:
定数フィールド値

NON_SPACING_MARK

public static final byte NON_SPACING_MARK
Unicode 仕様の汎用カテゴリ「Mn」

導入されたバージョン:
1.1
関連項目:
定数フィールド値

ENCLOSING_MARK

public static final byte ENCLOSING_MARK
Unicode 仕様の汎用カテゴリ「Me」

導入されたバージョン:
1.1
関連項目:
定数フィールド値

COMBINING_SPACING_MARK

public static final byte COMBINING_SPACING_MARK
Unicode 仕様の汎用カテゴリ「Mc」

導入されたバージョン:
1.1
関連項目:
定数フィールド値

DECIMAL_DIGIT_NUMBER

public static final byte DECIMAL_DIGIT_NUMBER
Unicode 仕様の汎用カテゴリ「Nd」

導入されたバージョン:
1.1
関連項目:
定数フィールド値

LETTER_NUMBER

public static final byte LETTER_NUMBER
Unicode 仕様の汎用カテゴリ「Nl」

導入されたバージョン:
1.1
関連項目:
定数フィールド値

OTHER_NUMBER

public static final byte OTHER_NUMBER
Unicode 仕様の汎用カテゴリ「No」

導入されたバージョン:
1.1
関連項目:
定数フィールド値

SPACE_SEPARATOR

public static final byte SPACE_SEPARATOR
Unicode 仕様の汎用カテゴリ「Zs」

導入されたバージョン:
1.1
関連項目:
定数フィールド値

LINE_SEPARATOR

public static final byte LINE_SEPARATOR
Unicode 仕様の汎用カテゴリ「Zl」

導入されたバージョン:
1.1
関連項目:
定数フィールド値

PARAGRAPH_SEPARATOR

public static final byte PARAGRAPH_SEPARATOR
Unicode 仕様の汎用カテゴリ「Zp」

導入されたバージョン:
1.1
関連項目:
定数フィールド値

CONTROL

public static final byte CONTROL
Unicode 仕様の汎用カテゴリ「Cc」

導入されたバージョン:
1.1
関連項目:
定数フィールド値

FORMAT

public static final byte FORMAT
Unicode 仕様の汎用カテゴリ「Cf」

導入されたバージョン:
1.1
関連項目:
定数フィールド値

PRIVATE_USE

public static final byte PRIVATE_USE
Unicode 仕様の汎用カテゴリ「Co」

導入されたバージョン:
1.1
関連項目:
定数フィールド値

SURROGATE

public static final byte SURROGATE
Unicode 仕様の汎用カテゴリ「Cs」

導入されたバージョン:
1.1
関連項目:
定数フィールド値

DASH_PUNCTUATION

public static final byte DASH_PUNCTUATION
Unicode 仕様の汎用カテゴリ「Pd」

導入されたバージョン:
1.1
関連項目:
定数フィールド値

START_PUNCTUATION

public static final byte START_PUNCTUATION
Unicode 仕様の汎用カテゴリ「Ps」

導入されたバージョン:
1.1
関連項目:
定数フィールド値

END_PUNCTUATION

public static final byte END_PUNCTUATION
Unicode 仕様の汎用カテゴリ「Pe」

導入されたバージョン:
1.1
関連項目:
定数フィールド値

CONNECTOR_PUNCTUATION

public static final byte CONNECTOR_PUNCTUATION
Unicode 仕様の汎用カテゴリ「Pc」

導入されたバージョン:
1.1
関連項目:
定数フィールド値

OTHER_PUNCTUATION

public static final byte OTHER_PUNCTUATION
Unicode 仕様の汎用カテゴリ「Po」

導入されたバージョン:
1.1
関連項目:
定数フィールド値

MATH_SYMBOL

public static final byte MATH_SYMBOL
Unicode 仕様の汎用カテゴリ「Sm」

導入されたバージョン:
1.1
関連項目:
定数フィールド値

CURRENCY_SYMBOL

public static final byte CURRENCY_SYMBOL
Unicode 仕様の汎用カテゴリ「Sc」

導入されたバージョン:
1.1
関連項目:
定数フィールド値

MODIFIER_SYMBOL

public static final byte MODIFIER_SYMBOL
Unicode 仕様の汎用カテゴリ「Sk」

導入されたバージョン:
1.1
関連項目:
定数フィールド値

OTHER_SYMBOL

public static final byte OTHER_SYMBOL
Unicode 仕様の汎用カテゴリ「So」

導入されたバージョン:
1.1
関連項目:
定数フィールド値

INITIAL_QUOTE_PUNCTUATION

public static final byte INITIAL_QUOTE_PUNCTUATION
Unicode 仕様の汎用カテゴリ「Pi」

導入されたバージョン:
1.4
関連項目:
定数フィールド値

FINAL_QUOTE_PUNCTUATION

public static final byte FINAL_QUOTE_PUNCTUATION
Unicode 仕様の汎用カテゴリ「Pf」

導入されたバージョン:
1.4
関連項目:
定数フィールド値

DIRECTIONALITY_UNDEFINED

public static final byte DIRECTIONALITY_UNDEFINED
未定義の双方向文字タイプ。Unicode 仕様では、未定義の char 値の方向性は定義されていません。

導入されたバージョン:
1.4
関連項目:
定数フィールド値

DIRECTIONALITY_LEFT_TO_RIGHT

public static final byte DIRECTIONALITY_LEFT_TO_RIGHT
Unicode 仕様の強力な双方向文字タイプ「L」

導入されたバージョン:
1.4
関連項目:
定数フィールド値

DIRECTIONALITY_RIGHT_TO_LEFT

public static final byte DIRECTIONALITY_RIGHT_TO_LEFT
Unicode 仕様の強力な双方向文字タイプ「R」

導入されたバージョン:
1.4
関連項目:
定数フィールド値

DIRECTIONALITY_RIGHT_TO_LEFT_ARABIC

public static final byte DIRECTIONALITY_RIGHT_TO_LEFT_ARABIC
Unicode 仕様の強力な双方向文字タイプ「AL」

導入されたバージョン:
1.4
関連項目:
定数フィールド値

DIRECTIONALITY_EUROPEAN_NUMBER

public static final byte DIRECTIONALITY_EUROPEAN_NUMBER
Unicode 仕様の弱い双方向文字タイプ「EN」

導入されたバージョン:
1.4
関連項目:
定数フィールド値

DIRECTIONALITY_EUROPEAN_NUMBER_SEPARATOR

public static final byte DIRECTIONALITY_EUROPEAN_NUMBER_SEPARATOR
Unicode 仕様の弱い双方向文字タイプ「ES」

導入されたバージョン:
1.4
関連項目:
定数フィールド値

DIRECTIONALITY_EUROPEAN_NUMBER_TERMINATOR

public static final byte DIRECTIONALITY_EUROPEAN_NUMBER_TERMINATOR
Unicode 仕様の弱い双方向文字タイプ「ET」

導入されたバージョン:
1.4
関連項目:
定数フィールド値

DIRECTIONALITY_ARABIC_NUMBER

public static final byte DIRECTIONALITY_ARABIC_NUMBER
Unicode 仕様の弱い双方向文字タイプ「AN」

導入されたバージョン:
1.4
関連項目:
定数フィールド値

DIRECTIONALITY_COMMON_NUMBER_SEPARATOR

public static final byte DIRECTIONALITY_COMMON_NUMBER_SEPARATOR
Unicode 仕様の弱い双方向文字タイプ「CS」

導入されたバージョン:
1.4
関連項目:
定数フィールド値

DIRECTIONALITY_NONSPACING_MARK

public static final byte DIRECTIONALITY_NONSPACING_MARK
Unicode 仕様の弱い双方向文字タイプ「NSM」

導入されたバージョン:
1.4
関連項目:
定数フィールド値

DIRECTIONALITY_BOUNDARY_NEUTRAL

public static final byte DIRECTIONALITY_BOUNDARY_NEUTRAL
Unicode 仕様の弱い双方向文字タイプ「BN」

導入されたバージョン:
1.4
関連項目:
定数フィールド値

DIRECTIONALITY_PARAGRAPH_SEPARATOR

public static final byte DIRECTIONALITY_PARAGRAPH_SEPARATOR
Unicode 仕様のニュートラルな双方向文字タイプ「B」

導入されたバージョン:
1.4
関連項目:
定数フィールド値

DIRECTIONALITY_SEGMENT_SEPARATOR

public static final byte DIRECTIONALITY_SEGMENT_SEPARATOR
Unicode 仕様のニュートラルな双方向文字タイプ「S」

導入されたバージョン:
1.4
関連項目:
定数フィールド値

DIRECTIONALITY_WHITESPACE

public static final byte DIRECTIONALITY_WHITESPACE
Unicode 仕様のニュートラルな双方向文字タイプ「WS」

導入されたバージョン:
1.4
関連項目:
定数フィールド値

DIRECTIONALITY_OTHER_NEUTRALS

public static final byte DIRECTIONALITY_OTHER_NEUTRALS
Unicode 仕様のニュートラルな双方向文字タイプ「ON」

導入されたバージョン:
1.4
関連項目:
定数フィールド値

DIRECTIONALITY_LEFT_TO_RIGHT_EMBEDDING

public static final byte DIRECTIONALITY_LEFT_TO_RIGHT_EMBEDDING
Unicode 仕様の強力な双方向文字タイプ「LRE」

導入されたバージョン:
1.4
関連項目:
定数フィールド値

DIRECTIONALITY_LEFT_TO_RIGHT_OVERRIDE

public static final byte DIRECTIONALITY_LEFT_TO_RIGHT_OVERRIDE
Unicode 仕様の強力な双方向文字タイプ「LRO」

導入されたバージョン:
1.4
関連項目:
定数フィールド値

DIRECTIONALITY_RIGHT_TO_LEFT_EMBEDDING

public static final byte DIRECTIONALITY_RIGHT_TO_LEFT_EMBEDDING
Unicode 仕様の強力な双方向文字タイプ「RLE」

導入されたバージョン:
1.4
関連項目:
定数フィールド値

DIRECTIONALITY_RIGHT_TO_LEFT_OVERRIDE

public static final byte DIRECTIONALITY_RIGHT_TO_LEFT_OVERRIDE
Unicode 仕様の強力な双方向文字タイプ「RLO」

導入されたバージョン:
1.4
関連項目:
定数フィールド値

DIRECTIONALITY_POP_DIRECTIONAL_FORMAT

public static final byte DIRECTIONALITY_POP_DIRECTIONAL_FORMAT
Unicode 仕様の弱い双方向文字タイプ「PDF」

導入されたバージョン:
1.4
関連項目:
定数フィールド値

MIN_HIGH_SURROGATE

public static final char MIN_HIGH_SURROGATE
UTF-16 エンコーディングでの Unicode 上位サロゲートコード単位の最小値。上位サロゲートは、「リーディングサロゲート」ともいいます。

導入されたバージョン:
1.5
関連項目:
定数フィールド値

MAX_HIGH_SURROGATE

public static final char MAX_HIGH_SURROGATE
UTF-16 エンコーディングでの Unicode 上位サロゲートコード単位の最大値。上位サロゲートは、「リーディングサロゲート」ともいいます。

導入されたバージョン:
1.5
関連項目:
定数フィールド値

MIN_LOW_SURROGATE

public static final char MIN_LOW_SURROGATE
UTF-16 エンコーディングでの Unicode 下位サロゲートコード単位の最小値。下位サロゲートは、「トレーリングサロゲート」ともいいます。

導入されたバージョン:
1.5
関連項目:
定数フィールド値

MAX_LOW_SURROGATE

public static final char MAX_LOW_SURROGATE
UTF-16 エンコーディングでの Unicode 下位サロゲートコード単位の最大値。下位サロゲートは、「トレーリングサロゲート」ともいいます。

導入されたバージョン:
1.5
関連項目:
定数フィールド値

MIN_SURROGATE

public static final char MIN_SURROGATE
UTF-16 エンコーディングでの Unicode サロゲートコード単位の最小値

導入されたバージョン:
1.5
関連項目:
定数フィールド値

MAX_SURROGATE

public static final char MAX_SURROGATE
UTF-16 エンコーディングでの Unicode サロゲートコード単位の最大値

導入されたバージョン:
1.5
関連項目:
定数フィールド値

MIN_SUPPLEMENTARY_CODE_POINT

public static final int MIN_SUPPLEMENTARY_CODE_POINT
補助コードポイントの最小値

導入されたバージョン:
1.5
関連項目:
定数フィールド値

MIN_CODE_POINT

public static final int MIN_CODE_POINT
Unicode コードポイントの最小値

導入されたバージョン:
1.5
関連項目:
定数フィールド値

MAX_CODE_POINT

public static final int MAX_CODE_POINT
Unicode コードポイントの最大値

導入されたバージョン:
1.5
関連項目:
定数フィールド値

SIZE

public static final int SIZE
符号なしバイナリ形式で char 値を表すのに使用されるビット数

導入されたバージョン:
1.5
関連項目:
定数フィールド値
コンストラクタの詳細

Character

public Character(char value)
指定された char 値を表す、新しく割り当てられた Character オブジェクトを構築します。

パラメータ:
value - Character オブジェクトが表す値
メソッドの詳細

valueOf

public static Character valueOf(char c)
指定した char 値を表す Character インスタンスを返します。新規 Character インスタンスが不要な場合、通常このメソッドがコンストラクタ Character(char) に優先して使用されます。 その理由は、このメソッドが頻繁に要求される値をキャッシュするので、操作に必要な領域や時間がはるかに少なくて済む場合が多いためです。

パラメータ:
c - char 値
戻り値:
c を表す Character インスタンス
導入されたバージョン:
1.5

charValue

public char charValue()
この Character オブジェクトの値を返します。

戻り値:
このオブジェクトが表すプリミティブ char

hashCode

public int hashCode()
Character のハッシュコードを返します。

オーバーライド:
クラス Object 内の hashCode
戻り値:
このオブジェクトのハッシュコード値
関連項目:
Object.equals(java.lang.Object), Hashtable

equals

public boolean equals(Object obj)
オブジェクトと指定されたオブジェクトを比較します。引数が null ではなく、このオブジェクトと同じ char 値を表す Character オブジェクトである場合にだけ、結果は true になります。

オーバーライド:
クラス Object 内の equals
パラメータ:
obj - 比較対象のオブジェクト
戻り値:
オブジェクトが同じである場合は true、そうでない場合は false
関連項目:
Object.hashCode(), Hashtable

toString

public String toString()
Character の値を表す String オブジェクトを返します。結果は、長さ 1 の文字列 (構成要素は Character オブジェクトにより表されるプリミティブ型の char 値だけ) になります。

オーバーライド:
クラス Object 内の toString
戻り値:
このオブジェクトの文字列表現

toString

public static String toString(char c)
指定された char を表す String オブジェクトを返します。結果は、指定された char だけで構成される長さ 1 の文字列になります。

パラメータ:
c - 変換対象の char
戻り値:
指定された char の文字列表現
導入されたバージョン:
1.4

isValidCodePoint

public static boolean isValidCodePoint(int codePoint)
指定されたコードポイントが、0x0000 から 0x10FFFF までの範囲の有効な Unicode コードポイントであるかどうかを判定します。このメソッドの呼び出しは次の式と等価です。
 codePoint >= 0x0000 && codePoint <= 0x10FFFF
 

パラメータ:
codePoint - 判定対象の Unicode コードポイント
戻り値:
指定されたコードポイント値が有効なコードポイント値である場合は true、そうでない場合は false
導入されたバージョン:
1.5

isSupplementaryCodePoint

public static boolean isSupplementaryCodePoint(int codePoint)
指定された文字 (Unicode コードポイント) が補助文字の範囲にあるかどうかを判定します。このメソッドの呼び出しは次の式と等価です。
 codePoint >= 0x10000 && codePoint <= 0x10FFFF
 

パラメータ:
codePoint - 判定対象の文字 (Unicode コードポイント)
戻り値:
指定された文字が Unicode 補助文字の範囲にある場合は true、そうでない場合は false
導入されたバージョン:
1.5

isHighSurrogate

public static boolean isHighSurrogate(char ch)
指定された char 値が上位サロゲートコード単位 (「リーディングサロゲートコード単位」ともいう) であるかどうかを判定します。これらの値は、それ自体で文字を表しませんが、UTF-16エンコーディングの補助文字の表現で使用されます。  

このメソッドが、true を返すのは、

ch >= '\uD800' && ch <= '\uDBFF'
 
上の式が true となるような最小の k です。

パラメータ:
ch - 判定対象の char
戻り値:
char 値が「\uD800」から「\uDBFF」までの範囲にある場合は true、そうでない場合は false
導入されたバージョン:
1.5
関連項目:
isLowSurrogate(char), Character.UnicodeBlock.of(int)

isLowSurrogate

public static boolean isLowSurrogate(char ch)
指定された char 値が下位サロゲートコード単位 (「トレーリングサロゲートコード単位」ともいう) であるかどうかを判定します。これらの値は、それ自体で文字を表しませんが、UTF-16エンコーディングの補助文字の表現で使用されます。  

このメソッドが、true を返すのは、

ch >= '\uDC00' && ch <= '\uDFFF'
 
is true.

パラメータ:
ch - 判定対象の char
戻り値:
char 値が「\uDC00」から「\uDFFF」までの範囲にある場合は true、そうでない場合は false
導入されたバージョン:
1.5
関連項目:
isHighSurrogate(char)

isSurrogatePair

public static boolean isSurrogatePair(char high,
                                      char low)
指定された char 値のペアが有効なサロゲートペアであるかどうかを判定します。このメソッドの呼び出しは次の式と等価です。
 isHighSurrogate(high) && isLowSurrogate(low)
 

パラメータ:
high - 判定対象の上位サロゲートコード値
low - 判定対象の下位サロゲートコード値
戻り値:
指定された上位/下位サロゲートコード値が有効なサロゲートペアを表す場合は true、そうでない場合は false
導入されたバージョン:
1.5

charCount

public static int charCount(int codePoint)
指定された文字 (Unicode コードポイント) を表すのに必要な char 値の数を判定します。このメソッドは、指定された文字が 0x10000 以上である場合は、2 を返し、そうでない場合は、1 を返します。  

このメソッドは、指定された文字が有効な Unicode コードポイントであることを検証しません。呼び出し元は、必要に応じて、isValidCodePoint を使って文字値を検証する必要があります。

パラメータ:
codePoint - 判定対象の文字 (Unicode コードポイント)
戻り値:
文字が有効な補助文字の場合は 2、そうでない場合は 1
導入されたバージョン:
1.5
関連項目:
isSupplementaryCodePoint(int)

toCodePoint

public static int toCodePoint(char high,
                              char low)
指定されたサロゲートペアをその補助コードポイント値に変換します。このメソッドは、指定されたサロゲートペアを検証しません。呼び出し元は、必要に応じて、isSurrogatePair を使ってサロゲートペアを検証する必要があります。

パラメータ:
high - 上位サロゲートコード単位
low - 下位サロゲートコード単位
戻り値:
指定されたサロゲートペアから作成された補助コードポイント
導入されたバージョン:
1.5

codePointAt

public static int codePointAt(CharSequence seq,
                              int index)
CharSequence の指定されたインデックスにあるコードポイントを返します。CharSequence の指定されたインデックス位置の char 値が上位サロゲート範囲にある場合、それに続くインデックスが、CharSequence の長さ未満である場合、それに続くインデックスの char 値が下位サロゲート範囲にある場合、このサロゲートペアに対応する補助コードポイントを返します。そうでない場合、指定されたインデックスにある char 値が返されます。

パラメータ:
seq - char 値のシーケンス (Unicode コード単位)
index - 変換される seqchar 値 (Unicode コード単位) へのインデックス
戻り値:
所定のインデックス位置の Unicode コードポイント
例外:
NullPointerException - seq が null の場合
IndexOutOfBoundsException - index が負の値または seq.length() 以上である場合
導入されたバージョン:
1.5

codePointAt

public static int codePointAt(char[] a,
                              int index)
char 配列の指定されたインデックスにあるコードポイントを返します。char 配列の指定されたインデックス位置の char 値が上位サロゲート範囲にある場合、それに続くインデックスが、char 配列の長さ未満である場合、それに続くインデックスの char 値が下位サロゲート範囲にある場合、このサロゲートペアに対応する補助コードポイントを返します。そうでない場合、指定されたインデックスにある char 値が返されます。

パラメータ:
a - char 配列
index - 変換される char 配列の char 値 (Unicode コード単位) へのインデックス
戻り値:
所定のインデックス位置の Unicode コードポイント
例外:
NullPointerException - a が null の場合
IndexOutOfBoundsException - index が負の値、または char 配列の長さ以上の値である場合
導入されたバージョン:
1.5

codePointAt

public static int codePointAt(char[] a,
                              int index,
                              int limit)
limit の長さ未満の index を持つ配列要素のみを使用可能な、char 配列の指定されたインデックスにあるコードポイントを返します。char 配列の指定されたインデックス位置の char 値が上位サロゲート範囲にある場合、それに続くインデックスが limit の長さ未満である場合、およびそれに続くインデックスの char 値が下位サロゲート範囲にある場合、このサロゲートペアに対応する補助コードポイントを返します。そうでない場合、指定されたインデックスにある char 値が返されます。

パラメータ:
a - char 配列
index - 変換される char 配列の char 値 (Unicode コード単位) へのインデックス
limit - char 配列で使用可能な最後の配列要素の後ろのインデックス
戻り値:
所定のインデックス位置の Unicode コードポイント
例外:
NullPointerException - a が null の場合
IndexOutOfBoundsException - index 引数が負の値または limit 引数以上である場合、または limit 引数が負の値または char 配列の長さより大きい場合
導入されたバージョン:
1.5

codePointBefore

public static int codePointBefore(CharSequence seq,
                                  int index)
CharSequence の指定されたインデックスの前にあるコードポイントを返します。CharSequence(index - 1) 位置の char 値が下位サロゲートの範囲にある場合、(index - 2) が負ではない場合、CharSequence(index - 2) 位置の char 値が上位サロゲートの範囲にある場合、このサロゲートペアに対応する補助コードポイントが返されます。そうでない場合、(index - 1) 位置の char 値が返されます。

パラメータ:
seq - CharSequence インスタンス
index - 返されるコードポイントに続くインデックス
戻り値:
指定されたインデックスの前にある Unicode コードポイント値
例外:
NullPointerException - seq が null の場合
IndexOutOfBoundsException - index 引数が 1 未満の値または seq.length() より大きい場合
導入されたバージョン:
1.5

codePointBefore

public static int codePointBefore(char[] a,
                                  int index)
char 配列の指定されたインデックスの前にあるコードポイントを返します。char 配列の (index - 1) 位置の char 値が下位サロゲートの範囲にある場合、(index - 2) が負ではない場合、および char 配列の (index - 2) 位置の char 値が上位サロゲートの範囲にある場合、このサロゲートペアに対応する補助コードポイントが返されます。そうでない場合、(index - 1) 位置の char 値が返されます。

パラメータ:
a - char 配列
index - 返されるコードポイントに続くインデックス
戻り値:
指定されたインデックスの前にある Unicode コードポイント値
例外:
NullPointerException - a が null の場合
IndexOutOfBoundsException - index 引数が 1 未満であるか、または char 配列の長さより大きい値の場合
導入されたバージョン:
1.5

codePointBefore

public static int codePointBefore(char[] a,
                                  int index,
                                  int start)
start 以上の index を持つ配列要素のみを使用可能な、char 配列の指定されたインデックスの前にあるコードポイントを返します。char 配列の (index - 1) 位置の char 値が下位サロゲートの範囲にある場合、(index - 2)start 以上の場合、および char 配列の (index - 2) 位置の char 値が上位サロゲートの範囲にある場合、このサロゲートペアに対応する補助コードポイントが返されます。そうでない場合、(index - 1) 位置の char 値が返されます。

パラメータ:
a - char 配列
index - 返されるコードポイントに続くインデックス
start - char 配列の最初の配列要素のインデックス
戻り値:
指定されたインデックスの前にある Unicode コードポイント値
例外:
NullPointerException - a が null の場合
IndexOutOfBoundsException - index 引数が start 引数以下であるか char 配列の長さより大きい場合、または start 引数が負の値であるか char 配列の長さ以上である場合
導入されたバージョン:
1.5

toChars

public static int toChars(int codePoint,
                          char[] dst,
                          int dstIndex)
指定された文字 (Unicode コードポイント) を UTF-16 表現に変換します。指定されたコードポイントが BMP (基本多言語面または第 0 面) 値の場合は、同じ値が dst[dstIndex] に格納され、1 が返されます。指定されたコードポイントが補助文字の場合は、サロゲート値が dst[dstIndex] (上位サロゲート) と dst[dstIndex+1] (下位サロゲート) に格納され、2 が返されます。

パラメータ:
codePoint - 変換対象の文字 (Unicode コードポイント)
dst - codePoint の UTF-16 値が格納される char の配列
dstIndex - 変換された値が格納される dst 配列の開始インデックス
戻り値:
コードポイントが BMP コードポイントの場合は 1、コードポイントが補助コードポイントの場合は 2
例外:
IllegalArgumentException - 指定された codePoint が有効な Unicode コードポイントでない場合
NullPointerException - 指定された dst が null の場合
IndexOutOfBoundsException - dstIndex が負の値であるか、dst.length 以上である場合、または dstIndex 位置の dst が結果として得られる char 値を格納する十分な配列要素を持たない場合(dstIndexdst.length-1 と等価で、指定された codePoint が補助文字の場合、上位サロゲート値は dst[dstIndex] に格納されない)
導入されたバージョン:
1.5

toChars

public static char[] toChars(int codePoint)
指定された文字 (Unicode コードポイント) を char 配列に格納される UTF-16 表現に変換します。指定されたコードポイントが BMP (基本多言語面または第 0 面) 値の場合、char 配列は codePoint と同じ値を持ちます。指定されたコードポイントが補助コードポイントの場合は、結果として得られる char 配列は対応するサロゲートペアを持ちます。

パラメータ:
codePoint - Unicode コードポイント
戻り値:
Unicode コードポイント codePoint の UTF-16 表現を持つ char 配列
例外:
IllegalArgumentException - 指定された codePoint が有効な Unicode コードポイントでない場合
導入されたバージョン:
1.5

codePointCount

public static int codePointCount(CharSequence seq,
                                 int beginIndex,
                                 int endIndex)
指定された char シーケンスのテキスト範囲内の Unicode コードポイントの数を返します。テキスト範囲は、指定された beginIndex からインデックス endIndex - 1 の位置の char までです。したがって、テキスト範囲の長さ (char 間) は、endIndex-beginIndex です。テキスト範囲内でペアになっていないサロゲートは、それぞれ 1 つのコードポイントとして数えられます。

パラメータ:
seq - char シーケンス
beginIndex - テキスト範囲内の最初の char へのインデックス
endIndex - テキスト範囲内の最後の char の後ろのインデックス
戻り値:
指定されたテキスト範囲内の Unicode コードポイントの数
例外:
NullPointerException - seq が null の場合
IndexOutOfBoundsException - beginIndex が負の値である場合、endIndex が指定されたシーケンスの長さよりも大きい場合、あるいは beginIndexendIndex より大きい場合
導入されたバージョン:
1.5

codePointCount

public static int codePointCount(char[] a,
                                 int offset,
                                 int count)
char 配列引数の部分配列内の Unicode コードポイントの数を返します。offset 引数は、部分配列の最初の char のインデックスであり、count 引数は char 間の部分配列の長さを指定します。 部分配列内でペアになっていないサロゲートは、それぞれ 1 つのコードポイントとして数えられます。

パラメータ:
a - char 配列
offset - 指定された char 配列の最初の char のインデックス
count - char 間の部分配列の長さ
戻り値:
指定された部分配列内の Unicode コードポイントの数
例外:
NullPointerException - a が null の場合
IndexOutOfBoundsException - offset または count が負の値であるか、offset + count が指定された配列の長さよりも大きい場合
導入されたバージョン:
1.5

offsetByCodePoints

public static int offsetByCodePoints(CharSequence seq,
                                     int index,
                                     int codePointOffset)
codePointOffset コードポイントによって指定された index からのオフセットである、char シーケンス内のインデックスを返します。indexcodePointOffset によって指定されたテキスト範囲内でペアになっていないサロゲートは、それぞれ 1 つのコードポイントとして数えられます。

パラメータ:
seq - char シーケンス
index - オフセットへのインデックス
codePointOffset - コードポイント内のオフセット
戻り値:
char シーケンス内のインデックス
例外:
NullPointerException - seq が null の場合
IndexOutOfBoundsException - index が負の値または char シーケンスの長さよりも大きい場合、codePointOffset が正の値であり index で始まるサブシーケンスの持つコードポイント数が codePointOffset コードポイント数よりも少ない場合、あるいは codePointOffset が負の値で index の前のサブシーケンスの持つ値が codePointOffset コードポイントの絶対値よりも小さい場合
導入されたバージョン:
1.5

offsetByCodePoints

public static int offsetByCodePoints(char[] a,
                                     int start,
                                     int count,
                                     int index,
                                     int codePointOffset)
codePointOffset コードポイントによって指定された index からのオフセットである、指定された char 部分配列内のインデックスを返します。start および count 引数は、char 配列の部分配列を指定します。indexcodePointOffset によって指定されたテキスト範囲内でペアになっていないサロゲートは、それぞれ 1 つのコードポイントとして数えられます。

パラメータ:
a - char 配列
start - 部分配列内の最初の char のインデックス
count - char 間の部分配列の長さ
index - オフセットへのインデックス
codePointOffset - コードポイント内のオフセット
戻り値:
部分配列内のインデックス
例外:
NullPointerException - a が null の場合
IndexOutOfBoundsException - start または count が負の値、start + count が指定された配列の長さより大きい場合、indexstart より小さいか start + count より大きい場合、codePointOffset が正の値であり index で始まり start + count - 1 で終わるテキスト範囲の持つコードポイントの値が codePointOffset よりも小さい場合、あるいは codePointOffset が負の値であり start で始まり index - 1 で終わるテキスト範囲の値が codePointOffset コードポイントの絶対値よりも小さい場合
導入されたバージョン:
1.5

isLowerCase

public static boolean isLowerCase(char ch)
指定された文字が小文字かどうかを判定します。

Character.getType(ch) により示される汎用カテゴリ型が LOWERCASE_LETTER の場合、小文字になります。

小文字の例を次に示します。  

 a b c d e f g h i j k l m n o p q r s t u v w x y z
 '\u00DF' '\u00E0' '\u00E1' '\u00E2' '\u00E3' '\u00E4' '\u00E5' '\u00E6' 
 '\u00E7' '\u00E8' '\u00E9' '\u00EA' '\u00EB' '\u00EC' '\u00ED' '\u00EE'
 '\u00EF' '\u00F0' '\u00F1' '\u00F2' '\u00F3' '\u00F4' '\u00F5' '\u00F6'
 '\u00F8' '\u00F9' '\u00FA' '\u00FB' '\u00FC' '\u00FD' '\u00FE' '\u00FF'
 
 

Unicode 文字には、ほかにも多数の小文字が存在します。  

注: このメソッドは、補助文字を処理できません。補助文字を含むすべての Unicode 文字をサポートするには、isLowerCase(int) メソッドを使用してください。

パラメータ:
ch - 判定対象の文字
戻り値:
文字が小文字の場合は true、そうでない場合は false
関連項目:
isLowerCase(char), isTitleCase(char), toLowerCase(char), getType(char)

isLowerCase

public static boolean isLowerCase(int codePoint)
指定された文字 (Unicode コードポイント) が小文字かどうかを判定します。

getType(codePoint) により示される汎用カテゴリ型が LOWERCASE_LETTER の場合、小文字になります。

小文字の例を次に示します。  

 a b c d e f g h i j k l m n o p q r s t u v w x y z
 '\u00DF' '\u00E0' '\u00E1' '\u00E2' '\u00E3' '\u00E4' '\u00E5' '\u00E6' 
 '\u00E7' '\u00E8' '\u00E9' '\u00EA' '\u00EB' '\u00EC' '\u00ED' '\u00EE'
 '\u00EF' '\u00F0' '\u00F1' '\u00F2' '\u00F3' '\u00F4' '\u00F5' '\u00F6'
 '\u00F8' '\u00F9' '\u00FA' '\u00FB' '\u00FC' '\u00FD' '\u00FE' '\u00FF'
 
 

Unicode 文字には、ほかにも多数の小文字が存在します。

パラメータ:
codePoint - 判定対象の文字 (Unicode コードポイント)
戻り値:
文字が小文字の場合は true、そうでない場合は false
導入されたバージョン:
1.5
関連項目:
isLowerCase(int), isTitleCase(int), toLowerCase(int), getType(int)

isUpperCase

public static boolean isUpperCase(char ch)
指定された文字が大文字がどうかを判定します。

Character.getType(ch) により示される汎用カテゴリ型が UPPERCASE_LETTER の場合、大文字になります。

大文字の例を次に示します。  

 A B C D E F G H I J K L M N O P Q R S T U V W X Y Z
 '\u00C0' '\u00C1' '\u00C2' '\u00C3' '\u00C4' '\u00C5' '\u00C6' '\u00C7'
 '\u00C8' '\u00C9' '\u00CA' '\u00CB' '\u00CC' '\u00CD' '\u00CE' '\u00CF'
 '\u00D0' '\u00D1' '\u00D2' '\u00D3' '\u00D4' '\u00D5' '\u00D6' '\u00D8'
 '\u00D9' '\u00DA' '\u00DB' '\u00DC' '\u00DD' '\u00DE'
 
 

Unicode 文字には、ほかにも多数の大文字が存在します。

 

注: このメソッドは、補助文字を処理できません。補助文字を含むすべての Unicode 文字をサポートするには、isUpperCase(int) メソッドを使用してください。

パラメータ:
ch - 判定対象の文字
戻り値:
文字が大文字の場合は true、そうでない場合は false
導入されたバージョン:
1.0
関連項目:
isLowerCase(char), isTitleCase(char), toUpperCase(char), getType(char)

isUpperCase

public static boolean isUpperCase(int codePoint)
指定された文字 (Unicode コードポイント) が大文字かどうかを判定します。

getType(codePoint) により示される汎用カテゴリ型が UPPERCASE_LETTER の場合、大文字になります。

大文字の例を次に示します。  

 A B C D E F G H I J K L M N O P Q R S T U V W X Y Z
 '\u00C0' '\u00C1' '\u00C2' '\u00C3' '\u00C4' '\u00C5' '\u00C6' '\u00C7'
 '\u00C8' '\u00C9' '\u00CA' '\u00CB' '\u00CC' '\u00CD' '\u00CE' '\u00CF'
 '\u00D0' '\u00D1' '\u00D2' '\u00D3' '\u00D4' '\u00D5' '\u00D6' '\u00D8'
 '\u00D9' '\u00DA' '\u00DB' '\u00DC' '\u00DD' '\u00DE'
 
 

Unicode 文字には、ほかにも多数の大文字が存在します。

パラメータ:
codePoint - 判定対象の文字 (Unicode コードポイント)
戻り値:
文字が大文字の場合は true、そうでない場合は false
導入されたバージョン:
1.5
関連項目:
isLowerCase(int), isTitleCase(int), toUpperCase(int), getType(int)

isTitleCase

public static boolean isTitleCase(char ch)
指定された文字がタイトルケース文字かどうかを判定します。  

Character.getType(ch) により示される汎用カテゴリ型が TITLECASE_LETTER の場合、タイトルケース文字になります。

文字の中には、ラテン文字のペアのように見えるものがあります。たとえば、「LJ」のように見える大文字では、「lj」のように見える対応する小文字があります。「Lj」のように見える形式は、本のタイトルなど、最初は大文字であとは小文字にするときに使います。

次に示すのは、このメソッドが true を返す Unicode 文字の一部です。

 

Unicode 文字には、ほかにも多数のタイトルケース文字が存在します。

 

注: このメソッドは、補助文字を処理できません。補助文字を含むすべての Unicode 文字をサポートするには、isTitleCase(int) メソッドを使用してください。

パラメータ:
ch - 判定対象の文字
戻り値:
文字がタイトルケースの場合は true、そうでない場合は false
導入されたバージョン:
1.0.2
関連項目:
isLowerCase(char), isUpperCase(char), toTitleCase(char), getType(char)

isTitleCase

public static boolean isTitleCase(int codePoint)
指定された文字 (Unicode コードポイント) がタイトルケース文字かどうかを判定します。  

getType(codePoint) により示される汎用カテゴリ型が TITLECASE_LETTER の場合、タイトルケース文字になります。

文字の中には、ラテン文字のペアのように見えるものがあります。たとえば、「LJ」のように見える大文字では、「lj」のように見える対応する小文字があります。「Lj」のように見える形式は、本のタイトルなど、最初は大文字であとは小文字にするときに使います。

次に示すのは、このメソッドが true を返す Unicode 文字の一部です。

 

Unicode 文字には、ほかにも多数のタイトルケース文字が存在します。

パラメータ:
codePoint - 判定対象の文字 (Unicode コードポイント)
戻り値:
文字がタイトルケースの場合は true、そうでない場合は false
導入されたバージョン:
1.5
関連項目:
isLowerCase(int), isUpperCase(int), toTitleCase(int), getType(int)

isDigit

public static boolean isDigit(char ch)
指定された文字が数字かどうかを判定します。

Character.getType(ch) により示される汎用カテゴリ型が DECIMAL_DIGIT_NUMBER の場合、数字になります。

Unicode 文字範囲の中には、次の数字を含むものがあります。

そのほかにも多数の文字範囲に、数字が含まれます。  

注: このメソッドは、補助文字を処理できません。補助文字を含むすべての Unicode 文字をサポートするには、isDigit(int) メソッドを使用してください。

パラメータ:
ch - 判定対象の文字
戻り値:
文字が数値の場合は true、そうでない場合は false
関連項目:
digit(char, int), forDigit(int, int), getType(char)

isDigit

public static boolean isDigit(int codePoint)
指定された文字 (Unicode コードポイント) が数字かどうかを判定します。

getType(codePoint) により示される汎用カテゴリ型が DECIMAL_DIGIT_NUMBER の場合、数字になります。

Unicode 文字範囲の中には、次の数字を含むものがあります。

そのほかにも多数の文字範囲に、数字が含まれます。

パラメータ:
codePoint - 判定対象の文字 (Unicode コードポイント)
戻り値:
文字が数値の場合は true、そうでない場合は false
導入されたバージョン:
1.5
関連項目:
forDigit(int, int), getType(int)

isDefined

public static boolean isDefined(char ch)
文字が Unicode で定義されているかどうかを判定します。

次のどれかに当てはまる場合、文字は定義されています。

 

注: このメソッドは、補助文字を処理できません。補助文字を含むすべての Unicode 文字をサポートするには、isDefined(int) メソッドを使用してください。

パラメータ:
ch - 判定対象の文字
戻り値:
文字が Unicode に定義されている場合は true、そうでない場合は false
導入されたバージョン:
1.0.2
関連項目:
isDigit(char), isLetter(char), isLetterOrDigit(char), isLowerCase(char), isTitleCase(char), isUpperCase(char)

isDefined

public static boolean isDefined(int codePoint)
文字 (Unicodeコードポイント) が Unicode で定義されているかどうかを判定します。

次のどれかに当てはまる場合、文字は定義されています。

パラメータ:
codePoint - 判定対象の文字 (Unicode コードポイント)
戻り値:
文字が Unicode に定義されている場合は true、そうでない場合は false
導入されたバージョン:
1.5
関連項目:
isDigit(int), isLetter(int), isLetterOrDigit(int), isLowerCase(int), isTitleCase(int), isUpperCase(int)

isLetter

public static boolean isLetter(char ch)
指定された文字が汎用文字かどうかを判定します。

Character.getType(ch) の示す汎用カテゴリ型が次のどれかの場合に、文字は、汎用文字と見なされます。

すべての汎用文字に大文字と小文字があるわけではありません。多くの文字は汎用文字ですが、大文字でも小文字でもタイトルケースでもありません。  

注: このメソッドは、補助文字を処理できません。補助文字を含むすべての Unicode 文字をサポートするには、isLetter(int) メソッドを使用してください。

パラメータ:
ch - 判定対象の文字
戻り値:
文字が汎用文字の場合は true、そうでない場合は false
関連項目:
isDigit(char), isJavaIdentifierStart(char), isJavaLetter(char), isJavaLetterOrDigit(char), isLetterOrDigit(char), isLowerCase(char), isTitleCase(char), isUnicodeIdentifierStart(char), isUpperCase(char)

isLetter

public static boolean isLetter(int codePoint)
指定された文字 (Unicode コードポイント) が汎用文字かどうかを判定します。

getType(codePoint) により示される汎用カテゴリ型が次のような場合、汎用文字になります。

すべての汎用文字に大文字と小文字があるわけではありません。多くの文字は汎用文字ですが、大文字でも小文字でもタイトルケースでもありません。

パラメータ:
codePoint - 判定対象の文字 (Unicode コードポイント)
戻り値:
文字が汎用文字の場合は true、そうでない場合は false
導入されたバージョン:
1.5
関連項目:
isDigit(int), isJavaIdentifierStart(int), isLetterOrDigit(int), isLowerCase(int), isTitleCase(int), isUnicodeIdentifierStart(int), isUpperCase(int)

isLetterOrDigit

public static boolean isLetterOrDigit(char ch)
指定された文字が汎用文字または数字かどうかを判定します。

Character.isLetter(char ch) または Character.isDigit(char ch)true を返す場合、その文字は汎用文字または数字と見なされます。  

注: このメソッドは、補助文字を処理できません。補助文字を含むすべての Unicode 文字をサポートするには、isLetterOrDigit(int) メソッドを使用してください。

パラメータ:
ch - 判定対象の文字
戻り値:
文字が汎用文字または数字の場合は truetrue、そうでない場合は false
導入されたバージョン:
1.0.2
関連項目:
isDigit(char), isJavaIdentifierPart(char), isJavaLetter(char), isJavaLetterOrDigit(char), isLetter(char), isUnicodeIdentifierPart(char)

isLetterOrDigit

public static boolean isLetterOrDigit(int codePoint)
指定された文字 (Unicode コードポイント) が汎用文字または数字かどうかを判定します。

isLetter(codePoint) または isDigit(codePoint) のいずれかが文字に対して true を返す場合、その文字は汎用文字または数字と見なされます。

パラメータ:
codePoint - 判定対象の文字 (Unicode コードポイント)
戻り値:
文字が汎用文字または数字の場合は truetrue、そうでない場合は false
導入されたバージョン:
1.5
関連項目:
isDigit(int), isJavaIdentifierPart(int), isLetter(int), isUnicodeIdentifierPart(int)

isJavaLetter

@Deprecated
public static boolean isJavaLetter(char ch)
推奨されていません。 isJavaIdentifierStart(char) に置き換えられました。

指定された文字を Java 識別子の最初の文字として指定可能かどうかを判定します。

次のどれかが true の場合にだけ、その文字を Java 識別子の最初に指定できます。

パラメータ:
ch - 判定対象の文字
戻り値:
文字の先頭が Java 識別子の場合は true、そうでない場合は false
導入されたバージョン:
1.02
関連項目:
isJavaLetterOrDigit(char), isJavaIdentifierStart(char), isJavaIdentifierPart(char), isLetter(char), isLetterOrDigit(char), isUnicodeIdentifierStart(char)

isJavaLetterOrDigit

@Deprecated
public static boolean isJavaLetterOrDigit(char ch)
推奨されていません。 isJavaIdentifierPart(char) に置き換えられました。

指定された文字を Java 識別子の最初の文字以外に使用可能かどうかを判定します。

次のどれかが true の場合にだけ、その文字を Java 識別子の一部に指定できます。

パラメータ:
ch - 判定対象の文字
戻り値:
文字を Java 識別子の一部に使用可能な場合は true、そうでない場合は false
導入されたバージョン:
1.02
関連項目:
isJavaLetter(char), isJavaIdentifierStart(char), isJavaIdentifierPart(char), isLetter(char), isLetterOrDigit(char), isUnicodeIdentifierPart(char), isIdentifierIgnorable(char)

isJavaIdentifierStart

public static boolean isJavaIdentifierStart(char ch)
指定された文字を Java 識別子の最初の文字として指定可能かどうかを判定します。

次の条件のどれかが true の場合にだけ、その文字を Java 識別子の最初に指定できます。

 

注: このメソッドは、補助文字を処理できません。補助文字を含むすべての Unicode 文字をサポートするには、isJavaIdentifierStart(int) メソッドを使用してください。

パラメータ:
ch - 判定対象の文字
戻り値:
文字の先頭が Java 識別子の場合は true、そうでない場合は false
導入されたバージョン:
1.1
関連項目:
isJavaIdentifierPart(char), isLetter(char), isUnicodeIdentifierStart(char), SourceVersion.isIdentifier(CharSequence)

isJavaIdentifierStart

public static boolean isJavaIdentifierStart(int codePoint)
指定された文字 (Unicode コードポイント) を Java 識別子の最初の文字として指定可能かどうかを判定します。

次の条件のどれかが true の場合にだけ、その文字を Java 識別子の最初に指定できます。

パラメータ:
codePoint - 判定対象の文字 (Unicode コードポイント)
戻り値:
文字の先頭が Java 識別子の場合は true、そうでない場合は false
導入されたバージョン:
1.5
関連項目:
isJavaIdentifierPart(int), isLetter(int), isUnicodeIdentifierStart(int), SourceVersion.isIdentifier(CharSequence)

isJavaIdentifierPart

public static boolean isJavaIdentifierPart(char ch)
指定された文字を Java 識別子の最初の文字以外に使用可能かどうかを判定します。

次のどれかが true の場合にだけ、その文字を Java 識別子の一部に指定できます。

 

注: このメソッドは、補助文字を処理できません。補助文字を含むすべての Unicode 文字をサポートするには、isJavaIdentifierPart(int) メソッドを使用してください。

パラメータ:
ch - 判定対象の文字
戻り値:
文字を Java 識別子の一部に使用可能な場合は true、そうでない場合は false
導入されたバージョン:
1.1
関連項目:
isIdentifierIgnorable(char), isJavaIdentifierStart(char), isLetterOrDigit(char), isUnicodeIdentifierPart(char), SourceVersion.isIdentifier(CharSequence)

isJavaIdentifierPart

public static boolean isJavaIdentifierPart(int codePoint)
文字 (Unicode コードポイント) を Java 識別子の最初の文字以外に使用可能かどうかを判定します。

次のどれかが true の場合にだけ、その文字を Java 識別子の一部に指定できます。

パラメータ:
codePoint - 判定対象の文字 (Unicode コードポイント)
戻り値:
文字を Java 識別子の一部に使用可能な場合は true、そうでない場合は false
導入されたバージョン:
1.5
関連項目:
isIdentifierIgnorable(int), isJavaIdentifierStart(int), isLetterOrDigit(int), isUnicodeIdentifierPart(int), SourceVersion.isIdentifier(CharSequence)

isUnicodeIdentifierStart

public static boolean isUnicodeIdentifierStart(char ch)
指定された文字を Unicode 識別子の最初の文字として指定可能かどうかを判定します。

次の条件のどれかが true の場合にだけ、その文字を Unicode 識別子の最初に指定できます。

 

注: このメソッドは、補助文字を処理できません。補助文字を含むすべての Unicode 文字をサポートするには、isUnicodeIdentifierStart(int) メソッドを使用してください。

パラメータ:
ch - 判定対象の文字
戻り値:
文字を Unicode 識別子の先頭に使用可能な場合は true、そうでない場合は false
導入されたバージョン:
1.1
関連項目:
isJavaIdentifierStart(char), isLetter(char), isUnicodeIdentifierPart(char)

isUnicodeIdentifierStart

public static boolean isUnicodeIdentifierStart(int codePoint)
指定された文字 (Unicode コードポイント) を Unicode 識別子の最初の文字として指定可能かどうかを判定します。

次の条件のどれかが true の場合にだけ、その文字を Unicode 識別子の最初に指定できます。

パラメータ:
codePoint - 判定対象の文字 (Unicode コードポイント)
戻り値:
文字を Unicode 識別子の先頭に使用可能な場合は true、そうでない場合は false
導入されたバージョン:
1.5
関連項目:
isJavaIdentifierStart(int), isLetter(int), isUnicodeIdentifierPart(int)

isUnicodeIdentifierPart

public static boolean isUnicodeIdentifierPart(char ch)
指定された文字を Unicode 識別子の最初の文字以外に使用可能かどうかを判定します。

次の文のどれかが true の場合にだけ、その文字を Unicode 識別子の一部に使用できます。

 

注: このメソッドは、補助文字を処理できません。補助文字を含むすべての Unicode 文字をサポートするには、isUnicodeIdentifierPart(int) メソッドを使用してください。

パラメータ:
ch - 判定対象の文字
戻り値:
文字を Unicode 識別子の一部に使用可能な場合は true、そうでない場合は false
導入されたバージョン:
1.1
関連項目:
isIdentifierIgnorable(char), isJavaIdentifierPart(char), isLetterOrDigit(char), isUnicodeIdentifierStart(char)

isUnicodeIdentifierPart

public static boolean isUnicodeIdentifierPart(int codePoint)
指定された文字 (Unicode コードポイント) を Unicode 識別子の最初の文字以外に使用可能かどうかを判定します。

次の文のどれかが true の場合にだけ、その文字を Unicode 識別子の一部に使用できます。

パラメータ:
codePoint - 判定対象の文字 (Unicode コードポイント)
戻り値:
文字を Unicode 識別子の一部に使用可能な場合は true、そうでない場合は false
導入されたバージョン:
1.5
関連項目:
isIdentifierIgnorable(int), isJavaIdentifierPart(int), isLetterOrDigit(int), isUnicodeIdentifierStart(int)

isIdentifierIgnorable

public static boolean isIdentifierIgnorable(char ch)
指定された文字が、Java 識別子または Unicode 識別子内で無視可能な文字かどうかを判定します。

次の Unicode 文字は、Java 識別子や Unicode 識別子内で無視できます。

 

注: このメソッドは、補助文字を処理できません。補助文字を含むすべての Unicode 文字をサポートするには、isIdentifierIgnorable(int) メソッドを使用してください。

パラメータ:
ch - 判定対象の文字
戻り値:
Java または Unicode 識別子の一部に使用可能な、無視できる制御文字の場合は true、それ以外の場合は false
導入されたバージョン:
1.1
関連項目:
isJavaIdentifierPart(char), isUnicodeIdentifierPart(char)

isIdentifierIgnorable

public static boolean isIdentifierIgnorable(int codePoint)
指定された文字 (Unicode コードポイント) が、Java 識別子または Unicode 識別子内で無視可能な文字かどうかを判定します。

次の Unicode 文字は、Java 識別子や Unicode 識別子内で無視できます。

パラメータ:
codePoint - 判定対象の文字 (Unicode コードポイント)
戻り値:
Java または Unicode 識別子の一部に使用可能な、無視できる制御文字の場合は true、それ以外の場合は false
導入されたバージョン:
1.5
関連項目:
isJavaIdentifierPart(int), isUnicodeIdentifierPart(int)

toLowerCase

public static char toLowerCase(char ch)
UnicodeData ファイル内のケースマッピング情報を使用して、文字引数を小文字に変換します。

Character.isLowerCase(Character.toLowerCase(ch)) は、ある範囲の文字 (特に表意文字や記号) に対して常に true を返すわけではありません。  

通常、String.toLowerCase() は、文字を小文字にマップするときに使用する必要があります。String ケースマッピングメソッドは、Character ケースマッピングメソッドと比べて複数の利点があります。String ケースマッピングメソッドは、ロケール依存のマッピング、コンテキスト依存のマッピング、および 1:M 文字マッピングを実行できるのに対し、Character ケースマッピングメソッドはそのようなマッピングを実行できません。  

注: このメソッドは、補助文字を処理できません。補助文字を含むすべての Unicode 文字をサポートするには、toLowerCase(int) メソッドを使用してください。

パラメータ:
ch - 変換対象の文字
戻り値:
対応する小文字 (存在する場合)。小文字がない場合は、指定された文字そのもの
関連項目:
isLowerCase(char), String.toLowerCase()

toLowerCase

public static int toLowerCase(int codePoint)
UnicodeData ファイル内のケースマッピング情報を使用して、文字 (Unicode コードポイント) 引数を小文字に変換します。  

Character.isLowerCase(Character.toLowerCase(codePoint)) は、ある範囲の文字 (特に表意文字や記号) に対して常に true を返すわけではありません。  

通常、String.toLowerCase() は、文字を小文字にマップするときに使用する必要があります。String ケースマッピングメソッドは、Character ケースマッピングメソッドと比べて複数の利点があります。String ケースマッピングメソッドは、ロケール依存のマッピング、コンテキスト依存のマッピング、および 1:M 文字マッピングを実行できるのに対し、Character ケースマッピングメソッドはそのようなマッピングを実行できません。

パラメータ:
codePoint - 変換対象の文字 (Unicode コードポイント)
戻り値:
指定された文字 (Unicode コードポイント) の対応する小文字。 対応する小文字がない場合は、指定された文字そのもの
導入されたバージョン:
1.5
関連項目:
isLowerCase(int), String.toLowerCase()

toUpperCase

public static char toUpperCase(char ch)
UnicodeData ファイル内のケースマッピング情報を使用して、文字引数を大文字に変換します。

Character.isUpperCase(Character.toUpperCase(ch)) は、ある範囲の文字 (特に表意文字や記号) に対して常に true を返すわけではありません。  

通常、String.toUpperCase() は、文字を大文字にマップするときに使用する必要があります。String ケースマッピングメソッドは、Character ケースマッピングメソッドと比べて複数の利点があります。String ケースマッピングメソッドは、ロケール依存のマッピング、コンテキスト依存のマッピング、および 1:M 文字マッピングを実行できるのに対し、Character ケースマッピングメソッドはそのようなマッピングを実行できません。  

注: このメソッドは、補助文字を処理できません。補助文字を含むすべての Unicode 文字をサポートするには、toUpperCase(int) メソッドを使用してください。

パラメータ:
ch - 変換対象の文字
戻り値:
対応する大文字 (存在する場合)。大文字がない場合は、指定された文字そのもの
関連項目:
isUpperCase(char), String.toUpperCase()

toUpperCase

public static int toUpperCase(int codePoint)
UnicodeData ファイル内のケースマッピング情報を使用して、文字 (Unicode コードポイント) 引数を大文字に変換します。  

Character.isUpperCase(Character.toUpperCase(codePoint)) は、ある範囲の文字 (特に表意文字や記号) に対して常に true を返すわけではありません。  

通常、String.toUpperCase() は、文字を大文字にマップするときに使用する必要があります。String ケースマッピングメソッドは、Character ケースマッピングメソッドと比べて複数の利点があります。String ケースマッピングメソッドは、ロケール依存のマッピング、コンテキスト依存のマッピング、および 1:M 文字マッピングを実行できるのに対し、Character ケースマッピングメソッドはそのようなマッピングを実行できません。

パラメータ:
codePoint - 変換対象の文字 (Unicode コードポイント)
戻り値:
対応する大文字 (存在する場合)。大文字がない場合は、指定された文字そのもの
導入されたバージョン:
1.5
関連項目:
isUpperCase(int), String.toUpperCase()

toTitleCase

public static char toTitleCase(char ch)
UnicodeData ファイル内のケースマッピング情報を使用して、文字引数をタイトルケースに変換します。文字が、明示的なタイトルケースマッピングを保持せず、かつ UnicodeData に準拠したタイトルケース char ではない場合、等価なタイトルケースとして大文字へのマッピングが返されます。char 引数がタイトルケース char である場合には、同じ char 値が返されます。

Character.isTitleCase(Character.toTitleCase(ch)) は、ある範囲の文字に対して常に true を返すわけではないことに留意してください。  

注: このメソッドは、補助文字を処理できません。補助文字を含むすべての Unicode 文字をサポートするには、toTitleCase(int) メソッドを使用してください。

パラメータ:
ch - 変換対象の文字
戻り値:
対応するタイトルケース (存在する場合)。タイトルケースがない場合は、指定された文字そのもの
導入されたバージョン:
1.0.2
関連項目:
isTitleCase(char), toLowerCase(char), toUpperCase(char)

toTitleCase

public static int toTitleCase(int codePoint)
UnicodeData ファイル内のケースマッピング情報を使用して、文字 (Unicode コードポイント) 引数をタイトルケースに変換します。文字が、明示的なタイトルケースマッピングを保持せず、かつ UnicodeData に準拠したタイトルケース char ではない場合、等価なタイトルケースとして大文字へのマッピングが返されます。文字の引数がタイトルケース文字である場合には、同じ文字値が返されます。  

Character.isTitleCase(Character.toTitleCase(codePoint)) は、ある範囲の文字に対して常に true を返すわけではないことに留意してください。

パラメータ:
codePoint - 変換対象の文字 (Unicode コードポイント)
戻り値:
対応するタイトルケース (存在する場合)。タイトルケースがない場合は、指定された文字そのもの
導入されたバージョン:
1.5
関連項目:
isTitleCase(int), toLowerCase(int), toUpperCase(int)

digit

public static int digit(char ch,
                        int radix)
指定された基数での、文字 ch の数値としての値を返します。

基数が MIN_RADIX <= radix <= MAX_RADIX の範囲外の場合、または ch の値が指定された基数の有効数字でない場合は、-1 が返されます。次のどれかに当てはまる場合、文字は有効数字です。

 

注: このメソッドは、補助文字を処理できません。補助文字を含むすべての Unicode 文字をサポートするには、digit(int, int) メソッドを使用してください。

パラメータ:
ch - 変換対象の文字
radix - 基数
戻り値:
指定された基数での、文字によって表される数値
関連項目:
forDigit(int, int), isDigit(char)

digit

public static int digit(int codePoint,
                        int radix)
指定された基数の指定された文字 (Unicode コードポイント) の数値を返します。  

基数が MIN_RADIX <= radix <= MAX_RADIX の範囲外の場合、または文字が指定された基数の有効数字でない場合は、-1 が返されます。次のどれかに当てはまる場合、文字は有効数字です。

パラメータ:
codePoint - 変換対象の文字 (Unicode コードポイント)
radix - 基数
戻り値:
指定された基数での、文字によって表される数値
導入されたバージョン:
1.5
関連項目:
forDigit(int, int), isDigit(int)

getNumericValue

public static int getNumericValue(char ch)
指定された Unicode 文字の表す int 値を返します。たとえば、文字「\u216C」(ローマ数字の 50) は、値 50 の int を返します。 

A 〜 Z を表す大文字 ('\u0041''\u005A')、小文字 ('\u0061''\u007A')、および全角形式 ('\uFF21''\uFF3A''\uFF41''\uFF5A') は、10 〜 35 までの数値を形成します。これは Unicode 仕様 (これらの char 値に数値を割り当てない) からは独立しています。

文字が数値を持たない場合は、-1 が返されます。文字の数値を負でない整数として表現できない場合 (小数値など) は、-2 が返されます。  

注: このメソッドは、補助文字を処理できません。補助文字を含むすべての Unicode 文字をサポートするには、getNumericValue(int) メソッドを使用してください。

パラメータ:
ch - 変換対象の文字
戻り値:
負でない int 型の数値の場合、文字の数値。文字が負でない整数以外の数値を持つ場合は -2、文字が数値を持たない場合は -1
導入されたバージョン:
1.1
関連項目:
forDigit(int, int), isDigit(char)

getNumericValue

public static int getNumericValue(int codePoint)
指定された文字 (Unicode コードポイント) が表す int 値を返します。たとえば、文字「\u216C」(ローマ数字の 50) は、値 50 の int を返します。 

A 〜 Z を表す大文字 ('\u0041''\u005A')、小文字 ('\u0061''\u007A')、および全角形式 ('\uFF21''\uFF3A''\uFF41''\uFF5A') は、10 〜 35 までの数値を形成します。これは Unicode 仕様 (これらの char 値に数値を割り当てない) からは独立しています。

文字が数値を持たない場合は、-1 が返されます。文字の数値を負でない整数として表現できない場合 (小数値など) は、-2 が返されます。

パラメータ:
codePoint - 変換対象の文字 (Unicode コードポイント)
戻り値:
負でない int 型の数値の場合、文字の数値。文字が負でない整数以外の数値を持つ場合は -2、文字が数値を持たない場合は -1
導入されたバージョン:
1.5
関連項目:
forDigit(int, int), isDigit(int)

isSpace

@Deprecated
public static boolean isSpace(char ch)
推奨されていません。 isWhitespace(char) に置き換えられました。

指定された文字が ISO-LATIN-1 の空白かどうかを判定します。次の 5 つの文字についてだけ、このメソッドは true を返します。
'\t' \u0009 HORIZONTAL TABULATION
'\n' \u000A NEW LINE
'\f' \u000C FORM FEED
'\r' \u000D CARRIAGE RETURN
' ' \u0020 SPACE

パラメータ:
ch - 判定対象の文字
戻り値:
文字が ISO-LATIN-1 の空白の場合は true、そうでない場合は false
関連項目:
isSpaceChar(char), isWhitespace(char)

isSpaceChar

public static boolean isSpaceChar(char ch)
指定された文字が Unicode の空白文字かどうかを判定します。空白文字と見なされるのは、Unicode 標準で空白文字として指定されている場合だけです。文字の汎用カテゴリ型が次のどれかの場合にだけ、このメソッドは true を返します。  

注: このメソッドは、補助文字を処理できません。補助文字を含むすべての Unicode 文字をサポートするには、isSpaceChar(int) メソッドを使用してください。

パラメータ:
ch - 判定対象の文字
戻り値:
文字が空白文字の場合は true、そうでない場合は false
導入されたバージョン:
1.1
関連項目:
isWhitespace(char)

isSpaceChar

public static boolean isSpaceChar(int codePoint)
指定された文字 (Unicode コードポイント) が Unicode の空白文字かどうかを判定します。空白文字と見なされるのは、Unicode 標準で空白文字として指定されている場合だけです。文字の汎用カテゴリ型が次のどれかの場合にだけ、このメソッドは true を返します。

パラメータ:
codePoint - 判定対象の文字 (Unicode コードポイント)
戻り値:
文字が空白文字の場合は true、そうでない場合は false
導入されたバージョン:
1.5
関連項目:
isWhitespace(int)

isWhitespace

public static boolean isWhitespace(char ch)
指定された文字が Java の基準に従った空白かどうかを判定します。次の基準のどれかを満たす場合にだけ、Java の空白文字になります。  

注: このメソッドは、補助文字を処理できません。補助文字を含むすべての Unicode 文字をサポートするには、isWhitespace(int) メソッドを使用してください。

パラメータ:
ch - 判定対象の文字
戻り値:
文字が Java 空白文字の場合は true、そうでない場合は false
導入されたバージョン:
1.1
関連項目:
isSpaceChar(char)

isWhitespace

public static boolean isWhitespace(int codePoint)
指定された文字 (Unicode コードポイント) が Java の基準に従った空白かどうかを判定します。次の基準のどれかを満たす場合にだけ、Java の空白文字になります。

パラメータ:
codePoint - 判定対象の文字 (Unicode コードポイント)
戻り値:
文字が Java 空白文字の場合は true、そうでない場合は false
導入されたバージョン:
1.5
関連項目:
isSpaceChar(int)

isISOControl

public static boolean isISOControl(char ch)
指定された文字が ISO 制御文字かどうかを判定します。コードが「\u0000」〜「\u001F」の範囲、または「\u007F」〜「\u009F」の範囲の場合は、ISO 制御文字と見なされます。  

注: このメソッドは、補助文字を処理できません。補助文字を含むすべての Unicode 文字をサポートするには、isISOControl(int) メソッドを使用してください。

パラメータ:
ch - 判定対象の文字
戻り値:
文字が ISO 制御文字の場合は true、そうでない場合は false
導入されたバージョン:
1.1
関連項目:
isSpaceChar(char), isWhitespace(char)

isISOControl

public static boolean isISOControl(int codePoint)
参照された文字 (Unicode コードポイント) が ISO 制御文字かどうかを判定します。コードが「\u0000」〜「\u001F」の範囲、または「\u007F」〜「\u009F」の範囲の場合は、ISO 制御文字と見なされます。

パラメータ:
codePoint - 判定対象の文字 (Unicode コードポイント)
戻り値:
文字が ISO 制御文字の場合は true、そうでない場合は false
導入されたバージョン:
1.5
関連項目:
isSpaceChar(int), isWhitespace(int)

getType

public static int getType(char ch)
文字の汎用カテゴリを示す値を返します。  

注: このメソッドは、補助文字を処理できません。補助文字を含むすべての Unicode 文字をサポートするには、getType(int) メソッドを使用してください。

パラメータ:
ch - 判定対象の文字
戻り値:
文字の汎用カテゴリを表す int 型の値
導入されたバージョン:
1.1
関連項目:
COMBINING_SPACING_MARK, CONNECTOR_PUNCTUATION, CONTROL, CURRENCY_SYMBOL, DASH_PUNCTUATION, DECIMAL_DIGIT_NUMBER, ENCLOSING_MARK, END_PUNCTUATION, FINAL_QUOTE_PUNCTUATION, FORMAT, INITIAL_QUOTE_PUNCTUATION, LETTER_NUMBER, LINE_SEPARATOR, LOWERCASE_LETTER, MATH_SYMBOL, MODIFIER_LETTER, MODIFIER_SYMBOL, NON_SPACING_MARK, OTHER_LETTER, OTHER_NUMBER, OTHER_PUNCTUATION, OTHER_SYMBOL, PARAGRAPH_SEPARATOR, PRIVATE_USE, SPACE_SEPARATOR, START_PUNCTUATION, SURROGATE, TITLECASE_LETTER, UNASSIGNED, UPPERCASE_LETTER

getType

public static int getType(int codePoint)
文字の汎用カテゴリを示す値を返します。

パラメータ:
codePoint - 判定対象の文字 (Unicode コードポイント)
戻り値:
文字の汎用カテゴリを表す int 型の値
導入されたバージョン:
1.5
関連項目:
COMBINING_SPACING_MARK, CONNECTOR_PUNCTUATION, CONTROL, CURRENCY_SYMBOL, DASH_PUNCTUATION, DECIMAL_DIGIT_NUMBER, ENCLOSING_MARK, END_PUNCTUATION, FINAL_QUOTE_PUNCTUATION, 形式, INITIAL_QUOTE_PUNCTUATION, LETTER_NUMBER, LINE_SEPARATOR, LOWERCASE_LETTER, MATH_SYMBOL, MODIFIER_LETTER, MODIFIER_SYMBOL, NON_SPACING_MARK, OTHER_LETTER, OTHER_NUMBER, OTHER_PUNCTUATION, OTHER_SYMBOL, PARAGRAPH_SEPARATOR, PRIVATE_USE, SPACE_SEPARATOR, START_PUNCTUATION, SURROGATE, TITLECASE_LETTER, UNASSIGNED, UPPERCASE_LETTER

forDigit

public static char forDigit(int digit,
                            int radix)
指定された基数での、指定された数字の文字表現を判定します。radix の値が無効な基数の場合、または digit が指定された基数で無効な数字の場合は、null 文字 (「\u0000」) が返されます。

radix 引数は、MIN_RADIX 以上か、MAX_RADIX 以下である場合に有効です。digit 引数は、0 <=digit < radix の場合に有効です。

数字が 10 より小さいと、'0' + digit が返されます。そうでない場合は、'a' + digit - 10 が返されます。

パラメータ:
digit - 文字に変換する数
radix - 基数
戻り値:
指定された基数での、指定された数値の char 表現
関連項目:
MIN_RADIX, MAX_RADIX, digit(char, int)

getDirectionality

public static byte getDirectionality(char ch)
指定された文字の Unicode 方向性プロパティーを返します。文字の方向性は、テキストの表示順の計算に使用されます。未定義の char 値の方向性値は DIRECTIONALITY_UNDEFINED です。  

注: このメソッドは、補助文字を処理できません。補助文字を含むすべての Unicode 文字をサポートするには、getDirectionality(int) メソッドを使用してください。

パラメータ:
ch - 方向性プロパティーの要求された char
戻り値:
char 値の方向性プロパティー
導入されたバージョン:
1.4
関連項目:
DIRECTIONALITY_UNDEFINED, DIRECTIONALITY_LEFT_TO_RIGHT, DIRECTIONALITY_RIGHT_TO_LEFT, DIRECTIONALITY_RIGHT_TO_LEFT_ARABIC, DIRECTIONALITY_EUROPEAN_NUMBER, DIRECTIONALITY_EUROPEAN_NUMBER_SEPARATOR, DIRECTIONALITY_EUROPEAN_NUMBER_TERMINATOR, DIRECTIONALITY_ARABIC_NUMBER, DIRECTIONALITY_COMMON_NUMBER_SEPARATOR, DIRECTIONALITY_NONSPACING_MARK, DIRECTIONALITY_BOUNDARY_NEUTRAL, DIRECTIONALITY_PARAGRAPH_SEPARATOR, DIRECTIONALITY_SEGMENT_SEPARATOR, DIRECTIONALITY_WHITESPACE, DIRECTIONALITY_OTHER_NEUTRALS, DIRECTIONALITY_LEFT_TO_RIGHT_EMBEDDING, DIRECTIONALITY_LEFT_TO_RIGHT_OVERRIDE, DIRECTIONALITY_RIGHT_TO_LEFT_EMBEDDING, DIRECTIONALITY_RIGHT_TO_LEFT_OVERRIDE, DIRECTIONALITY_POP_DIRECTIONAL_FORMAT

getDirectionality

public static byte getDirectionality(int codePoint)
所定の文字 (Unicode コードポイント) の Unicode 方向性プロパティーを返します。文字の方向性は、テキストの表示順の計算に使用されます。未定義の文字の方向性値は DIRECTIONALITY_UNDEFINED です。

パラメータ:
codePoint - 方向性プロパティーが要求される文字 (Unicode コードポイント)
戻り値:
文字の方向性プロパティー
導入されたバージョン:
1.5
関連項目:
DIRECTIONALITY_UNDEFINED, DIRECTIONALITY_LEFT_TO_RIGHT, DIRECTIONALITY_RIGHT_TO_LEFT, DIRECTIONALITY_RIGHT_TO_LEFT_ARABIC, DIRECTIONALITY_EUROPEAN_NUMBER, DIRECTIONALITY_EUROPEAN_NUMBER_SEPARATOR, DIRECTIONALITY_EUROPEAN_NUMBER_TERMINATOR, DIRECTIONALITY_ARABIC_NUMBER, DIRECTIONALITY_COMMON_NUMBER_SEPARATOR, DIRECTIONALITY_NONSPACING_MARK, DIRECTIONALITY_BOUNDARY_NEUTRAL, DIRECTIONALITY_PARAGRAPH_SEPARATOR, DIRECTIONALITY_SEGMENT_SEPARATOR, DIRECTIONALITY_WHITESPACE, DIRECTIONALITY_OTHER_NEUTRALS, DIRECTIONALITY_LEFT_TO_RIGHT_EMBEDDING, DIRECTIONALITY_LEFT_TO_RIGHT_OVERRIDE, DIRECTIONALITY_RIGHT_TO_LEFT_EMBEDDING, DIRECTIONALITY_RIGHT_TO_LEFT_OVERRIDE, DIRECTIONALITY_POP_DIRECTIONAL_FORMAT

isMirrored

public static boolean isMirrored(char ch)
Unicode 仕様に従って文字をミラー化するかどうかを判定します。テキスト内で右から左に文字が描画される場合、文字のミラー化により、グリフが水平方向にミラー化されます。たとえば、「\u0028」 LEFT PARENTHESIS は、セマンティクスでは「開き括弧」として定義されています。これは、左から右に描画されるテキストでは「(」になり、右から左に描画されるテキストでは「)」になります。  

注: このメソッドは、補助文字を処理できません。補助文字を含むすべての Unicode 文字をサポートするには、isMirrored(int) メソッドを使用してください。

パラメータ:
ch - ミラー化プロパティーの要求された char
戻り値:
char がミラー化される場合は truechar がミラー化されないか未定義の場合は false
導入されたバージョン:
1.4

isMirrored

public static boolean isMirrored(int codePoint)
Unicode 仕様に従って、指定された文字 (Unicode コードポイント) をミラー化するかどうかを判定します。テキスト内で右から左に文字が描画される場合、文字のミラー化により、グリフが水平方向にミラー化されます。たとえば、「\u0028」 LEFT PARENTHESIS は、セマンティクスでは「開き括弧」として定義されています。これは、左から右に描画されるテキストでは「(」になり、右から左に描画されるテキストでは「)」になります。

パラメータ:
codePoint - 判定対象の文字 (Unicode コードポイント)
戻り値:
文字がミラー化される場合は true、ミラー化されないか未定義の場合は false
導入されたバージョン:
1.5

compareTo

public int compareTo(Character anotherCharacter)
2 つの Character オブジェクトを数値的に比較します。

定義:
インタフェース Comparable<Character> 内の compareTo
パラメータ:
anotherCharacter - 比較対象の Character
戻り値:
引数 Character がこの Character と等しい場合は値 0、この CharacterCharacter 引数より小さい数値の場合は 0 より小さい値、この CharacterCharacter 引数より大きい数値の場合は 0 より大きい値 (符号なしの比較)。これは完全に数値の比較なので、ロケールに依存しない
導入されたバージョン:
1.2

reverseBytes

public static char reverseBytes(char ch)
指定された char 値でバイト順を逆にして取得した値を返します。

戻り値:
指定された char 値でバイト順を逆にして (つまり入れ替えて) 取得した値
導入されたバージョン:
1.5

JavaTM Platform
Standard Ed. 6

バグの報告と機能のリクエスト
さらに詳しい API リファレンスおよび開発者ドキュメントについては、Java SE 開発者用ドキュメントを参照してください。開発者向けの詳細な解説、概念の概要、用語の定義、バグの回避策、およびコード実例が含まれています。

Copyright 2009 Sun Microsystems, Inc. All rights reserved. Use is subject to license terms. Documentation Redistribution Policy も参照してください。