public final class Character extends Object implements Serializable, Comparable<Character>
Character
クラスは、プリミティブ型 char
の値をオブジェクトにラップします。Character
型のオブジェクトには、型が char
の単一フィールドが含まれます。
また、このクラスは、文字のカテゴリ (小文字、数字など) を決定したり、大文字から小文字 (およびその逆) の変換を行ういくつかのメソッドも提供します。
文字情報は、Unicode Standard、バージョン 6.0.0 に基づきます。
Character
クラスのメソッドおよびデータは、UnicodeData ファイル内の情報により定義されます。このファイルは、Unicode Consortium がメンテナンスを行っている Unicode Character Database の一部です。このファイルは、定義済みの Unicode コードポイントまたは文字範囲ごとの名前やカテゴリを含むさまざまなプロパティーを指定します。
ファイルおよびその説明は、次のサイトの Unicode Consortium から入手できます。
char
データ型 (Character
オブジェクトにカプセル化される値) は、当初の Unicode 仕様に基づいています。この仕様では、文字が固定幅 16 ビットエンティティーとして定義されていました。Unicode 標準はその後、16 ビット以上の表現を必要とする文字を許容するように変更されています。適正なコードポイントの範囲は、現在 U+0000 - U+10FFFF であり、Unicode スカラー値として知られています。(Unicode 標準の U+n 表記の定義を参照。)
U+0000 - U+FFFF の文字セットは、基本多言語面 (BMP) と呼ばれる場合もあります。コードポイントが U+FFFF より大きい文字は補助文字と呼ばれます。Java プラットフォームでは、char
配列、String
クラス、および StringBuffer
クラスで UTF-16 表現が使用されます。UTF-16 表現では、補助文字は char
値のペアとして表現され、上位サロゲート範囲 (\uD800-\uDBFF) からの最初の値と、下位サロゲート範囲 (\uDC00-\uDFFF) からの第 2 の値から構成されています。
したがって、char
値は、サロゲートコードポイントや UTF-16 エンコーディングのコード単位を含む基本多言語面 (BMP) コードポイントを表します。int
値は、補助コードポイントを含むすべての Unicode コードポイントを表します。int
の下位 (最下位) 21 ビットは、Unicode コードポイントを表すために使用され、上位 (最上位) 11 ビットはゼロである必要があります。特に指定されないかぎり、補助文字とサロゲート char
値に関する動作は次のとおりです。
char
値だけを受け入れるメソッドは補助文字に対応できません。これらのメソッドはサロゲート範囲の char
値を未定義の文字として扱います。たとえば、Character.isLetter('\uD840')
は false
を返し、文字列でそのあとに下位サロゲート値が続く場合でも、この特定の値は文字を表します。
int
値を受け入れるメソッドは、補助文字を含むすべての Unicode 文字に対応します。たとえば、Character.isLetter(0x2F81A)
は、コードポイント値が文字 (CJK 統合漢字) を表すため、true
を返します。
Java SE API ドキュメンテーションでは、U+0000 - U+10FFFF の範囲の文字値に Unicode コードポイントを使用し、UTF-16 エンコーディングのコード単位である 16 ビット char
値に Unicode コード単位を使用します。Unicode 用語の詳細は、「Glossary of Unicode Terms」を参照してください。
修飾子と型 | クラスと説明 |
---|---|
static class |
Character.Subset
このクラスのインスタンスは、Unicode 文字セットの特定のサブセットを表します。
|
static class |
Character.UnicodeBlock
Unicode 仕様で定義されている文字ブロックを表す文字サブセットのファミリです。
|
static class |
Character.UnicodeScript
「Unicode Standard Annex #24: Script Names」で規定された文字スクリプトを表す文字サブセットのファミリです。
|
修飾子と型 | フィールドと説明 |
---|---|
static byte |
COMBINING_SPACING_MARK
Unicode 仕様の汎用カテゴリ「Mc」。
|
static byte |
CONNECTOR_PUNCTUATION
Unicode 仕様の汎用カテゴリ「Pc」。
|
static byte |
CONTROL
Unicode 仕様の汎用カテゴリ「Cc」。
|
static byte |
CURRENCY_SYMBOL
Unicode 仕様の汎用カテゴリ「Sc」。
|
static byte |
DASH_PUNCTUATION
Unicode 仕様の汎用カテゴリ「Pd」。
|
static byte |
DECIMAL_DIGIT_NUMBER
Unicode 仕様の汎用カテゴリ「Nd」。
|
static byte |
DIRECTIONALITY_ARABIC_NUMBER
Unicode 仕様の弱い双方向文字タイプ「AN」。
|
static byte |
DIRECTIONALITY_BOUNDARY_NEUTRAL
Unicode 仕様の弱い双方向文字タイプ「BN」。
|
static byte |
DIRECTIONALITY_COMMON_NUMBER_SEPARATOR
Unicode 仕様の弱い双方向文字タイプ「CS」。
|
static byte |
DIRECTIONALITY_EUROPEAN_NUMBER
Unicode 仕様の弱い双方向文字タイプ「EN」。
|
static byte |
DIRECTIONALITY_EUROPEAN_NUMBER_SEPARATOR
Unicode 仕様の弱い双方向文字タイプ「ES」。
|
static byte |
DIRECTIONALITY_EUROPEAN_NUMBER_TERMINATOR
Unicode 仕様の弱い双方向文字タイプ「ET」。
|
static byte |
DIRECTIONALITY_LEFT_TO_RIGHT
Unicode 仕様の強力な双方向文字タイプ「L」。
|
static byte |
DIRECTIONALITY_LEFT_TO_RIGHT_EMBEDDING
Unicode 仕様の強力な双方向文字タイプ「LRE」。
|
static byte |
DIRECTIONALITY_LEFT_TO_RIGHT_OVERRIDE
Unicode 仕様の強力な双方向文字タイプ「LRO」。
|
static byte |
DIRECTIONALITY_NONSPACING_MARK
Unicode 仕様の弱い双方向文字タイプ「NSM」。
|
static byte |
DIRECTIONALITY_OTHER_NEUTRALS
Unicode 仕様のニュートラルな双方向文字タイプ「ON」。
|
static byte |
DIRECTIONALITY_PARAGRAPH_SEPARATOR
Unicode 仕様のニュートラルな双方向文字タイプ「B」。
|
static byte |
DIRECTIONALITY_POP_DIRECTIONAL_FORMAT
Unicode 仕様の弱い双方向文字タイプ「PDF」。
|
static byte |
DIRECTIONALITY_RIGHT_TO_LEFT
Unicode 仕様の強力な双方向文字タイプ「R」。
|
static byte |
DIRECTIONALITY_RIGHT_TO_LEFT_ARABIC
Unicode 仕様の強力な双方向文字タイプ「AL」。
|
static byte |
DIRECTIONALITY_RIGHT_TO_LEFT_EMBEDDING
Unicode 仕様の強力な双方向文字タイプ「RLE」。
|
static byte |
DIRECTIONALITY_RIGHT_TO_LEFT_OVERRIDE
Unicode 仕様の強力な双方向文字タイプ「RLO」。
|
static byte |
DIRECTIONALITY_SEGMENT_SEPARATOR
Unicode 仕様のニュートラルな双方向文字タイプ「S」。
|
static byte |
DIRECTIONALITY_UNDEFINED
未定義の双方向文字タイプ。
|
static byte |
DIRECTIONALITY_WHITESPACE
Unicode 仕様のニュートラルな双方向文字タイプ「WS」。
|
static byte |
ENCLOSING_MARK
Unicode 仕様の汎用カテゴリ「Me」。
|
static byte |
END_PUNCTUATION
Unicode 仕様の汎用カテゴリ「Pe」。
|
static byte |
FINAL_QUOTE_PUNCTUATION
Unicode 仕様の汎用カテゴリ「Pf」。
|
static byte |
FORMAT
Unicode 仕様の汎用カテゴリ「Cf」。
|
static byte |
INITIAL_QUOTE_PUNCTUATION
Unicode 仕様の汎用カテゴリ「Pi」。
|
static byte |
LETTER_NUMBER
Unicode 仕様の汎用カテゴリ「Nl」。
|
static byte |
LINE_SEPARATOR
Unicode 仕様の汎用カテゴリ「Zl」。
|
static byte |
LOWERCASE_LETTER
Unicode 仕様の汎用カテゴリ「Ll」。
|
static byte |
MATH_SYMBOL
Unicode 仕様の汎用カテゴリ「Sm」。
|
static int |
MAX_CODE_POINT
Unicode コードポイントの最大値 (定数
U+10FFFF )。 |
static char |
MAX_HIGH_SURROGATE
UTF-16 エンコーディングでの Unicode 上位サロゲートコード単位の最大値 (定数
'\uDBFF' )。 |
static char |
MAX_LOW_SURROGATE
UTF-16 エンコーディングでの Unicode 下位サロゲートコード単位の最大値 (定数
'\uDFFF' )。 |
static int |
MAX_RADIX
文字列との変換に使用可能な最大基数。
|
static char |
MAX_SURROGATE
UTF-16 エンコーディングでの Unicode サロゲートコード単位の最大値 (定数
'\uDFFF' )。 |
static char |
MAX_VALUE
このフィールドの定数値は、
char 型の最大値 '\uFFFF' 。 |
static int |
MIN_CODE_POINT
Unicode コードポイントの最小値 (定数
U+0000 )。 |
static char |
MIN_HIGH_SURROGATE
UTF-16 エンコーディングでの Unicode 上位サロゲートコード単位の最小値 (定数
'\uD800' )。 |
static char |
MIN_LOW_SURROGATE
UTF-16 エンコーディングでの Unicode 下位サロゲートコード単位の最小値 (定数
'\uDC00' )。 |
static int |
MIN_RADIX
文字列との変換に使用可能な最小基数。
|
static int |
MIN_SUPPLEMENTARY_CODE_POINT
Unicode 補助コードポイントの最小値 (定数
U+10000 )。 |
static char |
MIN_SURROGATE
UTF-16 エンコーディングでの Unicode サロゲートコード単位の最小値 (定数
'\uD800' )。 |
static char |
MIN_VALUE
このフィールドの定数値は、
char 型の最小値 '\u0000' 。 |
static byte |
MODIFIER_LETTER
Unicode 仕様の汎用カテゴリ「Lm」。
|
static byte |
MODIFIER_SYMBOL
Unicode 仕様の汎用カテゴリ「Sk」。
|
static byte |
NON_SPACING_MARK
Unicode 仕様の汎用カテゴリ「Mn」。
|
static byte |
OTHER_LETTER
Unicode 仕様の汎用カテゴリ「Lo」。
|
static byte |
OTHER_NUMBER
Unicode 仕様の汎用カテゴリ「No」。
|
static byte |
OTHER_PUNCTUATION
Unicode 仕様の汎用カテゴリ「Po」。
|
static byte |
OTHER_SYMBOL
Unicode 仕様の汎用カテゴリ「So」。
|
static byte |
PARAGRAPH_SEPARATOR
Unicode 仕様の汎用カテゴリ「Zp」。
|
static byte |
PRIVATE_USE
Unicode 仕様の汎用カテゴリ「Co」。
|
static int |
SIZE
符号なしバイナリ形式で char 値を表すのに使用されるビット数 (定数
16 )。 |
static byte |
SPACE_SEPARATOR
Unicode 仕様の汎用カテゴリ「Zs」。
|
static byte |
START_PUNCTUATION
Unicode 仕様の汎用カテゴリ「Ps」。
|
static byte |
SURROGATE
Unicode 仕様の汎用カテゴリ「Cs」。
|
static byte |
TITLECASE_LETTER
Unicode 仕様の汎用カテゴリ「Lt」。
|
static Class<Character> |
TYPE
プリミティブ型
char を表す Class インスタンス。 |
static byte |
UNASSIGNED
Unicode 仕様の汎用カテゴリ「Cn」。
|
static byte |
UPPERCASE_LETTER
Unicode 仕様の汎用カテゴリ「Lu」。
|
コンストラクタと説明 |
---|
Character(char value)
指定された
char 値を表す、新しく割り当てられた Character オブジェクトを構築します。 |
修飾子と型 | メソッドと説明 |
---|---|
static int |
charCount(int codePoint)
指定された文字 (Unicode コードポイント) を表すのに必要な
char 値の数を判定します。 |
char |
charValue()
この
Character オブジェクトの値を返します。 |
static int |
codePointAt(char[] a, int index)
char 配列の指定されたインデックスにあるコードポイントを返します。 |
static int |
codePointAt(char[] a, int index, int limit)
limit の長さ未満の index を持つ配列要素のみを使用可能な、char 配列の指定されたインデックスにあるコードポイントを返します。 |
static int |
codePointAt(CharSequence seq, int index)
CharSequence の指定されたインデックスにあるコードポイントを返します。 |
static int |
codePointBefore(char[] a, int index)
char 配列の指定されたインデックスの前にあるコードポイントを返します。 |
static int |
codePointBefore(char[] a, int index, int start)
start 以上の index を持つ配列要素のみを使用可能な、char 配列の指定されたインデックスの前にあるコードポイントを返します。 |
static int |
codePointBefore(CharSequence seq, int index)
CharSequence の指定されたインデックスの前にあるコードポイントを返します。 |
static int |
codePointCount(char[] a, int offset, int count)
char 配列引数の部分配列内にある Unicode コードポイントの数を返します。 |
static int |
codePointCount(CharSequence seq, int beginIndex, int endIndex)
指定された char シーケンスのテキスト範囲内の Unicode コードポイントの数を返します。
|
static int |
compare(char x, char y)
2 つの
char 値を数値的に比較します。 |
int |
compareTo(Character anotherCharacter)
2 つの
Character オブジェクトを数値的に比較します。 |
static int |
digit(char ch, int radix)
指定された基数での、文字
ch の数値としての値を返します。 |
static int |
digit(int codePoint, int radix)
指定された基数での、指定された文字 (Unicode コードポイント) の数値を返します。
|
boolean |
equals(Object obj)
このオブジェクトと指定されたオブジェクトを比較します。
|
static char |
forDigit(int digit, int radix)
指定された基数での、指定された桁数の文字表現を判定します。
|
static byte |
getDirectionality(char ch)
指定された文字の Unicode 方向性プロパティーを返します。
|
static byte |
getDirectionality(int codePoint)
所定の文字 (Unicode コードポイント) の Unicode 方向性プロパティーを返します。
|
static String |
getName(int codePoint)
指定された文字
codePoint の Unicodee 名 (コードポイントが unassigned の場合は null) を返します。 |
static int |
getNumericValue(char ch)
指定された Unicode 文字が表す
int 値を返します。 |
static int |
getNumericValue(int codePoint)
指定された文字 (Unicode コードポイント) が表す
int 値を返します。 |
static int |
getType(char ch)
文字の汎用カテゴリを示す値を返します。
|
static int |
getType(int codePoint)
文字の汎用カテゴリを示す値を返します。
|
int |
hashCode()
この
Character のハッシュコード (charValue() を呼び出した場合の結果と等しくなる) を返します。 |
static char |
highSurrogate(int codePoint)
UTF-16 エンコーディングの指定された補助文字 (Unicode コードポイント) を表すサロゲートペアのリーディングサロゲート (上位サロゲートコード単位) を返します。
|
static boolean |
isAlphabetic(int codePoint)
指定された文字 (Unicode コードポイント) がアルファベットかどうかを判定します。
|
static boolean |
isBmpCodePoint(int codePoint)
指定された文字 (Unicode コードポイント) が基本多言語面 (BMP) に含まれるかどうかを判定します。
|
static boolean |
isDefined(char ch)
文字が Unicode で定義されているかどうかを判定します。
|
static boolean |
isDefined(int codePoint)
文字 (Unicodeコードポイント) が Unicode で定義されているかどうかを判定します。
|
static boolean |
isDigit(char ch)
指定された文字が数字かどうかを判定します。
|
static boolean |
isDigit(int codePoint)
指定された文字 (Unicode コードポイント) が数字かどうかを判定します。
|
static boolean |
isHighSurrogate(char ch)
指定された
char 値が Unicode 上位サロゲートコード単位 (リーディングサロゲートコード単位ともいう) であるかどうかを判定します。 |
static boolean |
isIdentifierIgnorable(char ch)
指定された文字が、Java 識別子または Unicode 識別子内で無視可能な文字かどうかを判定します。
|
static boolean |
isIdentifierIgnorable(int codePoint)
指定された文字 (Unicode コードポイント) が、Java 識別子または Unicode 識別子内で無視可能な文字かどうかを判定します。
|
static boolean |
isIdeographic(int codePoint)
指定された文字 (Unicode コードポイント) が、Unicode 標準で規定された CJKV (中国語、日本語、韓国語、およびベトナム語) の表意文字かどうかを判定します。
|
static boolean |
isISOControl(char ch)
指定された文字が ISO 制御文字かどうかを判定します。
|
static boolean |
isISOControl(int codePoint)
参照された文字 (Unicode コードポイント) が ISO 制御文字かどうかを判定します。
|
static boolean |
isJavaIdentifierPart(char ch)
指定された文字を Java 識別子の最初の文字以外に使用可能かどうかを判定します。
|
static boolean |
isJavaIdentifierPart(int codePoint)
文字 (Unicode コードポイント) を Java 識別子の最初の文字以外に使用可能かどうかを判定します。
|
static boolean |
isJavaIdentifierStart(char ch)
指定された文字を Java 識別子の最初の文字として指定可能かどうかを判定します。
|
static boolean |
isJavaIdentifierStart(int codePoint)
文字 (Unicode コードポイント) を Java 識別子の最初の文字として指定可能かどうかを判定します。
|
static boolean |
isJavaLetter(char ch)
非推奨。
isJavaIdentifierStart(char) に置き換えられました。
|
static boolean |
isJavaLetterOrDigit(char ch)
非推奨。
isJavaIdentifierPart(char) に置き換えられました。
|
static boolean |
isLetter(char ch)
指定された文字が汎用文字かどうかを判定します。
|
static boolean |
isLetter(int codePoint)
指定された文字 (Unicode コードポイント) が汎用文字かどうかを判定します。
|
static boolean |
isLetterOrDigit(char ch)
指定された文字が汎用文字または数字かどうかを判定します。
|
static boolean |
isLetterOrDigit(int codePoint)
指定された文字 (Unicode コードポイント) が汎用文字または数字かどうかを判定します。
|
static boolean |
isLowerCase(char ch)
指定された文字が小文字かどうかを判定します。
|
static boolean |
isLowerCase(int codePoint)
指定された文字 (Unicode コードポイント) が小文字かどうかを判定します。
|
static boolean |
isLowSurrogate(char ch)
指定された
char 値が Unicode 下位サロゲートコード単位 (トレーリングサロゲートコード単位ともいう) であるかどうかを判定します。 |
static boolean |
isMirrored(char ch)
Unicode 仕様に従って文字をミラー化するかどうかを判定します。
|
static boolean |
isMirrored(int codePoint)
Unicode 仕様に従って、指定された文字 (Unicode コードポイント) をミラー化するかどうかを判定します。
|
static boolean |
isSpace(char ch)
非推奨。
isWhitespace(char) に置き換えられました。
|
static boolean |
isSpaceChar(char ch)
指定された文字が Unicode の空白文字かどうかを判定します。
|
static boolean |
isSpaceChar(int codePoint)
指定された文字 (Unicode コードポイント) が Unicode の空白文字かどうかを判定します。
|
static boolean |
isSupplementaryCodePoint(int codePoint)
指定された文字 (Unicode コードポイント) が補助文字の範囲にあるかどうかを判定します。
|
static boolean |
isSurrogate(char ch)
指定された
char 値が Unicode サロゲートコード単位かどうかを判定します。 |
static boolean |
isSurrogatePair(char high, char low)
指定された
char 値のペアが有効な Unicode サロゲートペアであるかどうかを判定します。 |
static boolean |
isTitleCase(char ch)
指定された文字がタイトルケース文字かどうかを判定します。
|
static boolean |
isTitleCase(int codePoint)
指定された文字 (Unicode コードポイント) がタイトルケース文字かどうかを判定します。
|
static boolean |
isUnicodeIdentifierPart(char ch)
指定された文字を Unicode 識別子の最初の文字以外に使用可能かどうかを判定します。
|
static boolean |
isUnicodeIdentifierPart(int codePoint)
指定された文字 (Unicode コードポイント) を Unicode 識別子の最初の文字以外に使用可能かどうかを判定します。
|
static boolean |
isUnicodeIdentifierStart(char ch)
指定された文字を Unicode 識別子の最初の文字として指定可能かどうかを判定します。
|
static boolean |
isUnicodeIdentifierStart(int codePoint)
指定された文字 (Unicode コードポイント) を Unicode 識別子の最初の文字として指定可能かどうかを判定します。
|
static boolean |
isUpperCase(char ch)
指定された文字が大文字がどうかを判定します。
|
static boolean |
isUpperCase(int codePoint)
指定された文字 (Unicode コードポイント) が大文字かどうかを判定します。
|
static boolean |
isValidCodePoint(int codePoint)
指定されたコードポイントが有効な Unicode コードポイント値であるかどうかを判定します。
|
static boolean |
isWhitespace(char ch)
指定された文字が Java の基準に従った空白かどうかを判定します。
|
static boolean |
isWhitespace(int codePoint)
指定された文字 (Unicode コードポイント) が Java の基準に従った空白かどうかを判定します。
|
static char |
lowSurrogate(int codePoint)
UTF-16 エンコーディングの指定された補助文字 (Unicode コードポイント) を表すサロゲートペアのトレーリングサロゲート (下位サロゲートコード単位) を返します。
|
static int |
offsetByCodePoints(char[] a, int start, int count, int index, int codePointOffset)
指定された
char 部分配列内で、指定された index から codePointOffset コードポイント分だけオフセットされた位置のインデックスを返します。 |
static int |
offsetByCodePoints(CharSequence seq, int index, int codePointOffset)
指定された文字シーケンス内で、指定された
index から codePointOffset コードポイント分だけオフセットされた位置のインデックスを返します。 |
static char |
reverseBytes(char ch)
指定された char 値でバイト順を逆にして取得した値を返します。
|
static char[] |
toChars(int codePoint)
指定された文字 (Unicode コードポイント) を
char 配列に格納される UTF-16 表現に変換します。 |
static int |
toChars(int codePoint, char[] dst, int dstIndex)
指定された文字 (Unicode コードポイント) を UTF-16 表現に変換します。
|
static int |
toCodePoint(char high, char low)
指定されたサロゲートペアをその補助コードポイント値に変換します。
|
static char |
toLowerCase(char ch)
UnicodeData ファイル内のケースマッピング情報を使用して、文字引数を小文字に変換します。
|
static int |
toLowerCase(int codePoint)
UnicodeData ファイル内のケースマッピング情報を使用して、文字 (Unicode コードポイント) 引数を小文字に変換します。
|
String |
toString()
この
Character の値を表す String オブジェクトを返します。 |
static String |
toString(char c)
指定された
char を表す String オブジェクトを返します。 |
static char |
toTitleCase(char ch)
UnicodeData ファイル内のケースマッピング情報を使用して、文字引数をタイトルケースに変換します。
|
static int |
toTitleCase(int codePoint)
UnicodeData ファイル内のケースマッピング情報を使用して、文字 (Unicode コードポイント) 引数をタイトルケースに変換します。
|
static char |
toUpperCase(char ch)
UnicodeData ファイル内のケースマッピング情報を使用して、文字引数を大文字に変換します。
|
static int |
toUpperCase(int codePoint)
UnicodeData ファイル内のケースマッピング情報を使用して、文字 (Unicode コードポイント) 引数を大文字に変換します。
|
static Character |
valueOf(char c)
指定された char 値を表す Character インスタンスを返します。
|
public static final int MIN_RADIX
Integer
クラスの digit
メソッド、forDigit
メソッド、および toString
メソッドなどの基数変換メソッドの最小許容値です。public static final int MAX_RADIX
Integer
クラスの digit
メソッド、forDigit
メソッド、および toString
メソッドなどの基数変換メソッドの最大許容値です。public static final char MIN_VALUE
char
型の最小値 '\u0000'
です。public static final char MAX_VALUE
char
型の最大値 '\uFFFF'
です。public static final byte UNASSIGNED
public static final byte UPPERCASE_LETTER
public static final byte LOWERCASE_LETTER
public static final byte TITLECASE_LETTER
public static final byte MODIFIER_LETTER
public static final byte OTHER_LETTER
public static final byte NON_SPACING_MARK
public static final byte ENCLOSING_MARK
public static final byte COMBINING_SPACING_MARK
public static final byte DECIMAL_DIGIT_NUMBER
public static final byte LETTER_NUMBER
public static final byte OTHER_NUMBER
public static final byte SPACE_SEPARATOR
public static final byte LINE_SEPARATOR
public static final byte PARAGRAPH_SEPARATOR
public static final byte CONTROL
public static final byte FORMAT
public static final byte PRIVATE_USE
public static final byte SURROGATE
public static final byte DASH_PUNCTUATION
public static final byte START_PUNCTUATION
public static final byte END_PUNCTUATION
public static final byte CONNECTOR_PUNCTUATION
public static final byte OTHER_PUNCTUATION
public static final byte MATH_SYMBOL
public static final byte CURRENCY_SYMBOL
public static final byte MODIFIER_SYMBOL
public static final byte OTHER_SYMBOL
public static final byte INITIAL_QUOTE_PUNCTUATION
public static final byte FINAL_QUOTE_PUNCTUATION
public static final byte DIRECTIONALITY_UNDEFINED
char
値の方向性は定義されていません。public static final byte DIRECTIONALITY_LEFT_TO_RIGHT
public static final byte DIRECTIONALITY_RIGHT_TO_LEFT
public static final byte DIRECTIONALITY_RIGHT_TO_LEFT_ARABIC
public static final byte DIRECTIONALITY_EUROPEAN_NUMBER
public static final byte DIRECTIONALITY_EUROPEAN_NUMBER_SEPARATOR
public static final byte DIRECTIONALITY_EUROPEAN_NUMBER_TERMINATOR
public static final byte DIRECTIONALITY_ARABIC_NUMBER
public static final byte DIRECTIONALITY_COMMON_NUMBER_SEPARATOR
public static final byte DIRECTIONALITY_NONSPACING_MARK
public static final byte DIRECTIONALITY_BOUNDARY_NEUTRAL
public static final byte DIRECTIONALITY_PARAGRAPH_SEPARATOR
public static final byte DIRECTIONALITY_SEGMENT_SEPARATOR
public static final byte DIRECTIONALITY_WHITESPACE
public static final byte DIRECTIONALITY_OTHER_NEUTRALS
public static final byte DIRECTIONALITY_LEFT_TO_RIGHT_EMBEDDING
public static final byte DIRECTIONALITY_LEFT_TO_RIGHT_OVERRIDE
public static final byte DIRECTIONALITY_RIGHT_TO_LEFT_EMBEDDING
public static final byte DIRECTIONALITY_RIGHT_TO_LEFT_OVERRIDE
public static final byte DIRECTIONALITY_POP_DIRECTIONAL_FORMAT
public static final char MIN_HIGH_SURROGATE
'\uD800'
)。上位サロゲートは、リーディングサロゲートともいいます。public static final char MAX_HIGH_SURROGATE
'\uDBFF'
)。上位サロゲートは、リーディングサロゲートともいいます。public static final char MIN_LOW_SURROGATE
'\uDC00'
)。下位サロゲートは、トレーリングサロゲートともいいます。public static final char MAX_LOW_SURROGATE
'\uDFFF'
)。下位サロゲートは、トレーリングサロゲートともいいます。public static final char MIN_SURROGATE
'\uD800'
)。public static final char MAX_SURROGATE
'\uDFFF'
)。public static final int MIN_SUPPLEMENTARY_CODE_POINT
U+10000
)。public static final int MIN_CODE_POINT
U+0000
)。public static final int MAX_CODE_POINT
U+10FFFF
)。public static final int SIZE
16
)。public Character(char value)
char
値を表す、新しく割り当てられた Character
オブジェクトを構築します。value
- Character
オブジェクトによって表される値。public static Character valueOf(char c)
Character(char)
に優先して使用されます。その理由は、このメソッドが頻繁に要求される値をキャッシュするので、操作に必要な領域や時間がはるかに少なくて済む場合が多いためです。
このメソッドは、'\u0000'
から '\u007F'
の範囲 (両端含む) の値を常にキャッシュしますが、この範囲に含まれないその他の値もキャッシュすることがあります。c
- char 値。public char charValue()
Character
オブジェクトの値を返します。char
値。public int hashCode()
Character
のハッシュコード (charValue()
を呼び出した場合の結果と等しくなる) を返します。hashCode
、クラス: Object
Character
のハッシュコード値Object.equals(java.lang.Object)
, System.identityHashCode(java.lang.Object)
public boolean equals(Object obj)
true
になるのは、引数が null
ではなく、このオブジェクトと同じ char
値を表す Character
オブジェクトである場合だけです。equals
、クラス: Object
obj
- 比較対象のオブジェクトtrue
、そうでない場合は false
。Object.hashCode()
, HashMap
public String toString()
Character
の値を表す String
オブジェクトを返します。結果は、長さ 1 の文字列 (構成要素は Character
オブジェクトにより表されるプリミティブ型の char
値だけ) になります。public static String toString(char c)
char
を表す String
オブジェクトを返します。結果は、指定された char
だけで構成される長さ 1 の文字列になります。c
- 変換する char
char
の文字列表現public static boolean isValidCodePoint(int codePoint)
codePoint
- 判定対象の Unicode コードポイントMIN_CODE_POINT
- MAX_CODE_POINT
の範囲 (両端含む) に含まれる場合は true
、それ以外の場合は false
。public static boolean isBmpCodePoint(int codePoint)
char
を使って表せます。public static boolean isSupplementaryCodePoint(int codePoint)
codePoint
- 判定対象の文字 (Unicode コードポイント)MIN_SUPPLEMENTARY_CODE_POINT
- MAX_CODE_POINT
の範囲 (両端含む) に含まれる場合は true
、それ以外の場合は false
。public static boolean isHighSurrogate(char ch)
char
値が Unicode 上位サロゲートコード単位 (リーディングサロゲートコード単位ともいう) であるかどうかを判定します。
これらの値は、それ自体で文字を表しませんが、UTF-16 エンコーディングの補助文字の表現で使用されます。
ch
- 判定される char
値。char
の値が MIN_HIGH_SURROGATE
- MAX_HIGH_SURROGATE
の範囲 (両端含む) に含まれる場合は true
、それ以外の場合は false
。isLowSurrogate(char)
, Character.UnicodeBlock.of(int)
public static boolean isLowSurrogate(char ch)
char
値が Unicode 下位サロゲートコード単位 (トレーリングサロゲートコード単位ともいう) であるかどうかを判定します。
これらの値は、それ自体で文字を表しませんが、UTF-16 エンコーディングの補助文字の表現で使用されます。
ch
- 判定される char
値。char
値が MIN_LOW_SURROGATE
- MAX_LOW_SURROGATE
の範囲 (両端含む) に含まれる場合は true
、それ以外の場合は false
。isHighSurrogate(char)
public static boolean isSurrogate(char ch)
char
値が Unicode サロゲートコード単位かどうかを判定します。
これらの値は、それ自体で文字を表しませんが、UTF-16 エンコーディングの補助文字の表現で使用されます。
char 値がサロゲートコード単位になるのは、それが下位サロゲートコード単位と上位サロゲートコード単位のいずれかである場合だけです。
ch
- 判定される char
値。char
値が MIN_SURROGATE
- MAX_SURROGATE
の範囲 (両端含む) に含まれる場合は true
、それ以外の場合は false
。public static boolean isSurrogatePair(char high, char low)
char
値のペアが有効な Unicode サロゲートペアであるかどうかを判定します。
このメソッドは次の式と等価です。
isHighSurrogate(high) && isLowSurrogate(low)
high
- 判定対象の上位サロゲートコード値low
- 判定対象の下位サロゲートコード値true
、そうでない場合は false
。public static int charCount(int codePoint)
char
値の数を判定します。このメソッドは、指定された文字が 0x10000 以上である場合は 2 を返し、そうでない場合は 1 を返します。
このメソッドは、指定された文字が有効な Unicode コードポイントであることを検証しません。呼び出し側で、必要に応じて isValidCodePoint
を使用して、文字値を検証する必要があります。
codePoint
- 判定対象の文字 (Unicode コードポイント)。isSupplementaryCodePoint(int)
public static int toCodePoint(char high, char low)
isSurrogatePair
を使って検証する必要があります。high
- 上位サロゲートコード単位low
- 下位サロゲートコード単位public static int codePointAt(CharSequence seq, int index)
CharSequence
の指定されたインデックスにあるコードポイントを返します。CharSequence
内の指定されたインデックス位置の char
値が上位サロゲート範囲に含まれており、それに続くインデックスが CharSequence
の長さ未満であり、かつそのインデックス位置の char
値が下位サロゲート範囲に含まれている場合、このサロゲートペアに対応する補助コードポイントが返されます。それ以外の場合は、指定されたインデックスにある char
値が返されます。seq
- char
値のシーケンス (Unicode コード単位)index
- 変換される seq
内の char
値 (Unicode コード単位) へのインデックスNullPointerException
- seq
が null である場合。IndexOutOfBoundsException
- 値 index
が負であるか seq.length()
以上である場合。public static int codePointAt(char[] a, int index)
char
配列の指定されたインデックスにあるコードポイントを返します。char
配列内の指定されたインデックス位置の char
値が上位サロゲート範囲に含まれており、それに続くインデックスが char
配列の長さ未満であり、かつそのインデックス位置の char
値が下位サロゲート範囲に含まれている場合、このサロゲートペアに対応する補助コードポイントが返されます。それ以外の場合は、指定されたインデックスにある char
値が返されます。a
- char
配列index
- 変換される char
配列内の char
値 (Unicode コード単位) へのインデックスNullPointerException
- a
が null である場合。IndexOutOfBoundsException
- index
が負の値、または char
配列の長さ以上の値である場合。public static int codePointAt(char[] a, int index, int limit)
limit
の長さ未満の index
を持つ配列要素のみを使用可能な、char
配列の指定されたインデックスにあるコードポイントを返します。char
配列内の指定されたインデックス位置の char
値が上位サロゲート範囲に含まれており、それに続くインデックスが limit
未満であり、かつそのインデックス位置の char
値が下位サロゲート範囲に含まれている場合、このサロゲートペアに対応する補助コードポイントが返されます。それ以外の場合は、指定されたインデックスにある char
値が返されます。a
- char
配列index
- 変換される char
配列内の char
値 (Unicode コード単位) へのインデックスlimit
- char
配列で使用可能な最後の配列要素の後ろのインデックスNullPointerException
- a
が null である場合。IndexOutOfBoundsException
- index
引数が負の値または limit
引数以上である場合、または limit
引数が負の値または char
配列の長さより大きい場合。public static int codePointBefore(CharSequence seq, int index)
CharSequence
の指定されたインデックスの前にあるコードポイントを返します。CharSequence
内の (index - 1)
の char
値が下位サロゲート範囲に含まれており、(index - 2)
が負でなく、かつ CharSequence
内の (index - 2)
の char
値が上位サロゲート範囲に含まれている場合、このサロゲートペアに対応する補助コードポイントが返されます。そうでない場合は、(index - 1)
の char
値が返されます。seq
- CharSequence
インスタンスindex
- 返すべきコードポイントの直後のインデックスNullPointerException
- seq
が null である場合。IndexOutOfBoundsException
- index
引数が 1 より小さいか seq.length()
より大きい場合。public static int codePointBefore(char[] a, int index)
char
配列の指定されたインデックスの前にあるコードポイントを返します。char
配列内の (index - 1)
の char
値が下位サロゲート範囲に含まれており、(index - 2)
が負でなく、かつ char
配列内の (index - 2)
の char
値が上位サロゲート範囲に含まれている場合、このサロゲートペアに対応する補助コードポイントが返されます。そうでない場合は、(index - 1)
の char
値が返されます。a
- char
配列index
- 返すべきコードポイントの直後のインデックスNullPointerException
- a
が null である場合。IndexOutOfBoundsException
- index
引数が 1 未満であるか、または char
配列の長さより大きい値の場合public static int codePointBefore(char[] a, int index, int start)
start
以上の index
を持つ配列要素のみを使用可能な、char
配列の指定されたインデックスの前にあるコードポイントを返します。char
配列内の (index - 1)
の char
値が下位サロゲート範囲に含まれており、(index - 2)
が start
以上であり、かつ char
配列内の (index - 2)
の char
値が上位サロゲート範囲に含まれている場合、このサロゲートペアに対応する補助コードポイントが返されます。そうでない場合は、(index - 1)
の char
値が返されます。a
- char
配列index
- 返すべきコードポイントの直後のインデックスstart
- char
配列の最初の配列要素のインデックスNullPointerException
- a
が null である場合。IndexOutOfBoundsException
- index
引数が start
引数以下であるか char
配列の長さより大きい場合、または start
引数が負の値であるか char
配列の長さ以上である場合。public static char highSurrogate(int codePoint)
char
が返されます。
isSupplementaryCodePoint(x)
が true
の場合、isHighSurrogate
(highSurrogate(x))
および toCodePoint
(highSurrogate(x),
lowSurrogate
(x)) == x
も常に true
になります。
codePoint
- 補助文字 (Unicode コードポイント)public static char lowSurrogate(int codePoint)
char
が返されます。
isSupplementaryCodePoint(x)
が true
の場合、isLowSurrogate
(lowSurrogate(x))
および toCodePoint
(
highSurrogate
(x), lowSurrogate(x)) == x
も常に true
になります。
codePoint
- 補助文字 (Unicode コードポイント)public static int toChars(int codePoint, char[] dst, int dstIndex)
dst[dstIndex]
に格納され、1 が返されます。指定されたコードポイントが補助文字の場合は、サロゲート値が dst[dstIndex]
(上位サロゲート) と dst[dstIndex+1]
(下位サロゲート) に格納され、2 が返されます。codePoint
- 変換対象の文字 (Unicode コードポイント)。dst
- codePoint
の UTF-16 値が格納される char
の配列。dstIndex
- 変換された値が格納される dst
配列の開始インデックス。IllegalArgumentException
- 指定された codePoint
が有効な Unicode コードポイントでない場合。NullPointerException
- 指定された dst
が null の場合。IndexOutOfBoundsException
- dstIndex
が負の値であるか dst.length
以上である場合、または dstIndex
位置の dst
が結果として得られる char
値を格納する十分な配列要素を持たない場合。(dstIndex
が dst.length-1
と等価で、指定された codePoint
が補助文字の場合、上位サロゲート値は dst[dstIndex]
に格納されない。)public static char[] toChars(int codePoint)
char
配列に格納される UTF-16 表現に変換します。指定されたコードポイントが BMP (基本多言語面または第 0 面) 値の場合、結果として得られる char
配列は codePoint
と同じ値を持ちます。指定されたコードポイントが補助コードポイントの場合は、結果として得られる char
配列は対応するサロゲートペアを持ちます。codePoint
- Unicode コードポイントcodePoint
の UTF-16 表現を持つ char
配列。IllegalArgumentException
- 指定された codePoint
が有効な Unicode コードポイントでない場合。public static int codePointCount(CharSequence seq, int beginIndex, int endIndex)
beginIndex
からインデックス endIndex - 1
の位置の char
までです。したがって、テキスト範囲の長さ (char
数) は、endIndex-beginIndex
になります。テキスト範囲内でペアになっていないサロゲートは、それぞれ 1 つのコードポイントとして数えられます。seq
- 文字シーケンスbeginIndex
- テキスト範囲内の最初の char
へのインデックスendIndex
- テキスト範囲内の最後の char
の直後のインデックスNullPointerException
- seq
が null である場合。IndexOutOfBoundsException
- beginIndex
が負であるか、endIndex
が指定されたシーケンスの長さより大きいか、あるいは beginIndex
が endIndex
より大きい場合。public static int codePointCount(char[] a, int offset, int count)
char
配列引数の部分配列内にある Unicode コードポイントの数を返します。offset
引数は、部分配列の最初の char
のインデックスであり、count
引数は char
間の部分配列の長さを指定します。部分配列内でペアになっていないサロゲートは、それぞれ 1 つのコードポイントとして数えられます。a
- char
配列offset
- 指定された char
配列の最初の char
のインデックスcount
- 部分配列の長さ (char
数)NullPointerException
- a
が null である場合。IndexOutOfBoundsException
- offset
または count
が負の場合、または offset + count
が指定された配列の長さより大きい場合。public static int offsetByCodePoints(CharSequence seq, int index, int codePointOffset)
index
から codePointOffset
コードポイント分だけオフセットされた位置のインデックスを返します。index
と codePointOffset
で指定されるテキスト範囲内でペアになっていないサロゲートは、それぞれ 1 つのコードポイントとして数えられます。seq
- 文字シーケンスindex
- オフセットされるインデックスcodePointOffset
- オフセット (コードポイント数)NullPointerException
- seq
が null である場合。IndexOutOfBoundsException
- index
が負の値または文字シーケンスの長さよりも大きい場合、codePointOffset
が正の値であり index
で始まるサブシーケンスの持つコードポイント数が codePointOffset
コードポイント数よりも少ない場合、あるいは codePointOffset
が負の値で index
の前のサブシーケンスの持つ値が codePointOffset
コードポイントの絶対値よりも小さい場合。public static int offsetByCodePoints(char[] a, int start, int count, int index, int codePointOffset)
char
部分配列内で、指定された index
から codePointOffset
コードポイント分だけオフセットされた位置のインデックスを返します。start
および count
引数は、char
配列の部分配列を指定します。index
と codePointOffset
で指定されるテキスト範囲内でペアになっていないサロゲートは、それぞれ 1 つのコードポイントとして数えられます。a
- char
配列start
- 部分配列内の最初の char
のインデックスcount
- 部分配列の長さ (char
数)index
- オフセットされるインデックスcodePointOffset
- オフセット (コードポイント数)NullPointerException
- a
が null である場合。IndexOutOfBoundsException
- start
または count
が負の場合、または start + count
が指定された配列の長さより大きい場合、または index
が start
より小さいか start + count
より大きい場合、または codePointOffset
が正で、index
から始まり start + count - 1
で終わるテキスト範囲内のコードポイント数が codePointOffset
コードポイント数より少ない場合、または codePointOffset
が負で、start
から始まり index - 1
で終わるテキスト範囲内のコードポイント数が codePointOffset
コードポイントの絶対値より少ない場合。public static boolean isLowerCase(char ch)
ある文字が小文字になるのは、Character.getType(ch)
によって提供される汎用カテゴリ型が LOWERCASE_LETTER
である場合と、その文字が、Unicode 標準で規定された寄与プロパティー Other_Lowercase を持つ場合です。
小文字の例を次に示します。
a b c d e f g h i j k l m n o p q r s t u v w x y z '\u00DF' '\u00E0' '\u00E1' '\u00E2' '\u00E3' '\u00E4' '\u00E5' '\u00E6' '\u00E7' '\u00E8' '\u00E9' '\u00EA' '\u00EB' '\u00EC' '\u00ED' '\u00EE' '\u00EF' '\u00F0' '\u00F1' '\u00F2' '\u00F3' '\u00F4' '\u00F5' '\u00F6' '\u00F8' '\u00F9' '\u00FA' '\u00FB' '\u00FC' '\u00FD' '\u00FE' '\u00FF'
Unicode 文字には、ほかにも多数の小文字が存在します。
注: このメソッドは、補助文字を処理できません。補助文字を含むすべての Unicode 文字をサポートするには、isLowerCase(int)
メソッドを使用してください。
ch
- 判定対象の文字。true
、そうでない場合は false
。isLowerCase(char)
, isTitleCase(char)
, toLowerCase(char)
, getType(char)
public static boolean isLowerCase(int codePoint)
ある文字が小文字になるのは、getType(codePoint)
によって提供される汎用カテゴリ型が LOWERCASE_LETTER
である場合と、その文字が、Unicode 標準で規定された寄与プロパティー Other_Lowercase を持つ場合です。
小文字の例を次に示します。
a b c d e f g h i j k l m n o p q r s t u v w x y z '\u00DF' '\u00E0' '\u00E1' '\u00E2' '\u00E3' '\u00E4' '\u00E5' '\u00E6' '\u00E7' '\u00E8' '\u00E9' '\u00EA' '\u00EB' '\u00EC' '\u00ED' '\u00EE' '\u00EF' '\u00F0' '\u00F1' '\u00F2' '\u00F3' '\u00F4' '\u00F5' '\u00F6' '\u00F8' '\u00F9' '\u00FA' '\u00FB' '\u00FC' '\u00FD' '\u00FE' '\u00FF'
Unicode 文字には、ほかにも多数の小文字が存在します。
codePoint
- 判定対象の文字 (Unicode コードポイント)。true
、そうでない場合は false
。isLowerCase(int)
, isTitleCase(int)
, toLowerCase(int)
, getType(int)
public static boolean isUpperCase(char ch)
ある文字が大文字になるのは、Character.getType(ch)
によって提供される汎用カテゴリ型が UPPERCASE_LETTER
である場合と、その文字が、Unicode 標準で規定された寄与プロパティー Other_Uppercase を持つ場合です。
大文字の例を次に示します。
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z '\u00C0' '\u00C1' '\u00C2' '\u00C3' '\u00C4' '\u00C5' '\u00C6' '\u00C7' '\u00C8' '\u00C9' '\u00CA' '\u00CB' '\u00CC' '\u00CD' '\u00CE' '\u00CF' '\u00D0' '\u00D1' '\u00D2' '\u00D3' '\u00D4' '\u00D5' '\u00D6' '\u00D8' '\u00D9' '\u00DA' '\u00DB' '\u00DC' '\u00DD' '\u00DE'
Unicode 文字には、ほかにも多数の大文字が存在します。
注: このメソッドは、補助文字を処理できません。補助文字を含むすべての Unicode 文字をサポートするには、isUpperCase(int)
メソッドを使用してください。
ch
- 判定対象の文字。true
、そうでない場合は false
。isLowerCase(char)
, isTitleCase(char)
, toUpperCase(char)
, getType(char)
public static boolean isUpperCase(int codePoint)
ある文字が大文字になるのは、getType(codePoint)
によって提供される汎用カテゴリ型が UPPERCASE_LETTER
である場合と、その文字が、Unicode 標準で規定された寄与プロパティー Other_Uppercase を持つ場合です。
大文字の例を次に示します。
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z '\u00C0' '\u00C1' '\u00C2' '\u00C3' '\u00C4' '\u00C5' '\u00C6' '\u00C7' '\u00C8' '\u00C9' '\u00CA' '\u00CB' '\u00CC' '\u00CD' '\u00CE' '\u00CF' '\u00D0' '\u00D1' '\u00D2' '\u00D3' '\u00D4' '\u00D5' '\u00D6' '\u00D8' '\u00D9' '\u00DA' '\u00DB' '\u00DC' '\u00DD' '\u00DE'
Unicode 文字には、ほかにも多数の大文字が存在します。
codePoint
- 判定対象の文字 (Unicode コードポイント)。true
、そうでない場合は false
。isLowerCase(int)
, isTitleCase(int)
, toUpperCase(int)
, getType(int)
public static boolean isTitleCase(char ch)
Character.getType(ch)
により示される汎用カテゴリ型が TITLECASE_LETTER
の場合、文字はタイトルケース文字になります。
文字の中には、ラテン文字のペアのように見えるものがあります。たとえば、「LJ」のように見える大文字では、「lj」のように見える対応する小文字があります。「Lj」のように見える 3 つ目の形式は、本のタイトルなど、最初は大文字であとは小文字にするときに使います。
次に示すのは、このメソッドが true
を返す Unicode 文字の一部です。
LATIN CAPITAL LETTER D WITH SMALL LETTER Z WITH CARON
LATIN CAPITAL LETTER L WITH SMALL LETTER J
LATIN CAPITAL LETTER N WITH SMALL LETTER J
LATIN CAPITAL LETTER D WITH SMALL LETTER Z
Unicode 文字には、ほかにも多数のタイトルケース文字が存在します。
注: このメソッドは、補助文字を処理できません。補助文字を含むすべての Unicode 文字をサポートするには、isTitleCase(int)
メソッドを使用してください。
ch
- 判定対象の文字。true
、そうでない場合は false
。isLowerCase(char)
, isUpperCase(char)
, toTitleCase(char)
, getType(char)
public static boolean isTitleCase(int codePoint)
getType(codePoint)
により示される汎用カテゴリ型が TITLECASE_LETTER
の場合、文字はタイトルケース文字になります。
文字の中には、ラテン文字のペアのように見えるものがあります。たとえば、「LJ」のように見える大文字では、「lj」のように見える対応する小文字があります。「Lj」のように見える 3 つ目の形式は、本のタイトルなど、最初は大文字であとは小文字にするときに使います。
次に示すのは、このメソッドが true
を返す Unicode 文字の一部です。
LATIN CAPITAL LETTER D WITH SMALL LETTER Z WITH CARON
LATIN CAPITAL LETTER L WITH SMALL LETTER J
LATIN CAPITAL LETTER N WITH SMALL LETTER J
LATIN CAPITAL LETTER D WITH SMALL LETTER Z
Unicode 文字には、ほかにも多数のタイトルケース文字が存在します。
codePoint
- 判定対象の文字 (Unicode コードポイント)。true
、そうでない場合は false
。isLowerCase(int)
, isUpperCase(int)
, toTitleCase(int)
, getType(int)
public static boolean isDigit(char ch)
Character.getType(ch)
により示される汎用カテゴリ型が DECIMAL_DIGIT_NUMBER
の場合、文字は数字になります。
Unicode 文字範囲の中には、次の数字を含むものがあります。
'\u0030'
- '\u0039'
、ISO-LATIN-1 数字 ('0'
- '9'
)
'\u0660'
- '\u0669'
、アラビア数字
'\u06F0'
- '\u06F9'
、拡張アラビア数字
'\u0966'
- '\u096F'
、デヴァーナーガリ数字
'\uFF10'
- '\uFF19'
、全角数字
注: このメソッドは、補助文字を処理できません。補助文字を含むすべての Unicode 文字をサポートするには、isDigit(int)
メソッドを使用してください。
ch
- 判定対象の文字。true
、そうでない場合は false
。digit(char, int)
, forDigit(int, int)
, getType(char)
public static boolean isDigit(int codePoint)
getType(codePoint)
により示される汎用カテゴリ型が DECIMAL_DIGIT_NUMBER
の場合、文字は数字になります。
Unicode 文字範囲の中には、次の数字を含むものがあります。
'\u0030'
- '\u0039'
、ISO-LATIN-1 数字 ('0'
- '9'
)
'\u0660'
- '\u0669'
、アラビア数字
'\u06F0'
- '\u06F9'
、拡張アラビア数字
'\u0966'
- '\u096F'
、デヴァーナーガリ数字
'\uFF10'
- '\uFF19'
、全角数字
codePoint
- 判定対象の文字 (Unicode コードポイント)。true
、そうでない場合は false
。forDigit(int, int)
, getType(int)
public static boolean isDefined(char ch)
少なくとも次のいずれかに当てはまる場合、文字は定義されています。
注: このメソッドは、補助文字を処理できません。補助文字を含むすべての Unicode 文字をサポートするには、isDefined(int)
メソッドを使用してください。
ch
- 判定対象の文字true
、そうでない場合は false
。isDigit(char)
, isLetter(char)
, isLetterOrDigit(char)
, isLowerCase(char)
, isTitleCase(char)
, isUpperCase(char)
public static boolean isDefined(int codePoint)
少なくとも次のいずれかに当てはまる場合、文字は定義されています。
codePoint
- 判定対象の文字 (Unicode コードポイント)。true
、そうでない場合は false
。isDigit(int)
, isLetter(int)
, isLetterOrDigit(int)
, isLowerCase(int)
, isTitleCase(int)
, isUpperCase(int)
public static boolean isLetter(char ch)
Character.getType(ch)
の示す汎用カテゴリ型が次のどれかの場合に、文字は汎用文字と見なされます。
UPPERCASE_LETTER
LOWERCASE_LETTER
TITLECASE_LETTER
MODIFIER_LETTER
OTHER_LETTER
注: このメソッドは、補助文字を処理できません。補助文字を含むすべての Unicode 文字をサポートするには、isLetter(int)
メソッドを使用してください。
ch
- 判定対象の文字。true
、そうでない場合は false
。isDigit(char)
, isJavaIdentifierStart(char)
, isJavaLetter(char)
, isJavaLetterOrDigit(char)
, isLetterOrDigit(char)
, isLowerCase(char)
, isTitleCase(char)
, isUnicodeIdentifierStart(char)
, isUpperCase(char)
public static boolean isLetter(int codePoint)
getType(codePoint)
の示す汎用カテゴリ型が次のどれかの場合に、文字は汎用文字と見なされます。
UPPERCASE_LETTER
LOWERCASE_LETTER
TITLECASE_LETTER
MODIFIER_LETTER
OTHER_LETTER
codePoint
- 判定対象の文字 (Unicode コードポイント)。true
、そうでない場合は false
。isDigit(int)
, isJavaIdentifierStart(int)
, isLetterOrDigit(int)
, isLowerCase(int)
, isTitleCase(int)
, isUnicodeIdentifierStart(int)
, isUpperCase(int)
public static boolean isLetterOrDigit(char ch)
ある文字が文字または数字とみなされるのは、その文字の Character.isLetter(char ch)
または Character.isDigit(char ch)
から true
が返される場合です。
注: このメソッドは、補助文字を処理できません。補助文字を含むすべての Unicode 文字をサポートするには、isLetterOrDigit(int)
メソッドを使用してください。
ch
- 判定対象の文字。true
、そうでない場合は false
。isDigit(char)
, isJavaIdentifierPart(char)
, isJavaLetter(char)
, isJavaLetterOrDigit(char)
, isLetter(char)
, isUnicodeIdentifierPart(char)
public static boolean isLetterOrDigit(int codePoint)
ある文字が文字または数字とみなされるのは、その文字の isLetter(codePoint)
または isDigit(codePoint)
から true
が返される場合です。
codePoint
- 判定対象の文字 (Unicode コードポイント)。true
、そうでない場合は false
。isDigit(int)
, isJavaIdentifierPart(int)
, isLetter(int)
, isUnicodeIdentifierPart(int)
@Deprecated public static boolean isJavaLetter(char ch)
次のどれかに当てはまる場合にだけ、その文字を Java 識別子の最初に指定できます。
isLetter(ch)
が true
を返す
getType(ch)
が LETTER_NUMBER
を返す
ch
が通貨記号である ('$'
など)
ch
が連結句読点文字である ('_'
など)
ch
- 判定対象の文字。true
、そうでない場合は false
。isJavaLetterOrDigit(char)
, isJavaIdentifierStart(char)
, isJavaIdentifierPart(char)
, isLetter(char)
, isLetterOrDigit(char)
, isUnicodeIdentifierStart(char)
@Deprecated public static boolean isJavaLetterOrDigit(char ch)
次のどれかに当てはまる場合にだけ、その文字を Java 識別子の一部に指定できます。
'$'
など)
'_'
など)
isIdentifierIgnorable
が true
を返す。
ch
- 判定対象の文字。true
、そうでない場合は false
。isJavaLetter(char)
, isJavaIdentifierStart(char)
, isJavaIdentifierPart(char)
, isLetter(char)
, isLetterOrDigit(char)
, isUnicodeIdentifierPart(char)
, isIdentifierIgnorable(char)
public static boolean isAlphabetic(int codePoint)
getType(codePoint)
の示す汎用カテゴリ型が次のどれかの場合に、文字はアルファベットと見なされます。
UPPERCASE_LETTER
LOWERCASE_LETTER
TITLECASE_LETTER
MODIFIER_LETTER
OTHER_LETTER
LETTER_NUMBER
codePoint
- 判定対象の文字 (Unicode コードポイント)。true
、そうでない場合は false
。public static boolean isIdeographic(int codePoint)
codePoint
- 判定対象の文字 (Unicode コードポイント)。true
、そうでない場合は false
。public static boolean isJavaIdentifierStart(char ch)
次の条件のどれかに当てはまる場合にだけ、その文字を Java 識別子の最初に指定できます。
isLetter(ch)
が true
を返す
getType(ch)
が LETTER_NUMBER
を返す
ch
が通貨記号である ('$'
など)
ch
が連結句読点文字である ('_'
など)
注: このメソッドは、補助文字を処理できません。補助文字を含むすべての Unicode 文字をサポートするには、isJavaIdentifierStart(int)
メソッドを使用してください。
ch
- 判定対象の文字。true
、そうでない場合は false
。isJavaIdentifierPart(char)
, isLetter(char)
, isUnicodeIdentifierStart(char)
, SourceVersion.isIdentifier(CharSequence)
public static boolean isJavaIdentifierStart(int codePoint)
次の条件のどれかに当てはまる場合にだけ、その文字を Java 識別子の最初に指定できます。
isLetter(codePoint)
が次を返す: true
getType(codePoint)
が次を返す: LETTER_NUMBER
'$'
など)
'_'
など)
codePoint
- 判定対象の文字 (Unicode コードポイント)。true
、そうでない場合は false
。isJavaIdentifierPart(int)
, isLetter(int)
, isUnicodeIdentifierStart(int)
, SourceVersion.isIdentifier(CharSequence)
public static boolean isJavaIdentifierPart(char ch)
次のどれかに当てはまる場合にだけ、その文字を Java 識別子の一部に指定できます。
'$'
など)
'_'
など)
isIdentifierIgnorable
が true
を返す
注: このメソッドは、補助文字を処理できません。補助文字を含むすべての Unicode 文字をサポートするには、isJavaIdentifierPart(int)
メソッドを使用してください。
ch
- 判定対象の文字。true
、そうでない場合は false
。isIdentifierIgnorable(char)
, isJavaIdentifierStart(char)
, isLetterOrDigit(char)
, isUnicodeIdentifierPart(char)
, SourceVersion.isIdentifier(CharSequence)
public static boolean isJavaIdentifierPart(int codePoint)
次のどれかに当てはまる場合にだけ、その文字を Java 識別子の一部に指定できます。
'$'
など)
'_'
など)
isIdentifierIgnorable(codePoint)
が true
を返す
codePoint
- 判定対象の文字 (Unicode コードポイント)。true
、そうでない場合は false
。isIdentifierIgnorable(int)
, isJavaIdentifierStart(int)
, isLetterOrDigit(int)
, isUnicodeIdentifierPart(int)
, SourceVersion.isIdentifier(CharSequence)
public static boolean isUnicodeIdentifierStart(char ch)
次の条件のどれかに当てはまる場合にだけ、その文字を Unicode 識別子の最初に指定できます。
isLetter(ch)
が true
を返す
getType(ch)
が LETTER_NUMBER
を返す。
注: このメソッドは、補助文字を処理できません。補助文字を含むすべての Unicode 文字をサポートするには、isUnicodeIdentifierStart(int)
メソッドを使用してください。
ch
- 判定対象の文字。true
、そうでない場合は false
。isJavaIdentifierStart(char)
, isLetter(char)
, isUnicodeIdentifierPart(char)
public static boolean isUnicodeIdentifierStart(int codePoint)
次の条件のどれかに当てはまる場合にだけ、その文字を Unicode 識別子の最初に指定できます。
isLetter(codePoint)
が true
を返す
getType(codePoint)
が LETTER_NUMBER
を返す。
codePoint
- 判定対象の文字 (Unicode コードポイント)。true
、そうでない場合は false
。isJavaIdentifierStart(int)
, isLetter(int)
, isUnicodeIdentifierPart(int)
public static boolean isUnicodeIdentifierPart(char ch)
次の文のどれかに当てはまる場合にだけ、その文字を Unicode 識別子の一部に使用できます。
'_'
など)
isIdentifierIgnorable
が true
を返す。
注: このメソッドは、補助文字を処理できません。補助文字を含むすべての Unicode 文字をサポートするには、isUnicodeIdentifierPart(int)
メソッドを使用してください。
ch
- 判定対象の文字。true
、そうでない場合は false
。isIdentifierIgnorable(char)
, isJavaIdentifierPart(char)
, isLetterOrDigit(char)
, isUnicodeIdentifierStart(char)
public static boolean isUnicodeIdentifierPart(int codePoint)
次の文のどれかに当てはまる場合にだけ、その文字を Unicode 識別子の一部に使用できます。
'_'
など)
isIdentifierIgnorable
が true
を返す。
codePoint
- 判定対象の文字 (Unicode コードポイント)。true
、そうでない場合は false
。isIdentifierIgnorable(int)
, isJavaIdentifierPart(int)
, isLetterOrDigit(int)
, isUnicodeIdentifierStart(int)
public static boolean isIdentifierIgnorable(char ch)
次の Unicode 文字は、Java 識別子や Unicode 識別子内で無視できます。
'\u0000'
- '\u0008'
'\u000E'
- '\u001B'
'\u007F'
- '\u009F'
FORMAT
を保持するすべての文字
注: このメソッドは、補助文字を処理できません。補助文字を含むすべての Unicode 文字をサポートするには、isIdentifierIgnorable(int)
メソッドを使用してください。
ch
- 判定対象の文字。true
、それ以外の場合は false
。isJavaIdentifierPart(char)
, isUnicodeIdentifierPart(char)
public static boolean isIdentifierIgnorable(int codePoint)
次の Unicode 文字は、Java 識別子や Unicode 識別子内で無視できます。
'\u0000'
- '\u0008'
'\u000E'
- '\u001B'
'\u007F'
- '\u009F'
FORMAT
を保持するすべての文字
codePoint
- 判定対象の文字 (Unicode コードポイント)。true
、それ以外の場合は false
。isJavaIdentifierPart(int)
, isUnicodeIdentifierPart(int)
public static char toLowerCase(char ch)
Character.isLowerCase(Character.toLowerCase(ch))
は、ある範囲の文字 (特に表意文字や記号) に対して常に true
を返すわけではありません。
一般に、文字を小文字にマッピングする際には String.toLowerCase()
を使用するようにしてください。String
のケースマッピングメソッドには Character
のケースマッピングメソッドと比べて、いくつかの利点があります。ロケール依存マッピング、コンテキスト依存マッピング、および 1:M 文字マッピングは、String
のケースマッピングメソッドでは実行できますが、Character
のケースマッピングメソッドでは実行できません。
注: このメソッドは、補助文字を処理できません。補助文字を含むすべての Unicode 文字をサポートするには、toLowerCase(int)
メソッドを使用してください。
ch
- 変換対象の文字。isLowerCase(char)
, String.toLowerCase()
public static int toLowerCase(int codePoint)
Character.isLowerCase(Character.toLowerCase(codePoint))
は、ある範囲の文字 (特に表意文字や記号) に対して常に true
を返すわけではありません。
一般に、文字を小文字にマッピングする際には String.toLowerCase()
を使用するようにしてください。String
のケースマッピングメソッドには Character
のケースマッピングメソッドと比べて、いくつかの利点があります。ロケール依存マッピング、コンテキスト依存マッピング、および 1:M 文字マッピングは、String
のケースマッピングメソッドでは実行できますが、Character
のケースマッピングメソッドでは実行できません。
codePoint
- 変換対象の文字 (Unicode コードポイント)。isLowerCase(int)
, String.toLowerCase()
public static char toUpperCase(char ch)
Character.isUpperCase(Character.toUpperCase(ch))
は、ある範囲の文字 (特に表意文字や記号) に対して常に true
を返すわけではありません。
一般に、文字を大文字にマッピングする際には String.toUpperCase()
を使用するようにしてください。String
のケースマッピングメソッドには Character
のケースマッピングメソッドと比べて、いくつかの利点があります。ロケール依存マッピング、コンテキスト依存マッピング、および 1:M 文字マッピングは、String
のケースマッピングメソッドでは実行できますが、Character
のケースマッピングメソッドでは実行できません。
注: このメソッドは、補助文字を処理できません。補助文字を含むすべての Unicode 文字をサポートするには、toUpperCase(int)
メソッドを使用してください。
ch
- 変換対象の文字。isUpperCase(char)
, String.toUpperCase()
public static int toUpperCase(int codePoint)
Character.isUpperCase(Character.toUpperCase(codePoint))
は、ある範囲の文字 (特に表意文字や記号) に対して常に true
を返すわけではありません。
一般に、文字を大文字にマッピングする際には String.toUpperCase()
を使用するようにしてください。String
のケースマッピングメソッドには Character
のケースマッピングメソッドと比べて、いくつかの利点があります。ロケール依存マッピング、コンテキスト依存マッピング、および 1:M 文字マッピングは、String
のケースマッピングメソッドでは実行できますが、Character
のケースマッピングメソッドでは実行できません。
codePoint
- 変換対象の文字 (Unicode コードポイント)。isUpperCase(int)
, String.toUpperCase()
public static char toTitleCase(char ch)
char
引数がタイトルケース char
である場合には、同じ char
値が返されます。
Character.isTitleCase(Character.toTitleCase(ch))
は、ある範囲の文字に対して常に true
を返すわけではありません。
注: このメソッドは、補助文字を処理できません。補助文字を含むすべての Unicode 文字をサポートするには、toTitleCase(int)
メソッドを使用してください。
ch
- 変換対象の文字。isTitleCase(char)
, toLowerCase(char)
, toUpperCase(char)
public static int toTitleCase(int codePoint)
Character.isTitleCase(Character.toTitleCase(codePoint))
は、ある範囲の文字に対して常に true
を返すわけではありません。
codePoint
- 変換対象の文字 (Unicode コードポイント)。isTitleCase(int)
, toLowerCase(int)
, toUpperCase(int)
public static int digit(char ch, int radix)
ch
の数値としての値を返します。
基数が MIN_RADIX
≤ radix
≤ MAX_RADIX
の範囲外の場合、または ch
の値が指定された基数の有効数字でない場合は、-1
が返されます。次のどれかに当てはまる場合、文字は有効数字です。
isDigit
が true
を返し、その文字の Unicode 10 進数値 (または単一文字の分解) が指定された基数よりも小さい。この場合、10 進値が返される。
'A'
- 'Z'
のラテン大文字のどれかで、そのコードが radix + 'A' - 10
よりも小さい。この場合、ch - 'A' + 10
が返される。
'a'
- 'z'
のラテン小文字のどれかで、そのコードが radix + 'a' - 10
よりも小さい。この場合、ch - 'a' + 10
が返される。
'\uFF21'
) - Z ('\uFF3A'
) の全角ラテン大文字のどれかで、そのコードが radix + '\uFF21' - 10
よりも小さい。この場合、ch - '\uFF21' + 10
が返される。
'\uFF41'
) - z ('\uFF5A'
) の全角ラテン小文字のどれかで、そのコードが radix + '\uFF41' - 10
よりも小さい。この場合、ch - '\uFF41' + 10
が返される。
注: このメソッドは、補助文字を処理できません。補助文字を含むすべての Unicode 文字をサポートするには、digit(int, int)
メソッドを使用してください。
ch
- 変換対象の文字。radix
- 基数。forDigit(int, int)
, isDigit(char)
public static int digit(int codePoint, int radix)
基数が MIN_RADIX
≤ radix
≤ MAX_RADIX
の範囲外の場合、または文字が指定された基数の有効数字でない場合は、-1
が返されます。次のどれかに当てはまる場合、文字は有効数字です。
isDigit(codePoint)
が true
を返し、その文字の Unicode 10 進数値 (または単一文字の分解) が指定された基数よりも小さい。この場合、10 進値が返される。
'A'
- 'Z'
のラテン大文字のどれかで、そのコードが radix + 'A' - 10
よりも小さい。この場合、codePoint - 'A' + 10
が返される。
'a'
- 'z'
のラテン小文字のどれかで、そのコードが radix + 'a' - 10
よりも小さい。この場合、codePoint - 'a' + 10
が返される。
'\uFF21'
) - Z ('\uFF3A'
) の全角ラテン大文字のどれかで、そのコードが radix + '\uFF21' - 10
よりも小さい。この場合、codePoint - '\uFF21' + 10
が返される。
'\uFF41'
) - z ('\uFF5A'
) の全角ラテン小文字のどれかで、そのコードが radix + '\uFF41'- 10
よりも小さい。この場合、codePoint - '\uFF41' + 10
が返される。
codePoint
- 変換対象の文字 (Unicode コードポイント)。radix
- 基数。forDigit(int, int)
, isDigit(int)
public static int getNumericValue(char ch)
int
値を返します。たとえば、文字 '\u216C'
(ローマ数字の 50) は、値 50 の int を返します。
文字 A - Z の大文字 ('\u0041'
- '\u005A'
)、小文字 ('\u0061'
- '\u007A'
)、全角バリアント ('\uFF21'
- '\uFF3A'
および '\uFF41'
- '\uFF5A'
) の各形式は、10 - 35 の数値を持ちます。これは Unicode 仕様とは無関係であり、Unicode 仕様ではこれらの char
値に数値は割り当てられません。
文字が数値を持たない場合は、-1 が返されます。文字の数値を負でない整数として表現できない場合 (小数値など) は、-2 が返されます。
注: このメソッドは、補助文字を処理できません。補助文字を含むすべての Unicode 文字をサポートするには、getNumericValue(int)
メソッドを使用してください。
ch
- 変換対象の文字。int
型の数値の場合、文字の数値。文字が負でない整数以外の数値を持つ場合は -2、文字が数値を持たない場合は -1。forDigit(int, int)
, isDigit(char)
public static int getNumericValue(int codePoint)
int
値を返します。たとえば、文字 '\u216C'
(ローマ数字の 50) は、値 50 の int
を返します。
文字 A - Z の大文字 ('\u0041'
- '\u005A'
)、小文字 ('\u0061'
- '\u007A'
)、全角バリアント ('\uFF21'
- '\uFF3A'
および '\uFF41'
- '\uFF5A'
) の各形式は、10 - 35 の数値を持ちます。これは Unicode 仕様とは無関係であり、Unicode 仕様ではこれらの char
値に数値は割り当てられません。
文字が数値を持たない場合は、-1 が返されます。文字の数値を負でない整数として表現できない場合 (小数値など) は、-2 が返されます。
codePoint
- 変換対象の文字 (Unicode コードポイント)。int
型の数値の場合、文字の数値。文字が負でない整数以外の数値を持つ場合は -2、文字が数値を持たない場合は -1。forDigit(int, int)
, isDigit(int)
@Deprecated public static boolean isSpace(char ch)
true
を返します。
'\t' | U+0009 |
HORIZONTAL TABULATION |
'\n' | U+000A |
NEW LINE |
'\f' | U+000C |
FORM FEED |
'\r' | U+000D |
CARRIAGE RETURN |
' ' | U+0020 |
SPACE |
ch
- 判定対象の文字。true
、そうでない場合は false
。isSpaceChar(char)
, isWhitespace(char)
public static boolean isSpaceChar(char ch)
SPACE_SEPARATOR
LINE_SEPARATOR
PARAGRAPH_SEPARATOR
注: このメソッドは、補助文字を処理できません。補助文字を含むすべての Unicode 文字をサポートするには、isSpaceChar(int)
メソッドを使用してください。
ch
- 判定対象の文字。true
、そうでない場合は false
。isWhitespace(char)
public static boolean isSpaceChar(int codePoint)
codePoint
- 判定対象の文字 (Unicode コードポイント)。true
、そうでない場合は false
。isWhitespace(int)
public static boolean isWhitespace(char ch)
SPACE_SEPARATOR
、LINE_SEPARATOR
、または PARAGRAPH_SEPARATOR
) であるが、改行なしの空白 ('\u00A0'
、'\u2007'
、'\u202F'
) ではない。
'\t'
(U+0009 水平タブ) である。
'\n'
(U+000A 改行) である。
'\u000B'
(U+000B 垂直タブ) である。
'\f'
(U+000C フォームフィード) である。
'\r'
(U+000D 復帰) である。
'\u001C'
(U+001C ファイル区切り文字) である。
'\u001D'
(U+001D グループ区切り文字) である。
'\u001E'
(U+001E レコード区切り文字) である。
'\u001F'
(U+001F 単位区切り文字) である。
注: このメソッドは、補助文字を処理できません。補助文字を含むすべての Unicode 文字をサポートするには、isWhitespace(int)
メソッドを使用してください。
ch
- 判定対象の文字。true
、そうでない場合は false
。isSpaceChar(char)
public static boolean isWhitespace(int codePoint)
SPACE_SEPARATOR
、LINE_SEPARATOR
、または PARAGRAPH_SEPARATOR
) であるが、改行なしの空白 ('\u00A0'
、'\u2007'
、'\u202F'
) ではない。
'\t'
(U+0009 水平タブ) である。
'\n'
(U+000A 改行) である。
'\u000B'
(U+000B 垂直タブ) である。
'\f'
(U+000C フォームフィード) である。
'\r'
(U+000D 復帰) である。
'\u001C'
(U+001C ファイル区切り文字) である。
'\u001D'
(U+001D グループ区切り文字) である。
'\u001E'
(U+001E レコード区切り文字) である。
'\u001F'
(U+001F 単位区切り文字) である。
codePoint
- 判定対象の文字 (Unicode コードポイント)。true
、そうでない場合は false
。isSpaceChar(int)
public static boolean isISOControl(char ch)
'\u0000'
- '\u001F'
の範囲、または '\u007F'
- '\u009F'
の範囲の場合は、ISO 制御文字と見なされます。
注: このメソッドは、補助文字を処理できません。補助文字を含むすべての Unicode 文字をサポートするには、isISOControl(int)
メソッドを使用してください。
ch
- 判定対象の文字。true
、そうでない場合は false
。isSpaceChar(char)
, isWhitespace(char)
public static boolean isISOControl(int codePoint)
'\u0000'
- '\u001F'
の範囲、または '\u007F'
- '\u009F'
の範囲の場合は、ISO 制御文字と見なされます。codePoint
- 判定対象の文字 (Unicode コードポイント)。true
、そうでない場合は false
。isSpaceChar(int)
, isWhitespace(int)
public static int getType(char ch)
注: このメソッドは、補助文字を処理できません。補助文字を含むすべての Unicode 文字をサポートするには、getType(int)
メソッドを使用してください。
ch
- 判定対象の文字。int
型の値。COMBINING_SPACING_MARK
, CONNECTOR_PUNCTUATION
, CONTROL
, CURRENCY_SYMBOL
, DASH_PUNCTUATION
, DECIMAL_DIGIT_NUMBER
, ENCLOSING_MARK
, END_PUNCTUATION
, FINAL_QUOTE_PUNCTUATION
, FORMAT
, INITIAL_QUOTE_PUNCTUATION
, LETTER_NUMBER
, LINE_SEPARATOR
, LOWERCASE_LETTER
, MATH_SYMBOL
, MODIFIER_LETTER
, MODIFIER_SYMBOL
, NON_SPACING_MARK
, OTHER_LETTER
, OTHER_NUMBER
, OTHER_PUNCTUATION
, OTHER_SYMBOL
, PARAGRAPH_SEPARATOR
, PRIVATE_USE
, SPACE_SEPARATOR
, START_PUNCTUATION
, SURROGATE
, TITLECASE_LETTER
, UNASSIGNED
, UPPERCASE_LETTER
public static int getType(int codePoint)
codePoint
- 判定対象の文字 (Unicode コードポイント)。int
型の値。COMBINING_SPACING_MARK
, CONNECTOR_PUNCTUATION
, CONTROL
, CURRENCY_SYMBOL
, DASH_PUNCTUATION
, DECIMAL_DIGIT_NUMBER
, ENCLOSING_MARK
, END_PUNCTUATION
, FINAL_QUOTE_PUNCTUATION
, FORMAT
, INITIAL_QUOTE_PUNCTUATION
, LETTER_NUMBER
, LINE_SEPARATOR
, LOWERCASE_LETTER
, MATH_SYMBOL
, MODIFIER_LETTER
, MODIFIER_SYMBOL
, NON_SPACING_MARK
, OTHER_LETTER
, OTHER_NUMBER
, OTHER_PUNCTUATION
, OTHER_SYMBOL
, PARAGRAPH_SEPARATOR
, PRIVATE_USE
, SPACE_SEPARATOR
, START_PUNCTUATION
, SURROGATE
, TITLECASE_LETTER
, UNASSIGNED
, UPPERCASE_LETTER
public static char forDigit(int digit, int radix)
radix
の値が無効な基数の場合、または digit
が指定された基数で無効な数字の場合は、null 文字 ('\u0000'
) が返されます。
radix
引数は、MIN_RADIX
以上 MAX_RADIX
以下の場合に有効です。digit
引数は、0 <= digit < radix
の場合に有効です。
数字が 10 より小さいと、'0' + digit
が返されます。そうでない場合は、値 'a' + digit - 10
が返されます。
digit
- 文字に変換する数。radix
- 基数。char
表現。MIN_RADIX
, MAX_RADIX
, digit(char, int)
public static byte getDirectionality(char ch)
char
値の方向性値は DIRECTIONALITY_UNDEFINED
です。
注: このメソッドは、補助文字を処理できません。補助文字を含むすべての Unicode 文字をサポートするには、getDirectionality(int)
メソッドを使用してください。
ch
- 方向性プロパティーが要求された char
。char
値の方向性プロパティー。DIRECTIONALITY_UNDEFINED
, DIRECTIONALITY_LEFT_TO_RIGHT
, DIRECTIONALITY_RIGHT_TO_LEFT
, DIRECTIONALITY_RIGHT_TO_LEFT_ARABIC
, DIRECTIONALITY_EUROPEAN_NUMBER
, DIRECTIONALITY_EUROPEAN_NUMBER_SEPARATOR
, DIRECTIONALITY_EUROPEAN_NUMBER_TERMINATOR
, DIRECTIONALITY_ARABIC_NUMBER
, DIRECTIONALITY_COMMON_NUMBER_SEPARATOR
, DIRECTIONALITY_NONSPACING_MARK
, DIRECTIONALITY_BOUNDARY_NEUTRAL
, DIRECTIONALITY_PARAGRAPH_SEPARATOR
, DIRECTIONALITY_SEGMENT_SEPARATOR
, DIRECTIONALITY_WHITESPACE
, DIRECTIONALITY_OTHER_NEUTRALS
, DIRECTIONALITY_LEFT_TO_RIGHT_EMBEDDING
, DIRECTIONALITY_LEFT_TO_RIGHT_OVERRIDE
, DIRECTIONALITY_RIGHT_TO_LEFT_EMBEDDING
, DIRECTIONALITY_RIGHT_TO_LEFT_OVERRIDE
, DIRECTIONALITY_POP_DIRECTIONAL_FORMAT
public static byte getDirectionality(int codePoint)
DIRECTIONALITY_UNDEFINED
です。codePoint
- 方向性プロパティーが要求された文字 (Unicode コードポイント)。DIRECTIONALITY_UNDEFINED
, DIRECTIONALITY_LEFT_TO_RIGHT
, DIRECTIONALITY_RIGHT_TO_LEFT
, DIRECTIONALITY_RIGHT_TO_LEFT_ARABIC
, DIRECTIONALITY_EUROPEAN_NUMBER
, DIRECTIONALITY_EUROPEAN_NUMBER_SEPARATOR
, DIRECTIONALITY_EUROPEAN_NUMBER_TERMINATOR
, DIRECTIONALITY_ARABIC_NUMBER
, DIRECTIONALITY_COMMON_NUMBER_SEPARATOR
, DIRECTIONALITY_NONSPACING_MARK
, DIRECTIONALITY_BOUNDARY_NEUTRAL
, DIRECTIONALITY_PARAGRAPH_SEPARATOR
, DIRECTIONALITY_SEGMENT_SEPARATOR
, DIRECTIONALITY_WHITESPACE
, DIRECTIONALITY_OTHER_NEUTRALS
, DIRECTIONALITY_LEFT_TO_RIGHT_EMBEDDING
, DIRECTIONALITY_LEFT_TO_RIGHT_OVERRIDE
, DIRECTIONALITY_RIGHT_TO_LEFT_EMBEDDING
, DIRECTIONALITY_RIGHT_TO_LEFT_OVERRIDE
, DIRECTIONALITY_POP_DIRECTIONAL_FORMAT
public static boolean isMirrored(char ch)
'\u0028'
LEFT PARENTHESIS は、セマンティクスでは開き括弧として定義されています。これは、左から右に描画されるテキストでは「(」になり、右から左に描画されるテキストでは「)」になります。
注: このメソッドは、補助文字を処理できません。補助文字を含むすべての Unicode 文字をサポートするには、isMirrored(int)
メソッドを使用してください。
ch
- ミラー化プロパティーが要求された char
true
、char
がミラー化されないか未定義の場合は false
。public static boolean isMirrored(int codePoint)
'\u0028'
LEFT PARENTHESIS は、セマンティクスでは開き括弧として定義されています。これは、左から右に描画されるテキストでは「(」になり、右から左に描画されるテキストでは「)」になります。codePoint
- 判定対象の文字 (Unicode コードポイント)。true
、文字がミラー化されないか未定義の場合は false
。public int compareTo(Character anotherCharacter)
Character
オブジェクトを数値的に比較します。compareTo
、インタフェース: Comparable<Character>
anotherCharacter
- 比較対象の Character
。Character
がこの Character
と等しい場合は値 0
、この Character
が Character
引数より小さい数値の場合は 0
より小さい値、この Character
が Character
引数より大きい数値の場合は 0
より大きい値 (符号なしの比較)。これは完全に数値の比較なので、ロケールに依存しないpublic static int compare(char x, char y)
char
値を数値的に比較します。返される値は、次から返される値と同じになります。
Character.valueOf(x).compareTo(Character.valueOf(y))
x
- 比較する最初の char
y
- 比較する 2 番目の char
x == y
の場合は値 0
、x < y
の場合は 0
より小さい値、x > y
の場合は 0
より大きい値public static char reverseBytes(char ch)
public static String getName(int codePoint)
codePoint
の Unicodee 名 (コードポイントが unassigned
の場合は null) を返します。
注:UnicodeData ファイル (Unicode Consortium がメンテナンスを行っている Unicode Character Database の一部) で、指定された文字に名前が割り当てられていない場合、返される名前は次の式の結果と同じになります。
Character.UnicodeBlock.of(codePoint).toString().replace('_', ' ') + " " + Integer.toHexString(codePoint).toUpperCase(Locale.ENGLISH);
codePoint
- 文字 (Unicode コードポイント)IllegalArgumentException
- 指定された codePoint
が有効な Unicode コードポイントでない場合。 バグまたは機能を送信
詳細な API リファレンスおよび開発者ドキュメントについては、Java SE のドキュメントを参照してください。そのドキュメントには、概念的な概要、用語の定義、回避方法、有効なコード例などの、開発者を対象にしたより詳細な説明が含まれています。
Copyright © 1993, 2013, Oracle and/or its affiliates. All rights reserved.