public final class Character
extends Object
implements Serializable, Comparable<Character>
java.lang.Object | |
↳ | java.lang.Character |
Character
类将原始类型char
的值包装在对象中。 类型为Character
的对象包含一个类型为char
字段。
此外,该类提供了几种确定字符类别(小写字母,数字等)以及将字符从大写字母转换为小写字母,反之亦然的方法。
字符信息基于Unicode标准6.0.0版。
的方法和类的数据Character
通过在UnicodeData文件的是由Unicode Consortium维护的Unicode字符数据库的一部分的信息来定义。 该文件为每个定义的Unicode代码点或字符范围指定各种属性,包括名称和一般类别。
该文件及其说明可从Unicode Consortium获取:
char
数据类型(以及Character
对象封装的值)基于原始Unicode规范,该规范将字符定义为固定宽度的16位实体。 此后,Unicode标准已被更改为允许表示要求多于16位的字符。 合法代码点 s的范围现在是U + 0000到U + 10FFFF,称为Unicode标量值 。 (请参阅Unicode标准中的U + n表示法的 definition。 )
The set of characters from U+0000 to U+FFFF is sometimes referred to as the Basic Multilingual Plane (BMP). Characters其代码点大于U + FFFF称为增补字符秒。 Java平台在char
数组中以及在String
和StringBuffer
类中使用UTF-16表示StringBuffer
。 在此表示法中,补充字符表示为一对char
值,第一个来自高代理范围(\ uD800- \ uDBFF),第二个来自低代理范围(\ uDC00- \ uDFFF)。
因此, char
值代表基本多语言平面(BMP)代码点,包括替代代码点或UTF-16编码的代码单元。 int
值表示所有Unicode代码点,包括补充代码点。 int
的较低(最低有效)21位用于表示Unicode代码点,而高位(最高位)11位必须为零。 除非另有说明,关于增补字符和代理行为char
值如下:
char
value cannot support supplementary characters. They treat char
values from the surrogate ranges as undefined characters. For example, Character.isLetter('\uD840')
returns false
, even though this specific value if followed by any low-surrogate value in a string would represent a letter. int
value support all Unicode characters, including supplementary characters. For example, Character.isLetter(0x2F81A)
returns true
because the code point value represents a letter (a CJK ideograph). 在Java SE API文档中, Unicode代码点用于U + 0000和U + 10FFFF之间范围内的字符值,而Unicode代码单元用于16位char
值,这些值是UTF-16编码的代码单元。 有关Unicode术语的更多信息,请参阅Unicode Glossary 。
Nested classes |
|
---|---|
class |
Character.Subset 此类的实例表示Unicode字符集的特定子集。 |
class |
Character.UnicodeBlock 代表Unicode规范中的字符块的一系列字符子集。 |
枚举 |
Character.UnicodeScript 表示在Unicode Standard Annex #24: Script Names中定义的字符脚本的一系列字符子集。 |
Constants |
|
---|---|
int |
BYTES 用于以无符号二进制形式表示 |
byte |
COMBINING_SPACING_MARK Unicode规范中的一般类别“Mc”。 |
byte |
CONNECTOR_PUNCTUATION Unicode规范中的常规类别“Pc”。 |
byte |
CONTROL Unicode规范中的常规类别“Cc”。 |
byte |
CURRENCY_SYMBOL Unicode规范中的常规类别“Sc”。 |
byte |
DASH_PUNCTUATION Unicode规范中的常规类别“Pd”。 |
byte |
DECIMAL_DIGIT_NUMBER Unicode规范中的常规类别“Nd”。 |
byte |
DIRECTIONALITY_ARABIC_NUMBER Unicode规范中的弱双向字符类型“AN”。 |
byte |
DIRECTIONALITY_BOUNDARY_NEUTRAL Unicode规范中弱双向字符类型“BN”。 |
byte |
DIRECTIONALITY_COMMON_NUMBER_SEPARATOR Unicode规范中的弱双向字符类型“CS”。 |
byte |
DIRECTIONALITY_EUROPEAN_NUMBER Unicode规范中弱双向字符类型“EN”。 |
byte |
DIRECTIONALITY_EUROPEAN_NUMBER_SEPARATOR Unicode规范中弱双向字符类型“ES”。 |
byte |
DIRECTIONALITY_EUROPEAN_NUMBER_TERMINATOR Unicode规范中弱双向字符类型“ET”。 |
byte |
DIRECTIONALITY_LEFT_TO_RIGHT Unicode规范中的强双向字符类型“L”。 |
byte |
DIRECTIONALITY_LEFT_TO_RIGHT_EMBEDDING Unicode规范中的强双向字符类型“LRE”。 |
byte |
DIRECTIONALITY_LEFT_TO_RIGHT_OVERRIDE Unicode规范中的强双向字符类型“LRO”。 |
byte |
DIRECTIONALITY_NONSPACING_MARK Unicode规范中的弱双向字符类型“NSM”。 |
byte |
DIRECTIONALITY_OTHER_NEUTRALS Unicode规范中的中性双向字符类型“ON”。 |
byte |
DIRECTIONALITY_PARAGRAPH_SEPARATOR Unicode规范中的中性双向字符类型“B”。 |
byte |
DIRECTIONALITY_POP_DIRECTIONAL_FORMAT Unicode规范中的弱双向字符类型“PDF”。 |
byte |
DIRECTIONALITY_RIGHT_TO_LEFT Unicode规范中的强双向字符类型“R”。 |
byte |
DIRECTIONALITY_RIGHT_TO_LEFT_ARABIC Unicode规范中的强双向字符类型“AL”。 |
byte |
DIRECTIONALITY_RIGHT_TO_LEFT_EMBEDDING Unicode规范中的强双向字符类型“RLE”。 |
byte |
DIRECTIONALITY_RIGHT_TO_LEFT_OVERRIDE Unicode规范中的强双向字符类型“RLO”。 |
byte |
DIRECTIONALITY_SEGMENT_SEPARATOR Unicode规范中的中性双向字符类型“S”。 |
byte |
DIRECTIONALITY_UNDEFINED 未定义的双向字符类型。 |
byte |
DIRECTIONALITY_WHITESPACE Unicode规范中的中性双向字符类型“WS”。 |
byte |
ENCLOSING_MARK Unicode规范中的常规类别“我”。 |
byte |
END_PUNCTUATION Unicode规范中的常规类别“Pe”。 |
byte |
FINAL_QUOTE_PUNCTUATION Unicode规范中的常规类别“Pf”。 |
byte |
FORMAT Unicode规范中的常规类别“Cf”。 |
byte |
INITIAL_QUOTE_PUNCTUATION Unicode规范中的常规类别“Pi”。 |
byte |
LETTER_NUMBER Unicode规范中的常规类别“Nl”。 |
byte |
LINE_SEPARATOR Unicode规范中的常规类别“Zl”。 |
byte |
LOWERCASE_LETTER Unicode规范中的常规类别“Ll”。 |
byte |
MATH_SYMBOL Unicode规范中的常规类别“Sm”。 |
int |
MAX_CODE_POINT 最大值为 Unicode code point ,常数为 |
char |
MAX_HIGH_SURROGATE UTF-16编码中的一个 Unicode high-surrogate code unit的最大值,常量为 |
char |
MAX_LOW_SURROGATE UTF-16编码中的最大值 Unicode low-surrogate code unit ,常量 |
int |
MAX_RADIX 可用于转换为字符串和从字符串转换的最大基数。 |
char |
MAX_SURROGATE UTF-16编码中的Unicode替代代码单元的最大值,常量 |
char |
MAX_VALUE 该字段的常量值是类型 |
int |
MIN_CODE_POINT 最小值为 Unicode code point ,常数为 |
char |
MIN_HIGH_SURROGATE UTF-16编码中的 Unicode high-surrogate code unit的最小值,常量 |
char |
MIN_LOW_SURROGATE UTF-16编码中的最小值为 Unicode low-surrogate code unit ,常数为 |
int |
MIN_RADIX 可用于转换字符串和从字符串转换的最小基数。 |
int |
MIN_SUPPLEMENTARY_CODE_POINT 最小值为 Unicode supplementary code point ,常数为 |
char |
MIN_SURROGATE UTF-16编码中的Unicode替代代码单元的最小值,常量 |
char |
MIN_VALUE 该字段的常数值是类型 |
byte |
MODIFIER_LETTER Unicode规范中的常规类别“Lm”。 |
byte |
MODIFIER_SYMBOL Unicode规范中的常规类别“Sk”。 |
byte |
NON_SPACING_MARK Unicode规范中的常规类别“Mn”。 |
byte |
OTHER_LETTER Unicode规范中的常规类别“Lo”。 |
byte |
OTHER_NUMBER Unicode规范中的常规类别“否”。 |
byte |
OTHER_PUNCTUATION Unicode规范中的一般类别“Po”。 |
byte |
OTHER_SYMBOL Unicode规范中的一般类别“So”。 |
byte |
PARAGRAPH_SEPARATOR Unicode规范中的常规类别“Zp”。 |
byte |
PRIVATE_USE Unicode规范中的常规类别“Co”。 |
int |
SIZE 用于以无符号二进制形式表示 char值的位数,常数为 |
byte |
SPACE_SEPARATOR Unicode规范中的常规类别“Zs”。 |
byte |
START_PUNCTUATION Unicode规范中的常规类别“Ps”。 |
byte |
SURROGATE Unicode规范中的常规类别“Cs”。 |
byte |
TITLECASE_LETTER Unicode规范中的常规类别“Lt”。 |
byte |
UNASSIGNED Unicode规范中的常规类别“Cn”。 |
byte |
UPPERCASE_LETTER Unicode规范中的常规类别“Lu”。 |
Fields |
|
---|---|
public static final Class<Character> |
TYPE 表示原始类型 |
Public constructors |
|
---|---|
Character(char value) 构造一个新分配的 |
Public methods |
|
---|---|
static int |
charCount(int codePoint) 确定表示指定字符(Unicode代码点)所需的 |
char |
charValue() 返回此 |
static int |
codePointAt(char[] a, int index, int limit) 返回 |
static int |
codePointAt(char[] a, int index) 返回 |
static int |
codePointAt(CharSequence seq, int index) 返回 |
static int |
codePointBefore(char[] a, int index) 返回 |
static int |
codePointBefore(CharSequence seq, int index) 返回 |
static int |
codePointBefore(char[] a, int index, int start) 返回 |
static int |
codePointCount(CharSequence seq, int beginIndex, int endIndex) 返回指定字符序列文本范围内的Unicode代码点数。 |
static int |
codePointCount(char[] a, int offset, int count) 返回 |
static int |
compare(char x, char y) 以数字方式比较两个 |
int |
compareTo(Character anotherCharacter) 以数字方式比较两个 |
static int |
digit(int codePoint, int radix) 以指定的基数返回指定字符(Unicode代码点)的数值。 |
static int |
digit(char ch, int radix) 以指定的基数返回字符 |
boolean |
equals(Object obj) 将此对象与指定的对象进行比较。 |
static char |
forDigit(int digit, int radix) 确定指定基数中特定数字的字符表示形式。 |
static byte |
getDirectionality(char ch) 返回给定字符的Unicode方向性属性。 |
static byte |
getDirectionality(int codePoint) 返回给定字符(Unicode代码点)的Unicode方向属性。 |
static String |
getName(int codePoint) 返回指定字符的Unicode名称 |
static int |
getNumericValue(int codePoint) 返回指定字符(Unicode代码点)表示的 |
static int |
getNumericValue(char ch) 返回指定的Unicode字符表示的 |
static int |
getType(char ch) 返回一个值,表示一个角色的一般类别。 |
static int |
getType(int codePoint) 返回一个值,表示一个角色的一般类别。 |
static int |
hashCode(char value) 返回 |
int |
hashCode() 返回此 |
static char |
highSurrogate(int codePoint) 返回主导替代(一个 high surrogate code unit所述的) surrogate pair表示在UTF-16编码指定的补充的字符(Unicode代码点)。 |
static boolean |
isAlphabetic(int codePoint) 确定指定的字符(Unicode码点)是否为字母表。 |
static boolean |
isBmpCodePoint(int codePoint) 确定指定的字符(Unicode代码点)是否在 Basic Multilingual Plane (BMP)中 。 |
static boolean |
isDefined(int codePoint) 确定Unicode中是否定义了一个字符(Unicode码点)。 |
static boolean |
isDefined(char ch) 确定一个字符是否以Unicode定义。 |
static boolean |
isDigit(char ch) 确定指定的字符是否是数字。 |
static boolean |
isDigit(int codePoint) 确定指定的字符(Unicode代码点)是否是数字。 |
static boolean |
isHighSurrogate(char ch) 确定给定的 |
static boolean |
isISOControl(char ch) 确定指定的字符是否是ISO控制字符。 |
static boolean |
isISOControl(int codePoint) 确定引用的字符(Unicode代码点)是否是ISO控制字符。 |
static boolean |
isIdentifierIgnorable(char ch) 确定指定的字符是否应视为Java标识符或Unicode标识符中的可忽略字符。 |
static boolean |
isIdentifierIgnorable(int codePoint) 确定指定的字符(Unicode代码点)是否应视为Java标识符或Unicode标识符中的可忽略字符。 |
static boolean |
isIdeographic(int codePoint) 确定指定字符(Unicode代码点)是否是由Unicode标准定义的CJKV(中文,日文,韩文和越南文)表意文字。 |
static boolean |
isJavaIdentifierPart(char ch) 确定指定的字符是否可能是第一个字符以外的Java标识符的一部分。 |
static boolean |
isJavaIdentifierPart(int codePoint) 确定字符(Unicode代码点)是否可能是第一个字符以外的Java标识符的一部分。 |
static boolean |
isJavaIdentifierStart(int codePoint) 确定是否允许将字符(Unicode代码点)作为Java标识符中的第一个字符。 |
static boolean |
isJavaIdentifierStart(char ch) 确定是否允许指定的字符作为Java标识符中的第一个字符。 |
static boolean |
isJavaLetter(char ch) 此方法在API级别1中已被弃用。替换为isJavaIdentifierStart(char)。 |
static boolean |
isJavaLetterOrDigit(char ch) 此方法在API级别1中已被弃用。替换为isJavaIdentifierPart(char)。 |
static boolean |
isLetter(char ch) 确定指定的字符是否是字母。 |
static boolean |
isLetter(int codePoint) 确定指定的字符(Unicode代码点)是否是字母。 |
static boolean |
isLetterOrDigit(char ch) 确定指定的字符是字母还是数字。 |
static boolean |
isLetterOrDigit(int codePoint) 确定指定的字符(Unicode代码点)是字母还是数字。 |
static boolean |
isLowSurrogate(char ch) 确定给定的 |
static boolean |
isLowerCase(char ch) 确定指定的字符是否是小写字符。 |
static boolean |
isLowerCase(int codePoint) 确定指定的字符(Unicode代码点)是否是小写字符。 |
static boolean |
isMirrored(int codePoint) 根据Unicode规范确定是否镜像指定的字符(Unicode码点)。 |
static boolean |
isMirrored(char ch) 根据Unicode规范确定字符是否被镜像。 |
static boolean |
isSpace(char ch) 此方法在API级别1中已弃用。已由isWhitespace(char)替换。 |
static boolean |
isSpaceChar(char ch) 确定指定的字符是否是Unicode空格字符。 |
static boolean |
isSpaceChar(int codePoint) 确定指定的字符(Unicode代码点)是否是Unicode空格字符。 |
static boolean |
isSupplementaryCodePoint(int codePoint) 确定指定的字符(Unicode代码点)是否在 supplementary character范围内。 |
static boolean |
isSurrogate(char ch) 确定给定的 |
static boolean |
isSurrogatePair(char high, char low) 确定指定的一对 |
static boolean |
isTitleCase(int codePoint) 确定指定的字符(Unicode代码点)是否是标题字符。 |
static boolean |
isTitleCase(char ch) 确定指定的字符是否是标题字符。 |
static boolean |
isUnicodeIdentifierPart(int codePoint) 确定指定的字符(Unicode代码点)是否可能是Unicode标识符的一部分,而不是第一个字符。 |
static boolean |
isUnicodeIdentifierPart(char ch) 确定指定的字符是否可以是Unicode标识符的一部分,而不是第一个字符。 |
static boolean |
isUnicodeIdentifierStart(int codePoint) 确定是否允许指定的字符(Unicode码点)作为Unicode标识符中的第一个字符。 |
static boolean |
isUnicodeIdentifierStart(char ch) 确定是否允许指定的字符作为Unicode标识符中的第一个字符。 |
static boolean |
isUpperCase(char ch) 确定指定的字符是否为大写字符。 |
static boolean |
isUpperCase(int codePoint) 确定指定的字符(Unicode码点)是否为大写字符。 |
static boolean |
isValidCodePoint(int codePoint) 确定指定的代码点是否有效 Unicode code point value 。 |
static boolean |
isWhitespace(int codePoint) 根据Java确定指定的字符(Unicode代码点)是否为空白区域。 |
static boolean |
isWhitespace(char ch) 根据Java确定指定的字符是否为空白。 |
static char |
lowSurrogate(int codePoint) 返回尾随替代(一个 low surrogate code unit所述的) surrogate pair表示在UTF-16编码指定的补充的字符(Unicode代码点)。 |
static int |
offsetByCodePoints(CharSequence seq, int index, int codePointOffset) 返回给定字符序列中与给定的 |
static int |
offsetByCodePoints(char[] a, int start, int count, int index, int codePointOffset) 返回给定的 |
static char |
reverseBytes(char ch) 返回通过颠倒指定的 char值中的字节顺序而获得的值。 |
static int |
toChars(int codePoint, char[] dst, int dstIndex) 将指定的字符(Unicode代码点)转换为其UTF-16表示形式。 |
static char[] |
toChars(int codePoint) 将指定的字符(Unicode代码点)转换为存储在 |
static int |
toCodePoint(char high, char low) 将指定的代理对转换为其辅助代码点值。 |
static int |
toLowerCase(int codePoint) 使用UnicodeData文件中的大小写映射信息将字符(Unicode代码点)参数转换为小写字母。 |
static char |
toLowerCase(char ch) 使用UnicodeData文件中的大小写映射信息将字符参数转换为小写字母。 |
String |
toString() 返回代表此 |
static String |
toString(char c) 返回表示指定的 |
static char |
toTitleCase(char ch) 使用UnicodeData文件中的大小写映射信息将字符参数转换为titlecase。 |
static int |
toTitleCase(int codePoint) 使用UnicodeData文件中的大小写映射信息将字符(Unicode代码点)参数转换为标题。 |
static char |
toUpperCase(char ch) 使用UnicodeData文件中的大小写映射信息将字符参数转换为大写。 |
static int |
toUpperCase(int codePoint) 使用UnicodeData文件中的大小写映射信息将字符(Unicode代码点)参数转换为大写字母。 |
static Character |
valueOf(char c) 返回表示指定的 char值的 Character实例。 |
Inherited methods |
|
---|---|
From class java.lang.Object
|
|
From interface java.lang.Comparable
|
byte COMBINING_SPACING_MARK
Unicode规范中的一般类别“Mc”。
常量值:8(0x00000008)
byte CONNECTOR_PUNCTUATION
Unicode规范中的常规类别“Pc”。
常量值:23(0x00000017)
byte DECIMAL_DIGIT_NUMBER
Unicode规范中的常规类别“Nd”。
常量值:9(0x00000009)
byte DIRECTIONALITY_ARABIC_NUMBER
Unicode规范中的弱双向字符类型“AN”。
常数值:6(0x00000006)
byte DIRECTIONALITY_BOUNDARY_NEUTRAL
Unicode规范中弱双向字符类型“BN”。
常量值:9(0x00000009)
byte DIRECTIONALITY_COMMON_NUMBER_SEPARATOR
Unicode规范中的弱双向字符类型“CS”。
常量值:7(0x00000007)
byte DIRECTIONALITY_EUROPEAN_NUMBER
Unicode规范中弱双向字符类型“EN”。
常量值:3(0x00000003)
byte DIRECTIONALITY_EUROPEAN_NUMBER_SEPARATOR
Unicode规范中弱双向字符类型“ES”。
常量值:4(0x00000004)
byte DIRECTIONALITY_EUROPEAN_NUMBER_TERMINATOR
Unicode规范中弱双向字符类型“ET”。
常量值:5(0x00000005)
byte DIRECTIONALITY_LEFT_TO_RIGHT
Unicode规范中的强双向字符类型“L”。
常量值:0(0x00000000)
byte DIRECTIONALITY_LEFT_TO_RIGHT_EMBEDDING
Unicode规范中的强双向字符类型“LRE”。
常量值:14(0x0000000e)
byte DIRECTIONALITY_LEFT_TO_RIGHT_OVERRIDE
Unicode规范中的强双向字符类型“LRO”。
常量值:15(0x0000000f)
byte DIRECTIONALITY_NONSPACING_MARK
Unicode规范中的弱双向字符类型“NSM”。
常量值:8(0x00000008)
byte DIRECTIONALITY_OTHER_NEUTRALS
Unicode规范中的中性双向字符类型“ON”。
常量值:13(0x0000000d)
byte DIRECTIONALITY_PARAGRAPH_SEPARATOR
Unicode规范中的中性双向字符类型“B”。
常量值:10(0x0000000a)
byte DIRECTIONALITY_POP_DIRECTIONAL_FORMAT
Unicode规范中的弱双向字符类型“PDF”。
常量值:18(0x00000012)
byte DIRECTIONALITY_RIGHT_TO_LEFT
Unicode规范中的强双向字符类型“R”。
常数值:1(0x00000001)
byte DIRECTIONALITY_RIGHT_TO_LEFT_ARABIC
Unicode规范中的强双向字符类型“AL”。
常量值:2(0x00000002)
byte DIRECTIONALITY_RIGHT_TO_LEFT_EMBEDDING
Unicode规范中的强双向字符类型“RLE”。
常量值:16(0x00000010)
byte DIRECTIONALITY_RIGHT_TO_LEFT_OVERRIDE
Unicode规范中的强双向字符类型“RLO”。
常量值:17(0x00000011)
byte DIRECTIONALITY_SEGMENT_SEPARATOR
Unicode规范中的中性双向字符类型“S”。
常量值:11(0x0000000b)
byte DIRECTIONALITY_UNDEFINED
未定义的双向字符类型。 未定义的char
值在Unicode规范中具有未定义的方向性。
常量值:-1(0xffffffff)
byte DIRECTIONALITY_WHITESPACE
Unicode规范中的中性双向字符类型“WS”。
常量值:12(0x0000000c)
byte FINAL_QUOTE_PUNCTUATION
Unicode规范中的常规类别“Pf”。
常量值:30(0x0000001e)
byte INITIAL_QUOTE_PUNCTUATION
Unicode规范中的常规类别“Pi”。
常量值:29(0x0000001d)
int MAX_CODE_POINT
最大值为 Unicode code point ,常数为 U+10FFFF
。
常量值:1114111(0x0010ffff)
char MAX_HIGH_SURROGATE
Unicode high-surrogate code unit在UTF-16编码中的最大值,常量为'\uDBFF'
。 高代孕者也被称为领先代孕者 。
常量值:56319(0x0000dbff)
char MAX_LOW_SURROGATE
UTF-16编码中的最大值Unicode low-surrogate code unit ,常量'\uDFFF'
。 一个低代理人也被称为拖尾代理人 。
常量值:57343(0x0000dfff)
int MAX_RADIX
可用于转换为字符串和从字符串转换的最大基数。 此字段的常量值是基数转换方法(如digit
方法, forDigit
方法和toString
第toString
类方法)中基数参数所允许的Integer
。
常量值:36(0x00000024)
char MAX_SURROGATE
UTF-16编码中的Unicode替代代码单元的最大值,常量 '\uDFFF'
。
常量值:57343(0x0000dfff)
int MIN_CODE_POINT
最小值为 Unicode code point ,常数为 U+0000
。
常量值:0(0x00000000)
char MIN_HIGH_SURROGATE
UTF-16编码中的Unicode high-surrogate code unit的最小值,常量为'\uD800'
。 高代孕者也被称为领先代孕者 。
常量值:55296(0x0000d800)
char MIN_LOW_SURROGATE
UTF-16编码中的最小值Unicode low-surrogate code unit ,常量'\uDC00'
。 一个低代理人也被称为拖尾代理人 。
常量值:56320(0x0000dc00)
int MIN_RADIX
可用于转换字符串和从字符串转换的最小基数。 此字段的常量值是基数转换方法(如digit
方法, forDigit
方法和toString
类Integer
方法)中基数参数允许的Integer
。
常量值:2(0x00000002)
int MIN_SUPPLEMENTARY_CODE_POINT
最小值为 Unicode supplementary code point ,常数为 U+10000
。
常量值:65536(0x00010000)
char MIN_SURROGATE
UTF-16编码中的Unicode替代代码单元的最小值,常量 '\uD800'
。
常量值:55296(0x0000d800)
byte OTHER_PUNCTUATION
Unicode规范中的一般类别“Po”。
常量值:24(0x00000018)
byte PARAGRAPH_SEPARATOR
Unicode规范中的常规类别“Zp”。
常量值:14(0x0000000e)
byte START_PUNCTUATION
Unicode规范中的常规类别“Ps”。
常量值:21(0x00000015)
Character (char value)
构造一个新分配的 Character
对象,该对象表示指定的 char
值。
Parameters | |
---|---|
value |
char : the value to be represented by the Character object. |
int charCount (int codePoint)
确定表示指定字符(Unicode代码点)所需的char
值的数目。 如果指定的字符大于或等于0x10000,则该方法返回2.否则,该方法返回1。
此方法不会将指定的字符验证为有效的Unicode代码点。 如有必要,调用者必须使用isValidCodePoint
验证字符值。
Parameters | |
---|---|
codePoint |
int : the character (Unicode code point) to be tested. |
Returns | |
---|---|
int |
2 if the character is a valid supplementary character; 1 otherwise. |
char charValue ()
返回此 Character
对象的值。
Returns | |
---|---|
char |
the primitive char value represented by this object. |
int codePointAt (char[] a, int index, int limit)
返回char
数组给定索引处的代码点,其中只能使用index
小于limit
数组元素。 如果char
阵列中给定索引处的char
值处于高代理范围内,则以下索引小于limit
,并且以下索引处的char
值位于低代理范围内,则补充代码点对应于这个代理对被返回。 否则,返回给定索引处的char
值。
Parameters | |
---|---|
a |
char : the char array |
index |
int : the index to the char values (Unicode code units) in the char array to be converted |
limit |
int : the index after the last array element that can be used in the char array |
Returns | |
---|---|
int |
the Unicode code point at the given index |
Throws | |
---|---|
NullPointerException |
if a is null. |
IndexOutOfBoundsException |
if the index argument is negative or not less than the limit argument, or if the limit argument is negative or greater than the length of the char array. |
int codePointAt (char[] a, int index)
返回char
数组给定索引处的代码点。 如果char
阵列中给定索引处的char
值处于高代理范围内,则以下索引小于char
阵列的长度,并且以下索引处的char
值处于低代理范围内,则返回与该代理对对应的补充代码点。 否则,返回给定索引处的char
值。
Parameters | |
---|---|
a |
char : the char array |
index |
int : the index to the char values (Unicode code units) in the char array to be converted |
Returns | |
---|---|
int |
the Unicode code point at the given index |
Throws | |
---|---|
NullPointerException |
if a is null. |
IndexOutOfBoundsException |
if the value index is negative or not less than the length of the char array. |
int codePointAt (CharSequence seq, int index)
返回CharSequence
的给定索引处的代码点。 如果char
给定索引处的值CharSequence
处于高代理项范围,下列指数小于所述长度CharSequence
和char
以下索引处的值是在低代理项范围内,则所述辅助返回与此代理对相对应的代码点。 否则,返回给定索引处的char
值。
Parameters | |
---|---|
seq |
CharSequence : a sequence of char values (Unicode code units) |
index |
int : the index to the char values (Unicode code units) in seq to be converted |
Returns | |
---|---|
int |
the Unicode code point at the given index |
Throws | |
---|---|
NullPointerException |
if seq is null. |
IndexOutOfBoundsException |
if the value index is negative or not less than seq.length() . |
int codePointBefore (char[] a, int index)
返回char
数组给定索引之前的代码点。 如果char
在值(index - 1)
中char
阵列是在低代理项范围, (index - 2)
不为负,并且char
在值(index - 2)
中char
阵列在高代理项范围内,则对应于该替代的增补代码点对返回。 否则, char
在值(index - 1)
返回。
Parameters | |
---|---|
a |
char : the char array |
index |
int : the index following the code point that should be returned |
Returns | |
---|---|
int |
the Unicode code point value before the given index. |
Throws | |
---|---|
NullPointerException |
if a is null. |
IndexOutOfBoundsException |
if the index argument is less than 1 or greater than the length of the char array |
int codePointBefore (CharSequence seq, int index)
返回CharSequence
给定索引之前的代码点。 如果char
在值(index - 1)
在CharSequence
处于低代理项范围, (index - 2)
不为负,并且char
在值(index - 2)
在CharSequence
处于高代理项范围内,则对应于该代理对的增补代码点是回。 否则, char
在值(index - 1)
返回。
Parameters | |
---|---|
seq |
CharSequence : the CharSequence instance |
index |
int : the index following the code point that should be returned |
Returns | |
---|---|
int |
the Unicode code point value before the given index. |
Throws | |
---|---|
NullPointerException |
if seq is null. |
IndexOutOfBoundsException |
if the index argument is less than 1 or greater than seq.length() . |
int codePointBefore (char[] a, int index, int start)
返回char
数组给定索引之前的代码点,其中只能使用index
大于或等于start
数组元素。 如果char
在值(index - 1)
中char
阵列是在低代理项范围, (index - 2)
不小于start
和char
在值(index - 2)
中char
阵列在高代理项范围内,则对应于所述补充代码点这个代理对返回。 否则, char
在值(index - 1)
返回。
Parameters | |
---|---|
a |
char : the char array |
index |
int : the index following the code point that should be returned |
start |
int : the index of the first array element in the char array |
Returns | |
---|---|
int |
the Unicode code point value before the given index. |
Throws | |
---|---|
NullPointerException |
if a is null. |
IndexOutOfBoundsException |
if the index argument is not greater than the start argument or is greater than the length of the char array, or if the start argument is negative or not less than the length of the char array. |
int codePointCount (CharSequence seq, int beginIndex, int endIndex)
返回指定字符序列文本范围内的Unicode代码点数。 文本范围始于指定beginIndex
并延伸到char
在索引endIndex - 1
。 因此,文本范围的长度( char
s)为endIndex-beginIndex
。 文本范围内的不配对代理每个计为一个代码点。
Parameters | |
---|---|
seq |
CharSequence : the char sequence |
beginIndex |
int : the index to the first char of the text range. |
endIndex |
int : the index after the last char of the text range. |
Returns | |
---|---|
int |
the number of Unicode code points in the specified text range |
Throws | |
---|---|
NullPointerException |
if seq is null. |
IndexOutOfBoundsException |
if the beginIndex is negative, or endIndex is larger than the length of the given sequence, or beginIndex is larger than endIndex . |
int codePointCount (char[] a, int offset, int count)
返回char
数组参数的子数组中的Unicode代码点数。 所述offset
参数是第一的索引char
子阵列和所述count
参数指定在子阵列的长度char
秒。 子阵列中未配对的替代项每个都代表一个代码点。
Parameters | |
---|---|
a |
char : the char array |
offset |
int : the index of the first char in the given char array |
count |
int : the length of the subarray in char s |
Returns | |
---|---|
int |
the number of Unicode code points in the specified subarray |
Throws | |
---|---|
NullPointerException |
if a is null. |
IndexOutOfBoundsException |
if offset or count is negative, or if offset + count is larger than the length of the given array. |
int compare (char x, char y)
以数字方式比较两个char
值。 返回的值与以下内容返回的值相同:
Character.valueOf(x).compareTo(Character.valueOf(y))
Parameters | |
---|---|
x |
char : the first char to compare |
y |
char : the second char to compare |
Returns | |
---|---|
int |
the value 0 if x == y ; a value less than 0 if x < y ; and a value greater than 0 if x > y |
int compareTo (Character anotherCharacter)
以数字方式比较两个 Character
对象。
Parameters | |
---|---|
anotherCharacter |
Character : the Character to be compared. |
Returns | |
---|---|
int |
the value 0 if the argument Character is equal to this Character ; a value less than 0 if this Character is numerically less than the Character argument; and a value greater than 0 if this Character is numerically greater than the Character argument (unsigned comparison). Note that this is strictly a numerical comparison; it is not locale-dependent. |
int digit (int codePoint, int radix)
以指定的基数返回指定字符(Unicode代码点)的数值。
如果基数不在范围MIN_RADIX
≤ radix
≤ MAX_RADIX
,或者如果字符不是指定基数的有效数字, -1
返回。 如果以下至少一个条件成立,则字符是有效数字:
isDigit(codePoint)
is true
of the character and the Unicode decimal digit value of the character (or its single-character decomposition) is less than the specified radix. In this case the decimal digit value is returned. 'A'
through 'Z'
and its code is less than radix + 'A' - 10
. In this case, codePoint - 'A' + 10
is returned. 'a'
through 'z'
and its code is less than radix + 'a' - 10
. In this case, codePoint - 'a' + 10
is returned. '\uFF21'
) through Z ('\uFF3A'
) and its code is less than radix + '\uFF21' - 10
. In this case, codePoint - '\uFF21' + 10
is returned. '\uFF41'
) through z ('\uFF5A'
) and its code is less than radix + '\uFF41'- 10
. In this case, codePoint - '\uFF41' + 10
is returned. Parameters | |
---|---|
codePoint |
int : the character (Unicode code point) to be converted. |
radix |
int : the radix. |
Returns | |
---|---|
int |
the numeric value represented by the character in the specified radix. |
也可以看看:
int digit (char ch, int radix)
以指定的基数返回字符 ch
的数字值。
如果基数不在范围MIN_RADIX
≤ radix
≤ MAX_RADIX
或者价值ch
不是指定基数的有效数字, -1
返回。 如果以下至少一个条件成立,则字符是有效数字:
isDigit
is true
of the character and the Unicode decimal digit value of the character (or its single-character decomposition) is less than the specified radix. In this case the decimal digit value is returned. 'A'
through 'Z'
and its code is less than radix + 'A' - 10
. In this case, ch - 'A' + 10
is returned. 'a'
through 'z'
and its code is less than radix + 'a' - 10
. In this case, ch - 'a' + 10
is returned. '\uFF21'
) through Z ('\uFF3A'
) and its code is less than radix + '\uFF21' - 10
. In this case, ch - '\uFF21' + 10
is returned. '\uFF41'
) through z ('\uFF5A'
) and its code is less than radix + '\uFF41' - 10
. In this case, ch - '\uFF41' + 10
is returned. 注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符(包括补充字符),请使用digit(int, int)
方法。
Parameters | |
---|---|
ch |
char : the character to be converted. |
radix |
int : the radix. |
Returns | |
---|---|
int |
the numeric value represented by the character in the specified radix. |
也可以看看:
boolean equals (Object obj)
将此对象与指定的对象进行比较。 其结果是true
当且仅当该参数不是null
并且是Character
对象,表示相同char
值作为该对象。
Parameters | |
---|---|
obj |
Object : the object to compare with. |
Returns | |
---|---|
boolean |
true if the objects are the same; false otherwise. |
char forDigit (int digit, int radix)
确定指定基数中特定数字的字符表示形式。 如果radix
的值不是有效基数,或者digit
的值不是指定基数中的有效数字,则返回空字符( '\u0000'
)。
该radix
参数是有效的,如果它是大于或等于MIN_RADIX
且小于或等于MAX_RADIX
。 digit
参数是有效的,如果0 <= digit < radix
。
如果数字小于10,则返回'0' + digit
。 否则,返回值'a' + digit - 10
。
Parameters | |
---|---|
digit |
int : the number to convert to a character. |
radix |
int : the radix. |
Returns | |
---|---|
char |
the char representation of the specified digit in the specified radix. |
也可以看看:
byte getDirectionality (char ch)
返回给定字符的Unicode方向性属性。 字符方向性用于计算文本的视觉排序。 未定义的char
值的方向性值为DIRECTIONALITY_UNDEFINED
。
注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符(包括补充字符),请使用getDirectionality(int)
方法。
Parameters | |
---|---|
ch |
char : char for which the directionality property is requested. |
Returns | |
---|---|
byte |
the directionality property of the char value. |
也可以看看:
DIRECTIONALITY_UNDEFINED
DIRECTIONALITY_LEFT_TO_RIGHT
DIRECTIONALITY_RIGHT_TO_LEFT
DIRECTIONALITY_RIGHT_TO_LEFT_ARABIC
DIRECTIONALITY_EUROPEAN_NUMBER
DIRECTIONALITY_EUROPEAN_NUMBER_SEPARATOR
DIRECTIONALITY_EUROPEAN_NUMBER_TERMINATOR
DIRECTIONALITY_ARABIC_NUMBER
DIRECTIONALITY_COMMON_NUMBER_SEPARATOR
DIRECTIONALITY_NONSPACING_MARK
DIRECTIONALITY_BOUNDARY_NEUTRAL
DIRECTIONALITY_PARAGRAPH_SEPARATOR
DIRECTIONALITY_SEGMENT_SEPARATOR
DIRECTIONALITY_WHITESPACE
DIRECTIONALITY_OTHER_NEUTRALS
DIRECTIONALITY_LEFT_TO_RIGHT_EMBEDDING
DIRECTIONALITY_LEFT_TO_RIGHT_OVERRIDE
DIRECTIONALITY_RIGHT_TO_LEFT_EMBEDDING
DIRECTIONALITY_RIGHT_TO_LEFT_OVERRIDE
DIRECTIONALITY_POP_DIRECTIONAL_FORMAT
byte getDirectionality (int codePoint)
返回给定字符(Unicode代码点)的Unicode方向属性。 字符方向性用于计算文本的视觉排序。 未定义字符的方向性值为DIRECTIONALITY_UNDEFINED
。
Parameters | |
---|---|
codePoint |
int : the character (Unicode code point) for which the directionality property is requested. |
Returns | |
---|---|
byte |
the directionality property of the character. |
也可以看看:
DIRECTIONALITY_UNDEFINED
DIRECTIONALITY_LEFT_TO_RIGHT
DIRECTIONALITY_RIGHT_TO_LEFT
DIRECTIONALITY_RIGHT_TO_LEFT_ARABIC
DIRECTIONALITY_EUROPEAN_NUMBER
DIRECTIONALITY_EUROPEAN_NUMBER_SEPARATOR
DIRECTIONALITY_EUROPEAN_NUMBER_TERMINATOR
DIRECTIONALITY_ARABIC_NUMBER
DIRECTIONALITY_COMMON_NUMBER_SEPARATOR
DIRECTIONALITY_NONSPACING_MARK
DIRECTIONALITY_BOUNDARY_NEUTRAL
DIRECTIONALITY_PARAGRAPH_SEPARATOR
DIRECTIONALITY_SEGMENT_SEPARATOR
DIRECTIONALITY_WHITESPACE
DIRECTIONALITY_OTHER_NEUTRALS
DIRECTIONALITY_LEFT_TO_RIGHT_EMBEDDING
DIRECTIONALITY_LEFT_TO_RIGHT_OVERRIDE
DIRECTIONALITY_RIGHT_TO_LEFT_EMBEDDING
DIRECTIONALITY_RIGHT_TO_LEFT_OVERRIDE
DIRECTIONALITY_POP_DIRECTIONAL_FORMAT
String getName (int codePoint)
返回指定字符的Unicode名称 codePoint
;如果代码点为 unassigned
,则返回null。
注意:如果指定的字符未由 UnicodeData文件(由Unicode联合会维护的Unicode字符数据库的一部分)指定名称,则返回的名称与表达式的结果相同。
Character.UnicodeBlock.of(codePoint).toString().replace('_', ' ') + " " + Integer.toHexString(codePoint).toUpperCase(Locale.ENGLISH);
Parameters | |
---|---|
codePoint |
int : the character (Unicode code point) |
Returns | |
---|---|
String |
the Unicode name of the specified character, or null if the code point is unassigned. |
Throws | |
---|---|
IllegalArgumentException |
if the specified codePoint is not a valid Unicode code point. |
int getNumericValue (int codePoint)
返回指定字符(Unicode代码点)表示的值int
。 例如,字符'\u216C'
(罗马数字50)将返回值为50的int
。
大写字母AZ( '\u0041'
到 '\u005A'
),小写字母( '\u0061'
到 '\u007A'
)和全宽变体( '\uFF21'
到 '\uFF3A'
和 '\uFF41'
到 '\uFF5A'
)格式的字母AZ具有从10到35的数值。这与Unicode规范无关,不会为这些 char
值分配数值。
如果该字符没有数字值,则返回-1。 如果字符的数值不能表示为非负整数(例如,小数值),则返回-2。
Parameters | |
---|---|
codePoint |
int : the character (Unicode code point) to be converted. |
Returns | |
---|---|
int |
the numeric value of the character, as a nonnegative int value; -2 if the character has a numeric value that is not a nonnegative integer; -1 if the character has no numeric value. |
也可以看看:
int getNumericValue (char ch)
返回指定的Unicode字符表示的int
值。 例如,字符'\u216C'
(罗马数字50)将返回值为50的整数。
大写字母( '\u0041'
到 '\u005A'
),小写字母( '\u0061'
到 '\u007A'
)和全角变体( '\uFF21'
到 '\uFF3A'
和 '\uFF41'
到 '\uFF5A'
)中的字母AZ具有10到35的数值。这与Unicode规范无关,不会为这些 char
值分配数值。
如果该字符没有数字值,则返回-1。 如果字符的数值不能表示为非负整数(例如,小数值),则返回-2。
注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符(包括补充字符),请使用getNumericValue(int)
方法。
Parameters | |
---|---|
ch |
char : the character to be converted. |
Returns | |
---|---|
int |
the numeric value of the character, as a nonnegative int value; -2 if the character has a numeric value that is not a nonnegative integer; -1 if the character has no numeric value. |
也可以看看:
int getType (char ch)
返回一个值,表示一个角色的一般类别。
注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符(包括补充字符),请使用getType(int)
方法。
Parameters | |
---|---|
ch |
char : the character to be tested. |
Returns | |
---|---|
int |
a value of type int representing the character's general category. |
也可以看看:
COMBINING_SPACING_MARK
CONNECTOR_PUNCTUATION
CONTROL
CURRENCY_SYMBOL
DASH_PUNCTUATION
DECIMAL_DIGIT_NUMBER
ENCLOSING_MARK
END_PUNCTUATION
FINAL_QUOTE_PUNCTUATION
FORMAT
INITIAL_QUOTE_PUNCTUATION
LETTER_NUMBER
LINE_SEPARATOR
LOWERCASE_LETTER
MATH_SYMBOL
MODIFIER_LETTER
MODIFIER_SYMBOL
NON_SPACING_MARK
OTHER_LETTER
OTHER_NUMBER
OTHER_PUNCTUATION
OTHER_SYMBOL
PARAGRAPH_SEPARATOR
PRIVATE_USE
SPACE_SEPARATOR
START_PUNCTUATION
SURROGATE
TITLECASE_LETTER
UNASSIGNED
UPPERCASE_LETTER
int getType (int codePoint)
返回一个值,表示一个角色的一般类别。
Parameters | |
---|---|
codePoint |
int : the character (Unicode code point) to be tested. |
Returns | |
---|---|
int |
a value of type int representing the character's general category. |
也可以看看:
COMBINING_SPACING_MARK
CONNECTOR_PUNCTUATION
CONTROL
CURRENCY_SYMBOL
DASH_PUNCTUATION
DECIMAL_DIGIT_NUMBER
ENCLOSING_MARK
END_PUNCTUATION
FINAL_QUOTE_PUNCTUATION
FORMAT
INITIAL_QUOTE_PUNCTUATION
LETTER_NUMBER
LINE_SEPARATOR
LOWERCASE_LETTER
MATH_SYMBOL
MODIFIER_LETTER
MODIFIER_SYMBOL
NON_SPACING_MARK
OTHER_LETTER
OTHER_NUMBER
OTHER_PUNCTUATION
OTHER_SYMBOL
PARAGRAPH_SEPARATOR
PRIVATE_USE
SPACE_SEPARATOR
START_PUNCTUATION
SURROGATE
TITLECASE_LETTER
UNASSIGNED
UPPERCASE_LETTER
int hashCode (char value)
返回char
值的散列码; 与Character.hashCode()
兼容。
Parameters | |
---|---|
value |
char : The char for which to return a hash code. |
Returns | |
---|---|
int |
a hash code value for a char value. |
int hashCode ()
返回此Character
的哈希码; 等于调用charValue()
的结果。
Returns | |
---|---|
int |
a hash code value for this Character |
char highSurrogate (int codePoint)
返回主导替代(一个high surrogate code unit所述的) surrogate pair表示在UTF-16编码指定的补充的字符(Unicode代码点)。 如果指定的字符不是supplementary character ,则返回未指定的char
。
如果 isSupplementaryCodePoint(x)
是 true
,则 isHighSurrogate
(highSurrogate(x))
和 toCodePoint
(highSurrogate(x),
lowSurrogate
(x)) == x
也总是 true
。
Parameters | |
---|---|
codePoint |
int : a supplementary character (Unicode code point) |
Returns | |
---|---|
char |
the leading surrogate code unit used to represent the character in the UTF-16 encoding |
boolean isAlphabetic (int codePoint)
确定指定的字符(Unicode码点)是否为字母表。
如果字符由 getType(codePoint)
提供的一般类别类型为以下任一字符,则认为字符是字母:
UPPERCASE_LETTER
LOWERCASE_LETTER
TITLECASE_LETTER
MODIFIER_LETTER
OTHER_LETTER
LETTER_NUMBER
Parameters | |
---|---|
codePoint |
int : the character (Unicode code point) to be tested. |
Returns | |
---|---|
boolean |
true if the character is a Unicode alphabet character, false otherwise. |
boolean isBmpCodePoint (int codePoint)
确定指定的字符(Unicode代码点)是否在Basic Multilingual Plane (BMP)中 。 这样的代码点可以用一个char
表示。
Parameters | |
---|---|
codePoint |
int : the character (Unicode code point) to be tested |
Returns | |
---|---|
boolean |
true if the specified code point is between MIN_VALUE and MAX_VALUE inclusive; false otherwise. |
boolean isDefined (int codePoint)
确定Unicode中是否定义了一个字符(Unicode码点)。
如果以下至少一个条件成立,则会定义一个字符:
Parameters | |
---|---|
codePoint |
int : the character (Unicode code point) to be tested. |
Returns | |
---|---|
boolean |
true if the character has a defined meaning in Unicode; false otherwise. |
boolean isDefined (char ch)
确定一个字符是否以Unicode定义。
如果以下至少一个条件成立,则会定义一个字符:
注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符(包括补充字符),请使用isDefined(int)
方法。
Parameters | |
---|---|
ch |
char : the character to be tested |
Returns | |
---|---|
boolean |
true if the character has a defined meaning in Unicode; false otherwise. |
boolean isDigit (char ch)
确定指定的字符是否是数字。
甲字符是数字,如果它的一般类别类型,通过提供 Character.getType(ch)
,是 DECIMAL_DIGIT_NUMBER
。
一些包含数字的Unicode字符范围:
'\u0030'
through '\u0039'
, ISO-LATIN-1 digits ('0'
through '9'
) '\u0660'
through '\u0669'
, Arabic-Indic digits '\u06F0'
through '\u06F9'
, Extended Arabic-Indic digits '\u0966'
through '\u096F'
, Devanagari digits '\uFF10'
through '\uFF19'
, Fullwidth digits 注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符(包括补充字符),请使用isDigit(int)
方法。
Parameters | |
---|---|
ch |
char : the character to be tested. |
Returns | |
---|---|
boolean |
true if the character is a digit; false otherwise. |
boolean isDigit (int codePoint)
确定指定的字符(Unicode代码点)是否是数字。
甲字符是数字,如果它的一般类别类型,通过提供 getType(codePoint)
,是 DECIMAL_DIGIT_NUMBER
。
一些包含数字的Unicode字符范围:
'\u0030'
through '\u0039'
, ISO-LATIN-1 digits ('0'
through '9'
) '\u0660'
through '\u0669'
, Arabic-Indic digits '\u06F0'
through '\u06F9'
, Extended Arabic-Indic digits '\u0966'
through '\u096F'
, Devanagari digits '\uFF10'
through '\uFF19'
, Fullwidth digits Parameters | |
---|---|
codePoint |
int : the character (Unicode code point) to be tested. |
Returns | |
---|---|
boolean |
true if the character is a digit; false otherwise. |
也可以看看:
boolean isHighSurrogate (char ch)
确定给定的 char
值是否为 Unicode high-surrogate code unit (也称为 领先代理代码单元 )。
这些值本身不代表字符,但用于UTF-16编码的 supplementary characters表示。
Parameters | |
---|---|
ch |
char : the char value to be tested. |
Returns | |
---|---|
boolean |
true if the char value is between MIN_HIGH_SURROGATE and MAX_HIGH_SURROGATE inclusive; false otherwise. |
也可以看看:
boolean isISOControl (char ch)
确定指定的字符是否是ISO控制字符。 一个字符被认为如果其代码是在范围为ISO控制字符'\u0000'
通过'\u001F'
或在范围'\u007F'
通过'\u009F'
。
注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符(包括补充字符),请使用isISOControl(int)
方法。
Parameters | |
---|---|
ch |
char : the character to be tested. |
Returns | |
---|---|
boolean |
true if the character is an ISO control character; false otherwise. |
boolean isISOControl (int codePoint)
确定引用的字符(Unicode代码点)是否是ISO控制字符。 如果字符的代码范围在'\u0000'
到'\u001F'
或者范围在'\u007F'
到'\u009F'
则认为该字符是ISO控制字符。
Parameters | |
---|---|
codePoint |
int : the character (Unicode code point) to be tested. |
Returns | |
---|---|
boolean |
true if the character is an ISO control character; false otherwise. |
boolean isIdentifierIgnorable (char ch)
确定指定的字符是否应视为Java标识符或Unicode标识符中的可忽略字符。
以下Unicode字符在Java标识符或Unicode标识符中可以忽略:
'\u0000'
through '\u0008'
'\u000E'
through '\u001B'
'\u007F'
through '\u009F'
FORMAT
general category value 注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符(包括补充字符),请使用isIdentifierIgnorable(int)
方法。
Parameters | |
---|---|
ch |
char : the character to be tested. |
Returns | |
---|---|
boolean |
true if the character is an ignorable control character that may be part of a Java or Unicode identifier; false otherwise. |
boolean isIdentifierIgnorable (int codePoint)
确定指定的字符(Unicode代码点)是否应视为Java标识符或Unicode标识符中的可忽略字符。
以下Unicode字符在Java标识符或Unicode标识符中可以忽略:
'\u0000'
through '\u0008'
'\u000E'
through '\u001B'
'\u007F'
through '\u009F'
FORMAT
general category value Parameters | |
---|---|
codePoint |
int : the character (Unicode code point) to be tested. |
Returns | |
---|---|
boolean |
true if the character is an ignorable control character that may be part of a Java or Unicode identifier; false otherwise. |
boolean isIdeographic (int codePoint)
确定指定字符(Unicode代码点)是否是由Unicode标准定义的CJKV(中文,日文,韩文和越南文)表意文字。
Parameters | |
---|---|
codePoint |
int : the character (Unicode code point) to be tested. |
Returns | |
---|---|
boolean |
true if the character is a Unicode ideograph character, false otherwise. |
boolean isJavaIdentifierPart (char ch)
确定指定的字符是否可能是第一个字符以外的Java标识符的一部分。
如果以下任一情况属实,字符可能是Java标识符的一部分:
'$'
) '_'
) isIdentifierIgnorable
returns true
for the character 注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符(包括补充字符),请使用isJavaIdentifierPart(int)
方法。
Parameters | |
---|---|
ch |
char : the character to be tested. |
Returns | |
---|---|
boolean |
true if the character may be part of a Java identifier; false otherwise. |
boolean isJavaIdentifierPart (int codePoint)
确定字符(Unicode代码点)是否可能是第一个字符以外的Java标识符的一部分。
如果以下任一情况属实,字符可能是Java标识符的一部分:
'$'
) '_'
) isIdentifierIgnorable(codePoint)
returns true
for the character Parameters | |
---|---|
codePoint |
int : the character (Unicode code point) to be tested. |
Returns | |
---|---|
boolean |
true if the character may be part of a Java identifier; false otherwise. |
boolean isJavaIdentifierStart (int codePoint)
确定是否允许将字符(Unicode代码点)作为Java标识符中的第一个字符。
当且仅当满足以下条件之一时,字符才可以启动Java标识符:
isLetter(codePoint)
returns true
getType(codePoint)
returns LETTER_NUMBER
'$'
) '_'
). Parameters | |
---|---|
codePoint |
int : the character (Unicode code point) to be tested. |
Returns | |
---|---|
boolean |
true if the character may start a Java identifier; false otherwise. |
boolean isJavaIdentifierStart (char ch)
确定是否允许指定的字符作为Java标识符中的第一个字符。
当且仅当满足以下条件之一时,字符才可以启动Java标识符:
isLetter(ch)
returns true
getType(ch)
returns LETTER_NUMBER
ch
is a currency symbol (such as '$'
) ch
is a connecting punctuation character (such as '_'
). 注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符(包括补充字符),请使用isJavaIdentifierStart(int)
方法。
Parameters | |
---|---|
ch |
char : the character to be tested. |
Returns | |
---|---|
boolean |
true if the character may start a Java identifier; false otherwise. |
boolean isJavaLetter (char ch)
此方法在API级别1中已弃用。
替换为isJavaIdentifierStart(char)。
确定是否允许指定的字符作为Java标识符中的第一个字符。
当且仅当满足以下条件之一时,字符才可以启动Java标识符:
isLetter(ch)
returns true
getType(ch)
returns LETTER_NUMBER
ch
is a currency symbol (such as '$'
) ch
is a connecting punctuation character (such as '_'
). Parameters | |
---|---|
ch |
char : the character to be tested. |
Returns | |
---|---|
boolean |
true if the character may start a Java identifier; false otherwise. |
boolean isJavaLetterOrDigit (char ch)
此方法在API级别1中已弃用。
替换为isJavaIdentifierPart(char)。
确定指定的字符是否可能是第一个字符以外的Java标识符的一部分。
一个字符可能是Java标识符的一部分,当且仅当满足以下任一条件时:
'$'
) '_'
) isIdentifierIgnorable
returns true
for the character. Parameters | |
---|---|
ch |
char : the character to be tested. |
Returns | |
---|---|
boolean |
true if the character may be part of a Java identifier; false otherwise. |
boolean isLetter (char ch)
确定指定的字符是否是字母。
如果字符 Character.getType(ch)
提供的一般类别类型是以下任何一种,则该字符被认为是字母:
UPPERCASE_LETTER
LOWERCASE_LETTER
TITLECASE_LETTER
MODIFIER_LETTER
OTHER_LETTER
注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符(包括补充字符),请使用isLetter(int)
方法。
Parameters | |
---|---|
ch |
char : the character to be tested. |
Returns | |
---|---|
boolean |
true if the character is a letter; false otherwise. |
boolean isLetter (int codePoint)
确定指定的字符(Unicode代码点)是否是字母。
如果字符 getType(codePoint)
提供的一般类别类型是以下任何一种,则该字符被认为是字母:
UPPERCASE_LETTER
LOWERCASE_LETTER
TITLECASE_LETTER
MODIFIER_LETTER
OTHER_LETTER
Parameters | |
---|---|
codePoint |
int : the character (Unicode code point) to be tested. |
Returns | |
---|---|
boolean |
true if the character is a letter; false otherwise. |
boolean isLetterOrDigit (char ch)
确定指定的字符是字母还是数字。
如果字符被 Character.isLetter(char ch)
或 Character.isDigit(char ch)
返回 true
,则认为该字符是字母或数字。
注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符(包括补充字符),请使用isLetterOrDigit(int)
方法。
Parameters | |
---|---|
ch |
char : the character to be tested. |
Returns | |
---|---|
boolean |
true if the character is a letter or digit; false otherwise. |
boolean isLetterOrDigit (int codePoint)
确定指定的字符(Unicode代码点)是字母还是数字。
如果字符是 isLetter(codePoint)
或 isDigit(codePoint)
返回 true
,则认为字符是字母或数字。
Parameters | |
---|---|
codePoint |
int : the character (Unicode code point) to be tested. |
Returns | |
---|---|
boolean |
true if the character is a letter or digit; false otherwise. |
boolean isLowSurrogate (char ch)
确定给定的 char
值是否为 Unicode low-surrogate code unit (也称为 尾随 替 代码单元 )。
这些值本身并不代表字符,但用于UTF-16编码的 supplementary characters表示。
Parameters | |
---|---|
ch |
char : the char value to be tested. |
Returns | |
---|---|
boolean |
true if the char value is between MIN_LOW_SURROGATE and MAX_LOW_SURROGATE inclusive; false otherwise. |
也可以看看:
boolean isLowerCase (char ch)
确定指定的字符是否是小写字符。
如果其字符为 Character.getType(ch)
提供的常规类别类型为 LOWERCASE_LETTER
,或者它具有由Unicode标准定义的贡献属性Other_Lowercase,则该字符为小写字母。
以下是小写字符的示例:
a b c d e f g h i j k l m n o p q r s t u v w x y z '\u00DF' '\u00E0' '\u00E1' '\u00E2' '\u00E3' '\u00E4' '\u00E5' '\u00E6' '\u00E7' '\u00E8' '\u00E9' '\u00EA' '\u00EB' '\u00EC' '\u00ED' '\u00EE' '\u00EF' '\u00F0' '\u00F1' '\u00F2' '\u00F3' '\u00F4' '\u00F5' '\u00F6' '\u00F8' '\u00F9' '\u00FA' '\u00FB' '\u00FC' '\u00FD' '\u00FE' '\u00FF'
许多其他Unicode字符也是小写字母。
注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符(包括补充字符),请使用isLowerCase(int)
方法。
Parameters | |
---|---|
ch |
char : the character to be tested. |
Returns | |
---|---|
boolean |
true if the character is lowercase; false otherwise. |
boolean isLowerCase (int codePoint)
确定指定的字符(Unicode代码点)是否是小写字符。
如果其字符为 getType(codePoint)
提供的常规类别类型为 LOWERCASE_LETTER
,或者它具有由Unicode标准定义的贡献属性Other_Lowercase,则该字符为小写字母。
以下是小写字符的示例:
a b c d e f g h i j k l m n o p q r s t u v w x y z '\u00DF' '\u00E0' '\u00E1' '\u00E2' '\u00E3' '\u00E4' '\u00E5' '\u00E6' '\u00E7' '\u00E8' '\u00E9' '\u00EA' '\u00EB' '\u00EC' '\u00ED' '\u00EE' '\u00EF' '\u00F0' '\u00F1' '\u00F2' '\u00F3' '\u00F4' '\u00F5' '\u00F6' '\u00F8' '\u00F9' '\u00FA' '\u00FB' '\u00FC' '\u00FD' '\u00FE' '\u00FF'
许多其他Unicode字符也是小写字母。
Parameters | |
---|---|
codePoint |
int : the character (Unicode code point) to be tested. |
Returns | |
---|---|
boolean |
true if the character is lowercase; false otherwise. |
boolean isMirrored (int codePoint)
根据Unicode规范确定是否镜像指定的字符(Unicode码点)。 镜像字符应显示在从右到左的文本中时水平镜像的字形。 例如, '\u0028'
左括号在语义上被定义为左括号 。 这将显示为从左到右的文本中的“(”,但在从右到左的文本中显示为“)”。
Parameters | |
---|---|
codePoint |
int : the character (Unicode code point) to be tested. |
Returns | |
---|---|
boolean |
true if the character is mirrored, false if the character is not mirrored or is not defined. |
boolean isMirrored (char ch)
根据Unicode规范确定字符是否被镜像。 镜像字符应显示在从右到左的文本中时水平镜像的字形。 例如, '\u0028'
LEFT PARENTHESIS在语义上被定义为左括号 。 这将显示为从左到右的文本中的“(”,但在从右到左的文本中显示为“)”。
注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符(包括补充字符),请使用isMirrored(int)
方法。
Parameters | |
---|---|
ch |
char : char for which the mirrored property is requested |
Returns | |
---|---|
boolean |
true if the char is mirrored, false if the char is not mirrored or is not defined. |
boolean isSpace (char ch)
此方法在API级别1中已弃用。
被isWhitespace替换(char)。
确定指定的字符是否为ISO-LATIN-1空格。 此方法true
以下五个字符返回true
:
'\t' |
U+0009 |
HORIZONTAL TABULATION |
'\n' |
U+000A |
NEW LINE |
'\f' |
U+000C |
FORM FEED |
'\r' |
U+000D |
CARRIAGE RETURN |
' ' |
U+0020 |
SPACE |
Parameters | |
---|---|
ch |
char : the character to be tested. |
Returns | |
---|---|
boolean |
true if the character is ISO-LATIN-1 white space; false otherwise. |
boolean isSpaceChar (char ch)
确定指定的字符是否是Unicode空格字符。 一个字符被认为是一个空格字符,当且仅当它被Unicode标准指定为一个空格字符时。 如果角色的一般类别类型为以下任一种,则此方法返回true:
SPACE_SEPARATOR
LINE_SEPARATOR
PARAGRAPH_SEPARATOR
注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符(包括补充字符),请使用isSpaceChar(int)
方法。
Parameters | |
---|---|
ch |
char : the character to be tested. |
Returns | |
---|---|
boolean |
true if the character is a space character; false otherwise. |
也可以看看:
boolean isSpaceChar (int codePoint)
确定指定的字符(Unicode代码点)是否是Unicode空格字符。 一个字符被认为是一个空格字符,当且仅当它被Unicode标准指定为一个空格字符时。 如果角色的一般类别类型为以下任一种,则此方法返回true:
Parameters | |
---|---|
codePoint |
int : the character (Unicode code point) to be tested. |
Returns | |
---|---|
boolean |
true if the character is a space character; false otherwise. |
也可以看看:
boolean isSupplementaryCodePoint (int codePoint)
确定指定的字符(Unicode代码点)是否在 supplementary character范围内。
Parameters | |
---|---|
codePoint |
int : the character (Unicode code point) to be tested |
Returns | |
---|---|
boolean |
true if the specified code point is between MIN_SUPPLEMENTARY_CODE_POINT and MAX_CODE_POINT inclusive; false otherwise. |
boolean isSurrogate (char ch)
确定给定的 char
值是否是Unicode 代理代码单元 。
这些值本身不代表字符,但用于UTF-16编码的 supplementary characters表示形式。
char值是代理代码单元当且仅当它是 low-surrogate code unit或 high-surrogate code unit 。
Parameters | |
---|---|
ch |
char : the char value to be tested. |
Returns | |
---|---|
boolean |
true if the char value is between MIN_SURROGATE and MAX_SURROGATE inclusive; false otherwise. |
boolean isSurrogatePair (char high, char low)
确定指定的一对 char
值是否为有效的 Unicode surrogate pair 。
这种方法相当于表达式:
isHighSurrogate(high) && isLowSurrogate(low)
Parameters | |
---|---|
high |
char : the high-surrogate code value to be tested |
low |
char : the low-surrogate code value to be tested |
Returns | |
---|---|
boolean |
true if the specified high and low-surrogate code values represent a valid surrogate pair; false otherwise. |
boolean isTitleCase (int codePoint)
确定指定的字符(Unicode代码点)是否是标题字符。
字符是否为标题字符,如果它的一般类别类型,通过提供 getType(codePoint)
,是 TITLECASE_LETTER
。
有些字符看起来像是一对拉丁字母。 例如,有一个大写字母看起来像“LJ”,并有一个相应的小写字母,看起来像“lj”。 第三种形式看起来像“Lj”,是以首字母大写呈现小写字母时使用的适当形式,例如书名。
这些是此方法返回的一些Unicode字符 true
:
LATIN CAPITAL LETTER D WITH SMALL LETTER Z WITH CARON
LATIN CAPITAL LETTER L WITH SMALL LETTER J
LATIN CAPITAL LETTER N WITH SMALL LETTER J
LATIN CAPITAL LETTER D WITH SMALL LETTER Z
许多其他的Unicode字符也是标题。
Parameters | |
---|---|
codePoint |
int : the character (Unicode code point) to be tested. |
Returns | |
---|---|
boolean |
true if the character is titlecase; false otherwise. |
boolean isTitleCase (char ch)
确定指定的字符是否是标题字符。
字符是否为标题字符,如果它的一般类别类型,通过提供 Character.getType(ch)
,是 TITLECASE_LETTER
。
有些字符看起来像是一对拉丁字母。 例如,有一个大写字母看起来像“LJ”,并有一个相应的小写字母,看起来像“lj”。 第三种形式看起来像“Lj”,是以首字母大写呈现小写字母时使用的适当形式,例如书名。
这些是此方法返回的一些Unicode字符 true
:
LATIN CAPITAL LETTER D WITH SMALL LETTER Z WITH CARON
LATIN CAPITAL LETTER L WITH SMALL LETTER J
LATIN CAPITAL LETTER N WITH SMALL LETTER J
LATIN CAPITAL LETTER D WITH SMALL LETTER Z
许多其他的Unicode字符也是标题。
注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符(包括补充字符),请使用isTitleCase(int)
方法。
Parameters | |
---|---|
ch |
char : the character to be tested. |
Returns | |
---|---|
boolean |
true if the character is titlecase; false otherwise. |
boolean isUnicodeIdentifierPart (int codePoint)
确定指定的字符(Unicode代码点)是否可能是Unicode标识符的一部分,而不是第一个字符。
一个字符可能是Unicode标识符的一部分当且仅当下列其中一个语句为真时:
'_'
) isIdentifierIgnorable
returns true
for this character. Parameters | |
---|---|
codePoint |
int : the character (Unicode code point) to be tested. |
Returns | |
---|---|
boolean |
true if the character may be part of a Unicode identifier; false otherwise. |
boolean isUnicodeIdentifierPart (char ch)
确定指定的字符是否可以是Unicode标识符的一部分,而不是第一个字符。
一个字符可能是Unicode标识符的一部分当且仅当下列其中一个语句为真时:
'_'
) isIdentifierIgnorable
returns true
for this character. 注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符(包括补充字符),请使用isUnicodeIdentifierPart(int)
方法。
Parameters | |
---|---|
ch |
char : the character to be tested. |
Returns | |
---|---|
boolean |
true if the character may be part of a Unicode identifier; false otherwise. |
boolean isUnicodeIdentifierStart (int codePoint)
确定是否允许指定的字符(Unicode码点)作为Unicode标识符中的第一个字符。
当且仅当满足以下条件之一时,字符才可以启动Unicode标识符:
isLetter(codePoint)
returns true
getType(codePoint)
returns LETTER_NUMBER
. Parameters | |
---|---|
codePoint |
int : the character (Unicode code point) to be tested. |
Returns | |
---|---|
boolean |
true if the character may start a Unicode identifier; false otherwise. |
boolean isUnicodeIdentifierStart (char ch)
确定是否允许指定的字符作为Unicode标识符中的第一个字符。
当且仅当满足以下条件之一时,字符才可以启动Unicode标识符:
isLetter(ch)
returns true
getType(ch)
returns LETTER_NUMBER
. 注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符(包括补充字符),请使用isUnicodeIdentifierStart(int)
方法。
Parameters | |
---|---|
ch |
char : the character to be tested. |
Returns | |
---|---|
boolean |
true if the character may start a Unicode identifier; false otherwise. |
boolean isUpperCase (char ch)
确定指定的字符是否为大写字符。
一个字符大写如果其一般类别类型,通过提供Character.getType(ch)
,是UPPERCASE_LETTER
。 或者它具有由Unicode标准定义的贡献属性Other_Uppercase。
以下是大写字符的示例:
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z '\u00C0' '\u00C1' '\u00C2' '\u00C3' '\u00C4' '\u00C5' '\u00C6' '\u00C7' '\u00C8' '\u00C9' '\u00CA' '\u00CB' '\u00CC' '\u00CD' '\u00CE' '\u00CF' '\u00D0' '\u00D1' '\u00D2' '\u00D3' '\u00D4' '\u00D5' '\u00D6' '\u00D8' '\u00D9' '\u00DA' '\u00DB' '\u00DC' '\u00DD' '\u00DE'
许多其他Unicode字符也是大写字母。
注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符(包括补充字符),请使用isUpperCase(int)
方法。
Parameters | |
---|---|
ch |
char : the character to be tested. |
Returns | |
---|---|
boolean |
true if the character is uppercase; false otherwise. |
boolean isUpperCase (int codePoint)
确定指定的字符(Unicode码点)是否为大写字符。
如果一个字符的大致类别类型由 getType(codePoint)
提供,为 UPPERCASE_LETTER
,或者它具有由Unicode标准定义的贡献属性Other_Uppercase,则该字符为大写字母。
以下是大写字符的示例:
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z '\u00C0' '\u00C1' '\u00C2' '\u00C3' '\u00C4' '\u00C5' '\u00C6' '\u00C7' '\u00C8' '\u00C9' '\u00CA' '\u00CB' '\u00CC' '\u00CD' '\u00CE' '\u00CF' '\u00D0' '\u00D1' '\u00D2' '\u00D3' '\u00D4' '\u00D5' '\u00D6' '\u00D8' '\u00D9' '\u00DA' '\u00DB' '\u00DC' '\u00DD' '\u00DE'
许多其他Unicode字符也是大写字母。
Parameters | |
---|---|
codePoint |
int : the character (Unicode code point) to be tested. |
Returns | |
---|---|
boolean |
true if the character is uppercase; false otherwise. |
boolean isValidCodePoint (int codePoint)
确定指定的代码点是否有效 Unicode code point value 。
Parameters | |
---|---|
codePoint |
int : the Unicode code point to be tested |
Returns | |
---|---|
boolean |
true if the specified code point value is between MIN_CODE_POINT and MAX_CODE_POINT inclusive; false otherwise. |
boolean isWhitespace (int codePoint)
根据Java确定指定的字符(Unicode代码点)是否为空白区域。 一个字符是一个Java空白字符,当且仅当它满足下列条件之一时:
SPACE_SEPARATOR
, LINE_SEPARATOR
, or PARAGRAPH_SEPARATOR
) but is not also a non-breaking space ('\u00A0'
, '\u2007'
, '\u202F'
). '\t'
, U+0009 HORIZONTAL TABULATION. '\n'
, U+000A LINE FEED. '\u000B'
, U+000B VERTICAL TABULATION. '\f'
, U+000C FORM FEED. '\r'
, U+000D CARRIAGE RETURN. '\u001C'
, U+001C FILE SEPARATOR. '\u001D'
, U+001D GROUP SEPARATOR. '\u001E'
, U+001E RECORD SEPARATOR. '\u001F'
, U+001F UNIT SEPARATOR. Parameters | |
---|---|
codePoint |
int : the character (Unicode code point) to be tested. |
Returns | |
---|---|
boolean |
true if the character is a Java whitespace character; false otherwise. |
也可以看看:
boolean isWhitespace (char ch)
根据Java确定指定的字符是否为空白。 一个字符是一个Java空白字符,当且仅当它满足下列条件之一时:
SPACE_SEPARATOR
, LINE_SEPARATOR
, or PARAGRAPH_SEPARATOR
) but is not also a non-breaking space ('\u00A0'
, '\u2007'
, '\u202F'
). '\t'
, U+0009 HORIZONTAL TABULATION. '\n'
, U+000A LINE FEED. '\u000B'
, U+000B VERTICAL TABULATION. '\f'
, U+000C FORM FEED. '\r'
, U+000D CARRIAGE RETURN. '\u001C'
, U+001C FILE SEPARATOR. '\u001D'
, U+001D GROUP SEPARATOR. '\u001E'
, U+001E RECORD SEPARATOR. '\u001F'
, U+001F UNIT SEPARATOR. 注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符(包括补充字符),请使用isWhitespace(int)
方法。
Parameters | |
---|---|
ch |
char : the character to be tested. |
Returns | |
---|---|
boolean |
true if the character is a Java whitespace character; false otherwise. |
也可以看看:
char lowSurrogate (int codePoint)
返回尾随替代(一个low surrogate code unit所述的) surrogate pair表示在UTF-16编码指定的补充的字符(Unicode代码点)。 如果指定的字符不是supplementary character ,则返回未指定的char
。
如果 isSupplementaryCodePoint(x)
是 true
,那么 isLowSurrogate
(lowSurrogate(x))
和 toCodePoint
(
highSurrogate
(x), lowSurrogate(x)) == x
也总是 true
。
Parameters | |
---|---|
codePoint |
int : a supplementary character (Unicode code point) |
Returns | |
---|---|
char |
the trailing surrogate code unit used to represent the character in the UTF-16 encoding |
int offsetByCodePoints (CharSequence seq, int index, int codePointOffset)
返回给定字符序列内的索引,该索引与给定的codePointOffset
码位的偏移量index
codePointOffset
。 由index
和codePointOffset
给出的文本范围内的未配对代理每个计为一个代码点。
Parameters | |
---|---|
seq |
CharSequence : the char sequence |
index |
int : the index to be offset |
codePointOffset |
int : the offset in code points |
Returns | |
---|---|
int |
the index within the char sequence |
Throws | |
---|---|
NullPointerException |
if seq is null. |
IndexOutOfBoundsException |
if index is negative or larger then the length of the char sequence, or if codePointOffset is positive and the subsequence starting with index has fewer than codePointOffset code points, or if codePointOffset is negative and the subsequence before index has fewer than the absolute value of codePointOffset code points. |
int offsetByCodePoints (char[] a, int start, int count, int index, int codePointOffset)
返回给定的char
子char
中的索引,该子index
与给定的codePointOffset
码位index
codePointOffset
。 start
和count
参数指定了char
阵列的子阵列。 由index
和codePointOffset
给出的文本范围内的不成对的代理每个计为一个代码点。
Parameters | |
---|---|
a |
char : the char array |
start |
int : the index of the first char of the subarray |
count |
int : the length of the subarray in char s |
index |
int : the index to be offset |
codePointOffset |
int : the offset in code points |
Returns | |
---|---|
int |
the index within the subarray |
Throws | |
---|---|
NullPointerException |
if a is null. |
IndexOutOfBoundsException |
if start or count is negative, or if start + count is larger than the length of the given array, or if index is less than start or larger then start + count , or if codePointOffset is positive and the text range starting with index and ending with start + count - 1 has fewer than codePointOffset code points, or if codePointOffset is negative and the text range starting with start and ending with index - 1 has fewer than the absolute value of codePointOffset code points. |
char reverseBytes (char ch)
返回通过颠倒指定的 char值中的字节顺序而获得的值。
Parameters | |
---|---|
ch |
char
|
Returns | |
---|---|
char |
the value obtained by reversing (or, equivalently, swapping) the bytes in the specified char value. |
int toChars (int codePoint, char[] dst, int dstIndex)
将指定的字符(Unicode代码点)转换为其UTF-16表示形式。 如果指定的代码点是BMP(基本多语言平面或平面0)值,则相同的值存储在dst[dstIndex]
,并返回1。 如果指定的代码点是补充字符,则其替代值将存储在dst[dstIndex]
(高代理)和dst[dstIndex+1]
(低代理)中,并返回2。
Parameters | |
---|---|
codePoint |
int : the character (Unicode code point) to be converted. |
dst |
char : an array of char in which the codePoint 's UTF-16 value is stored. |
dstIndex |
int : the start index into the dst array where the converted value is stored. |
Returns | |
---|---|
int |
1 if the code point is a BMP code point, 2 if the code point is a supplementary code point. |
Throws | |
---|---|
IllegalArgumentException |
if the specified codePoint is not a valid Unicode code point. |
NullPointerException |
if the specified dst is null. |
IndexOutOfBoundsException |
if dstIndex is negative or not less than dst.length , or if dst at dstIndex doesn't have enough array element(s) to store the resulting char value(s). (If dstIndex is equal to dst.length-1 and the specified codePoint is a supplementary character, the high-surrogate value is not stored in dst[dstIndex] .) |
char[] toChars (int codePoint)
将指定的字符(Unicode代码点)转换为存储在char
数组中的UTF-16表示形式。 如果指定的代码点是BMP(基本多语言平面或平面0)值,则生成的char
阵列与codePoint
值相同。 如果指定的代码点是补充代码点,则生成的char
阵列具有相应的代理对。
Parameters | |
---|---|
codePoint |
int : a Unicode code point |
Returns | |
---|---|
char[] |
a char array having codePoint 's UTF-16 representation. |
Throws | |
---|---|
IllegalArgumentException |
if the specified codePoint is not a valid Unicode code point. |
int toCodePoint (char high, char low)
将指定的代理对转换为其辅助代码点值。 此方法不验证指定的代理对。 如有必要,来电者必须使用isSurrogatePair
进行验证。
Parameters | |
---|---|
high |
char : the high-surrogate code unit |
low |
char : the low-surrogate code unit |
Returns | |
---|---|
int |
the supplementary code point composed from the specified surrogate pair. |
int toLowerCase (int codePoint)
使用UnicodeData文件中的大小写映射信息将字符(Unicode代码点)参数转换为小写字母。
请注意, Character.isLowerCase(Character.toLowerCase(codePoint))
并不总是为某些范围的字符返回 true
,特别是那些符号或表意文字。
一般来说,应该使用toLowerCase()
将字符映射为小写字母。 String
情况下映射方法经历了好几个好处Character
情况下映射方法。 String
大小写映射方法可以执行区域敏感映射,上下文敏感映射和1:M字符映射,而Character
大小写映射方法不能。
Parameters | |
---|---|
codePoint |
int : the character (Unicode code point) to be converted. |
Returns | |
---|---|
int |
the lowercase equivalent of the character (Unicode code point), if any; otherwise, the character itself. |
也可以看看:
char toLowerCase (char ch)
使用UnicodeData文件中的大小写映射信息将字符参数转换为小写字母。
请注意, Character.isLowerCase(Character.toLowerCase(ch))
并不总是为某些字符范围返回 true
,特别是那些符号或表意文字。
通常,应使用toLowerCase()
将字符映射为小写字母。 String
情况下映射方法经历了好几个好处Character
情况下映射方法。 String
大小写映射方法可以执行区域敏感映射,上下文敏感映射和1:M字符映射,而Character
大小写映射方法不能。
注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符(包括补充字符),请使用toLowerCase(int)
方法。
Parameters | |
---|---|
ch |
char : the character to be converted. |
Returns | |
---|---|
char |
the lowercase equivalent of the character, if any; otherwise, the character itself. |
也可以看看:
String toString ()
返回代表此Character
值的String
对象。 结果是一个长度为1的字符串,其唯一分量是由此Character
对象表示的原语char
值。
Returns | |
---|---|
String |
a string representation of this object. |
String toString (char c)
返回表示指定的char
的String
对象。 结果是一个长度为1的字符串,仅由指定的char
。
Parameters | |
---|---|
c |
char : the char to be converted |
Returns | |
---|---|
String |
the string representation of the specified char |
char toTitleCase (char ch)
使用UnicodeData文件中的大小写映射信息将字符参数转换为titlecase。 如果一个字符没有显式的标题映射,并且它本身不是根据UnicodeData的标题字符,那么大写映射作为等价的标题映射返回。 如果参数char
已经是标题char
,则返回相同的char
值。
请注意,对于某些字符范围, Character.isTitleCase(Character.toTitleCase(ch))
并不总是返回 true
。
注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符(包括补充字符),请使用toTitleCase(int)
方法。
Parameters | |
---|---|
ch |
char : the character to be converted. |
Returns | |
---|---|
char |
the titlecase equivalent of the character, if any; otherwise, the character itself. |
int toTitleCase (int codePoint)
使用UnicodeData文件中的大小写映射信息将字符(Unicode代码点)参数转换为标题。 如果一个字符没有显式的标题映射,并且它本身不是根据UnicodeData的标题字符,那么大写映射作为等价的标题映射返回。 如果字符参数已经是标题字符,则会返回相同的字符值。
请注意,对于某些字符范围, Character.isTitleCase(Character.toTitleCase(codePoint))
并不总是返回 true
。
Parameters | |
---|---|
codePoint |
int : the character (Unicode code point) to be converted. |
Returns | |
---|---|
int |
the titlecase equivalent of the character, if any; otherwise, the character itself. |
char toUpperCase (char ch)
使用UnicodeData文件中的大小写映射信息将字符参数转换为大写。
请注意,对于某些字符范围, Character.isUpperCase(Character.toUpperCase(ch))
并不总是返回 true
,特别是那些符号或表意符号。
通常,应使用toUpperCase()
将字符映射为大写。 String
情况下映射方法经历了好几个好处Character
情况下映射方法。 String
大小写映射方法可以执行区域敏感映射,上下文敏感映射和1:M字符映射,而Character
大小写映射方法不能。
注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符(包括补充字符),请使用toUpperCase(int)
方法。
Parameters | |
---|---|
ch |
char : the character to be converted. |
Returns | |
---|---|
char |
the uppercase equivalent of the character, if any; otherwise, the character itself. |
也可以看看:
int toUpperCase (int codePoint)
使用UnicodeData文件中的大小写映射信息将字符(Unicode代码点)参数转换为大写字母。
请注意,对于某些字符范围, Character.isUpperCase(Character.toUpperCase(codePoint))
并不总是返回 true
,特别是那些符号或表意文字。
一般来说,应该使用toUpperCase()
来将字符映射为大写。 String
情况下映射方法经历了好几个好处Character
情况下映射方法。 String
大小写映射方法可以执行区域敏感映射,上下文敏感映射和1:M字符映射,而Character
大小写映射方法不能。
Parameters | |
---|---|
codePoint |
int : the character (Unicode code point) to be converted. |
Returns | |
---|---|
int |
the uppercase equivalent of the character, if any; otherwise, the character itself. |
也可以看看:
Character valueOf (char c)
返回表示指定的char值的Character实例。 如果不需要新的Character实例,则通常应优先使用此方法,而不是构造函数Character(char)
,因为此方法通过缓存频繁请求的值可能会产生显着更好的空间和时间性能。 此方法将始终缓存'\u0000'
至'\u007F'
(含)范围内的值,并可缓存此范围之外的其他值。
Parameters | |
---|---|
c |
char : a char value. |
Returns | |
---|---|
Character |
a Character instance representing c. |