Swift中的字符串和字符比较不区分语言环境是什么意思?

我开始学习Swift语言,我很好奇,这意味着

Swift中的字符串和字符比较不区分语言环境?这是否

意味着所有字符都像UTF-8字符一样存储在Swift中?

回答:

(现在已为Swift 3更新所有代码示例。)

夫特串与比较<确实基于逐一比较所谓“Unicode范式

d”(其可以与被计算decomposedStringWithCanonicalMapping)

例如,分解

"ä" = U+00E4 = LATIN SMALL LETTER A WITH DIAERESIS

是两个Unicode代码点的序列

U+0061,U+0308 = LATIN SMALL LETTER A + COMBINING DIAERESIS

出于演示目的,我编写了一个小的String扩展名,该扩展名将String 的内容转储为Unicode代码点的数组:

extension String {

var unicodeData : String {

return self.unicodeScalars.map {

String(format: "%04X", $0.value)

}.joined(separator: ",")

}

}

现在,让我们取一些字符串,用<以下命令对其进行排序:

let someStrings = ["ǟψ", "äψ", "ǟx", "äx"].sorted()

print(someStrings)

// ["a", "ã", "ă", "ä", "ǟ", "b"]

并将每个字符串(原始和分解

形式)的Unicode代码点转储到排序数组中:

for str in someStrings {

print("\(str) \(str.unicodeData) \(str.decomposedStringWithCanonicalMapping.unicodeData)")

}

The output

äx  00E4,0078  0061,0308,0078

ǟx 01DF,0078 0061,0308,0304,0078

ǟψ 01DF,03C8 0061,0308,0304,03C8

äψ 00E4,03C8 0061,0308,03C8

很好地显示了该比较是通过分解形式的Unicode代码点的字典顺序进行的。

如以下

示例所示,对于多个字符的字符串也是如此。用

let someStrings = ["ǟψ", "äψ", "ǟx", "äx"].sorted()

以上循环的输出是

äx  00E4,0078  0061,0308,0078

ǟx 01DF,0078 0061,0308,0304,0078

ǟψ 01DF,03C8 0061,0308,0304,03C8

äψ 00E4,03C8 0061,0308,03C8

意思就是

"äx" < "ǟx", but "äψ" > "ǟψ"

(这至少对我来说是出乎意料的)。

最后,让我们将其与语言环境敏感的顺序进行比较,例如

瑞典语:

let locale = Locale(identifier: "sv") // svenska

var someStrings = ["ǟ", "ä", "ã", "a", "ă", "b"]

someStrings.sort {

$0.compare($1, locale: locale) == .orderedAscending

}

print(someStrings)

// ["a", "ă", "ã", "b", "ä", "ǟ"]

As you see, the result is different from the Swift < sorting.

以上是 Swift中的字符串和字符比较不区分语言环境是什么意思? 的全部内容, 来源链接: utcz.com/qa/401539.html

回到顶部