更新:网络上流传的 emoji 代码点不太完整,我按照维基百科的资料重新整理了一下,文中的 Swift 版本代码已更新。
很多时候我们需要判断一个字符、或者说是一句话里是不是包含了emoji,使用 Swift 语言开发 app 也不例外,比如可以使用正则表达式——但很遗憾,似乎不同的语言对于正则表达式的支持区别, \u 这个功能不是到哪都好使的,所以最简单粗暴的办法,我们弄一个字符串,它包含了所有可能会用到的 emoji,然后去检索它:
1 2 3 4 |
var emojis = "???" if let range = emojis.range(of:"xxx") { } |
其实吧,说句良心哈,效率还不错……当然了,这样的结果就是你的列表得时常更新——同时你还得忍受 Xcode 卡得一逼的状态。
使用遍历
所以,网上有一个用 OC 实现的扩展,似乎流传很广:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 |
@implementation NSString (Emoji) + (BOOL)stringContainsEmoji:(NSString *)string { __block BOOL returnValue = NO; [string enumerateSubstringsInRange:NSMakeRange(0, [string length]) options:NSStringEnumerationByComposedCharacterSequences usingBlock:^(NSString *substring, NSRange substringRange, NSRange enclosingRange, BOOL *stop) { const unichar hs = [substring characterAtIndex:0]; if (0xd800 <= hs && hs <= 0xdbff) { if (substring.length > 1) { const unichar ls = [substring characterAtIndex:1]; const int uc = ((hs - 0xd800) * 0x400) + (ls - 0xdc00) + 0x10000; if (0x1d000 <= uc && uc <= 0x1f77f) { returnValue = YES; } } } else if (substring.length > 1) { const unichar ls = [substring characterAtIndex:1]; if (ls == 0x20e3) { returnValue = YES; } } else { if (0x2100 <= hs && hs <= 0x27ff) { returnValue = YES; } else if (0x2B05 <= hs && hs <= 0x2b07) { returnValue = YES; } else if (0x2934 <= hs && hs <= 0x2935) { returnValue = YES; } else if (0x3297 <= hs && hs <= 0x3299) { returnValue = YES; } else if (hs == 0xa9 || hs == 0xae || hs == 0x303d || hs == 0x3030 || hs == 0x2b55 || hs == 0x2b1c || hs == 0x2b1b || hs == 0x2b50) { returnValue = YES; } } }]; return returnValue; } |
其实它的原理还是去匹配 Emoji 所在区间,所以,如果我们应用上 Swift 语句以及其特性,那么 Swift 版本就是这样:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 |
extension String { var containsEmoji: Bool { for scalar in unicodeScalars { switch scalar.value { case 0x00A0...0x00AF, 0x2030...0x204F, 0x2120...0x213F, 0x2190...0x21AF, 0x2310...0x329F, 0x1F000...0x1F9CF: return true default: continue } } return false } } |
?是不是很简洁?
代码来自:Check if Swift string contains an emoji or dingbat charater
本文由 落格博客 原创撰写:落格博客 » Swift 中判断字符串是否有 Emoji 表情
转载请保留出处和原文链接:https://www.logcg.com/archives/2504.html
为什么不用正则?
用正则原理也是一样,匹配emoji区间范围,可以用正则啊。只是写这篇文章的时候我没想到可以用正则,我对这个也不熟练罢了。
不过由于emoji一直在演进,最终的结果是我选择将 emoji 单独存放并记录数据来源,从根本上对他们进行了区分,不需要判断了。(当然这是针对我自己的业务逻辑)
由于 emoji 是变长的,我觉得还是反过来判断ASCII字符比较容易,如果包含中文就再加上中文的字符区间好了。
老铁你发的这个有bug哦。在真机键盘的 九键拼音中。 你的检测不准、
是的,这个并不能覆盖所有的emoji范围,因为emoji范围本身是演进扩大的,你要根据变化来改这个值的范围,比如说我补充了如下的代码,这几个就不在正文那个范围之内的。
if (self.range(of: "8️⃣") != nil) { return true } else if (self.range(of: "0️⃣") != nil) { return true } else if (self.range(of: "6️⃣") != nil) { return true }