@implementation NSString (Emoji)
+ (BOOL)stringContainsEmoji:(NSString *)string
{
__block BOOL returnValue = NO;
[string enumerateSubstringsInRange:NSMakeRange(0, [string length])
options:NSStringEnumerationByComposedCharacterSequences
usingBlock:^(NSString *substring, NSRange substringRange, NSRange enclosingRange, BOOL *stop) {
const unichar hs = [substring characterAtIndex:0];
if (0xd800 <= hs && hs <= 0xdbff) {
if (substring.length > 1) {
const unichar ls = [substring characterAtIndex:1];
const int uc = ((hs - 0xd800) * 0x400) + (ls - 0xdc00) + 0x10000;
if (0x1d000 <= uc && uc <= 0x1f77f) {
returnValue = YES;
}
}
} else if (substring.length > 1) {
const unichar ls = [substring characterAtIndex:1];
if (ls == 0x20e3) {
returnValue = YES;
}
} else {
if (0x2100 <= hs && hs <= 0x27ff) {
returnValue = YES;
} else if (0x2B05 <= hs && hs <= 0x2b07) {
returnValue = YES;
} else if (0x2934 <= hs && hs <= 0x2935) {
returnValue = YES;
} else if (0x3297 <= hs && hs <= 0x3299) {
returnValue = YES;
} else if (hs == 0xa9 || hs == 0xae || hs == 0x303d || hs == 0x3030 || hs == 0x2b55 || hs == 0x2b1c || hs == 0x2b1b || hs == 0x2b50) {
returnValue = YES;
}
}
}];
return returnValue;
}
为什么不用正则?
用正则原理也是一样,匹配emoji区间范围,可以用正则啊。只是写这篇文章的时候我没想到可以用正则,我对这个也不熟练罢了。
不过由于emoji一直在演进,最终的结果是我选择将 emoji 单独存放并记录数据来源,从根本上对他们进行了区分,不需要判断了。(当然这是针对我自己的业务逻辑)
由于 emoji 是变长的,我觉得还是反过来判断ASCII字符比较容易,如果包含中文就再加上中文的字符区间好了。
老铁你发的这个有bug哦。在真机键盘的 九键拼音中。 你的检测不准、
是的,这个并不能覆盖所有的emoji范围,因为emoji范围本身是演进扩大的,你要根据变化来改这个值的范围,比如说我补充了如下的代码,这几个就不在正文那个范围之内的。
if (self.range(of: "8️⃣") != nil) { return true } else if (self.range(of: "0️⃣") != nil) { return true } else if (self.range(of: "6️⃣") != nil) { return true }