使用Python统计字符数量:中文,英文,根据Unicode编码即可
- 共 3,361 次检阅

Unicode 字符编码表|汉字Unicode编码的区间为:0x4E00→0x9FA5(转)

我这里统计英文的字符数量使用的是(可能不对):

 

def get_number(char):
    count = 0
    for item in char:
        if 48 <= ord(item) <= 122:
            count += 1
    return count

 

统计中文字符应该是:

def get_number(char):
    count = 0
    for item in char:
        if 0x4E00 <= ord(item) <= 0x9FA5:
            count += 1
    return count

 

 

分享到:

这篇文章还没有评论

发表评论