情景分析
(1) 零在中文数字串中起补位作用,处理的时候可以忽略掉
(2) 一十通常直接缩减为十,意味着十前获取不到数字时为一十
(3) 单位千、百、十前的数为单个数字
(4) 单位万前的数可以由(3)复合而成
(5) 单位亿前的数可以由(3)、(4)及亿本身复合而成
代码实现
digit = {'一': 1, '二': 2, '三': 3, '四': 4, '五': 5, '六': 6, '七': 7, '八': 8, '九': 9}
def _trans(s):
num = 0
if s:
idx_q, idx_b, idx_s = s.find('千'), s.find('百'), s.find('十')
if idx_q != -1:
num += digit[s[idx_q - 1:idx_q]] * 1000
if idx_b != -1:
num += digit[s[idx_b - 1:idx_b]] * 100
if idx_s != -1:
# 十前忽略一的处理
num += digit.get(s[idx_s - 1:idx_s], 1) * 10
if s[-1] in digit:
num += digit[s[-1]]
return num
def trans(chn):
chn = chn.replace('零', '')
idx_y, idx_w = chn.rfind('亿'), chn.rfind('万')
if idx_w < idx_y:
idx_w = -1
num_y, num_w = 100000000, 10000
if idx_y != -1 and idx_w != -1:
return trans(chn[:idx_y]) * num_y + _trans(chn[idx_y + 1:idx_w]) * num_w + _trans(chn[idx_w + 1:])
elif idx_y != -1:
return trans(chn[:idx_y]) * num_y + _trans(chn[idx_y + 1:])
elif idx_w != -1:
return _trans(chn[:idx_w]) * num_w + _trans(chn[idx_w + 1:])
return _trans(chn)
测试例子
print(trans('十') == 10)
print(trans('一百零一') == 101)
print(trans('九百二十一') == 921)
print(trans('五十六万零一十') == 560010)
print(trans('一万亿零二千一百零一') == 1000000002101)
print(trans('一万亿二千一百万零一百零一') == 1000021000101)
print(trans('一万零二百三十亿四千零七千八百九十') == 1023000007890)