在网络爬虫或者读取文件中的数据时,很多时候读取出来的数值是字符串形式的,这些字符串形式的数据并不能用来作计算或者更深入的操作,因此我们需要把他们转换为数值的形式。
简单粗暴的 for 循环
假设,这里有一个以字符串形式存储数值的列表,具体如下:
a = ['2', '3.5', '10', '88', '32.66']
我们需要将其转换为浮点的形式,最简单粗暴直接的方法,可以使用 for 循环
来处理,方法如下:
a_float = []
for num in a:
a_float.append(float(num))
a_float
>> [2.0, 3.5, 10.0, 88.0, 32.66]
我们通过 for 循环
, 把列表中的每一个数值都用 float()
函数将其转换成浮点的形式,然后再将转换后的值添加到一个新列表中,最终我们即可得到一个浮点值得列表。
更优雅的 map() 方法
如果我们每次都需要写一个 for 循环
,这样一来显得不优雅,二来代码看起来也很冗长。我们也可以使用 map()
方法来处理。具体代码如下:
a_float_m = map(float, a)
a_float_m
>> <map at 0x109854da0>
a_float_m = list(a_float_m)
[2.0, 3.5, 10.0, 88.0, 32.66]
和刚才的 for 循环
对比,我们使用 map()
方法,只需要一行代码就可以完成。这里有一点需要注意,在 Python2 中,map()
返回的是列表,而在 Python3 中,返回的是迭代器。因此,我们这里如果想得到一个列表,我们还需要使用以下 list()
。
意外的处理
很多时候,我们的原始数据未必是那么完美,假如我们原始的列表中,有一些不能转换的数据,那情况将如何?接下来,我们对 a
列表进行一些改造。
a.append('a')
a
>> ['2', '3.5', '10', '88', '32.66', 'a']
接下来,我们还是对 a
使用 map()
方法:
a_float_new = list(map(float, a))
>> ValueError: could not convert string to float: 'a'
这时,我们的程序就报错了,因为字符串不能转成浮点数值。如果我们还希望继续完成这个转换,我们就需要对改造一下处理的函数,具体代码如下:
def safe_float(number):
try:
return float(number)
except:
return None
a_float_new = list(map(safe_float, a))
a_float_new
>> [2.0, 3.5, 10.0, 88.0, 32.66, None]
我们先约定好,将不能转换的值保存为 None
,然后编写了一个 safe_float()
的方法进行处理,随后再将这个函数传到 map()
中,这样,最后我们就能得到处理完成后的列表了。