1、安装
因为自己电脑安装了anaconda,所以,直接使用conda install。
(E:\Anaconda3) C:\Users\RoFun>conda install pandas
2.简单实现
2.1数据预处理
###数据预处理
import pandas as pd
train=pd.read_json(r'G:\训练小样本3_label.csv',lines=True)
print(train.sample(2))
输出结果:
0
201 93.0
100 97.5
2.2数缺失值
#test tianchi
import pandas as pd
def col_miss(train_df):
col_missing_df = train_df.isnull().sum(axis=0).reset_index()
# print('col_missing_df',col_missing_df)
# print(col_missing_df)
# print('\n')
col_missing_df.columns = ['col','missing_count']
# print('col_missing_df.columns',col_missing_df.columns)
# print('\n')
col_missing_df = col_missing_df.sort_values(by='missing_count')
#print('col_missing_df',col_missing_df)
#print('\n')
return col_missing_df
if __name__ == '__main__':
train_df = pd.read_excel(r'G:\null_test.xlsx')
col_missing_df = col_miss(train_df)
#print('col_missing_df',col_missing_df)
运行结果:
index 0
0 a 0
1 b 1
2 c 2
3 d 1
参考: