数据科学中经常出现的标签为文本型的,因为需要转化为数值型,以便后续处理。
1.读取数据
import pandas as pd
data = pd.read_csv('all_data.txt',delimiter='\t')
data.head()
2.对标签列进行替换
data_class={'否':0,'是':1}
data['是否过线']=data['是否过线'].map(data_class)
数据科学中经常出现的标签为文本型的,因为需要转化为数值型,以便后续处理。
import pandas as pd
data = pd.read_csv('all_data.txt',delimiter='\t')
data.head()
data_class={'否':0,'是':1}
data['是否过线']=data['是否过线'].map(data_class)
下一篇 一行代码实现数据标准化