数据科学中经常出现的标签为文本型的,因为需要转化为数值型,以便后续处理。
1.读取数据
import pandas as pd
data = pd.read_csv('all_data.txt',delimiter='\t')
data.head()

2.对标签列进行替换
data_class={'否':0,'是':1}
data['是否过线']=data['是否过线'].map(data_class)

数据科学中经常出现的标签为文本型的,因为需要转化为数值型,以便后续处理。
import pandas as pd
data = pd.read_csv('all_data.txt',delimiter='\t')
data.head()

data_class={'否':0,'是':1}
data['是否过线']=data['是否过线'].map(data_class)

下一篇 一行代码实现数据标准化