One Hot 编码是将分类数据转换为等效数值表示的常用方法。Python 中的 pand
as
库提供了实现 One Hot 编码的
函数
。
以下是对数据框中的一个列进行 One Hot 编码的代码示例:
import pandas as pd
# 创建数据框
data = {'gender': ['male', 'female', 'male', 'male', 'female']}
df = pd.DataFrame(data)
# 将 gender 列进行 One Hot 编码
one_hot = pd.get_dummies(df['gender'])
# 将编码结果添加到原始数据框
df = pd.concat([df, one_hot], axis=1)
# 打印结果
print(df)
gender female male
0 male 0 1
1 female 1 0
2 male 0 1
3 male 0 1
4 female 1 0
在上面的示例中,我们通过使用 pandas 库的 get_dummies()
函数,对数据框中的 gender
列进行了 One Hot 编码。编码结果被存储在 one_hot
变量中,并通过 concat()
函数添加到原始数据框中。