遵循 Pandas 文档:
>>> s1 = ['a', 'b', np.nan]
>>> pd.get_dummies(s1)
a b
0 1 0
1 0 1
2 0 0
>>> pd.get_dummies(s1, dummy_na=True)
a b NaN
0 1 0 0
1 0 1 0
2 0 0 1
现在,我不明白为什么有人需要使用 Dummy_na,我也没有在 stackoverflow 上找到任何关于此的评论。
作为从事数据科学工作的人,我想知道以这种方式标记 NaN 值是否有任何好处
最佳答案
正如您在示例中看到的,第三项没有任何值。这也是一个有值(value)的功能。例如,如果每个特征都是患者患有的一种疾病,您可能想知道患者没有任何疾病。
关于python - Pandas - 函数 get_dummies() 中参数 dummy_na 的好处/用例是什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/61337427/
相关文章:
reactjs - 不变失败 : You should not use outside
reactjs - 构建后 Admob 不会在真实设备上展示广告。 Expo React-nativ
dataframe - 在 DataFrame 上描述 vs printSchema 方法
windows - 在 Visual Studio Code 中更改工作区目录
tensorflow - 如何将 Tensorflow model.json 转换为 model.p
python - tf.print 何时会按预期实际工作(即打印张量和变量的值)?
react-native - 使用 create-react-native-app 创建新项目时出现