python - Pandas - 函数 get_dummies() 中参数 dummy_na 的好

遵循 Pandas 文档:

>>> s1 = ['a', 'b', np.nan]

>>> pd.get_dummies(s1)
   a  b
0  1  0
1  0  1
2  0  0

>>> pd.get_dummies(s1, dummy_na=True)
   a  b  NaN
0  1  0    0
1  0  1    0
2  0  0    1

现在,我不明白为什么有人需要使用 Dummy_na,我也没有在 stackoverflow 上找到任何关于此的评论。

作为从事数据科学工作的人,我想知道以这种方式标记 NaN 值是否有任何好处

最佳答案

正如您在示例中看到的,第三项没有任何值。这也是一个有值(value)的功能。例如,如果每个特征都是患者患有的一种疾病,您可能想知道患者没有任何疾病。

关于python - Pandas - 函数 get_dummies() 中参数 dummy_na 的好处/用例是什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/61337427/

相关文章:

reactjs - 不变失败 : You should not use outside

reactjs - 构建后 Admob 不会在真实设备上展示广告。 Expo React-nativ

dataframe - 在 DataFrame 上描述 vs printSchema 方法

windows - 在 Visual Studio Code 中更改工作区目录

tensorflow - 如何将 Tensorflow model.json 转换为 model.p

azure - 如何在ARM模板中添加多个访问策略

python - tf.print 何时会按预期实际工作(即打印张量和变量的值)?

react-native - 使用 create-react-native-app 创建新项目时出现

php - 从 laravel 中的数据库动态填充语言翻译数组

reactjs - 如何将 firebase 与 React 功能组件同步?