假设我有一个数据集,其特征值是连续的,并且有两个以上的可能标签(例如: rain、sunny、windy等),我应该在sklearn中实现哪个朴素贝叶斯模型?
我在考虑高斯或多项式。然而,多项式适用于离散特征,我尝试了高斯,但事实证明,预测的准确性就像随机选择。
谢谢你的帮助,一格
发布于 2021-04-27 05:41:07
朴素贝叶斯分类(NBC)使用离散值。这意味着你必须离散化所有连续的特征。有关更多详细信息,请访问this could help
无论如何,多项式是正确的,因为您有多个标签。但你也应该记住,你必须对你的标签(OneHotEncoder in sklearn)进行一次热编码。
https://stackoverflow.com/questions/67269495
复制相似问题