文章/答案/技术大牛

发布

社区首页 >问答首页 >如何计算连续特征的信息增益

问如何计算连续特征的信息增益
EN

Stack Overflow用户

提问于 2015-12-11 21:54:20

回答 1查看 842关注 0票数 2

如果我没有任何离散值，因此我首先需要将这些点离散为区间，那么在为信息增益找到正确的参数方面，我有问题。

我拥有的：

我在做图像处理，我的特征可能在0-255范围内。使用一些培训数据，我可以定义一些间隔(只定义“是对象或不是对象”)。如果goods是匹配点的间隔数，并且bads被标记为它的环境。我用这种方法计算

本案的信息增益：

[](https://chart.googleapis.com/chart?cht=tx&chl=IG=Entropy%5Cfrac%7Bgoods%7D%7BallIntervalls%7D%7D-ratio(Entropy%5Cfrac%7Bgoods%7D%7BallIntervalls%7D%7D%2BEntropy%5Cfrac%7Bbads%7D%7BallIntervalls%7D%7D%29)

哪里

[](https://chart.googleapis.com/chart?cht=tx&chl=Entropy(p%29=-log(p%29p)

结果与idea

由于某些原因，我最终得到了一个负 IG，这是一个安静的废话，但我没有看到错误。另一个想法是，不要计算good的对象匹配间隔，而是在good中计算适合任何良好间隔的样本。

有什么主意吗？

machine-learning

feature-extraction

entropy

information-extraction

image-processing

回答 1

Stack Overflow用户

回答已采纳

发布于 2015-12-12 10:18:24

我看不出像(或P和Q)分布之前和之后那里有什么。

你有改变什么东西从一种情况到另一种情况吗？还不清楚。

看看What is "entropy and information gain"?

good+bad似乎代表了整个发行版。

所以你需要有一些改变，从一个(好的，坏的)到另一个(好的，坏的)。

然后正确地应用公式--或者遵循下面的示例

你的公式好像搞砸了。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/34233168

复制

相似问题

问如何计算连续特征的信息增益
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何计算连续特征的信息增益EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何计算连续特征的信息增益
EN