首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何计算连续特征的信息增益

如何计算连续特征的信息增益
EN

Stack Overflow用户
提问于 2015-12-11 21:54:20
回答 1查看 842关注 0票数 2

如果我没有任何离散值,因此我首先需要将这些点离散为区间,那么在为信息增益找到正确的参数方面,我有问题。

我拥有的

我在做图像处理,我的特征可能在0-255范围内。使用一些培训数据,我可以定义一些间隔(只定义“是对象或不是对象”)。如果goods是匹配点的间隔数,并且bads被标记为它的环境。我用这种方法计算

本案的信息增益:

[](https://chart.googleapis.com/chart?cht=tx&chl=IG=Entropy%5Cfrac%7Bgoods%7D%7BallIntervalls%7D%7D-ratio(Entropy%5Cfrac%7Bgoods%7D%7BallIntervalls%7D%7D%2BEntropy%5Cfrac%7Bbads%7D%7BallIntervalls%7D%7D%29)

哪里

[](https://chart.googleapis.com/chart?cht=tx&chl=Entropy(p%29=-log(p%29p)

结果与idea

由于某些原因,我最终得到了一个 IG,这是一个安静的废话,但我没有看到错误。另一个想法是,不要计算good的对象匹配间隔,而是在good中计算适合任何良好间隔的样本。

有什么主意吗?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2015-12-12 10:18:24

我看不出像(或P和Q)分布之前和之后那里有什么。

你有改变什么东西从一种情况到另一种情况吗?还不清楚。

看看What is "entropy and information gain"?

good+bad似乎代表了整个发行版。

所以你需要有一些改变,从一个(好的,坏的)到另一个(好的,坏的)。

然后正确地应用公式--或者遵循下面的示例

你的公式好像搞砸了。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/34233168

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档