无法在这个位置找到: head2.htm
当前位置: 建站首页 > 新闻动态 > 行业新闻 >

信息内容增益比和信息内容增益

时间:2021-04-07 08:21来源:未知 作者:jianzhan 点击:
信息内容增益熵:H(X)=−∑i=1kpilog⁡piH(X) = -\sum_{i=1}^k p_i\log p_iH(X)=−∑i=1k​pi​logpi​标准熵:H(X∣Y)=−∑j=1np(yj)H(X∣yj)=−∑j=1np(yj)∑i=1kp(xi∣yj)log⁡p(xi∣yj)H(X|Y) =-\sum_{j=1}^n p(y_j)H(X|y_j
信息内容增益

熵:H(X)=−∑i=1kpilog⁡piH(X) = -\sum_{i=1}^k p_i\log p_iH(X)=−∑i=1k​pi​logpi​

标准熵:H(X∣Y)=−∑j=1np(yj)H(X∣yj)=−∑j=1np(yj)∑i=1kp(xi∣yj)log⁡p(xi∣yj)H(X|Y) =-\sum_{j=1}^n p(y_j)H(X|y_j) =-\sum_{j=1}^n p(y_j) \sum_{i=1}^k p(x_i|y_j)\log p(x_i|y_j)H(X∣Y)=−∑j=1n​p(yj​)H(X∣yj​)=−∑j=1n​p(yj​)∑i=1k​p(xi​∣yj​)logp(xi​∣yj​)

信息内容增益: g(D,A)=H(D)−H(D∣A)g(D,A) = H(D) - H(D|A)g(D,A)=H(D)−H(D∣A)

信息内容增益意味着运用特点A多数据集D归类后错乱水平减少了是多少。信息内容增益越大,归类性越强。

可是,信息内容增益通常会偏重于挑选出赋值较多的特点,但这种特点有将会是不经意义的特点,比如客户ID、学籍号、时间等。假如挑选赋值较多的特点,会使管理决策树支系过量。

信息内容增益比

gR(D,A)=g(D,A)HA(D)g_R(D,A) = \frac{g(D,A)}{H_A(D)}gR​(D,A)=HA​(D)g(D,A)​

HA(D)=−∑i=1npilog⁡piH_A(D) =- \sum_{i=1}^np_i\log p_iHA​(D)=−∑i=1n​pi​logpi​,在其中pi=P(A特点赋值为ai)p_i = P(\text{A特点赋值为}a_i)pi​=P(A特点赋值为ai​)

HA(D)H_A(D)HA​(D)归属于对信息内容增益的处罚主要参数,特点A赋值越大处罚主要参数越大,赋值越低处罚主要参数越小;进而摆脱信息内容增益偏重于选择赋值较多的特点的难题。


熊掌号经营者信息内容能够改动吗?

来讲说熊掌号经营的一些疑惑吧,自然也是一些基本但又感觉还很重要的难题:熊掌号经营者信息内容能否改动?经营者辞职后公司的担心熊掌号

ContextLoaderListener全自动安装配备信息内容

Spring配备全过程时要考虑到2个监视器:ContextLoaderListener与RequestContextListener。 ContextLoaderListener extends ContextLoa

python网络爬虫 获得小米手机运用店铺app信息内容

然后上一一篇文章,此次抓取小米手机app的数据信息。关键是抓取运用和手机游戏这两大类的app数据信息import requests from lxml import etree import re

sql server 统计分析表信息内容

//查寻全部说明 select name from sysobjects where xtype='u' select * from sys.tables

每一个人都必须掌握相关软性广告宣传营销推广的大量信息内容

(责任编辑:admin)
织梦二维码生成器
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
无法在这个位置找到: ajaxfeedback.htm
栏目列表
推荐内容


扫描二维码分享到微信