网页
资讯
视频
图片
知道
文库
贴吧
地图
采购
进入贴吧
全吧搜索
吧内搜索
搜贴
搜人
进吧
搜标签
日
一
二
三
四
五
六
签到排名:今日本吧第
个签到,
本吧因你更精彩,明天继续来努力!
本吧签到人数:0
一键签到
成为超级会员,使用一键签到
一键签到
本月漏签
0
次!
0
成为超级会员,赠送8张补签卡
如何使用?
点击日历上漏签日期,即可进行
补签
。
连续签到:
天 累计签到:
天
0
超级会员单次开通12个月以上,赠送连续签到卡3张
使用连续签到卡
06月26日
漏签
0
天
机器学习吧
关注:
22,246
贴子:
39,895
看贴
图片
吧主推荐
游戏
1
2
3
4
下一页
尾页
86
回复贴,共
4
页
,跳到
页
确定
<<返回机器学习吧
>0< 加载中...
很好的资料.让你们快速学习工作~
只看楼主
收藏
回复
迟三岁
核心吧友
6
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
迟三岁
核心吧友
6
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
不用说了 spark在现在大数据技术里面很火 主要是因为是分布式内存计算引擎,还有sparksql,spark ml 很丰富的api
趋动科技(上海)有限公司
趋动云
机器学习
,基于数据+算法双引擎,快速支撑建模业务,助企业智能化转型,降低建模门槛,提供高计算建模能力!
2024-06-26 10:03
广告
立即查看
迟三岁
核心吧友
6
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
迟三岁
核心吧友
6
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
当然我还有很多视频,包含大数据开发,挖掘,分析,深度学习,可以加我Q:27381248交流学习
迟三岁
核心吧友
6
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
机器学习大纲~
迟三岁
核心吧友
6
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
hbuygva
初级粉丝
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
楼主资料不错,大赞.谢谢了
苏苏欧欧
初级粉丝
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
楼主,怎么能拿到这些视频?
深圳市优智创芯科技
共建·共享·开源!发现资源、发文:人工智能、类脑智能、
机器学习
、算法、互联网、技术…来O站,玩转AGI,欢迎大家加入OpenSNN创作社区!招运营专员、销售等!
2024-06-26 10:03
广告
立即查看
迟三岁
核心吧友
6
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
没啦就是没啦
初级粉丝
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
有偿吗?
迟三岁
核心吧友
6
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
免费分享,很多不错的资料,企鹅27@38@1248
迟三岁
核心吧友
6
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
很不错的总结,希望对你们有用;
以下就是从参加评选的18种候选算法中,最终决选出来的十大经典算法:
一、C4.5
C4.5,是机器学习算法中的一个分类决策树算法,
它是决策树(决策树也就是做决策的节点间的组织方式像一棵树,其实是一个倒树)核心算法
ID3的改进算法,所以基本上了解了一半决策树构造方法就能构造它。
决策树构造方法其实就是每次选择一个好的特征以及分裂点作为当前节点的分类条件。
C4.5相比于ID3改进的地方有:
1、用信息增益率来选择属性。
ID3选择属性用的是子树的信息增益,这里可以用很多方法来定义信息,ID3使用的是熵(entropy,熵是一种不纯度度量准则),
也就是熵的变化值.
而C4.5用的是信息增益率。对,区别就在于一个是信息增益,一个是信息增益率。
一般来说率就是用来取平衡用的,就像方差起的作用差不多,
比如有两个跑步的人,一个起点是10m/s的人、其10s后为20m/s;
另一个人起速是1m/s、其1s后为2m/s。
如果紧紧算差值那么两个差距就很大了,如果使用速度增加率(加速度,即都是为1m/s^2)来衡量,2个人就是一样的加速度。
因此,C4.5克服了ID3用信息增益选择属性时偏向选择取值多的属性的不足。
2、在树构造过程中进行剪枝,在构造决策树的时候,那些挂着几个元素的节点,不考虑最好,不然容易导致overfitting。
3、对非离散数据也能处理。
4、能够对不完整数据进行处理。
二、The k-means algorithm 即K-Means算法
k-means algorithm算法是一个聚类算法,把n的对象根据他们的属性分为k个分割(k < n)。
它与处理混合正态分布的最大期望算法(本十大算法第五条)很相似,因为他们都试图找到数据中自然聚类的中心。
它假设对象属性来自于空间向量,并且目标是使各个群组内部的均方误差总和最小。
三、 Support vector machines
支持向量机,英文为Support Vector Machine,简称SV机(论文中一般简称SVM)。
它是一种监督式学习的方法,它广泛的应用于统计分类以及回归分析中。
支持向量机将向量映射到一个更高维的空间里,在这个空间里建立有一个最大间隔超平面。
在分开数据的超平面的两边建有两个互相平行的超平面,分隔超平面使两个平行超平面的距离最大化。
假定平行超平面间的距离或差距越大,分类器的总误差越小。
一个极好的指南是C.J.C Burges的《模式识别支持向量机指南》。
van der Walt 和 Barnard 将支持向量机和其他分类器进行了比较。
四、The Apriori algorithm
Apriori算法是一种最有影响的挖掘布尔关联规则频繁项集的算法。
其核心是基于两阶段频集思想的递推算法。
该关联规则在分类上属于单维、单层、布尔关联规则。
在这里,所有支持度大于最小支持度的项集称为频繁项集,简称频集。
五、最大期望(EM)算法
在统计计算中,最大期望 (EM,Expectation–Maximization)算法是在概率
(probabilistic)模型中寻找参数最大似然估计的算法,其中概率模型依赖于无法观测的隐藏变量(Latent Variabl)。
最大期望经常用在机器学习和计算机视觉的数据集聚(Data Clustering)领域。
古音希声
初级粉丝
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
楼主可否发我一份啊
云输入端
初级粉丝
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
求资料,谢谢楼主
上海声振前沿机电科技
打破噪声壁垒,
机器学习
技术助您远离噪音困扰。十年技术沉淀,
机器学习
为您打造宁静世界!
2024-06-26 10:03
广告
立即查看
free夜孤寒
中级粉丝
2
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
求资料,谢楼主740146159@qq.com
登录百度账号
扫二维码下载贴吧客户端
下载贴吧APP
看高清直播、视频!
贴吧页面意见反馈
违规贴吧举报反馈通道
贴吧违规信息处理公示