博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
机器学习基础6--集群模型和算法
阅读量:5278 次
发布时间:2019-06-14

本文共 700 字,大约阅读时间需要 2 分钟。

案例:

  现在手上有许多的文档,需要将其按照类型(体育,财经,科技等)进行分类,也就是对文章进行分组或聚类.

分析:

  如果手上有已经标记过类型的数据,可以将其作为训练集进行学习.

  那么这是否是一个多元分类问题?

其实是监督学习问题

现在我们有一堆无标签的文档,打算推断出相关文章的分组向量.

  Input:文档向量

  Output:集群标签

这是一个无监督学习任务.

 

怎样去定义一个集群:

  集群用中心和形状来定义.

 

以形状来判断,上方1号点明显应属于椭圆形集群.而若是以距离来看,2号点明显属于圆形集群.

聚类算法:k-means

  k均值算法(k-means):固定k个集群,看每个集群的平均值.只考虑集群中心,以此来将数据点分不到不通的集群中.

步骤:

1.初始化集群中心

 

2.把所有数据点分给离它最近的集群中心.(沃罗诺伊镶嵌算法)

3.将聚类中心修改为指定的观测值的平均值.

4.重复前面的步骤,直到结果收敛.

 


其他的例子:

  1.图像分类

  2.疾病分类

  3.商品分类

  4.网页搜索优化

  5.房价预测

  6.预测犯罪率

end


课程:机器学习基础:案例研究(华盛顿大学)

视频链接: https://www.coursera.org/learn/ml-foundations/lecture/EPR3S/clustering-documents-task-overview

week4 Clustering models and algorithms

 

转载于:https://www.cnblogs.com/redheat/p/9287970.html

你可能感兴趣的文章
TYVJ.1864.[Poetize I]守卫者的挑战(概率DP)
查看>>
0925 韩顺平java视频
查看>>
iOS-程序启动原理和UIApplication
查看>>
mysql 8.0 zip包安装
查看>>
awk 统计
查看>>
模板设计模式的应用
查看>>
实训第五天
查看>>
平台维护流程
查看>>
2012暑期川西旅游之总结
查看>>
12010 解密QQ号(队列)
查看>>
2014年辛星完全解读Javascript第一节
查看>>
装配SpringBean(一)--依赖注入
查看>>
java选择文件时提供图像缩略图[转]
查看>>
方维分享系统二次开发, 给评论、主题、回复、活动 加审核的功能
查看>>
Matlab parfor-loop并行运算
查看>>
string与stringbuilder的区别
查看>>
2012-01-12 16:01 hibernate注解以及简单实例
查看>>
iOS8统一的系统提示控件——UIAlertController
查看>>
PAT甲级——1101 Quick Sort (快速排序)
查看>>
python创建进程的两种方式
查看>>