Tinghua Data Mining 8

聚类 Clustering

1103990-20181206174804002-5392546.png

1103990-20181206174840661-153238936.png

1103990-20181206174957279-1685966124.png

1103990-20181206175136389-2056571040.png

根据评论信息做一些聚类,挖掘关系。

1103990-20181206175621167-1829207948.png

1103990-20181206175755773-485166956.png

1103990-20181206175921499-1085771630.png

1103990-20181206195749643-593738059.png

1103990-20181206195803335-1664194895.png

1103990-20181206200243001-2095782724.png

bug

期望最大法

1103990-20181206200618221-54538025.png

peek高峰的个数与高斯函数的个数不一定相同

1103990-20181206200848767-1708146128.png

1103990-20181206201109116-1212812877.png

Z隐含参数 不需要求 每个点属于哪个簇 类似于辅助线 跳板 借力 模型参数是要求的 theta是两个聚类的中心点

1103990-20181206201316033-149930831.png

1103990-20181206201634205-1288573751.png

1103990-20181206201833030-779333066.png

1103990-20181206202213236-1376093201.png

密度与层次

1103990-20181206202736012-991425158.png

1103990-20181206202841804-1604770677.png

1103990-20181206203004492-706664308.png

1103990-20181206203157936-702485356.png

剔除噪点

1103990-20181206203343064-540976093.png

从底往上

1103990-20181206203557045-143981077.png

1103990-20181206203715772-82184245.png

1103990-20181206203909487-176748826.png

1103990-20181206204113119-1015321017.png

1103990-20181206204125197-511466315.png

1103990-20181206204500993-696580142.png

1103990-20181206204617535-2137381776.png

转载于:https://www.cnblogs.com/ioveNature/p/10078818.html