精彩课程推荐

PBI系列 快选池 聚类分析 二维化 13(数据分析)【花随花心】

[复制链接]
查看: 142|回复: 0
发表于 2018-10-1 12:03:33 | 显示全部楼层 |阅读模式

PBI系列 快选池 聚类分析 二维化 13(数据分析)

  • 教师介绍:本次课程涵盖3个核心关键词:快选池、聚类分析、二维化,希望通过这节课程,让大家学会如何用K-means聚类算法进行数据分类,更具针对性。
    商业智能数据分析师,花随花心。

    大家好,我是花老师。今天,这堂课是整个PBI系列的第13课,核心关键词正如本文名字一样,快选池、聚类分析、二维化。当然,这么讲肯定是不好理解的,不过没关系,稍后我会好好给大家分享。
  • 课程讲师
    花随花心
  • 课程时长
  • 客户群
(10.0分)
价格:¥68.00元
课程简介:
还没有看过上12堂课的同学,要记得提前预习,文章名如下:

《PBI系列 车图 色彩搭配 数据分析 01》花随花心著
《PBI系列 竞品评论 流量 词云分析 02》花随花心著
《PBI系列 快选 人气新品池 品质档 03》花随花心著
《PBI系列 天猫国际 搜索 属性分析 04》花随花心著
《PBI系列 京东 词根分析 时段流量 05》花随花心著
《PBI系列 关键词 多维度 市场分析 06》花随花心著
《PBI系列 类目大词 群店 竞争透视 07》花随花心著
《PBI系列 搜索环境 竞店 二维矩阵 08》花随花心著
《PBI系列 店铺分类 地区透视 关系 09》花随花心著
《PBI系列 象限分析 雷达 区间分段 10》花随花心著
《PBI系列 搜索环境 波动性 集中度 11》花随花心著
《PBI系列 权重 相关系数 指标关联 12》花随花心著

那么,接下来,就让我们正式进入主题。

课程表:

  • 课时1 主讲:花随花心
  • 课时2 主讲:花随花心
  • 课时3 主讲:花随花心
  • 课时4 主讲:花随花心
  • 课时5 主讲:花随花心
  • 课时6 主讲:花随花心
老师介绍花随花心花随花心数据自媒体创始人,五年电商数据分析从业经验,擅长选款定价、竞品追踪、市场调研、软件研发、报表制作。




简  介
本次课程涵盖3个核心关键词:快选池、聚类分析、二维化,希望通过这节课程,让大家学会如何用K-means聚类算法进行数据分类,更具针对性。
商业智能数据分析师,花随花心。
  
大家好,我是花老师。今天,这堂课是整个PBI系列的第13课,核心关键词正如本文名字一样,快选池、聚类分析、二维化。当然,这么讲肯定是不好理解的,不过没关系,稍后我会好好给大家分享。
  
还没有看过上12堂课的同学,要记得提前预习,文章名如下:
  
《PBI系列 车图 色彩搭配 数据分析 01》花随花心著
《PBI系列 竞品评论 流量 词云分析 02》花随花心著
《PBI系列 快选 人气新品池 品质档 03》花随花心著
《PBI系列 天猫国际 搜索 属性分析 04》花随花心著
《PBI系列 京东 词根分析 时段流量 05》花随花心著
《PBI系列 关键词 多维度 市场分析 06》花随花心著
《PBI系列 类目大词 群店 竞争透视 07》花随花心著
《PBI系列 搜索环境 竞店 二维矩阵 08》花随花心著
《PBI系列 店铺分类 地区透视 关系 09》花随花心著
《PBI系列 象限分析 雷达 区间分段 10》花随花心著
《PBI系列 搜索环境 波动性 集中度 11》花随花心著
《PBI系列 权重 相关系数 指标关联 12》花随花心著
  
那么,接下来,就让我们正式进入主题。                                                                    
  
正文
  
紧跟着第12堂课,今天的重点部分内容其实还是跟数据挖掘有关,只不过我们借用了Excel的数据挖掘套件。上一堂课学习过视频的同学,如果需要这个套件的话,留言给花老师即可,我刚好有做准备。
  
那么今天我们来看这3个核心关键词。首先是快选池,我相信学过前面课程的同学都应该不陌生,知道快选池是指什么,如果您不清楚,可查看第03堂课,文章目录在上面有所提示。
  

  
这个入口是全网人气新品池,我们今天所获取到的数据都是来源于这里。无论是C店还是B店,统统都有机会进来。这个平台最有价值的数据,就是可以告诉我们自己的新品究竟算是什么品质的,俗称档次,如图所示
  

  
不同档位的产品,,平台的推荐力度不同,并且这里是达人们经常选品的地方,如果能进来这里,实际上也算是多了一层曝光。
  
从营销的角度来讲,实际上让产品尽量得到足够多的曝光才是当务之急的事情。除了达人会主动推荐外,手淘首页也会进行推荐。
  

  
这份数据图表就是今天的案例13。重点部分内容就是这个散点图。我们之前做过很多散点图的同学应该都很清楚,散点图本身不难,但如果想要让散点图里头的数据都能够自动分好类的话,似乎不是那么容易的事情。
  
正如上面这张图所示,我把获取到的快选池新品数据,按不同的关键词进行分类,不同关键词下都可以将数据自动分成5个类别,也就是5种不同的数据。
之所以进行分类,是因为可以更好的区别不同类别的数据特征。因此,为了达到这个效果,我使用了聚类算法当中的K-means算法。不懂算法的同学不要紧,因为微软已经帮我们做好了一个专门来用进行数据挖掘的套件。我们暂且先来看看,究竟这些不同类别的数据都有什么特征。
  

  
数据源当中,我使用了品质档、价格、付款人数、所在地,通过K-means算法进行聚类,最后得到5个不同的类别。这些类别的名字分别从1-5进行取名。
  

  
通过这个关系图,我们可以很明显看得出来,实际上分类1的数据可以直接连接分类2、3、4、5,说明其重要性不言而喻。
  

  
暂且从分类1的角度来看数据,从上面这个图可以看出,分类1的一些特征,比如付款人数在0-299这个范围,价格150.0-361.4这个范围,其他的以此类推,最关键的地方在于这些数据背后的产品,基本上代表的就是第4档位的产品。
  

  
而实际上,这个档次的产品的销量是最好的。那么也就是我们这里的分类1的产品代表的就是最好的。
  

  
从散点图我们可以看出来,实际上这个分类被其他分类给包裹住了,哈哈。如果没有事先进行数据挖掘的话,我们将看到一堆小圈圈在浮动。
  

  
这个是分类特征图,基本上可以快速告诉我们数据的很多信息了。比如,档次上来讲就是集中在4和5,所在地上海就是个热门区域。
  

  
通过我们自己做的PBI图表,也是可以看得出来的,这里可能更加明显。
  

  
这个数据挖掘套件的好处在于,还能告诉我们不同类别的具体特征,比如从付款人数的平均值来看,分类1在117.07,分类2在64.22,分类3在152.17等等。这样子看数据是不是很方便了。
  

  
结合价格区间,我们也可以看出这些产品的价格段分布,基本上在106-375之间。因此,我们的定价这块应该着重考虑这个价格段的。
  

  
因为红酒属于标品,因此大品牌特别多,我们可以看出来官方超市是第一位的,其次是上面这些品牌。
  
最后,说一下这次用到的数据,主要来自于花老师自己研发的数据分析工具箱当中的其中一项功能,如图所示

  
目前为止,这个是第5代版本,一共有15个免费功能,当然随着我后面的不断更新,肯定会加入更多实用功能进来,尽请期待!
  
以上内容,基本上可以让大家了解到这个图表是干嘛用的。当然,其中技术方面的细节,我都会留到(付费)视频、(免费)音频当中进行详细介绍。不过,从这个系列开始,与以往不同的是,我会加入一段漫长的无声操作视频,将自己完整的操作过程记录下来,这样大家就不会说不清楚其中的细节了,由于是无声,因此我在音频当中会减掉这部分内容。
  

  
希望我今天的分享能对大家有所帮助,谢谢!想要获取这堂课的核心技术的同学,如下所示操作即可。




本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

商务合作

客服热线:156-002-02555
点击这里给我发消息

关注微信公众号

Copyright;  ©2015-2018  鼎豪教育    技术支持:鼎豪网络