商圈选址 旅游洞察 数据科学家为你揭开大数据的神秘面纱

发布时间:2019-04-29 13:42 本文来源于 未知 | 评论( 我要投搞
说起大数据,估计大家都觉得很熟悉,但是具体是怎么定义,怎样应用,却没有很清晰的概念。在我们的印象中,很多公司都叫大数据公司,业务形态则有几百种。大数据到底是什么?在各行各业中如何应用? 维克托迈尔-舍恩伯格及肯尼斯库克耶编写的《大数据时代》

 说起大数据,估计大家都觉得很熟悉,但是具体是怎么定义,怎样应用,却没有很清晰的概念。在我们的印象中,很多公司都叫大数据公司,业务形态则有几百种。大数据到底是什么?在各行各业中如何应用?

维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大数据时代》提到了大数据的4个特征:

一个是数量大——只有数据体量达到了PB级别以上,才能被称为大数据。

一个是价值大——你如果有1PB以上的全国所有20-35年轻人的上网数据的时候,那么它自然就有了商业价值,比如通过分析这些数据,我们就知道这些人的爱好,进而指导产品的发展方向等等。

一个是速度快——通过算法对数据的逻辑处理速度非常快,可从各种类型的数据中快速获得高价值的信息,这一点也是和传统的数据挖掘技术有着本质的不同。

一个是多样性——如果只有单一的个人数据,或者单一的用户提交数据,这些数据还不能称为大数据。比如特定时段上网用户年龄,学历,爱好,性格等等每个人的特征汇总,即可呈现了大数据的多样性,如果扩展到全国,那么数据的多样性会更强。

通过大数据的分析,可以在各个行业得到多样化的应用:

梅西百货根据需求和库存的情况,基于SAS系统对多达7300万种货品进行实时调价。

麻省理工学院利用手机定位数据和交通数据建立城市规划。

Google流感趋势(Google Flu Trends)利用搜索关键词预测禽流感的散布。

广告公司根据客户的购买习惯,为其推送他可能感兴趣的优惠信息。

那么大数据和传统数据处理的方式有什么区别呢,以一家普通咖啡店为例:

在采用传统做法对用户进行分析时,多采用老客新客、男客女客等维度进行分析;而通过大数据,则可以运用机器学习和组内平方误差和WSS来找到最佳的分类方式,根据这家店铺的数据进行处理分析后得到,最佳的聚类数目为4类。(从4类客户扩展到5类及5类后客户,曲线斜度已变小,失去客户拓展价值。)

而根据RFM聚类(识别客户价值,应用最广泛的客户细分模型是通过三个指标:最近消费时间间隔Recency、消费频率Frequency、消费金额Monetary进行聚类。)和K-means算法聚类(采用欧式距离作为相似性的评价指标,即认为两个对象的距离越近,其相似度就越大。该算法认为簇是由距离靠近的对象组成的,因此把得到紧凑且独立的簇作为最终目标。)分析,则直观地显示出四类客户的价值区块,帮助店铺进行客户价值区分。(蓝色区域为最具有价值的客户。)

1556508290022015712.jpg

在进行促销时,传统做法往往根据销量,对销量较好的产品进行折扣促销,以便吸引更多客户,提升营业额,比如单独对拿铁单品进行促销。而根据大数据基于Apriori算法的商品关联规则挖掘,可得到,这家店铺如果以澳洲小白咖啡和原味千层蛋糕组合进行促销,可以得到最佳销售效果。

1556508328493094381.jpg

通过以上事例,可以充分显示出大数据分析的价值和在现实中应用的效果。

以上是由11FL公众号(微信搜索11FL或在文章结尾扫码即可关注)的数据科学家们应用大数据分析的真实应用案例。他们运用大数据技术对数据进行分析处理,形成各类商业、政企及民生的数据分析报告,涉及各行业多角度、多维度、多层面的数据分析。

1556508350640079575.jpg

目前已应用的展示及报告有:

旅游洞察分析

星巴克门店效应分析

新东方客群分析

上海咖啡文化

上海市民周末好去处

中国电影大数据

上海河道治理数据

上海购物大数据

上海非物质遗产大数据

全球主要商圈对比

火车站人流大数据

产业地图——新能源汽车

陆家嘴商圈客群和上班人群分析

麦当劳业务分析报告

社区舆情数据分析

联合利华高端冰淇淋选址

雪碧淘宝造物节画像报告

百威六大人群画像分析

大数据与文化

上海公寓房&人才公寓报告

……

不管在金融、交通、文化、营销或是其他方向,数据科学家团队都有极其精准的洞察与解析,尤其在商业选址和旅游交通等方向,已有多个成功应用。其能力包括数据挖掘与整合,数据分析与处理,数据洞察与应用,数据展示与发布。

欢迎关注11FL公众号,与数据科学家进行大数据应用探讨。

1556508379092019037.jpg

  • 责任编辑:中国商业电讯
    分享到: