我们认为“自助式数据分析”会是后续数据分析的一个发展方向。目前,诸葛io也是在朝着这个方向转换和发展。 在做诸葛io之前,我们最开始实际上也在给企业做一些DMP的产品和项目,当时也是从第三方数据切入的。比如:最早我们通过微博的数据给企业CRM里面的用户进行画像的丰富或者是通过其他社交网络上的数据补全用户的一些行为特征或者是消费模式。后来做诸葛io是因为我们认为企业内的第一方数据的价值是远远高于第三方数据的,所以我们先要帮助企业解决第一个问题,即通过内部数据驱动业务,挖掘数据价值。 一、自助式数据分析的兴起:BI发展的3个十年 自助式数据分析是最近几年兴起的一个概念。传统的数据分析需要传统的IT、数据部门去支持,最后通过数据分析师来帮忙实现。这个过程中间的依赖性比较强。所谓自助式数据分析主要是指业务人员能够自主、敏捷的通过一些数据分析工具满足自己分析的需求。在这一过程中,业务人员基本上不需要IT部门的支持,比如:二次开发、重新建模等一系列逻辑。 我们可以先回顾一下,正式的数据分析起源于所谓的BI,即商业智能。当时,BI核心的概念是基于商业的事实,通过一系列的概念和方法,最后去对这些事实进行分析,以达到辅助企业做商业决策的目的。这些核心的技术和方法基本上和现在的数据分析是一致的,从最基础的数据收集,到数据的整合,再到数据的挖掘、算法、洞察、可视化甚至是数据报告的协同工作等,整个过程其实是非常繁杂的。 这里面涉及到三类人员,第一类是IT人员,IT人员主要是做基础技术架构的实施。在这个过程中,他需要负责数据采集、整合、存储甚至是一些基础数据仓库架构的搭建以及一些检索的支持。往往这一部分的实施周期非常长,少则几个月,多则半年、一年。第二类人员就是需求方,即业务人员。业务人员的目标相对比较明确,他会提出自己的一些场景需求,有一些类似的假设需要去验证,或者是有一些需要探索的数据维度。中间一层就是分析师,分析师需要理解业务的需求,理解背后的数据模型,基于它去进行数据建模,包括一些统计模型的构建,最后形成一些报告或者可视化的图表。 在整个过程中间,从业务人员到分析师再到IT人员,整个流程是非常冗长的,响应的速度也非常有限。由于现在的业务敏捷性和快速性,导致很多业务端提出的需求在分析师和IT人员实施完之后,其实已经变得没有价值了。所以,这是90年代第一个十年的BI发展。基于这样的需求,后续我们演进到了BI的第二个十年。 第二个十年由于处在企业信息化的红利中,所以在部分成熟的企业里面,数据采集、信息化技术以及一些行业的数据积累越来越多,使得第二个十年的BI系统实施变得更加敏捷和迅速。在第二个十年里面,因为计算能力的提升,使得我们能够部分做到准时甚至是实时性的计算。同时由于云计算的兴起,让整个部署的复杂度也降低了,整个IT服务被快速的标准化。 第三个十年基本上是在2006年以后,出现了一个新的发向,我们叫做“ Analytics Anywhere”,即随处可用的数据分析。这需要从几个方面来讲,第一是我可以通过云端任意访问;另外是通过移动端也可以去查阅BI报表。但是,实际的背后是有两块核心的方向,一块叫做智能化数据分析,一块叫做自助式数据分析。 智能化数据分析相当于自动探索的模式,即如果你给我一些数据,我就能够部分的从数据本身的分布或者是特征上帮助你发现一些背后潜在的相关性。比如:Google的Google Spreadsheet,就是类似于Excel的工具,如果你用过会发现,上传一个Excel文档,Google在不需要人工干预的情况下,会自动给你生成一些报表,而这些报表都是基于你的数据类型、数据分布以及它们之间的相关性,通过统计模型统计出来的。 四、美国市场的发展现状
基于我们能拿到的2016年2月份Gartner出的关于新的BI领域的魔力象限分析,我们能看到在leader层面上有三家公司,即Tableau、Qlik、Microsoft,其中Microsoft会入选是因为其最近推出的Power BI,以前Excel的功能是非常强大的,只是大家不太会用,而Power BI是将Excel上面的部分功能加进来,另外它们也收购了一家加拿大做可视化或者是BI的公司,所以Power BI最终让Microsoft进入到Leaders的象限。 在Visionaries的象限中,表示的是你的愿景是完整的,但是你赋予企业的执行能力比Leaders还是稍有欠缺。从这一象限中我们可以看到,传统的SAS、MicroStrategy、IBM等都在这一象限中,为什么他们在Ability to Execute上面要比Tableau、Qlik、Microsoft要弱呢?主要原因在于后三者是自助式数据分析,而前面的还是以传统BI的方式,需要大量的时间去实施和部署。 左下方的象限叫做Niche Players,这里面有Domo、GoodData、Salesforce等,这些公司是在某些特殊领域里面已经有突破的,但他们的执行部分还是偏弱的。Domo从今年2月份之后做了很多次改版,我相信如果单纯从可执行的效率上来说,现在的Domo已经在Leaders层面了。 五、国内市场情况 从国内市场来看,其实有很多类似于Tableau的这种公司出来。比方说网易的有数、海智BDP、甚至还有一些新的创业者也在朝这个方向去做。这一块的厂商非常多,国内的现状也是非常早期。海智BDP相对来说是一家时间比较久的企业了。但是我觉得类似于Tableau公司的这种模式在国内是存疑的。为什么呢?因为国内的整个现状,即我们刚才说的第一方数据、第三方数据和整个API经济这块还不够成熟。即使第一方数据用的是别人的SaaS系统或者是私有部署的系统,那么过去的那些老系统对于数据的开放性还不行。比方说在广告监测行业,国内有两家做的比较出名,但是他们只能给你一份报告,如果你要看背后每一个用户的行为数据,他们要么没有,要么是给不了你。 我们当时做诸葛io的一个原因就是,诸葛io出生下来就是要拥抱数据API经济的,即你的数据就是你的,不管是SaaS化还是私有部署,我们都能提供丰富的数据API接口。但是,现在国内除了从SaaS开始做起的业务系统之外,整个数据的开放性还是不够的,不管是第一方业务系统还是第三方系统,像第三方系统只是给你做一些业务报表。所以,我们认为目前在国内要做自助式数据分析,你得搞好生态,把这些新型的数据相关业务系统的联盟给拉起来,这样大家就可以一起组建自助式数据分析平台。 从侧面来看,其实Tableau本身在中国市场上的占有率还是不错的,至少我们了解到的像银行、零售、物流等企业都在用Tableau做数据分析。但是我们通过访谈发现,他们只是把Tableau当成了一个数据可视化的工具,对于数据的联通性以及业务的联通性在国内做的都不是很好。当然,Tableau本身在业务联通性上在美国做的也是稍有问题,Domo在这一块做的就更好一些。 我们认为自助式数据分析这样一个大方向在国内还处于非常早期的阶段,这个市场是非常巨大的。从诸葛io的角度,我们是希望有更多开放的玩家进来,我们一起协作,去构建一个更完善、开放的生态。最终,帮助企业加速它们的BI或者是数据分析的流程,让企业的第一方和买来的第三方数据的价值真正能够得到商业的体现和回报。 作者:赵乾坤(诸葛io联合创始人) 原文链接:http://www.itongji.cn/cms/article/articledetails?articleid=4831
|