从移动网络到5G时代,企业欠缺的再也不是数据,而是一套符合商业目标的大数据策略,实现数据变现。数据,终将成为企业的核心资产。但是要落实以数据为核心的改变、让数据发挥策略性的价值,在实际运作上还有许多环节要打通。
企业建立以数据驱动为核心的智能商业模式,包括:如何从工作流中寻找数据化的切入点、如何设定数据收集策略与数据流通策略,已成为重要致胜关键。
数据像电力一样不可或缺
而随着计算与储存能力的增强,数据资源的供应将如同电力一样不可或缺,为企业提供源源不断的优化能力。既然是核心资源,数据资产的营运就变得日益重要,对建立在数据基础上的互联网公司来说更是如此。盘点这些资源并不简单,我在阿里工作时共做过三次,并归纳了一些经验:
1. 什么样的数据用量大、覆盖率高?—具公共属性的数据。
2. 什么样的数据稀缺、但重要?—具战略性的数据。
3. 重要数据不可再生,因此必须备份的数据。
4. 数据资源用完可以再用,因为复制成本极低。
5. 大数据的关联特性,使得数据权属的边界变得越来越模糊。
几次的资产盘点让我认识到,数据的盘点与实物不一样,数据可以无限衍生,而且,多并不代表有用。
对传统产业来说,拥有数据资源,将使企业拥有创新的可能性,并降低被淘汰的可能性,可以更好地适应高速变化的市场环境和用户需求,从而更具竞争力。可惜的是,传统产业往往在信息化和数字化建设方面存在缺失,弥补短处是当务之急,当然,这急切性往往与公司的经营方向相关。
无论是新兴产业还是传统产业,选择人工智能与大数据的切入点,场景尤为重要。在执行智能项目时,必须考虑数据是否足以成为解决问题的要素,同时,场景的业务逻辑稳定性相当重要。
数据让企业实现商业价值
数据作为资产,能够帮助企业更有效地进攻及防守。有效地创建、生产智能工具及产品,强化顾客关系,预测顾客的消费习惯趋势及流失,靠近并满足消费者的需求。用大数据做营销,已经是许多企业的常规性营销手段,也就是利用数据加强对顾客的获取、活跃、保留等服务能力。
在互联网领域,数据的规模、活跃程度以及收集、运用数据的能力,已经成为企业的核心竞争力之一。要深入洞悉市场、快速精准地找出应对策略时,数据已经成为企业实现更大商业价值的最强驱动力。当然,数据作为一种企业资产,需要与其他资产,如人力资源、硬件等相互组合,才能发挥出最大的价值。
大数据是来自多源异构的数据,“乱”是其特性,为避免出现无用输入、无用输出(garbage in, garbage out)的问题,在使用数据之前,需要对数据资产进行加工,从而带来了“数据治理”这一重要课题。
大量、来源广泛的数据,看起来往往是一团乱麻,我还记得,2013年时,我当时的老板淘宝网总裁三丰就跟我说过:“我们不能总坐金山吃馒头。”企业采集和储存PB(千兆位元组)级别数据的成本却是分文不少,而且有越演越烈的趋势。一方面要治理数据资产,同时也要证明数据有大价值。
今天,数据的价值其实已无须再多言。开发阿尔法狗而一举成名的团队被收购后,成功地帮助谷歌数据中心的冷却系统节约用电40%,未来几年还将会帮助谷歌省下数亿美元支出,而据说,该项目仅有五、六个团队成员。
难怪《人类大命运》(Homo Deus)的作者哈拉瑞(Yuval Noah Harari)认为,我们将会进入一个无机智能(inorganic intelligence)的世界,未来,我们可能受演算法主宰。当机器具备深度学习的能力之后,人工智能的定义有可能被改写,人类的感知和普世价值也会改变,商业元素也将会发生巨变。就如我在《大数据的关键思考》一书中所说:未来,人与人之间的差别,拼的是他可使用的数据量和演算法。
企业「养」数据的六大要点
人工智能因大数据而重生,但制约人工智能在各领域实现更广泛应用的,并不是演算法不够先进,而是缺乏高品质的数据。若想开发最先进的机器学习技术,能否获得高品质的训练数据极为关键,如何启动是大部分企业的一个难题。
对于从事机器学习研究的初创公司来说,起步时数据十分有限,难以建立起高品质的大数据资源。甚至有些企业在聘请数据科学团队、购置昂贵的设备之后,才知道还未制订“养数据”的策略。
数据来源的选择必定与商业模式相关,我的经验是,从小问题入手,弄清楚问题的本质,往往是选择数据和演算法的前提。每家公司的数据获取策略不尽相同,但回想这么多年我在阿里也算面对了不少类似的困难,抛砖引玉与大家分享几点:
1. 要从零开始创建好的专有数据集。
几乎永远意味着,要预先投入大量人力收集数据。但更痛苦的是,在业务变化的同时,数据结构也需要时时更新,正如前辈所说:“数据集成的同时已经在断裂。”
2. 即使表面上拥有很多数据,但在运用机器学习时,仍会发现数据量不足。
你需要的数据量与你试图解决的问题紧密相关。
3. 数据的收集、处理、运用,短期来说肯定是越贴近业务越有效率。
从长远看并不利于数据的标准化及重复使用,将导致开发周期变得漫长。我的经验是,起点可以从最小化应用做闭环,基于众多应用做长线规划。
4. 确保早期创造的应用有足够的吸引力,让业务方及使用者甘愿交出他们的数据。
让大数据落地,除了关乎技术问题,亦系于业务方及个人的意愿是否足够,只有互利互惠,才有长久合作。
5. 在大范围使用大数据之前,必须严肃地面对数据的标准和品质问题,否则后果堪忧。
数据驱动型企业必须明白,数据品质是全部员工的责任,并不仅仅是技术问题。
6. 大数据安全是一个命门,数据越多,责任越大。
有时候会超出你的想象,原以为很安全的数据,拼合其他数据之后,可能成为机密级别。
我曾经对朋友说,我在阿里的数据治理过程可谓九死一生,很多人听了不明白,看到上面的内容,再设想我要面对几十个不同业务方的情境,你可能就了解了吧。
出自:《数据的商战策略》/天下杂志出版社(本文经编修)