大数据,你我共同拥有
大数据的意义是由人类日益普及的网络行为所伴生的,受到相关部门、企业采集的,蕴含数据生产者真实意图、喜好的,非传统结构和意义的数据 。2013年5月10日,阿里巴巴集团董事局主席马云在淘宝十周年晚会上,将卸任阿里集团CEO的职位,并在晚会上做卸任前的演讲,马云说,大家还没搞清PC时代的时候,移动互联网来了,还没搞清移动互联网的时候,大数据时代来了。
从海量数据中“提纯”出有用的信息,这对网络架构和数据处理能力而言也是巨大的挑战。在经历了几年的批判、质疑、讨论、炒作之后,大数据终于迎来了属于它的时代。2012年3月22日,奥巴马政府宣布投资2亿美元拉动大数据相关产业发展,将“大数据战略”上升为国家战略。奥巴马政府甚至将大数据定义为“未来的新石油”。
大数据就是互联网发展到现今阶段的一种表象或特征而已,有必要神话它或对它保持敬畏之心,在以云计算为代表的技术创新大幕的衬托下,这些原本很难收集和使用的数据开始容易被利用起来了,通过各行各业的不断创新,大数据会逐步为人类创造更多的价值。
大多数传统BI工具都受到以下两个方面的局限:
首先,它们都是“预设-抓取”工具,由分析师预先确定收集什么数据用于分析。
其次,它们都专注于报告“已知的未知”(Known unknowns),也就是我们知道问题是什么,然后去找答案。(而大数据会给而大数据会给出一些未知的未知,也就是你没有想到的一些问题的结果)。传统BI工具主要用于企业运营,侧重于成本控制和计划执行报告。而大数据技术最主要的功能/应用是ETL(Extract、Transform、Load)。将近80%的
Hadoop应用都与ETL有关,例如在导入Vertica这样的分析数据库之前对日志文件或传感器数据的处理。
今天计算和存储硬件变得非常便宜,配合大量的开源大数据工具,人们可以非常“奢侈”地先抓取大量数据再考虑分析命题。可以说,低廉的计算资源正在改变我们使用数据的方式。
此外,处理性能的大幅提高(例如内存计算)使得实时互动分析更加容易实现,而“实时”和“预测”将BI带到了一个新的境界――未知的未知。这也是大数据分析与传统BI之间最大的区别。
今天的大数据技术还处于战国时期,未来几年,随着企业间的兼并和新产品的不断推出,BI厂商们将能推出完善的,让CEO感到满意的“大数据套件”,但这并不意味着企业IT经理们的工作将受到威胁。因为正如云计算在理想和现实间达成妥协一样,大数据也会经历类似的发展过程。传统的BI工具将与大数据分析并存。公共服务大数据另外一个重大的应用领域是社会和政府。如今,数据挖掘已经能够预测疾病暴发、理解交通模型并改善教育。
今天,城市正面临预算超支、基础设施难题以及从农村和郊区涌入的大量人口。这些都是非常紧迫的问题,而城市,也正是大数据计划的绝佳实验室。
以纽约这样的大都市为例,政府公共数据公开化、以及市民生活的高度数字化(购物、交通、医疗等)等都是大数据分析的理想对象。
客观的市政数据,是消除争端,维系公民社会的最佳纽带。当然,前提是让公民能够
访问这些数据。苹果的Siri和谷歌的Google Now都具备成为个人化助理的潜力。当然,我们还需要更多的产品和技术让数据分析结果更容易被公众理解和接受(数据可视化)。此外,IBM的Watson以及Wolfram Alpha这样的人工智能技术还能实现与用户的互动。
今天,智能手机(以及Twitter等社交网络)的普及让人类社会首次实现了公民的联网。应用程序商店实时上已经打通了政府和公民之间的应用层面的通道。伴随着各国政务的数字化进程,以及政务数据的透明化,公民将能准确了解政府的运作效率。这是不可逆转的历史潮流,同时也是大数据最具潜力的应用领域之一。
大数据已经与在线营销交织在一起,其应用可以分为两大类:
首先,从线上到线下。配备了NFC近场通讯技术的智能手机和基于位置的签到正在成为营销人员的最新利器。他们将能跟踪商场人流,把在线零售的分析优化应用于线下。
其次,数据分析工具将更加容易使用(面向中小企业应用的大数据创业非常火爆),中小企业也许没有BI平台,但他们都有平板电脑和智能手机,移动版客户智能分析将会改变企业使用营销工具的方式。
大数据时代已经来临,它将在众多领域掀起变革的巨浪。但我们要冷静的看到,大数据的核心在于为客户挖掘数据中蕴藏的价值,而不是软硬件的堆砌。因此,针对不同领域的大数据应用模式、商业模式研究将是大数据产业健康发展的关键。我们相信,在国家的统筹规划与支持下,通过各地方政府因地制宜制定大数据产业发展策略,通过国内外IT龙头企业以及众多创新企业的积极参与,大数据产业未来发展前景十分广阔。
因篇幅问题不能全部显示,请点此查看更多更全内容