关于我们

质量为本、客户为根、勇于拼搏、务实创新

< 返回新闻公共列表

公开数据:大数据挖掘领域的蓝海

发布时间:2017-05-25 18:29:28

据5月27日报道,随着我国“互联网+”专项行动的实施和国务院《促进大数据发展行动纲要》的推进,我国大数据的体量呈指数级增长。大数据的流通、开放、共享、安全等问题也受到越来越多的关注。

公开数据:大数据挖掘领域的蓝海,大数据, 数据 私有 访问

随着大数据的价值被广泛认可,尤其是政府高层的主动推进,越来越多的企业加入到该领域中掘金。目前,大数据主要在医疗、消费、金融、公共安全等这几大非公开领域被讨论和研究得较多。目前较少有人关注公开数据,其实公开数据比私有数据具有更大的价值挖掘空间。
 

一般而言,大数据根据访问权限可分为私有数据和公开数据。很多人认为私有数据才具有价值,例如银行交易记录、抵押信息、医疗、通讯、电商交易数据等,因此大量机构和企业聚焦于私有数据的价值挖掘。
 

与私有数据不同,公开数据是指每个人都能够访问的数据,种类繁多。人们日常生活中随处可接触到的行政处罚信息、土地出让公示、法院公告、新闻、外汇交易信息、股票交易信息、商标公示信息、专利公示、域名备案等,都是公开数据,却较少人关注其价值和挖掘潜力。或许正是因为所有人都能访问,很少有人关注其背后的价值,也鲜有机构具备挖掘其价值的技术能力。
 

据统计,2015年我国大数据项目规模超过100亿元,预计到2020年国内企业级大数据市场应用规模将突破200亿元,其中私有数据占大部分,是大数据挖掘领域的红海;但私有数据因其私有性,连接性差、流通壁垒高,和公开数据相比,挖掘后的价值增值空间并不明显。
 

而让公开数据产品化,对大数据企业的产品理念和技术能力都提出了更大挑战。这个鲜有人关注的领域常面临“有数据的没技术,有技术的没数据”的困境,
 

公开数据具有公开、透明、种类繁多等特征,最能够体现大数据“连接”本质,相反,私有数据则因其私有性而具有连接性差、流通壁垒高的特点。私有数据已经是大数据的红海领域,而公开数据则是一块蓝海。
 

国家发改委副主任林念修称,未来5年,中国大数据产业规模年均增长率将超50%,到2020年数据总量将占全球两成,成为世界第一数据资源大国和全球数据中心。
 

国际数据挖掘协会中国分会主席、香港科大计算机系主任杨强教授指出,少量公开数据的获取难度不大,但是真正对于商业决策有帮助的大量公开数据的收集难度是很大的,搜索、整理、挖掘、呈现出其中的关联关系、并呈现出一个具象化的结果,这个难度就更大,所以目前需要一个高效、直接的方法把杂乱信息转换为决策支持。


/template/Home/Shiwaix2/PC/Static