现在大数据越来越火了,在公司里也感觉到。各种Hadoop、Spark,然后BI部门每天报表分析。有点好奇,大数据技术在未来的发展趋势是什么?


大数据,人类又一个技术乌托邦?(王冠雄)

【大数据是一个时代,「国家队」很及时】

去年底宣布的一个事情,将对未来有深远影响,现在大家还没意识到。

2013年11月19日,国家统计局与11家国内企业签署战略合作框架协议,合作内容涉及大数据应用统计标准,以及企业数据补充政府统计数据等领域。有分析称,在大数据国家战略日益强烈的情况下,统计局介入将进一步推动大数据的应用落地。

大数据绝对不是忽悠,它是当下IT领域最时髦的词,简单说就是从各种数据中快速获取价值信息的能力。美国是最早发现和使用大数据科学价值的国家。2012年3月,奥巴马政府宣布投资2亿美元拉动大数据相关产业发展,将「大数据战略」上升为国家战略,奥巴马政府甚至将大数据定义为「未来的新石油」。当时美国政府声明说通过提高美国从大型复杂的数据集中提取知识和管理的能力,来加强整个国家的竞争力,这被认为是跟互联网同一个级别的时代。显然,大数据不止是一个辞汇,更是一门技术,是一个产业时代。

而中国作为世界上人口最多、GDP排名第二的国家,成立大数据国家队是非常及时的。大数据的精髓在于「大」,它不是抽样而是全样,它不是盲人摸到的象腿或者是象鼻子,而是整个大象本身,大数据的精妙处在于用的人越多越增持,通过这样一个模糊的宏观判断,能够完成一个精准的个体推荐,从而会让整个生产效率得到极大提高。

【不开放大数据,周边创业是无米之炊】

目前我国大数据应用还存在一些问题。

首先,大数据不是IT公司的专利。第一批国家统计局引入的战略合作伙伴,大多数还是聚焦在IT公司,其实不是只有IT公司才有大数据,如线下零售巨头企业在实体经济中积累了很大的数据资源,他们数据的深度和广度不亚于甚至超过互联网公司。第一批进入的合作伙伴之一上海钢联其实掌握了煤炭钢铁在内的大宗商品数据,这是国家统计局没有涉及到的。因此,非IT类公司、拥有巨大的业务形态的企业,都可以成为第二批国家统计局大数据合作伙伴。我们也看到,国家统计局作为国家法定职能部门把姿态放平,主动寻求和民营企业的合作,这是非常可喜的进步。

第二,拥有大数据的IT公司和非IT公司应该打破数据格局。我们看BAT(百度、阿里、腾讯),近期围绕微信和淘宝发生新一轮互相屏蔽,在早前百度和淘宝进行了屏蔽,这三家掌握搜索、消费和社交的数据,本来是三方的数据汇总才能拼凑出比较完整的网上信息图谱,但是三家公司为了彼此的商业利益,并没有体现出数据合作的意愿,而是互相封杀,这将给社会数据的流动带来伤害。因此,在保证一定商业利益的基础上,巨头的眼光应该放远一点,打破数据割据。这看起来是一个很难实现的乌托邦。不过任何美好的事情都需要乌托邦的愿景作为起步的。我们看到许多美好的事情,比如说互联网,全世界的人通过互联网联结在一起,开始大家觉得乌托邦,现在已经形成现实。

第三,应该呼吁政府相关部门进一步开放市场。因为围绕大数据不管是应用还是创业,最核心的是要有数据的源头,然后才能进行采集、编辑,重新编制。据报道,现在大量的关于国民经济或者说民生的数据其实还在封闭状态,在工商部门、银行、保险、公安、医院、社保,包括电信运营商机构的手里。如何让这些数据流动起来,能让大家更方便,其实应该由政府带头实现等级制数据的开放共享。在不违反保密或者是国防的情况下,如果不开放大数据,那么相关研究和创业都是无米之炊。

所以还是应该抓住这个机遇,进一步开放市场,不断试点,一步一步把数据开放转起来,带来更多的应用价值。

【隐私保护与数据精准之间的平衡】

数据应该共融共通,还要开放市场。这个开放市场不仅仅是企业之间开放,企业对个人也要开放。

为什么现在开放变得这么谨慎?因为开放有风险,一是安全问题,二是伦理问题。已经有专家指出:安全问题是对于国防、军事以及整个经济信息的保密顾虑而言;伦理问题是从个体角度而言,即网民的隐私。《大数据》作者曾经说过,在一个有组织的社会里,几乎每一则信息都在不同的时候,以不同的形式公开过。就公民而言,他的信息一次性在网上公开,和第一种情况有本质区别。大数据平台在提供服务的同时,也在时刻收集用户的各种消费习惯、浏览习惯甚至生活习惯。如何保护用户的隐私成了大数据时代发展过程中不可回避的问题。因此,大数据的应用价值在于个人隐私保护与数据精准之间的平衡。

要真正做到大数据的开放,还需要很长的路走。大数据会成为互联网之后,人类又一个技术乌托邦。大数据的启动跟互联网有著相同的逻辑,一开始大家谈,不知道怎么做,会有一轮甚至几轮比较明显的产业泡沫,但是随著那些看似乌托邦的愿景,一个技术、一个尝试的创业公司的进入,会一步一步变成现实。

未来大数据会怎样,创业者跟投资者都需要很谨慎。目前来说,就大数据做预测是非常危险的事情,比较谨慎的说,可能在三年左右会看到一些具体的、受到社会应用的大数据,往长期看则还是未知数。


趋势预测是最扯淡的,也没有什么意义。绝大多数的大数据推崇者都没有理解大数据的真正含义。

BTW,自己领悟才最重要,不妨看看《失控》,相信看完你会有独特的感悟。


您好,很荣幸为您解答。大数据市场的发展趋势和前景是许多参加大数据培训学习的学员比较关心的问题,随著大数据的崛起,许多学员开始进行大数据培训学习,从而进入大数据行业。后台君认为这是个不错的选择,但是在学习前一定要了解大数据。刚刚回答了一个类似的问题,但您放心,后台君一定会不厌其烦的为您解决您的疑惑。下面就一起分析一下大数据的数据市场和未来发展趋势。

近年来,全球大数据储量呈现爆炸式增长,其中中国数据产生量增长最为迅速,平均每年增长速度比全球快3%,预计到2025年中国将成为全球最大的数据圈。

中国数据圈将受到来自物联网设备信号、元数据、娱乐相关数据、云计算和边缘计算增长的驱动,中国生产力数据和物联网数据占比将从2015年的11%增长至2025年的40%。

全球大数据储量规模爆炸式增长

随著物联网、电子商务、社会化网路的快速发展,全球大数据储量迅猛增长,成为大数据产业发展的基础。预测未来几年,全球大数据储量规模也都会保持40%左右的增长率。在数据储量不断增长和应用驱动创新的推动下,大数据产业将会不断丰富商业模式,构建出多层多样的市场格局,具有广阔的发展空间。

中国网民规模稳步增长,将超越美国

当前网民增长进入了一个相对平稳的阶段,互联网在易转化人群和发达地区居民中的普及率已经达到较高水平。

当前,我国正在加速从数据大国向著数据强国迈进。国际数据公司IDC和数据存储公司希捷的一份报告显示,到2025年,随著中国物联网等新技术的持续推进,产生的数据将超过美国。

生产力数据和物联网数据增长迅猛

预计到从2015到2025年,娱乐数据(来自数字电视、在线视频、音乐和游戏的数据)将增长7.8倍,生产力数据(大数据和元数据)和物联网数据的增长则更加迅猛,娱乐数据的占比将从46%以上下降到25%。

随著大数据的不断发展,我们的生活将快速发生改变,大数据引用不断融入我们的生活中。我们对于大数据会有更好的理解 。

大数据的发展趋势虽然好,但是面临很多挑战的:

对于大数据近几年的火爆发展和大数据相关就业岗位的增加,有很多IT技术培训机构都瞄准了大数据培训行业的机会不断的开设大数据培训班,让许多想要从事大数据的人通过参加大数据培训班快速的进入到大数据行业。随著大数据培训行业的不断发展,相关的发展问题也越来越多,挑战性也越来越大。那么大数据培训都有那些挑战呢?

1、随著大数据行业的不断发展,相应的大数据培训班也越来越多,各种各样的班级形式相互之间的竞争越来越大,越来越激烈,导致宣传成本大幅增加。

2、行业培训机构层次不齐,教学质量也是良莠不齐,缺乏规范性。有的培训班就俩个老师就开课讲授,甚至相关教学设备都配不齐。相比较好的大数据培训就相对好些,不管是教学环境还是师资力量都是比较不错的。

3、学员对于培训机构的信任度的提高,就目前而言大多数人对应培训机构的信任度是普遍比较低的,因外市场上的有许多机构培训出来的学员是什么也没学到工作也找不到的。

4、课程内容的制定,由于国内目前相关的技术都是国外的,想要做到及时更新比较困难,如果掌握前沿技术是大数据培训的关键。

通过上边的分析,大家一定对大数据现阶段的培训有所了解,那们我们要学习大数据的话也可以根据这方面的内容去分析大数据培训机构是否具有竞争力。

最后大数据发展「钱」景,但有一点须注意,长期坚持学习是不被社会淘汰的法宝。做不到,请绕道。


大数据作为一个全新互联网的产业,仍然处于快速发展的初期,在这个快速发展的领域,每时每刻都在产生新的事物。从整体发展角度评价,大数据行业的未来将呈现直线上升发展趋势。数据是资源也是战略资源,大数据技术就是从数量庞大、结构复杂,快速获得有价值信息的能力,它已成为学术界、企业界甚至各国政府关注的热点。近几年,大数据从「可有可无」的边缘迅速演变成「必须获取」的核心。深度挖掘分析把数据变成可操作利用的情报,提供个性化推荐、精细化运营,帮助企业降低成本,增加利润,大数据的作用在逐渐显现。数据已成为新的企业战略制高点,也各个企业争夺的新焦点。其应用领域也十分广泛,医疗,教育,体育,金融,娱乐产业,房地产,电影电视剧的制作等等,都用上了大数据。近年来,中国互联网三巨头BAT(百度、阿里、腾讯)均耗费巨资投入大数据发展,纷纷建立大数据研究院、大数据实验室等,提供大数据专业服务,一批大数据专业分析公司也应运而生。各家公司都在搭建大数据平台,或者已经在生产环境实践大数据,有些公司已经做了足够的了解,开发准备就绪。那么大数据该怎么学,学习大数据需要什么条件呢?

学习大数据是需要有前提条件的,首先需要你具备一定的编程和Linux基础。这里个人觉得会一些Java或者Python是最好的,推荐你看《贝叶斯思维:统计建模的PYTHON学习法》目前流行大数据的Hadoop框架,map-reduce框架可以用Java编程,很多部分都是用开源的Java语言编写。对于想要转行大数据的程序员来讲,在你工作中,或多或少的了解和接触过大数据相关的东西,这使得你们学起来比起0基础入门的人要少走很多弯路,拥有更高的学习效率,在这场长跑中已经有了可观的领先优势。而对于需要从编程基础开始的人来说,想要赶上前者的步伐就需要你更多的努力和付出了,你们要花费更多的时间去钻研和学习,这时候如果有人能给你一些正确的指引将会让你受益良多。学习的过程相对来讲会有更多的困难,但最后你们要到的终点是一样的,如果你足够努力弯道超车也不是不可能。


从不惜重金聘用首席数据科学家到采购最新的分析软体,企业领导者们在应用数据分析提高业务方面可谓极尽所能。

但是,想要真正用好数据分析相关技术,却没有那么简单。

「数字化业务涉及到的规模、复杂度、数据分布结构、所需的执行速度等问题意味著:任何僵化和集中的架构或工具都会崩溃,」Gartner副总裁Donald Feinberg说。 「任何企业的持续生存都将取决于灵活的,以数据为中心的架构,以响应不断变化的速度。」

Donald Feinberg认为,数字化颠覆带来了挑战,但也出现了前所未有的机遇。

庞大的数据量与云的强大处理能力相结合,意味著现在可以大规模地训练和执行相关演算法,以最终实现AI的全部潜力。

Gartner 建议企业领导者与高级业务负责人应该深入了解以下十大技术趋势,并讨论他们的关键业务优先顺序,以探索以下主要趋势在推进这些关键业务方面的应用。

1.增强分析(Augmented Analytics)

作为数据分析的高级增强阶段,增强分析能为分析计划带来更多自动化动能以及创新洞察力。

因为在正式进入数据分析之前,都需要对数据进行抽取、清洗、融合等准备工作,以提高数据分析的效率和准确性,更利于决策。而增强分析则能够帮助普通用户在没有数据科学专家或IT人员协助的情况下,访问有效数据,并对理论和假设情况展开测试与验证。

增强型数据分析侧重于增强智能的特定领域,利用机器学习(machine learning)转变分析内容的开发、使用与共享方式。

Gartner表示,到2020年,增强分析将成为分析和BI解决方案的主要卖点。

机器学习和人工智慧、增强型分析将为数据和分析市场带来颠覆,因为它将彻底改变开发、消费和共享分析内容的方式,可使数据准备、洞察力获取和洞察力可视化这个过程实现自动化,在许多情况下无需专业的数据科学家

2.增强数据管理(Augmented data Management)

增强数据管理是指利用机器学习功能和AI技术来制作数据管理类别,包括数据质量,主数据管理,元数据管理,数据集成以及资料库管理系统(DBMS)自我配置和自我调整。

它可以自动执行许多手动任务,为技术水平较低的用户提供使用数据的机会。它还有助于高技能的技术资源专注于更多的增值任务。

据Gartner预测,到2022年底,借助机器学习和自动化服务级别管理,数据管理中的手动任务将减少45%。

3.持续智能(Continuous Intelligence)

持续数据可不仅仅是实时数据的时髦说法。它是一种设计模式,指将实时分析与业务运营相结合,处理当前和历史数据以规定响应事件的行动。

「持续智能代表了数据和分析团队工作的重大变化,」Gartner研究副总裁Rita Sallam说。「分析和BI(商业智能)团队在2019年帮助企业做出更明智的实时决策,这是一个巨大的挑战,也是一个巨大的机会。它可以被看作是运营商业智能的终极目标。」

到2022年,超过一半的重要新业务系统将采用持续智能,使用实时上下文数据来改善决策。

4.可解释的 AI(Explainable AI)

AI已经越来越多地用于数据管理,但AI解决方案如何解释为什么他们得出某些结论?这是可解释的人工智慧的用武之地。

数据科学和机器学习平台中的可解释AI是关于在自然语言中准确性,属性,模型统计和特征方面生成数据模型的解释。

5.图形分析(Graph)

图形分析是一组分析技术,可帮助企业探索关注实体(如交易,流程和员工)之间的关系。

到2022年,图形处理和图形资料库管理系统的应用将以每年100%的速度增长。

6.数据结构(Data Fabric)

数据结构是指单一且一致的数据管理框架。它著眼于在分散式数据环境中实现无摩擦访问和数据共享,而不是孤立存储。

到2022年,定制数据结构配置将主要用作静态基础架构,迫使组织进行新一轮的成本控制,以完全重新设计更动态的数据网格方法。

7.NLP /会话分析(NLP/Conversational Analytics)

到2020年,50%的分析查询将通过搜索,自然语言处理(NLP)或语音生成,或者将自动生成。

分析复杂的数据组合并使组织中的每个人都可以访问分析的需求将推动更广泛的采用,使分析工具像搜索界面或与虚拟助手的对话一样简单。

根据另一项单独研究,NLP 用例非常庞大,预计到 2020 年 NLP 市场价值将达到 134 亿美元。

8.商用人工智慧和机器学习(Commercial AI and ML)

Gartner表示,到2022年,75%利用ML和AI技术的新终端用户解决方案将采用商业解决方案而非开源平台构建。

商业供应商已经在开源生态系统中创建了连接器,它们为组织提供了扩展AI和ML所需的功能,例如项目和模型管理、透明度、复用、数据沿袭,平台凝聚力以及开源技术所缺乏的集成。

9.区块链(Blockchain)

区块链等分散式分类账本技术在数据分析领域看起来很有前景,因为它们可能会在不受信任的参与者网路中提供分散的信任。

分析用例的影响很大,特别是那些利用参与者关系和交互的分支。

但是,根据Gartner的说法,未来几年,区块链将在这个领域完全起飞。与此同时,企业将部分地与区块链技术和标准集成,这些技术和标准很可能由其主要客户或网路决定。这包括与您现有的数据和分析基础架构的集成。

10.持久性内存伺服器(Persistent Memory Servers)

持久存储器技术旨在降低采用内存计算(IMC)的架构的成本和复杂性。持久性内存代表DRAM和NAND快闪记忆体之间的新内存层,可为高性能工作负载提供经济高效的大容量内存。

根据Gartner的说法,它有可能升级应用程序性能,可用性,启动时间,集群方法和安全实践。它还将通过减少数据复制的需要,帮助组织降低其应用程序和数据体系结构的复杂性。

「数据量正在激增,实时将数据转化为价值的紧迫性正以同样快的速度增长,」Feinberg说。 「新的伺服器工作负载不仅要求更快的CPU性能,还要求大容量内存和更快的存储。」


趋势一:提升企业竞争力

随著互联网时代的飞速发展,大数据产业已经成为这个时代发展不可或缺的因素,同时也是提升企业竞争力的强力资源。大数据行业有著巨大的价值和资源,只有掌握了大数据,才能有效地控制资源。在企业的发展过程中,各方都需要通过数据分析来获取信息。

趋势二:有效促进技术创新

目前,它主要是由开源的,和一个大数据技术框架系统集成多种技术和架构不断形成,因此有必要打造出自主创新和开放源码的组合可供企业使用的新的大数据技术开发的模式。

趋势三:促进其他行业的发展

借助强大平台,大数据开发运维一体化模式快速发展,不断更新,使大数据的使用效果更加清晰这一显著的提升在一定程度上促进了大数据的发展。可以说学习技术的快速发展带动了视觉化技术的发展。特别是对于人机交互,采用特定的原理在此基础上,将分析结果直观地展示出来,便于用户理解。

趋势四:展现数据资产的价值

在我国未来的发展中,受到不同类型和形式的码头的影响,使网路功能不断丰富,积累了丰富的数据资产,形成了互联网数据的社会。因此,企业在发展中合理运用大数据挖掘技术技术,可以展示数据资产的价值,从而支持自身的发展。

趋势五:价值链更加完善,突出优势

利用大数据技术,可以在改造传统价值链的同时,从最初的生产驱动到需求驱动。该企业通过了研究开发、设计、生产等环节完善价值链,提高产品服务水平能力,显示其智力和灵活性的发展优势。



推荐阅读:
相关文章