据知名调研机构Gartner公司声称,数据和分析技术领域的几大趋势在未来三到五年内具有巨大的颠覆性力量,其中包括增强型分析、持续型智能和可解释型AI。
Gartner的研究副总裁Rita Sallam今天在悉尼举行的Gartner数据和分析峰会上表示,数据和分析领导人必须审视这些趋势给业务带来的潜在影响,并相应调整业务模式和运营,否则有可能丧失竞争优势。
她说:“数据和分析领域的形势在不断变化,从支持内部决策到持续型智能、信息产品和任命首席数据官。更深入地了解推动这种不断变化的形势的技术趋势,并根据业务价值对它们确定优先级显得至关重要。”
据Gartner副总裁兼杰出分析师Donald Feinberg声称,数字化颠覆带来的挑战(数据太多)也创造了前所未有的机遇。海量数据加上云带来日益强大的处理功能,这意味着现在可以大规模地训练和执行算法,而最终实现AI的全部潜力势必需要这么做。
Feinberg先生说:“数字化业务需要大量复杂且分布式的数据、迅速行动以及持续型智能,这意味着僵化且集中式的架构和工具分崩离析。任何企业的持续生存将取决于灵活的且以数据为中心的架构,可应对不断变化的形势。”
Gartner建议数据和分析领导人与高级业务负责人讨论他们的关键业务优先级,并探讨下列几大趋势如何助力自己。
趋势1:增强型分析
增强型分析是数据和分析市场的下一波颠覆。它使用机器学习和AI技术来彻底改变开发、消费和共享分析内容的方式。
到2020年,增强型分析将成为促使企业新购买分析及商业智能(BI)、数据科学及机器学习平台以及嵌入式分析技术的主要驱动因素。数据和分析领导人应计划在平台功能趋于成熟时采用增强型分析。
趋势2:增强型数据管理
增强型数据管理充分利用机器学习功能和AI引擎来搞好几类企业信息管理,包括数据质量、元数据管理、主数据管理、数据集成以及数据库管理系统(DBMS)自我配置和自我调整。它使许多手动任务实现自动化,让技术不太娴熟的用户得以更独立自主地使用数据。它还让技能娴熟的人员得以专注于更重要的任务。
增强型数据管理将元数据由仅用于审计、沿袭和报告变成支持动态系统。元数据正由被动变成主动,正成为所有AI/机器学习的主要驱动因素。
到2022年底,有望通过增加机器学习和自动化服务级别管理,将数据管理手动任务减少45%。
趋势3:持续型智能
到2022年,一半以上的主要新业务系统将采用利用实时上下文数据来改善决策的持续型智能。
持续型智能是一种设计模式;按照这种模式,实时分析技术集成到业务运营中,处理当前数据和历史数据,以确定响应事件的操作。它提供决策自动化或决策支持。持续型智能利用多种技术,比如增强型分析、事件流处理、优化、业务规则管理和机器学习。
Sallam女士说:“持续型智能代表数据和分析团队的工作发生了重大变化。这既是巨大挑战,又是巨大机会,分析和BI(商业智能)团队可以在2019年帮助企业做出更明智的实时决策。可以将它视作操作型BI的终极版。”
趋势4:可解释型AI
企业日益部署AI模型以增强和取代人类决策。然而在一些情况下,企业必须证明这些模型如何做出决策。为了赢得用户和利益相关者的信任,应用软件领导者必须使这些模型更易于解释。
遗憾的是,大多数这些先进的AI模型都是复杂的黑盒子,无法解释它们为何得出特定的推荐或决策。比如说,数据科学和机器学习平台中的可解释型AI可自动生成模型的解释,用自然语言从准确性、属性、模型统计和特征等方面解释模型。
趋势5:图形分析
图形分析是一组分析技术,便于探究组织、人员和事务等相关实体之间的关系。
图形处理和图形DBMS的运用将以每年100%的速度增长,一直持续到2022年,不断加快数据准备,并支持更复杂、更适应的数据科学。
据Gartner声称,图形数据存储系统可以跨数据孤岛高效地建模、探究和查询有着复杂关系的数据,但迄今为止需要专业技能限制了它们的采用。
由于需要跨复杂数据询问复杂问题,图形分析在今后几年会迎来增长,跨复杂数据询问复杂问题在大规模环境下使用SQL查询并不总是切实可行或甚至可能的。
趋势6:数据结构(data fabric)
数据结构可以顺畅无阻地访问和共享分布式数据环境下的数据。它支持单一、一致的数据管理框架,因而可以跨原本孤立的存储环境无缝地访问和处理数据。
到2022年,定制的数据结构设计将主要部署成静态基础设施,迫使企业组织迎来新一波的成本控制浪潮,针对更动态的数据网格方法全面重新设计。
趋势7:NLP /对话式分析
到2020年,50%的分析查询将通过搜索、自然语言处理(NLP)或语音来生成,或者将自动生成。需要分析复杂的数据组合,并使企业组织中的每个人都易于访问分析技术,这将推动更广泛的采用,使分析工具如同搜索界面或借助虚拟助理的对话一样简易。
趋势8:商业AI和机器学习
Gartner预测,到2022年,利用AI和机器学习技术的新的最终用户解决方案中75%将采用商业解决方案而非开源平台来构建。
商业供应商现在已经构建了连接到开源生态系统的组件,它们提供了扩展并普及AI和机器学习所必需的企业功能,比如项目及模型管理、重复使用、透明度、数据沿袭以及开源技术缺乏的平台凝聚力和集成。
趋势9:区块链
区块链和分布式账本技术的核心价值主张是,跨不受信任的参与者网络提供去中心化的信任。区块链在数据分析这种使用场合大有影响,对利用参与者关系和交互的那些企业来说影响尤其大。
然而,几年后四五种主要的区块链技术会成为主导者。在此之前,技术最终用户将被迫与其主导性的客户或网络所要求的区块链技术和标准整合起来。这包括与你现有的数据和分析基础设施整合起来。整合成本可能超过任何潜在的好处。区块链是数据源,而不是数据库,不会取代现有的数据管理技术。
趋势10:持久性内存服务器
新的持久性内存技术将有助于降低采用基于内存计算(IMC)的架构的成本和复杂性。持久性内存代表DRAM和NAND闪存之间一个新的内存层,可为高性能工作负载提供经济高效的大容量内存。它有望改善应用软件的性能、可用性、启动时间、集群方法和安全实践,同时牢牢控制成本。它还可以减少对数据复制的需要,帮助企业组织降低其应用软件和数据架构的复杂性。
Feinberg先生说:“数据量正在快速增长,将数据实时转化成价值的紧迫性正以同样快的速度增长。新的服务器工作负载不仅需要更高的CPU性能,还需要大容量内存和更快的存储系统。”