新闻 动态 ·
News Center
关注我们 关注前沿

利用数据分析拓展云服务业务(干货满满)

发表日期:2018-10-19        文章编辑:         阅读次数:

 数据分析的背景及现状
呈指数增长的数据量推动云服务实现了高增长和多样性的发展。作为云服务提供商(CSP),会根据客户对数据的需求来创建业务,例如,提供存储数据所需的基础设施(基础设施即服务,简称 IaaS),基于客户数据的服务或软件(软件即服务,简称 SaaS),或者为客户提供新的数据类型和格式,例如高清视频流媒体。
数据量的增长给各种规模的企业带来挑战的同时也带来了新机遇。拥有相应数据分析技术的企业,可以从大数据中获得更多关于客户、市场、产品开发、销售趋势和其他事件的信息。对于想要在竞争中领跑的企业,大数据分析是一种强大的工具,具有重要的变革意义。据报告称,到 2017 年底,有 53% 的公司都使用了大数据分析,而在 2年之前,这一数字仅为 15%。
对于云服务提供商,大数据分析蕴藏着无限可能。一是可以借此机会洞察使用数据分析来生成关于客户和企业的能力;二是可以通过数据分析服务为客户提供差异化的商业洞察,借此建立新的收入渠道。
英特尔数据分析规划的五大阶段
随着企业利用数据分析解决方案从概念验证(PoC)阶段迈入部署阶段,2017 年的全球大数据分析市场相比上一年增长了 24.5%。此外,分析机构 Gartner 在2017 年对 2,500 名 CIO 实施调查后发现,所有类型的企业都把“商业智能和数据分析”的支出列为首要的投资事项。所有这些调查都显示,对于云服务提供商,现在正是他们利用数据分析向前发展的大好时机:市场正在增长,而客户和 CIO 们都已经做好了投资准备。
英特尔的数据分析规划指南描绘了从描述性分析到认知性分析的 5 个阶段(参见图 1)。研究显示,大部分企业都处于前两个阶段之间:描述性分析和诊断性分析。从图表中可以清晰看出,许多企业距离达到成熟的数据分析还有一段相当长的距离。

图 1:数据分析成熟度的各个阶段
实施数据分析不可或缺的因素
许多企业已经具备了实施数据分析所需的数据、技术和流程,为企业利用分析所能提供的优势打下了良好的基础。促使企业进一步向高级分析迈进,需要的因素有:
1.对所拥有的数据有深入的了解,知道如何利用数据
2.了解数据分析能够带来的业务价值
3.负责开发数据分析项目的内部人才,例如,数据科学家或其他专家
4.支持更高级数据分析项目所需的数据中心基础设施,例如软件定义基础设施或足够的处理能力
5.不了解哪些工具能够为依赖数据的员工提供支持,以便他们根据数据洞察来做出业务决策并履行工作职责
数据分析变革趋势
据分析师预测,全球分析市场将持续增长,到 2026 年,市场规模将达到 922 亿美元。随着市场发展,云服务提供商将获得更多机会,通过为客户提供分析服务来实现收入增长。在这个快速发展的市场中,云服务提供商需要了解的重要趋势包括:
1.Hadoop* 曾为大数据分析的事实标准,现已发展成熟,且仍被广泛使用。但是,对于希望利用新的分析部署来颠覆市场的创新型企业,Hadoop 开始被视为陈旧技术。
2.更快速、更有针对性的数据处理技术正被广泛采用。例如:适用于一般数据处理的 Apache Spark*、适用于分布式高性能数据流传输应用的 Apache Flink*,以及适用于数据批处理和流传输数据处理的 Apache Beam*。
3.打包式分析应用和解决方案的数量不断增加,也越来越受到用户欢迎。企业逐渐趋向于采用开源和非专用分析解决方案,这些解决方案允许企业根据自身的需求,混合采用最匹配的分析工具。
4.人工智能(AI)是许多分析提供商想要实现的最终目标,利用先进的自学分析算法来为企业提供完全自动化的洞察。
开始着手发展数据分析能力之前,云服务提供商要做的第一步是理解数据分析所具备的变革能力,不只是对于自身企业,还有为客户企业带来的影响。
云服务提供商的机遇
云服务提供商是推动数据分析发展的一支重要力量。借助云服务提供商的数据中心,企业通常能够更好地整理、浏览和查询数据。数据分析能够给云服务提供商带来的一些特定机遇,帮助他们实现差异化服务。
1. 凭借出色的客户洞察,实现收入增长
对于云服务提供商,最直接的机遇源自为他们自己提供数据分析项目。通过了解数据分析能够给云服务业务带来哪些可能性,您就能够设立与如何使用数据有关的目标,以及未来您可能希望提供哪些基于分析的服务。
2. 提供客户所需的数据分析专业知识
对于许多企业而言,最大的挑战在于不知从何处开始数据分析。无论客户希望实现什么结果,他们的数据驱动能力很大程度上都依赖于他们当前数据的全面性和可用性。要评估客户在多大程度上准备好开始采用更高级的分析,您可以询问诸如以下这些问题:
企业是否具备数据清单,或者其他了解已有数据内容和位置的方式?
他们是否明确了解数据之间存在的空白,以及可能填补这些空白的方式?
员工是否能够简便地访问所需的信息?
各业务部门需要等待多久才能获得所需的数据?他们是否能够即时获得报告,还是必须等待几天或几周?
客户对于这些问题的回答有助于您引导他们踏上数据分析之旅,并与他们合作,带领他们向成熟的数据分析迈进(参见图 1)。
3. 帮助客户整理和分类数据
在您的客户中,有些可能并不完全了解他们拥有的数据,也不知道何处存在空白,以及该如何使用数据。许多公司仍然将数据保存在由应用、业务部门、项目或生成位置所定义的孤岛内。可能存在这样一种基本需求:需要将您的客户所拥有的不同类型的数据集合到一起,并且按照能够查询和从中获取价值的方式进行整理。
4. 支持客户的数据分析概念验证
对于想要形成自己的分析能力的企业而言,最重要的步骤之一就是创建概念验证(PoC)。客户能够借助这种方法,证明数据分析可以为企业带来的实际好处。此外,概念验证还有助他们检验对数据的理解程度,了解将来数据分析项目全面铺开后可能遇到的独特挑战。对于身为云服务提供商的您而言,通过客户的概念验证,可以证实您的分析服务能够实现预期的结果,从而有助于您成为客户信赖的数据处理合作伙伴。
5. 提供预打包的数据分析应用
根据您的客户所在的行业领域,可能存在几种具备广泛吸引力的常见分析应用案例,例如:
销售与营销
对于销售团队,如果能实时访问与客户有关的可信洞察,将带来重大变革。在数据分析服务中采用最常见的数据格式,并将这些数据结合起来得出新的洞察,这可以让您的客户与目标受众进行更加有效的对话,将更多机会转化成销售,提升客户的忠诚度。采用这种方法的一个例子就是 Salesforce 的 Einstein Analytics* 解决方案,它允许Salesforce 的客户在预先构建的应用和仪表板内探索从任何来源获得的各种数据。它让用户获得关于目标对象和客户的新洞察,从而帮助提高营销、销售和客户对话的效率。
物联网(IoT)
传感器如今在各行业中非常常见,从制造到医疗,从运输到零售,都能见到传感器的身影。这些传感器收集的数据如果能够正确查询,则可以提供大量潜在信息。专用于从特定类型的传感器数据获得洞察的应用,可能比较容易被一些已经开始利用物联网的客户所接受。例如,在阿姆斯特丹等智慧城市,经常利用强有力的分析技术,对传感器数据进行分析,以此缓解交通拥堵及与之相关的污染。这还只是数据分析提升居民生活品质的其中一种方式而已(参见图 2)。

图 2. 高级分析中的机遇 – 传感器和物联网
特定于行业的应用
各个企业或组织都会关注不同的分析应用案例,具体由它们所在的行业领域决定。例如,在零售行业,亚马逊正通过将多个传感器和基于机器学习算法的实时分析结合在一起,借此创建无人商店。无论您的客户是处于医疗、制造、政府,还是完全处于其他领域,您的专业洞察都有助于提供满足他们需求的分析服务。
基于云的数据分析面临的挑战
为客户设计基于云的分析服务时,需谨记他们目前在采用方面所面临的障碍,这非常重要。应当思考他们无法进一步向高级分析迈进的原因,这有助于您准确找出适合他们的解决方案和服务。
1.时间和成本
数据分析项目涉及大量管理和治理工作,因而对小型企业来说是一个严峻的挑战。构建流畅、预打包的工作流程来帮助您的客户处理好大数据分析的治理与管理,是确保数据分析服务具备吸引力的一个有效策略。
2.复杂性
对于大多数用户而言,大数据分析项目的环境和用户界面仍然太过复杂。公司可能会加大对分析环境的投资,以获得简单的工具和功能,让广大员工都能够顺畅使用它们。云服务提供商若能关注数据分析环境的可用性,将更有希望提高利润。
3.咨询
鉴于数据分析项目所需的专业知识,很少有企业能够在不介入外部咨询的情况下提供数据分析项目。这可能非常令人懊恼,对小型企业来说尤其如此,但云服务提供商可以从两个方面入手,帮助企业消除这方面的需求。通过结合易于使用的定制分析应用(面向常见的应用案例),提供自己的专业咨询服务,云服务提供商就可以帮助客户实现其数据分析目标,让他们无需购买成本高昂的专业服务。
数据驱动型企业的技术基础
拥有合适的技术是推动企业向数据驱动型企业转型的基础,也是客户从中获取数据驱动型服务和解决方案的来源。
1. 性能
对于大多数云服务提供商而言,主要挑战不在于获得数据和基础设施,而是如何以足够快的速度从数据中获取洞察,从而为客户提供价值,快速获取投资回报。对于致力于提供分析服务的云服务提供商而言,关键词就是“获取洞察的时间”。在企业领导者和数据科学家带领企业在数据分析之旅中向前迈进时,这已成为衡量成败与否的关键指标。
1.1 处理器性能
为了提供符合客户期望的数据分析工作负载,您需要确保新服务基于最新的处理器技术。英特尔® 至强® 可扩展处理器基于上一代英特尔® 至强® 处理器出色的性能、效率和价值而构建,能够提供以下优势:
更高的性能,将 4 年的 TCO 降低高达 65%
更多内核、更高内存带宽和 I/O 性能提升,在 SAP HANA* 上每小时执行的查询量提高 1.5 倍
更快的大数据查询,例如采用 IBM DB2 时,将批量分析的平均速度加快 1.4 倍
每秒运算次数提升高达 4.6 倍,支持多达 5 倍的客户端数量(采用 Cassandra* NoSQL 数据库)
1.2 存储和内存性能
通过将英特尔® 至强® 可扩展处理器与英特尔® 傲腾™ 技术和英特尔® 固态盘(英特尔® SSD)结合在一起,云服务提供商能够从数据分析平台的性能改善中获益。对于 SAS Business Analytics*,结合使用两种技术生成的洞察,要比仅仅一年前使用英特尔最出色的平台快 2 倍(参见图3)。

图3. 数据分析平台的性能
 
内存和存储技术的进步对于能否实现更高水平的数据分析性能至关重要,英特尔正利用新一代的持久内存,基于英特尔和 Micron 联合开发的 3D XPoint ™ 媒体,来助力推动实现这些改进 。借助这一技术,数据中心的操作员可将更多数据放置在更靠近处理器的非易失性媒介上,借此克服一直以来阻碍实现更高应用容量和性能的障碍。这种经济的持久内存可能会彻底改变 SAP HANA* 和其他内存数据库等应用案例,使用户能够更快速地生成更好的洞察。此外,这些技术支持更快的数据获取,可以缩短训练和运行模型所需的时间。
1.3 网络性能
出于预测性分析目的,我们会将数据湖或仓库中的数据移至计算基础设施,如果此过程出现延迟,则会增加实时操作的成本。为了帮助云服务提供商避免遭遇这类延迟,英特尔提供了市面上速度最快的高带宽网络,从而跨不同网络通道加速预测性分析工作负载。
1.4 软件框架和库
为数据分析应用案例选择正确的框架和库,对于数据分析服务能否实现高性价比至关重要。根据应用案例,您的基础设施需要为分布式处理框架组合提供支持,例如Apache Spark* 软件、非关系型分析数据库和分析应用。
对于更高级的分析应用案例,例如指导性分析,深度学习能够以越来越快的速度自动对大数据重复应用复杂的数学计算,借此生成洞察。但是,许多框架和库的设计并不支持大数据堆栈,因此往往难以高效地管理大型数据集。为了帮助企业弥补这一空白,英特尔开发出了 BigDL。这是一种基于 Spark* 平台在本机构建的开源、分布式深度学习库(参见图 4)。BigDL 能够横向扩展至数千台服务器,采用英特尔® 数学核心函数库(英特尔® MKL)和并行计算技术,在基于英特尔® 至强® 处理器的服务器上实现高性能。英特尔® MKL 能够以最小的工作量,为未来的英特尔® 处理器系列优化代码。它可以兼容您选择的编译器、语言、操作系统、链接以及线程模型。

图 4:BigDL 为 Spark*(使用 CPU)上的深度学习提供原生支持
 
如果云服务提供商现有的大数据工作负载使用 Spark/Hadoop 集群,则可以轻松集成 BigDL,让客户将深度学习集成到现有工作负载中。它支持您使用现有的基础设施来引入大数据即服务和人工智能即服务功能,从而利用差异化的服务进一步推动业务发展,同时缩短深度学习增强服务和解决方案上市的时间。
比起开箱即用的开放式深度学习框架,BigDL 的实现速度更快,这是因为它可以在存储数据的同一集群上分析大数据,从而降低系统的复杂程度,缩短端到端学习的延迟。采用 BigDL 之后,您可以将来自其他深度学习框架的预先训练模型加载到 Spark 中,例如 Tensorflow*、Keras*、Caffe* 和 Torch*。之后,可对它们实施微调、推理,并用于学习。

2. 可扩展性
数据分析服务所依托的技术需要适应不断变化的业务需求。例如,如果随时间过去,数据需要改变,或者需要针对特定项目实施改变,您的基础设施必须适应这种改变,以让客户保持满意。全新英特尔® 至强® 可扩展处理器旨在加快数据分析工作负载的速度,完善机器学习和人工智能等技术,让它们成为数据分析服务的理想基础。
3. 兼容性
阻碍最终用户采用数据分析的主要障碍之一是复杂性。造成这种复杂性的部分原因在于数据分析生态系统的广度。企业可以选择不同的供应商、技术堆栈和项目,用于部署数据分析——由于这些解决方案之间不具备互操作性,因此会进一步加剧复杂性。随着数据分析市场的发展,企业各自束缚于特定的供应商解决方案,常常想要采取模块化方法来组合数据分析系统。为此,云服务提供商需要确保数据分析服务、平台和应用都能与任何其他项目或客户可能想要使用的附件兼容,这一点非常重要。
一些相关的技术已经涌现,可帮助云服务提供商及客户解决兼容性问题。例如,Alluxio 是一种开源解决方案,它允许任何应用与来自任何存储系统(存储器速度)的数据交互,将计算和存储分离开来,且不会导致性能下降。对于提供多种分析功能的云服务提供商而言,这可以统一不同系统的数据访问,桥接计算框架和底层存储。

 
拓展数据分析业务的后续行动
 
高级分析和公有云彼此相连,难以分割,而云服务提供商在交付变革性洞察方面发挥着基础性作用。当前存在大量机会,可供云服务提供商构建新的基于分析的差异化服务,但这需要高性能、高效且可扩展的基础设施作为保障。如果云服务提供商有意通过数据分析拓展业务,可采取以下后续行动:
研究
了解客户想要通过数据分析实现哪些结果,并从竞争对手使用数据分析技术的做法中获得启发。
组建自己的团队
客户会依赖于您的数据分析专业知识,所以务必确保拥有自己的数据科学家,以及了解数据分析环境的产
品开发团队。
评估现有 IT 系统
使用上面的“技术考量因素”部分作为确定基础设施和流程适用性的起点,发现可以升级或改进的环节。
 

文章摘自英特尔精英汇

 

想购买及了解更多英特尔产品详情,欢迎咨询以下联系方式!

永信贵宾会集团联系方式

咨询热线:0755-88603572

永信贵宾会官网:www.yyhsjs.com
客户垂询邮箱:cuifang.mo@yyhsjs.com

客户垂询QQ1627678462

地址:深圳市福田区深南大道1006号国际创新中心C11

邮编:518026


 
电话:0755-82964380
邮件:xinyuan.guo@yyhsjs.com
地址:深圳市福田区深南大道1006号国际创新中心C座11楼

  • 官方微信

  • 官方微博
  • 服务热线

    0755-83647532

    微信服务号

    [!--page.stats—]