hadoop集群数据处理较长,工作效率低,或者数据体量爆发式增长,超出计算能力支持范围。而阿里云大数据计算服务MaxCompute可以完全解决这
方面的问题。下面阿里云最新优惠网(www.aliyun111.com)带大家科普下阿里云大数据计算服务产品相关知识。
购买阿里云大数据计算服务(MaxCompute)请先领取阿里云通用代金券1888元礼包。>>>点击领取
阿里云大数据计算服务(MaxCompute)活动购买地址:前往查看
一、大数据计算服务MaxCompute优势:
大规模计算存储
适用于100GB以上规模的存储及计算需求,最大可达EB级别
多种计算模型
支持SQL、MapReduce、Graph等计算类型及MPI迭代类算法
强数据安全
稳定支撑阿里全部离线分析业务7年以上,提供多层沙箱防护及监控
低成本
与企业自建私有云相比,计算存储更高效,降低20%-30%采购成本
二、大数据计算服务MaxCompute功能:
1、数据通道
支持批量/历史数据通道和实时/增量数据通道
①、批量、历史数据通道
Tunnel是MaxCompute向用户提供的数据传输服务。该服务水平可扩展,支持每天TB/PB级别的数据导入导出。特别适合于全量数据或历
史数据的批量导入。Tunnel提供了Java SDK,并且在MaxCompute的客户端工具中,有对应的命令实现本地文件与服务数据的互通。
②、实时、增量数据通道
另一方面,针对实时数据上传的场景,MaxCompute提供了另一套名为DataHub的服务。该服务具有延迟低、使用方便的特点,特别适用于增
量数据的导入。Datahub还支持多种数据传输插件,例如:Logstash、Flume、Fluentd、Sqoop等。同时支持日志服务Log
Service中的日志数据的一键投递至MaxCompute,进而利用大数据开发套件进行日志分析和挖掘。
2、以二维表格式存储数据
所有数据均以表格式存储,不暴露文件系统。并采用列压缩存储格式,极高的数据压缩比极大节省了用户成本。通常情况下,MaxCompute存储具备5倍压缩的能力
3、计算模型
支持SQL、MapReduce、Graph多种计算模型与一身
①、SQL
MaxCompute
SQL采用标准的SQL语法,兼容部分Hive语法。在语法上和HQL非常接近,熟悉SQL或HQL的编程人员都容易上手。另外MaxCompute提供
更高效的计算框架支持SQL计算模型,执行效率比普通的MapReduce模型更高。需要注意的是,MaxCompute
SQL不支持事务、索引及Update/Delete等操作。
②、MapReduce
MaxCompute提供的Java
MapReduce编程模型。值得注意的是,由于MaxCompute并没有开放文件接口,用户只能通过它所提供的Table读写数据,因此
MaxCompute的MapReduce模型与开源社区中通用的MapReduce模型在使用上有一定的区别。我们相信,这样的改动虽然失去一定的灵活
性,例如:不能够自定义排序及哈希算法,但却能够简化开发流程,免除很多琐碎的工作。更为重要的是,MaxCompute还提供了基于MapReduce
的扩展计算模型, 即MR2。在该模型下,一个Map函数后,可以接入连续多个Reduce函数。
③、Graph
对于某些复杂的迭代计算场景,例如:K-Means,PageRank等,如果仍然使用MapReduce来完成这些计算任务将是非常耗时的。MaxCompute提供的Graph模型能够非常好的完成这一类计算任务。
4、安全
MaxCompute是一个多租户的计算平台。默认情况下,各租户间数据不共享,彼此隔离,但用户可以通过MaxCompute提供的授权机制将数据共享给项目组其他人
三、实战应用场景
1、使用成本低(东润环能)
成本低,数据上云周期短
3个月内业务全面交付云端,数据处理时间不到原来自建方式的1/3,并确保云上新能源电力数据安全无忧
让企业更专注于业务
用了不到3个月时间,就将业务全面的交付云端,让云端的海量资源真正为业务服务
降低投资、运维成本
极大减少了自建大数据平台的物力投入、人力运维投入和研发投入
安全稳定
全方位服务能力及其稳定安全的表现确保数据上云万无一失
2、大数据仓库(小红唇)
大数据仓库
在云计算、大数据时代,数据仓库的重要性毋庸置疑,其建设也在不断的进化中。小红唇在横向对比之后,毅然决定基于数加MaxCompute强大的计算能力之上进行数据仓库的建设。
数据上云
第一阶段通过DataX和Tunnel向MaxCompute同步数据
数据清洗
第二阶段通过内部产品打通在Data IDE进行同步和数据清洗
数据展现
Data IDE进行ETL和OLAP的数据通过Quick BI进行产出报表
3、日志大数据分析(墨迹天气)
提升开发效率,降低存储和计算成本
墨迹天气日志分析业务迁移到数加MaxCompute后,开发效率提升了超过5倍,存储和计算费用节省了70%,每天处理分析2TB的日志数据,更高效的赋能其个性化运营策略。
提高工作效率
日志数据全部通过SQL进行分析,工作效率提升了5倍以上
提升存储利用率
整体存储和计算的费用比之前节省70%,性能和稳定性也有提升
降低大数据使用门槛
MaxCompute提供多种开源软件的插件,轻松完成数据上云
4、精细化运营(美甲帮)
盘活海量数据,实现百万用户精细化运营
美甲帮的主营业务在商城方面,截至目前已经拥有百万级别的用户,积累了大量的用户数据,如何更好的服务用户并提升客户体验是美甲帮进行大数据探索的出发点
提升业务洞察能力
通过MaxCompute计算能力实现了针对百万用户的精细化运营
业务数据化
对业务数据分析能力提升并有效监控,更好的业务赋能
快速响应业务需求
数加生态满足新业务数据分析需求的“随机应变”能力
5、精准化广告营销(汇合营销)
大数据精准营销
基于阿里云数加平台,汇合营销搭建了核心的大数据精准营销平台,所有的日志数据存储在MaxCompute并通过Data IDE进行离线调度和分析
高效低成本的海量数据分析
对海量日志数据进行统计分析,既要保障高效率,也要降低开发成本
数据查询分析的实时性
系统需要在毫秒级响应广告商的查询请求并返回标签的用户量等信息
低门槛的机器学习平台
作为精准营销广告提供商,算法模型的好坏直接与最终收益挂钩
6、海量营销数据分析(PING++)
海量营销数据分析
Ping++当前日交易笔数为百万级,目前已经积累了海量交易数据。如何对海量数据进行数据分析与业务创新从而提高用户黏性,Ping++ 亟需搭建安全、可靠、稳定的大数据平台。
数据创新
一站式大数据平台同时满足存储、计算、BI和机器学习等功能
快速、高效、低成本
作为互联网创业公司,需尽可能以最低的成本去实现
安全、稳定、可靠
需要严格的数据隐私保护机制,商户的数据只用于自身分析
四、购买阿里云大数据计算服务客户案例
案例1:
公司:华大基因
行业:生命科学
客户痛点:数据体量爆发式增长,远超出原有计算能力支持范围。
使用阿里云大数据计算服务收益
十万人的基因数据,MaxCompute可在几小时内完成,同时计算成本大幅降低到$1000美金以内。
案例2:
公司:ofo小黄车
行业:共享单车
客户需求:数据化运营,精准化营销,降低运维成本。
使用阿里云大数据计算服务收益:
1、线下运营效率提高50%以上,轻松处理ofo每天3200万订单量,整体运行效率提升76%。
2、大数据平台运维成本大幅度降低,只需投入0.5人。
3、让ofo小黄车可以100%专注于业务本身。
案例3:
公司:众安保险
行业:保险
客户需求:健壮、可扩展、安全、低成本以及与应用系统高效交互。
使用阿里云大数据计算服务收益:
除满足众安对大数据平台的各种基本要求外,MaxCompute生态的丰富,资源与工具的共享,对挖掘算法的深入支持都可强大到满足众安的使用需求。
案例4:
公司:东润环能
行业:能源服务
客户痛点:自建hadoop集群每天数据处理需3小时以上,效率低。
使用阿里云大数据计算服务收益:
1、原来至少3个小时完成的任务,MaxCompute仅需1个小时完成。
2、基于MaxCompute提供的API/SDK和一站式数据开发套件,使得项目实施难度极大降低。
3、执行效率更快,相同业务需求下,消耗更少的系统资源,极大降低了成本。
购买阿里云大数据计算服务(MaxCompute)请先领取阿里云通用代金券1888元礼包。>>>点击领取
阿里云大数据计算服务(MaxCompute)活动购买地址:前往查看
猜您还喜欢看:
大数据计算服务购买一年多少钱?
《一分钟了解阿里云大数据计算服务实践应用场景与产品功能》有一个想法