阿里云数据库HBase版有哪些内核优势?
- 内核在集团数百个集群使用、数百个业务、10000台左右规模、服务天猫双十一
- 跟踪开源社区改进
- 修复bug,改进内核性能
- 增强功能,如支持 公网、内网 同时访问、支持OSS等
- 运维主动推送升级,用户无感知
低成本
- 多种形态研发中,满足不同规模的需求
- 虚拟机 + 高效云盘 系列(当前):满足小数据量,200g ~ 20T规模的数据需求,写入写入频繁,随机读一般的场景
- 虚拟机 + SSD云盘 系列(当前):满足小数据量,200g ~ 20T规模的数据需求,写入写入频繁,随机读高的场景,延迟低的场景
- HBase on OSS系列(研发中): > 100g起步, 成本便宜,满足日志、聊天等消息归档的需求,写入频繁但是读取较小的场景
- 本地实例:虚拟机 + SATA本地盘(研发中) >30T起步:成本便宜,但是规格固定,不能单独存储扩容,满足计算、读取频繁、数据量大的场景
- 本地实例:虚拟机 + SSD(研发中) >2T起步 :成本便宜,但是规格固定,不能单独存储扩容,满足计算、读取频繁、随机读高、延迟低的场景
- Master多种规格:最小2cpu4g(待上),2cpu4g是入门级别,一般情况下4cpu8g即可
有需要购买阿里云产品的朋友,先领取阿里云幸运券,再购买云数据库HBase版,领取使用后可有返现优惠。
支持SQL及二级索引
- 支持通过 SQL 访问数据库数据
- 高效的二级索引方案让您查询数据更加便捷高效
扩展性
- 支持在线增加节点,且可以平滑增加资源,如每个月增加1台
- 支持在线增加容量,且可以平滑增加资源,如存储量每月增加100g
- 计算量:从1k qps 到 5000w qps(满足大部分的需求)
- 存储量:从200g到1p (满足大部分的需求)
数据可靠性
- 99.99999999%的数据可靠性
高性能
- 基于1.1改造,服务集团业务与云上业务,性能提升30% ~ 300%
高可用性
- 自动负载均衡
- 默认HA
- 对集群服务进程自动守护
- 单节点故障时可秒级故障迁移
- 独占资源,可靠稳定,不受其它用户干扰
生态完整
- 完全兼容开源、与Hadoop生态完美融合
- 内部支持Phoenix组件
易运维
- 15分钟内完成部署
- 可视化web控制台
- 全指标监控预警
- 修改配置等
数据访问安全
- 支持网络白名单
- VPC网络隔离、
- 基于阿里云AK访问集群(待上)、支持ACL
多形态支持
- 支持不同规格,不同场景的需求
- 支持独享、普通实例
- 支持SSD云盘、高效云盘
- 支持OSS存储(研发中)
- 支持本地实例(研发中)
一致性
- 目前支持强一致性,后续可以在客户端自由选择CP模型、还是AP模型
支持阿里云产品打通
- 与EMR hadoop、spark连通,正在产品打通logservice、ODPS、Blink等(待上)
数据导入导出
- 支持关系型、ODPS、EMR等数据源与ApsaraDB HBase导入导出,参考 数据同步
应用场景
ApsaraDB for HBase的使用场景比较广泛,以至于很多客户无法把握他。以下我们大致列下,适合的场景:
HBase的设计之初是为了存储互联网,几乎所有非事务类结构化的存储需求都可以使用HBASE来满足。HBase是NoSql,讲的是Not only SQL,也是支持SQL及二级索引的。在整个数据的世界里,事务是比较少,占了不到1%的份额,大部分的数据存储都是无事务的。
目前阿里的使用情况:
在讲述具体的HBase场景,我们先看下HBase在整个数据处理大图之间的位置:
云HBase处于数据存储的位置,自带分析的功能
1、数据来源的途径有:
- 通过业务 ECS 直接写入到 云HBase之中
- 有一些消息中间件自带push功能,可以直接写入到HBase之中;有一些不行,需要拉取消息再转化处理后写入到HBase之中
- 通过流式系统,比如:SparkStreaming、Flink、Storm等流式引擎计算写入到云HBase之中
- 从离线同步数据到云HBase之中,一般为T+1同步
- 从关系型数据库同步数据到云Hbase之中,可以做到实时同步
- 在机器学习场景中,直接把云Hbase作为存储
2、云HBase的数据的去向:
- 云HBase自带Phoenix模块分析,支持百亿的毫秒级别分析
- 通过Spark等离线分析引擎分析
- ECS业务端查询,如Scan一些数据,在客户端展示
物联网大数据
HBase天生适合物联网的场景,比如:单车、物流轨迹类 等等
大数据类
满足安全风控、大数据处理、搜索等等具体的场景,一般跟流式系统、离线系统结合
大数据存储类、包括历史数据存储
存储包括各类数据,比如:日志、订单、交易数据、消息等等,在线实时写入,在实时查询。历史数据查询批量低,需要分层存储,云HBase预计在12月份支持冷热数据分离存储,降低存储成本
实时分析类
先领取阿里云1888元优惠券:【一键领取】
阿里云数据库rds购买:阿里云数据库HBase版