阿里云数据库HBase版有哪些应用场景与产品优势?

阿里云数据库rds购买:阿里云数据库HBase版

阿里云数据库HBase版有哪些内核优势?

  • 内核在集团数百个集群使用、数百个业务、10000台左右规模、服务天猫双十一
  • 跟踪开源社区改进
  • 修复bug,改进内核性能
  • 增强功能,如支持 公网、内网 同时访问、支持OSS等
  • 运维主动推送升级,用户无感知

低成本

  • 多种形态研发中,满足不同规模的需求
    • 虚拟机 + 高效云盘 系列(当前):满足小数据量,200g ~ 20T规模的数据需求,写入写入频繁,随机读一般的场景
    • 虚拟机 + SSD云盘 系列(当前):满足小数据量,200g ~ 20T规模的数据需求,写入写入频繁,随机读高的场景,延迟低的场景
    • HBase on OSS系列(研发中): > 100g起步, 成本便宜,满足日志、聊天等消息归档的需求,写入频繁但是读取较小的场景
    • 本地实例:虚拟机 + SATA本地盘(研发中) >30T起步:成本便宜,但是规格固定,不能单独存储扩容,满足计算、读取频繁、数据量大的场景
    • 本地实例:虚拟机 + SSD(研发中) >2T起步 :成本便宜,但是规格固定,不能单独存储扩容,满足计算、读取频繁、随机读高、延迟低的场景
  • Master多种规格:最小2cpu4g(待上),2cpu4g是入门级别,一般情况下4cpu8g即可

有需要购买阿里云产品的朋友,先领取阿里云幸运券,再购买云数据库HBase版,领取使用后可有返现优惠。 

支持SQL及二级索引

  • 支持通过 SQL 访问数据库数据
  • 高效的二级索引方案让您查询数据更加便捷高效

扩展性

  • 支持在线增加节点,且可以平滑增加资源,如每个月增加1台
  • 支持在线增加容量,且可以平滑增加资源,如存储量每月增加100g
  • 计算量:从1k qps 到 5000w qps(满足大部分的需求)
  • 存储量:从200g到1p (满足大部分的需求)

数据可靠性

  • 99.99999999%的数据可靠性

高性能

  • 基于1.1改造,服务集团业务与云上业务,性能提升30% ~ 300%

高可用性

  • 自动负载均衡
  • 默认HA
  • 对集群服务进程自动守护
  • 单节点故障时可秒级故障迁移
  • 独占资源,可靠稳定,不受其它用户干扰

生态完整

  • 完全兼容开源、与Hadoop生态完美融合
  • 内部支持Phoenix组件

易运维

  • 15分钟内完成部署
  • 可视化web控制台
  • 全指标监控预警
  • 修改配置等

数据访问安全

  • 支持网络白名单
  • VPC网络隔离、
  • 基于阿里云AK访问集群(待上)、支持ACL

多形态支持

  • 支持不同规格,不同场景的需求
  • 支持独享、普通实例
  • 支持SSD云盘、高效云盘
  • 支持OSS存储(研发中)
  • 支持本地实例(研发中)

一致性

  • 目前支持强一致性,后续可以在客户端自由选择CP模型、还是AP模型

支持阿里云产品打通

  • 与EMR hadoop、spark连通,正在产品打通logservice、ODPS、Blink等(待上)

数据导入导出

  • 支持关系型、ODPS、EMR等数据源与ApsaraDB HBase导入导出,参考 数据同步

应用场景

ApsaraDB for HBase的使用场景比较广泛,以至于很多客户无法把握他。以下我们大致列下,适合的场景:

HBase的设计之初是为了存储互联网,几乎所有非事务类结构化的存储需求都可以使用HBASE来满足。HBase是NoSql,讲的是Not only SQL,也是支持SQL及二级索引的。在整个数据的世界里,事务是比较少,占了不到1%的份额,大部分的数据存储都是无事务的。

目前阿里的使用情况:

在讲述具体的HBase场景,我们先看下HBase在整个数据处理大图之间的位置:

云HBase处于数据存储的位置,自带分析的功能

1、数据来源的途径有:

  • 通过业务 ECS 直接写入到 云HBase之中
  • 有一些消息中间件自带push功能,可以直接写入到HBase之中;有一些不行,需要拉取消息再转化处理后写入到HBase之中
  • 通过流式系统,比如:SparkStreaming、Flink、Storm等流式引擎计算写入到云HBase之中
  • 从离线同步数据到云HBase之中,一般为T+1同步
  • 从关系型数据库同步数据到云Hbase之中,可以做到实时同步
  • 在机器学习场景中,直接把云Hbase作为存储

2、云HBase的数据的去向:

  • 云HBase自带Phoenix模块分析,支持百亿的毫秒级别分析
  • 通过Spark等离线分析引擎分析
  • ECS业务端查询,如Scan一些数据,在客户端展示

物联网大数据

HBase天生适合物联网的场景,比如:单车、物流轨迹类 等等

大数据类

满足安全风控、大数据处理、搜索等等具体的场景,一般跟流式系统、离线系统结合

大数据存储类、包括历史数据存储

存储包括各类数据,比如:日志、订单、交易数据、消息等等,在线实时写入,在实时查询。历史数据查询批量低,需要分层存储,云HBase预计在12月份支持冷热数据分离存储,降低存储成本

实时分析类

 

先领取阿里云1888元优惠券:【一键领取

阿里云数据库rds购买:阿里云数据库HBase版

 

 

发表评论

邮箱地址不会被公开。 必填项已用*标注