阿里云数据库 HBase 版-面向大数据领域的一站式NoSQL服务
VIEW CONTENTS

阿里云数据库 HBase 版-面向大数据领域的一站式NoSQL服务

2020-9-14 14:50| 发布者: xtyly| 查看: 434| 评论: 0
摘要: 云数据库 HBase 版 面向大数据领域的一站式NoSQL服务,100%兼容开源HBase并深度扩展,支持海量数据下的实时存储、高并发吞吐、轻SQL分析、全文检索、时序时空查询等能力,是风控、推荐、广告、物联网、车联网、Feeds ...
阿里云数据库 HBase 版是面向大数据领域的一站式NoSQL服务,100%兼容开源HBase并深度扩展,支持海量数据下的实时存储、高并发吞吐、轻SQL分析、全文检索、时序时空查询等能力,是风控、推荐、广告、物联网、车联网、Feeds流、数据大屏等场景首选数据库,是为淘宝、支付宝、菜鸟等众多阿里核心业务提供关键支撑的数据库。

阿里云HBase是低成本、高扩展、云智能的大数据NoSQL,兼容标准HBase访问协议,提供低成本存储、高扩展吞吐、智能数据处理等核心优势,是为淘宝推荐、花呗风控、广告投放、监控大屏、菜鸟物流轨迹、支付宝账单、手淘消息等众多阿里巴巴核心服务提供支撑的数据库,具备PB规模、千万级并发、秒级伸缩、毫秒响应、跨机房高可用、全托管、全球分布等企业能力

阿里云HBase全面提供海量半结构/非结构化数据下的实时存储、高并发吞吐、轻SQL分析(集成Phoenix)、全文检索(集成Solr)等能力, 结合完备的工具服务,丰富的生态融合,一站式高效满足企业在大数据量场景下的存储、检索、分析需求, 是风控、推荐、广告、物联网、车联网、Feeds流、数据大屏等场景首选数据库。

HBase:最受欢迎的开源大数据存储型数据库之一

hbase

阿里云HBase总览

云HBase总览

阿里云HBase产品架构

云HBase架构

浅析场景

类型存储对象引擎接口代表场景优势
KVkey、valueHBase API社交分发、聊天信息等延迟低、并发高
SQL关系模型Phoenix SQL传统关系型数据库升级存储量大、分布式SQL数据库
表格存储稀疏TableHBase API风控、画像等动态Schema、存储量大
文档存储json、xml、htmlHBase API新闻等存储量大、并发高
对象存储图片、视频等HBase API图片视频存储量大
时序数据时间维度的连续数据OpenTSDB/HBase API传感器、物联网存储量大
时空数据有空间维度\轨迹GeoMesa/HBase API车联网、运动APP等存储量大,写入性能高
全文全文solr/HBase api全文查询吞吐量大

典型的案例

大数据存储分析

广告技术

车联网


与自建HBase开源版对比

云数据库HBase增强版(Lindorm)HBase开源版
核心功能HBase API支持支持
数据模型支持宽列(HBase API)、表格(SQL-Like API)、队列等多种,对其他模型感兴趣的话,可以联系我们仅支持宽列仅支持宽列
SQLJDBC标准,兼容Phoenix,具备更好的稳定性与性能(待发布)通过Phoenix支持通过Phoenix支持
全局二级索引内置,查询透明、高性能、按需冗余非索引列,详情参考高性能原生二级索引依赖外部组件,复杂
全文检索智能集成搜索引擎Solr,提供面向海量数据的存储、多维查询、全文索引等统一访问的混合型能力,详情全文索引服务(Solr)不支持
性能吞吐性能单机吞吐是开源HBase的7倍,详情参考性能白皮书无优化
请求毛刺P99延迟是开源HBase的1/10,详情参考性能白皮书无优化
成本数据压缩深度优化的ZSTD算法,JNA重写,可杜绝Core dump,并且基于字典采样优化,压缩率比snappy提高50%,数据压缩比可高达10:1默认为Snappy,使用ZSTD需依赖Hadoop-3.0,存在Core Dump的概率
编码独家IndexableDelta算法,相比DIFF算法,保持相同压缩率,访问速度快一倍推荐DIFF,随机访问较慢
冷热分离冷热数据自动分层存储,冷数据使用高压缩和廉价存储介质,减少70%成本,热数据可提升访问性能15%,详情参考冷热分离不支持
存储介质支持高效云盘、SSD云盘、本地HDD、本地SSD。独家支持冷存储(OSS)、容量型云盘(超性价比云盘,即将发布)N/A
可靠性主备双活成熟,支持自动容灾切换、双集群请求并发等高级能力,支持与自建HBase构建混合主备,详情参考主备双活无优化,不支持切换
跨机房强一致跨机房部署,支持机房级故障的自动恢复,并保证数据的强一致(待开放)不支持
备份恢复支持100TB+规模的数据备份至OSS,并提供与规模无关的RTO(<30分钟)、按需备份、指定时间点恢复等高级能力,详情参考HBase备份恢复不支持
全球多活支持(待开放,有需要请联系)不支持
MTTR深度优化,宕机恢复速度是开源HBase的10倍不支持
多租户认证与ACL支持易用的账号密码认证+ACL,使用参考链接较复杂
资源隔离支持RS Group功能,实现租户间的资源物理隔离不支持
Quota支持租户独立的全局Quota限流,包括请求、存储等(待开放,有需要请联系)只支持单Server
RPC拦截支持,可限制RPC调用(待开放)不支持
审计计划中不支持
高级功能Feed流API提供社交IM场景专属的FeedStream功能,开发效率和运行性能提升一个数量级(待开放,有需要请联系)不支持
表回收站数据表被删除后进入回收站,支持找回,防止误删(待开放,有需要请联系)不支持
级联SplitRegion可以连续Split,无需等待Compaction,可大幅提升扩展和负载均衡能力(待开放,有需要请联系)不支持
离散TTL支持保留多个时间区段的数据,比如数据保留90天,同时11.11的数据永久保留(待开放,有需要请联系)不支持
运维诊断运维工具界面化集群管理工具,支持表,Namespace,Group,ACL等管理,详见集群管理系统HBase Shell
数据查询HBase Shell+集群管理系统内支持图形化SQL交互查询,详见数据查询HBase Shell
系统诊断支持常见问题(热点/慢请求)的系统自诊断(待开放)不支持
生态数据搬迁支持HBase各个版本之间的在线、跨版本、自动化、高效搬迁,应用零影响、零改造,详见BDS服务介绍只能离线迁移
MySQL数据同步通过BDS服务介绍,支持Mysql数据到HBase的全量同步在线实时同步自己用工具、不支持在线增量
Spark分析产品化深度集成,支持Spark SQL分析HBase,HBase数据到Spark(HDFS/OSS)的增量归档,离线分析结果回流到HBase等无优化,数据集成需要较大开发
MaxCompute产品化集成,支持增量归档数据集成需要较大开发
日志服务(SLS)通过BDS服务介绍,支持SLS数据到HBase的在线实时同步数据集成需要较大开发
服务能力可用性SLA提供SLA保障,单集群99.9%,双集群高可用99.99%N/A
运维成本全托管,无需复杂的数据库运维投入N/A
技术团队由多名Apache社区PMC&Committer组成的专家队伍提供技术服务支持N/A
实践经验支持9年天猫双十一,阿里部署上万台N/A

与传统数据库对比


路过

雷人

握手

鲜花

鸡蛋
腾讯云服务器优惠

相关阅读

最新评论




在线客服(工作时间:9:00-22:00)
400-600-6565

内容导航

微信客服

Copyright   ©2015-2019  云服务器社区  Powered by©Discuz!  技术支持:尊托网络     ( 湘ICP备15009499号-1 )