博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
HBase是什么?为什么要使用HBase?
阅读量:6936 次
发布时间:2019-06-27

本文共 819 字,大约阅读时间需要 2 分钟。

hot3.png

 

HBase是什么? 

HBase是Apache Hadoop中的一个子项目,Hbase依托于Hadoop的HDFS作为最基本存储基础单元,通过使用hadoop的DFS工具就可以看到这些这些数据 存储文件夹的结构,还可以通过Map/Reduce的框架(算法)对HBase进行操作,如右侧的图所示:
http://niaklq.bay.livefilestore.com/y1pG0dfN--ZmWUPjevQkIGp0CsXxWQQ6tyzYR-XAsrWWAJYHtvcdtxk0tIK66x8N_1TKj1CO79xLljO32yk0KvLiNi7GAAaa2Lm/storage-hbase-m.png?psid=1
HBase在产品中还包含了Jetty,在HBase启动时采用嵌入式的方式来启动Jetty,因此可以通过web界面对HBase进行管理和查看当前运行的一些状态,非常轻巧。

 

为什么采用HBase

HBase 不同于一般的关系数据库,它是一个适合于非结构化数据存储的数据库.所谓非结构化数据存储就是说HBase是基于列的而不是基于行的模式,这样方面读写你的大数据内容。

HBase是介于Map Entry(key & value)和DB Row之间的一种数据存储方式。就点有点类似于现在流行的Memcache,但不仅仅是简单的一个key对应一个 value,你很可能需要存储多个属性的数据结构,但没有传统数据库表中那么多的关联关系,这就是所谓的松散数据。

简单来说,你在HBase中的表创建的可以看做是一张很大的表,而这个表的属性可以根据需求去动态增加,在HBase中没有表与表之间关联查询。你只需要 告诉你的数据存储到Hbase的那个column families 就可以了,不需要指定它的具体类型:char,varchar,int,tinyint,text等等。但是你需要注意HBase中不包含事务此类的功 能。

Apache HBase 和Google Bigtable 有非常相似的地方,一个数据行拥有一个可选择的键和任意数量的列。表是疏松的存储的,因此用户可以给行定义各种不同的列,对于这样的功能在大项目中非常实用,可以简化设计和升级的成本。

 

转载于:https://my.oschina.net/u/814844/blog/112621

你可能感兴趣的文章
第一次写自己的博客
查看>>
windows查看端口占用 windows端口占用 查找端口占用程序 强制结束端口占用 查看某个端口被占用的解决方法 如何查看Windows下端口占用情况...
查看>>
JavaScript判断是否是手机mobile登录
查看>>
[转载]javascript创建对象的几种方式
查看>>
经典排序算法 - 鸽巢排序Pigeonhole sort
查看>>
angularJs的学习笔记
查看>>
Zabbix poller processes more than 75% busy
查看>>
Html引入百度富文本编辑器ueditor
查看>>
CSS:<link>标签rel和media的解释(转)
查看>>
Python与Cisco的事儿之四
查看>>
kali用Squid简单配置搭建http代理服务器
查看>>
定时备份MySQL数据库
查看>>
redmine 2.2.x 修改文档附件的存放目录
查看>>
幸福街的博客开通了
查看>>
薛老师软考高项学员:2016年4月27日作业
查看>>
我的友情链接
查看>>
tomcat jvm调优
查看>>
【坐在马桶上看算法】排序总结:小哼买书
查看>>
我的友情链接
查看>>
阿里巴巴开源项目: 基于mysql数据库binlog的增量订阅&消费
查看>>