主流分布式存储技术对比分析.docx
《主流分布式存储技术对比分析.docx》由会员分享,可在线阅读,更多相关《主流分布式存储技术对比分析.docx(8页珍藏版)》请在第壹文秘上搜索。
1、1引言目前市面上各个厂家的分布式存储产品五花八门,但是如果透过产品本身的包装看到其背后的核心技术体系,基本上会分为两种架构.一种是有中心架构的分布式文件系统架构,以GFS、In)FS为代为;另外一种是完全无中心的分布式存储架构,以CePh、SWifI、GlusterFS为代表。对具体分布式存储产品选型的时候,要根据其背后的核心架构来分析它本来的原貌然后才能决定其是否适合我们的具体场景.2主流分布式存储技术对比分析2.1GFS&HDFS客户端姓映射管理节点GFS和HDFS都是基于文件系统实现的分布式存储系统;都是有中心的分布式架构(图2.1);通过对中心节点元数据的索引杳询得到数据地址空间,然后
2、再去数据节点上查询数据本身的机制来完成数据的读写;都是基于文件数据存储场景设计的架构;都是适合顺序写入顺序读取,对随机读写不友好.FiIeNamcFileAddress三数据Fik(FiIJMaP,State&Heathy)文件系统数据节点文件系统数据节点、文件系统,数据节点IS2.1中心化的分布式存储架构接下来,我们来看GFS和HDFS都有哪些具体特性,我们应该如何应用?1.GFS是一种适合大文件尤其是GB级别的大文件存储场景的分布式存储系统.2. GFS非需适合对数据访问延迟不敏惑的搜索引擎服务.3. GFS是一种有中心节点的分布式架构,Master节点是单一的集中管理节点,既是高可用的瓶
3、颈,也是可能出现性能问题的瓶颈.4. GFS可以通过缓存一部分Metadata到Client节点,减少Client与MaSter的交互.5. GFS的Master节点上的OPerationIog和Checkpoint文件需要通过巨制方式保留多个副本,来保障元数据以及中心省理功能的高可用性.相对于GFS来说,我们来看HDFS做了哪些区别?1. HDFS的默认最小存储单元为128M,比GFS的64M更大.2. HDFS不支持文件并发写,对于单个文件它仅允许有一个写或者追加请求.3. HDFS从2.0版本之后支持两个管理节点(NameNode),主备切换可以做到分钟级别.5. HDFS更适合单次写多
4、次读的大文件流式读取的场景.6. HDFS不支持对已写文件的更新操作,仅支持对它的追加操作.2.2GIusterFSGIusterFS虽然是基于文件系统的分布式存描技术,但是它与GFS/HDFS有本质的区别,它是去中心化的无中心分布式架构(图2.2);它是通过对文件全目录的DHT弊法计或得到相应的Brike地址,从而实现对数据的读写;它与Ceph/Swift的架构区别在于它没有集中收集保存集群拓扑结构信息的存储区,因此在做计算的时候,需要遍历整个卷的Brike信息.BrikcInfoOOOifOONodeOOOO工JBrikEI-Nodc图2.2GlusterFS接下来,我们来看GIuster
5、FS都有哪些具体特性,我们应该如何应用?1. GIusterFS是采用无中心对称式架构,没有专用的元数据服务器,也就不存在元数据服务器瓶颈.元数据存在于文件的属性和扩展属性中.2. GIusterFS可以提供Raid0、Raid1、Raidl+0等多种类型存储卷类型。3. GIusterFS采用数据最终一致性算法,只要有一个副本写完就可以Commit.4. GIusterFS默认会将文件切分为128KB的切片然后分布于卷对应的所有Brike当中.所以从其设计初衷来看,更适合大文件并发的场景.5. GIusterFS采用的DHT算法不具备良好的稳定性,一旦存储节点发生增减变化,势必影峋卷下面所有
6、Brike的数据进行再平衡操作,开销比较大.6. GlusterFS文件目录利用扩展属性记录子卷的中brick的hash分布范围,每个brick的范围均不审卷.遍历目录时,需要获取每个文件的属性和扩展属性进行聚合,当目录文件较多时,遍历效率很差.2.3Ceph&Swift我们知道,相对于文件系统的中心架构分布式存储技术,Ceph&Swift都是去中心化的无中心分布式架构(图2.3);他们底层都是对象存储技术;他们都是通过对对象的哈希算法得到相应的Bucket&Node地址,从而实现对数据的读写.叵)客户端算法因子Buckc(sNics寻址算法管理节点(State&Heathy)算法因子O(Z)
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 主流 分布式 存储 技术 对比 分析