-大数据技术课件第4章PPT内容-.docx
《-大数据技术课件第4章PPT内容-.docx》由会员分享,可在线阅读,更多相关《-大数据技术课件第4章PPT内容-.docx(6页珍藏版)》请在第壹文秘上搜索。
1、“大数据技术课件第4章PPT内容“1、大数据技术与应用第4章HDFS分布式文件系统提纲O4.1HDFSe)4.2HDFS操作实践O习题O小结24.1HDFSHadooP分布式文件系统(HadooPDiStribUtedFiIeSyStem,HDFS)是Hadoop项目的核心子项目,它被设计成适合运行在通用硬件(CommOdityhardWare)上的分布式文件系统。34.1HDFSo4.2.1HDFSSheiIHDFS设计的前提和设计目标如下:U(I)硬件错误U流式数据访问U大规模数据集u(4)简洁的全都性模型u(5)移动计算比移动数据更划算u(6)异构软硬件平台间的可移植性但是HDFS也有自
2、2、己的劣势:u低时延长数据访问u小文件存储U并发写入、文件随机修改44.1HDFSo4.2.1HDFSSheIIHDFS设计的前提和设计目标如下:U硬件错误u(2)流式数据访问u(3)大规模数据集u(4)简洁的全都性模型U移动计算比移动数据更划算u(6)异构软硬件平台间的可移植性但是HDFS也有自己的劣势:U低时延长数据访问U小文件存储U并发写入、文件随机修改54.1HDFSo4.1.2Namenode和DatanodeHDFS采纳MaSter/Slave架构。一个HDFS集群是由一个Namenode和肯定数目54的Datane)des组成的3oHDFS暴露了文件系统的名字空间,用户能够以文
3、件的形式在上面存储数据,如下图所示。6图4-1HDFS架构图4-1HDFS架构图4-1HDFS架构图4-1HDFS架构图4-1HDFS架构图4-1HDFS架构图4-1HDFS架构图4-1HDFS架构图4-1HDFS架构HDFSHDFS架构架构o4.1.3文件系统的名字空间IHDFS支持传统的层次型文件组织结构INamenode负责维护文件系统的名字空间INamenode将对文件系统的改动追加保存到本地文件系统上的一个日志文件ISeCOndaryNamenode定期合并fsimage和edits日志,将edits日志文4、件大小掌握在一个限度下。ISecondaryNamenode的检查点进程启
4、动,是由两个配置参数掌握的:U(I)fs.checkpoint.PeriOdU(2)fs.checkpoint.SizeINamenode可以引入这个最新的检查点:u在配置参数dfs.name.dir指定的位置建立一个空文件夹。u(2)把检查点名目的位置赋值给配置参数fs.checkpoint.dirou(3)启动NamenOde,并力口上-importcheckpoint。74.1HDFSu(1)Block的副本放置策略在大多数状况下,副本系数是3,HDFS的存放策略是将一个副本存放在本地机架的节点上,一个副本5、放在同一机架的另一个节点上,最终一个副本放在不同机架的节点上。u(2)副本选择
5、为了降低整体的带宽消耗和读取延时,HDFS会尽量让读取程序读取离它最近的副本。u(3)平安模式Namenode启动后会进入一个称为平安模式的特别状态。处于平安模式的Namenode是不会进行数据块的复制的。u(4)文件系统元数据的长久化Namenode上保存着HDFS的名字空间。对于任何对文件系统元数据产生修改的操作,NamenOde都会使用一种称为EditLOg的事务日志记录下来。84.1HDFSu(5)通讯协议全部的HDFS通讯协议都是建立在TCP/IP协议之上。u(6)健壮性HDFS的主要目标就是即使在出错的6、状况下也要保证数据存储的牢靠性。常见的三种出错状况是:Namenode出错,
6、Datanode出错和网络割裂(networkpartitions)0u(7)磁盘数据错误,心跳检测和重新复制每个Datanode节点周期性地向Namenode发送心跳信号。u(8)集群均衡HDFS的架构支持数据均衡策略。u(9)数据完整性从某个Datanode猎取的数据块有可能是损坏的,损坏可能是由Datanode的存储设备错误、网络错误或者软件bug造成的94.1HDFSu(5)通讯协议全部的HDFS通讯协议都是建立在TCP/IP协议之上。u(6)健壮性HDFS的主要目标就是即使在出错的状况下也要保证数据存储的7、牢靠性。常见的三种出错状况是:Namenode出错,Datanode出错和网
7、络割裂(networkpartitions)ou(7)磁盘数据错误,心跳检测和重新复制每个Datanode节点周期性地向NamenOde发送心跳信号。u(8)集群均衡HDFS的架构支持数据均衡策略。u(9)数据完整性从某个DatanOde猎取的数据块有可能是损坏的,损坏可能是由Datanode的存储设备错误、网络错误或者软件bug造成的104.1HDFSu元数据磁盘错误nFslmage和Editlog是HDFS的核心数据结构。nNamenode是HDFS集群中的单点故障(singlepointoffailur8、e)所在114.1HDFSo4.1.5HDFS读流程如下图所示。124.1HDFS
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 技术 课件 PPT 内容