NoSQL数据库原理第二章NoSQL数据库的基本原理.pptx
《NoSQL数据库原理第二章NoSQL数据库的基本原理.pptx》由会员分享,可在线阅读,更多相关《NoSQL数据库原理第二章NoSQL数据库的基本原理.pptx(60页珍藏版)》请在第壹文秘上搜索。
1、NoSQL数据库原理第2章 NoSQL数据库的基本原理 2 2.1.1 关系模型 (1)实体(Entity):是指现实世界中的具体或抽象的事物。例如:一个学生、一个教师、一门课程等。 (2)属性(Attribute):对实体的特性进行描述,例如学生的学号、班级、姓名等。属性一般要求具有原子性,即不可再分割。属性具有值域和数据类型两种特性。 (3)实体标识符:能够唯一标识一个实体的属性称为实体标识符,例如学生的学号,即数据库实现中的键(key)的概念。 (4)联系(Relation):实体之间的关系,以及实体内部属性之间的关系。第2章 NoSQL数据库的基本原理2.1 关系型数据库的重要机制回顾
2、 3 2.1.1 关系模型 关系模型中的常见特征l 关系模型中具有明确的表结构l 列具有原子性,不可再分割l 列的值域和类型时固定的l 如果某字段出现空值,一般会保留存储空间(NULL),以便今后插入数值 NoSQL可能打破这些特征l NoSQL中可能没有明确的结构l 列可能是复合型的l 列中的内容和类型可能是随意的、无定义的l 不会为空值流出存储空间,可能很难直接插入数值第2章 NoSQL数据库的基本原理2.1 关系型数据库的重要机制回顾 4 2.1.2 关系型数据库的完整性约束 关系模型中的完整性约束l 域完整性:是指对列的值域、类型等进行约束。l 实体完整性:实体集中的每个实体都具有唯一
3、性标识,或者说数据表中的每个元组是可区分的。这意味着数据表中存在不能为空的主属性(即主键)。l 参照完整性:表明表1中的一列A依赖于表2中被参照列的情况。l 用户定义的完整性:用户根据业务逻辑定义的完整性约束。 NoSQL中的完整性约束l 域完整性一般较弱,或不支持l 可能存在主键相同的行,或内容相同但时间戳不同的行等情况,一般不会出现空的主属性l 一般不提供参照完整性,或者外键,因此一般也不支持跨表的关联查询(Join)l 用户定义完整性靠应用程序支持第2章 NoSQL数据库的基本原理2.1 关系型数据库的重要机制回顾 5 2.1.3 关系型数据库的事务机制 事务是关系型数据库最重要的机制之
4、一l 关系型数据库会对并发操作进行控制,防止用户在存取数据时破坏数据的完整性,造成数据错误。l 事务机制可以保障用户定义的一组操作序列作为一个不可分割的整体提交执行,这一组操作要么都执行,要么都不执行,当事务执行成功,我们认为事务被整体“提交”,则所有数据改变均被持久化保存,而当事务在执行中发生错误时,事务会进行“回滚”,返回到事务尚未开始执行的状态。 ACID:原子性(Atomicity)、一致性(Consistency)、隔离性(Isolation)、持久性(Durability)。l ACID是典型的强一致性要求l ACID是大多数NoSQL抛弃的机制,因为无法在分布式环境中保证效率第2
5、章 NoSQL数据库的基本原理2.1 关系型数据库的重要机制回顾 6 2.1.3 关系型数据库的事务机制 并发控制和封锁机制l 并发调度指将多个事务串行化,并发控制则强调解决共享资源并发存取过程中产生的各类问题 丢失更新、幻读、脏读l 封锁是数据库中所采用的常见并发控制。封锁是一种软件机制,使得当某个事务访问某数据对象时,其他事务不能对该数据进行特定的访问。 共享锁、排它锁l 死锁和预防死锁 顺序加锁、超时法、等待图法分布式环境下实现事务和锁,可能出现什么问题?第2章 NoSQL数据库的基本原理2.1 关系型数据库的重要机制回顾 7 2.1.4 关系型数据库的分布式部署 关系型数据库一般部署在
6、单机上,并通过垂直扩展(scale up)方式提升性能 一些关系型数据库也可以实现水平扩展,一般需要通过外部软件、或用户编程等方式实现。l (1)将不同的表存储在不同节点。如果某个表体积过大、或频繁被访问,则其他节点无法提供帮助。l (2)水平分割数据,将表中不同的行存储在不同节点上。在RDBMS中需要保持数据的完整性,插入数据时需要检查所有节点上的数据。索引、锁等机制的维护也较为繁琐。l (3)垂直分割数据,将表中不同的列存储在不同节点上。在大数据场景下,表中的行数可能仍然过多,热点数据可能无法做到负载均衡。也可能遇到和水平分割数据类似的问题。 分布式环境下,数据存储存储在不同节点,此时必须
7、通过网络传递相关消息,如果出现网络故障或部分节点失效,则有可能导致整个系统变得低效或死锁,因此在分布式环境下实现高效率的事务机制、以及强一致性等特性较为困难。 关系型数据库目前也存在多种横向扩展方案l 横向扩展可以提供负载均衡能力,例如:将数据进行垂直节分或水平切分。l 横向扩展可以提供一定的容错能力,例如:采用读写分离机制。 灵活运用上述方案,可以在很多应用场景中解决问题,但是当数据量持续增大时,则可能无法应对。 运用上述方案时,用户可能仍需要进行较多的第2章 NoSQL数据库的基本原理2.1 关系型数据库的重要机制回顾 8 2.1.4 关系型数据库的分布式部署 主从集群(读写分离)l 无法
8、解决写数据的瓶颈,但保持了对单机事务的支持l 读数据时,可以实现一定的负载均衡,提高并发性能,并且可以提供一定的容错机制l 一般来说从服务之间是不共享数据的,每台从服务器都保存全集数据,一般不会进行数据分割l 主从服务器之间可能存在数据不一致的隐患第2章 NoSQL数据库的基本原理2.1 关系型数据库的重要机制回顾利用分发服务器实现主从数据同步例如:Microsoft SQL Server提供了“Database Mirroring”、“log shipping”、发布订阅、“always on”等多种读写分离策略 9第2章 NoSQL数据库的基本原理2.1 关系型数据库的重要机制回顾分布式中
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- NoSQL 数据库 原理 第二 基本原理