博客
关于我
《Mysql是怎样运行的》读书笔记四
阅读量:810 次
发布时间:2019-03-24

本文共 949 字,大约阅读时间需要 3 分钟。

MySQL的InnoDB存储引擎以页面为基本读写单位,记录数据以.page结尾。作为常用的事务型数据库引擎,InnoDB具有持久化特性,即使服务器关闭数据也不会丢失。为了高效管理数据,InnoDB采用了行存储格式,其中COMPACT是最基础的行格式之一。以下将详细介绍COMPACT行格式的存储原理。

记录的组成结构

一条记录可以分为三个主要部分:额外信息、记录头信息和真实数据。这些部分共同构成记录存储在磁盘上的结构。

1. 记录的额外信息

(1) 变长字段长度列表

InnoDB行存储在磁盘上时,需要处理那些长度不固定(如VARCHAR、TEXT等变长字段)的数据。为了记录这些字段所占空间,COMPACT行格式采用了一个变长字段长度列表,该列表位于记录的开头部分。列表中的每个值代表相应变长字段所占用的字节数,存储顺序为列的访问顺序逆序排列。

例如:

  • 列1变长字段长度为100字节
  • 列2变长字段长度为150字节
  • 列3变长字段长度为200字节

(2) NULL值列表

InnoDB记录中某些列可能存在NULL值,以优化存储和查询效率,NULL值列表用于记录哪些列存在NULL值。该列表的存储方式采用位操作:

  • 每一个位代表一列
    • 位值为1:表示该列的值为NULL
    • 位值为0:表示该列的值不为NULL
  • 所需二进制位的字节数由记录中允许存储NULL值的列数量决定。如果二进制位数不足一个字节,高位补充0。

(3) 记录头信息

记录头由5个固定的字节组成,主要用于描述记录的存储属性和管理信息。这些字节包含以下内容:

  • 行格式类型(如COMPACT)
  • 是否存在Sort_key列(用于索引排序)
  • 行长度(固定大小或动态扩展)

2. 记录的真实数据

CPACT行格式的真实数据部分存储了定义的列及其对应的值,除此之外,InnoDB还为每条记录默认增加了以下隐藏列:

  • row_id: 行唯一标识符,6字节(用于唯一标识记录)
  • trx_id: 事务唯一标识符,6字节(用于标记当前记录所参与的事务)
  • roll_pointer: 事务回滚指针,7字节(用于记录回滚操作的位置)

通过上述结构,InnoDB能够高效地存储和管理各种数据类型,确保数据一致性和完整性。理解这些存储机制有助于优化数据库性能和磁盘使用效率。

转载地址:http://auhkk.baihongyu.com/

你可能感兴趣的文章
Pandas - 按列分组并将数据转换为 numpy 数组
查看>>
Pandas - 按日期对日内时间序列进行分组
查看>>
Pandas - 有条件的删除重复项
查看>>
pandas -按连续日期时间段分组
查看>>
pandas -更改重新采样的时间序列的开始和结束日期
查看>>
SpringBoot+Vue+Redis前后端分离家具商城平台系统(源码+论文初稿直接运行《精品毕设》)15主要设计:用户登录、注册、商城分类、商品浏览、查看、购物车、订单、支付、以及后台的管理
查看>>
pandas :to_excel() float_format
查看>>
pandas :从数据透视表中的另一列中减去一列
查看>>
pandas :加入有条件的数据框
查看>>
pandas :将多列汇总为一列,没有最后一列
查看>>
pandas :将时间戳转换为 datetime.date
查看>>
pandas :将行取消堆叠到新列中
查看>>
pandas :设置编号.最大行数
查看>>
pandas DataFrame 中的自定义浮点格式
查看>>
Pandas DataFrame 的 describe()方法详解-ChatGPT4o作答
查看>>
Pandas DataFrame中删除列级的方法链接解决方案
查看>>
Pandas DataFrame中的列从浮点数输出到货币(负值)
查看>>
Pandas DataFrame中的列从浮点数输出到货币(负值)
查看>>
Pandas DataFrame多索引透视表-删除空头和轴行
查看>>
pandas DataFrame的一些操作
查看>>