阿里二面差点败在这道题:MySQL自增主键为何不是连续的呢?

面试官:"MySQL主键你一般怎样用?"

心想:"嘿嘿,面试官肯定想问InnoDB引擎索引特性相关知识!“

小龙:”平时主键我一般用自增主键!因为自增ID有序,会按顺序往最后插入,而UUID无序,随机生成,随机插入,会造成频繁页分裂内存碎片化,大量随机IO,巴拉巴拉。。。。“

心想:“这波稳啦!“

然后,面试官又来一套组合拳

面试官:”en!好,那你知道自增主键是否严格递增呢?“

心想:”这还不简单,肯定递增啊!不对,仔细一想,有一些情况下自增主键是断开的,于是“

小龙:“‘肯定不是递增的啊!"

以为到这里结束啦,只是考考我是否实际真正用过,没想到还是天真啦!

面试官:”那你知道为啥不是严格递增的吗?换句话来说,为何不是连续的?“

小龙:”裂开!tm还真不知道,不会真要考那么底层吧!我去“

于是骂骂咧咧结束了这个话题!

但是由于其他问题回答的也可以,还是过啦!

不过,既然遇到啦这个问题,下来查阅了资料,还是想分享给大家!


1、前文

众所周知,由于自增主键可以让主键索引尽量地保持递增顺序插入,避免了页分裂,大量的随机IO。自增主键不连续。

这是大家已经熟知的知识点,但是,可能也有大部分朋友和之前的小龙一样不知道为何自增主键不是严格递增的?

今天这篇文章,我们就来说说这个问题,看看什么情况下自增主键会出现 “断层”?

为了更加形象,这里创建一个表xl_tb,其中id是自增主键字段、a是唯一索引,然后插入一条数据,我们再查看它的表结构。

CREATE TABLE `NewTable` (
`id`  int(11) NOT NULL AUTO_INCREMENT ,
`a`  int(11) NULL ,
`b`  int(11) NULL ,
PRIMARY KEY (`id`),
UNIQUE INDEX `a` (`a`) USING BTREE 
);
insert into xl_tb values(null, 1, 1)
mysql> show create table xl_tbG;
*************************** 1. row ***************************
       Table: xl_tb
Create Table: CREATE TABLE `xl_tb` (
  `id` int(11) NOT NULL AUTO_INCREMENT,
  `a` int(11) DEFAULT NULL,
  `b` int(11) DEFAULT NULL,
  PRIMARY KEY (`id`),
  UNIQUE KEY `a` (`a`) USING BTREE
) ENGINE=InnoDB AUTO_INCREMENT=4 DEFAULT CHARSET=utf8
1 row in set (0.04 sec)

可以看到,表定义里面出现了一个AUTO_INCREMENT=4,表示下一次插入数据时,如果需要自动生成自增值,会生成id=4。

大家也可以自己手动试试!

但是,看到这里,可能有朋友以为自增值存在表结构里吧!哈哈,你这样想就有错啦!

2、自增主键为何不连续

2.1、自增主键存储策略

接下来,我们一起看看自增值保存在哪里吧!

其实,不同的存储引擎,自增值保存策略不一样的。

理解了MySQL对自增值的保存策略以后,我们再看看自增值修改机制。

2.2、自增值修改机制

  1. 如果插入数据时id字段指定为0、null 或未指定值,那么就把这个表当前的 AUTO_INCREMENT值填到自增字段;
  2. 如果插入数据时id字段指定了具体的值,就直接使用语句里指定的值。

2.3、自增值新增机制

  1. 如果准备插入的值>=当前自增值,新的自增值就是“准备插入的值+1”;
  2. 否则,自增值不变。

2.4、自增值的修改时机

eg:

假设,表xl_tb里面已经有了(1,1,1)这条记录,这时我再执行一条插入数据命令:

insert into t values(null, 1, 1); (自增id,唯一键a,普通字段b)

这个语句的执行流程就是:

  1. 执行器调用InnoDB引擎接口写入一行,传入的这一行的值是(0,1,1);
  2. InnoDB发现用户没有指定自增id的值,获取表xl_tb当前的自增值4;
  3. 将传入的行的值改成(4,1,1);
  4. 将表的自增值改成5;
  5. 继续执行插入数据操作,由于已经存在a=1的记录,所以报Duplicate key error,语句返回。

这个表的自增值改成5,是在真正执行插入数据的操作之前。这个语句真正执行的时候,因为碰到唯一键a冲突,所以id=2这一行并没有插入成功,但也没有将自增值再改回去。

所以,在这之后,再插入新的数据行时,拿到的自增id就是5。也就是说,出现了自增主键不连续的情况。因此,唯一键冲突是导致自增主键id不连续的第一种原因

同样地,事务回滚也会产生类似的现象,这就是第二种原因

这时,你可能会想,为什么在出现唯一键冲突或者回滚的时候,MySQL没有把表xl_tb的自增值改回去呢?如果把表xl_tb的当前自增值从5改回4,再插入新数据的时候,不就可以生成id=2的一行数据了吗?

那么,接下来跟着我的思路来看看,为何不让自增主键后退吧!

首先,我们假设有两个并行执行的事务A、B,在申请自增值的时候,为了避免两个事务申请到相同的自增id,肯定要加锁,然后顺序申请。

阿里二面差点败在这道题:MySQL自增主键为何不是连续的呢?

那怎样解决呢?

虽然这两种方法可以解决,但是无疑性能极低。

于是,便让自增值不能回退,而避免造成主键冲突等问题。(也许还有其他问题我没有想到)


3、总结

为什么自增主键不连续?

展开阅读全文

页面更新:2024-04-25

标签:阿里   字段   小龙   语句   持久   顺序   冲突   事务   版本   引擎   数据

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2008-2024 All Rights Reserved. Powered By bs178.com 闽ICP备11008920号-3
闽公网安备35020302034844号

Top