MySQL中基于WRITESET的并行复制方式是什么

2025-03-13 技术教程

本篇内容主要讲解“MySQL中基于WRITESET的并行复制方式是什么”，感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷，实用性强。下面就让小编来带大家学习“MySQL中基于WRITESET的并行复制方式是什么”吧!

一、奇怪的last commit

我们先来看一个截图，仔细观察其中的last commit：

我们可以看到其中的last commit看起来是乱序的，这种情况在基于COMMIT_ORDER 的并行复制方式下是不可能出现的。实际上它就是我们前面说的基于WRITESET的并行复制再尽可能降低的last commit的结果。这种情况会在MTS从库获得更好的并行回放效果，第19节将会详细解释并行判定的标准。

二、Writeset是什么

实际上Writeset是一个集合，使用的是C++ STL中的set容器，在类Rpl_transaction_write_set_ctx中包含了如下定义：

std::set<uint64>write_set_unique;

集合中的每一个元素都是hash值，这个hash值和我们的transaction_write_set_extraction参数指定的算法有关，其来源就是行数据的主键和唯一键。每行数据包含了两种格式：

字段值为二进制格式

字段值为字符串格式

每行数据的具体格式为：

主键/唯一键名称分隔符库名分隔符库名长度表名分隔符表名长度键字段1分隔符长度键字段2分隔符长度其他字段…

在Innodb层修改一行数据之后会将这上面的格式的数据进行hash后写入到Writeset中。可以参考函数add_pke，后面我也会以伪代码的方式给出部分流程。

但是需要注意一个事务的所有的行数据的hash值都要写入到一个Writeset。如果修改的行比较多那么可能需要更多内存来存储这些hash值。虽然8字节比较小，但是如果一个事务修改的行很多，那么还是需要消耗较多的内存资源的。

为了更直观的观察到这种数据格式，可以使用debug的方式获取。下面我们来看一下。

三、Writeset的生成

我们使用如下表：

mysql>usetestDatabasechangedmysql>showcreatetablejj10\G***************************1.row***************************Table:jj10CreateTable:CREATETABLE`jj10`(`id1`int(11)DEFAULTNULL,`id2`int(11)DEFAULTNULL,`id3`int(11)NOTNULL,PRIMARYKEY(`id3`),UNIQUEKEY`id1`(`id1`),KEY`id2`(`id2`))ENGINE=InnoDBDEFAULTCHARSET=latin11rowinset(0.00sec)

我们写入一行数据：

insertintojj10values(36,36,36);

这一行数据一共会生成4个元素分别为：

注意：这里显示的?是分隔符

1. 主键二进制格式

(gdb)ppke$1="PRIMARY?test?4jj10?4\200\000\000$?4"**注意：\200\000\000$：为3个八进制字节和ASCII字符$，其转换为16进制就是“0X80000024”**

分解为：

主键名称分隔符库名分隔符库名长度表名分隔符表名长度主键字段1分隔符长度PRIMARY?test?4jj10?40x80 00 00 24?42. 主键字符串格式：

(gdb)ppke$2="PRIMARY?test?4jj10?436?2"

分解为：
| 主键名称 | 分隔符 | 库名 | 分隔符 |库名长度 | 表名 |分隔符|表名长度|主键字段1|分隔符|长度 |
| ——— | ——— | ——— | ——— | ——— | ——— | ——— | ——— | ——— |——— |———|
| PRIMARY |?| test|?|4|jj10|?|4|36 | ?|2|

3. 唯一键二进制格式

(gdb)ppke$3="id1?test?4jj10?4\200\000\000$?4"

解析同上

4. 唯一键字符串格式：

(gdb)ppke$4="id1?test?4jj10?436?2"

解析同上

最终这些数据会通过hash算法后写入到Writeset中。

四、函数add_pke的大概流程

下面是一段伪代码，用来描述这种生成过程：

如果表中存在索引：将数据库名，表名信息写入临时变量循环扫描表中每个索引：如果不是唯一索引：退出本次循环继续循环。循环两种生成数据的方式(二进制格式和字符串格式)：将索引名字写入到pke中。将临时变量信息写入到pke中。循环扫描索引中的每一个字段：将每一个字段的信息写入到pke中。如果字段扫描完成：将pke生成hash值并且写入到写集合中。如果没有找到主键或者唯一键记录一个标记，后面通过这个标记来判定是否使用Writeset的并行复制方式五、Writeset设置对last commit的处理方式

前一节我们讨论了基于ORDER_COMMIT的并行复制是如何生成last_commit和seq number的。实际上基于WRITESET的并行复制方式只是在ORDER_COMMIT的基础上对last_commit做更进一步处理，并不影响原有的ORDER_COMMIT逻辑，因此如果要回退到ORDER_COMMIT逻辑非常方便。可以参考MYSQL_BIN_LOG::write_gtid函数。

根据binlog_transaction_dependency_tracking取值的不同会做进一步的处理，如下：

ORDER_COMMIT：调用m_commit_order.get_dependency函数。这是前面我们讨论的方式。

WRITESET：调用m_commit_order.get_dependency函数，然后调用m_writeset.get_dependency。可以看到m_writeset.get_dependency函数会对原有的last commit做处理。

WRITESET_SESSION：调用m_commit_order.get_dependency函数，然后调用m_writeset.get_dependency再调用m_writeset_session.get_dependency。m_writeset_session.get_dependency会对last commit再次做处理。

这段描述的代码对应：

caseDEPENDENCY_TRACKING_COMMIT_ORDER:m_commit_order.get_dependency(thd,sequence_number,commit_parent);break;caseDEPENDENCY_TRACKING_WRITESET:m_commit_order.get_dependency(thd,sequence_number,commit_parent);m_writeset.get_dependency(thd,sequence_number,commit_parent);break;caseDEPENDENCY_TRACKING_WRITESET_SESSION:m_commit_order.get_dependency(thd,sequence_number,commit_parent);m_writeset.get_dependency(thd,sequence_number,commit_parent);m_writeset_session.get_dependency(thd,sequence_number,commit_parent);break;六、Writeset的历史MAP

我们到这里已经讨论了Writeset是什么，也已经说过如果要降低last commit的值我们需要通过对事务的Writeset和Writeset的历史MAP进行比对，看是否冲突才能决定降低为什么值。那么必须在内存中保存一份这样的一个历史MAP才行。在源码中使用如下方式定义：

/*Trackthelasttransactionsequencenumberthatchangedeachrowinthedatabase,usingrowhashesfromthewritesetastheindex.*/typedefstd::map<uint64,int64>Writeset_history;//map实现Writeset_historym_writeset_history;

我们可以看到这是C++ STL中的map容器，它包含两个元素：

Writeset的hash值

最新一次本行数据修改事务的seq number

它是按照Writeset的hash值进行排序的。

其次内存中还维护一个叫做m_writeset_history_start的值，用于记录Writeset的历史MAP中最早事务的seq number。如果Writeset的历史MAP满了就会清理这个历史MAP然后将本事务的seq number写入m_writeset_history_start，作为最早的seq number。后面会看到对于事务last commit的值的修改总是从这个值开始然后进行比较判断修改的，如果在Writeset的历史MAP中没有找到冲突那么直接设置last commit为这个m_writeset_history_start值即可。下面是清理Writeset历史MAP的代码：

if(exceeds_capacity||!can_use_writesets)//Writeset的历史MAP已满{m_writeset_history_start=sequence_number;//如果超过最大设置，清空writesethistory。从当前seqnumber重新记录，也就是最小的那个事务seqnumberm_writeset_history.clear();//清空历史MAP}七、Writeset的并行复制对last commit的处理流程

这里介绍一下整个处理的过程，假设如下：

当前通过基于ORDER_COMMIT的并行复制方式后，构造出来的是（last commit=125，seq number=130）。

本事务修改了4条数据，我分别使用ROW1/ROW7/ROW6/ROW10代表。

表只包含主键没有唯一键，并且我的图中只保留行数据的二进制格式的hash值，而没有包含数据的字符串格式的hash值。

初始化情况如下图（图16-1，高清原图包含在文末原图中）：

第一步设置last commit为writeset_history_start的值也就是100。

第二步 ROW1.HASHVAL在Writeset历史MAP中查找，找到冲突的行ROW1.HASHVAL将历史MAP中这行数据的seq number更改为130。同时设置last commit为120。

第三步 ROW7.HASHVAL在Writeset历史MAP中查找，找到冲突的行ROW7.HASHVAL将Writeset历史MAP中这行数据的seq number更改为130。由于历史MAP中对应的seq number为114，小于120不做更改。last commit依旧为120。

第四步 ROW6.HASHVAL在Writeset历史MAP中查找，找到冲突的行ROW6.HASHVAL将Writeset历史MAP中这行数据的seq number更改为130。由于历史MAP中对应的seq number为105，小于120不做更改。last commit依旧为120。

第五步 ROW10.HASHVAL在Writeset历史MAP中查找，没有找到冲突的行，因此需要将这一行插入到Writeset历史MAP中查找（需要判断是否导致历史MAP占满，如果占满则不需要插入，后面随即要清理掉）。即要将ROW10.HASHVAL和seq number=130插入到Writeset历史MAP中。

整个过程结束。last commit由以前的130降低为120，目的达到了。实际上我们可以看出Writeset历史MAP就相当于保存了一段时间以来修改行的快照，如果保证本次事务修改的数据在这段时间内没有冲突，那么显然是可以在从库并行执行的。last commit降低后如下图（图16-2，高清原图包含在文末原图中）：

整个逻辑就在函数Writeset_trx_dependency_tracker::get_dependency中，下面是一些关键代码，代码稍多：

if(can_use_writesets)//如果能够使用writeset方式{/*Checkifaddingthistransactionexceedsthecapacityofthewritesethistory.Ifthathappens,m_writeset_historywillbeclearedonlyafter而add_pkeusingitsinformationforcurrenttransaction.*/exceeds_capacity=m_writeset_history.size()+writeset->size()>m_opt_max_history_size;//如果大于参数binlog_transaction_dependency_history_size设置清理标记/*Computethegreatestsequence_numberamongallconflictsandaddthetransaction'srowhashestothehistory.*/int64last_parent=m_writeset_history_start;//临时变量，首先设置为最小的一个seqnumberfor(std::set<uint64>::iteratorit=writeset->begin();it!=writeset->end();++it)//循环每一个Writeset中的每一个元素{Writeset_history::iteratorhst=m_writeset_history.find(*it);//是否在writesethistory中已经存在了。map中的元素是key是writeset值是sequencenumberif(hst!=m_writeset_history.end())//如果存在{if(hst->second>last_parent&&hst->second<sequence_number)last_parent=hst->second;//如果已经大于了不需要设置hst->second=sequence_number;//更改这行记录的sequence_number}else{if(!exceeds_capacity)m_writeset_history.insert(std::pair<uint64,int64>(*it,sequence_number));//没有冲突则插入。}}......if(!write_set_ctx->get_has_missing_keys())//如果没有主键和唯一键那么不更改lastcommit{/*TheWRITESETcommit_parentthenbecomestheminimumoflargestparentfoundusingthehashesoftherowtouchedbythetransactionandthecommitparentcalculatedwithCOMMIT_ORDER.*/；commit_parent=std::min(last_parent,commit_parent);//这里对lastcommit做更改了。降低他的lastcommit}}}}if(exceeds_capacity||!can_use_writesets){m_writeset_history_start=sequence_number;//如果超过最大设置清空writesethistory。从当前sequence重新记录也就是最小的那个事务seqnucenumberm_writeset_history.clear();//清空真个MAP}八、WRITESET_SESSION的方式

前面说过这种方式就是在WRITESET的基础上继续处理，实际上它的含义就是同一个session的事务不允许在从库并行回放。代码很简单，如下：

int64session_parent=thd->rpl_thd_ctx.dependency_tracker_ctx().get_last_session_sequence_number();//取本session的上一次事务的seqnumberif(session_parent!=0&&session_parent<sequence_number)//如果本session已经做过事务并且本次当前的seqnumber大于上一次的seqnumbercommit_parent=std::max(commit_parent,session_parent);//说明这个session做过多次事务不允许并发，修改为order_commit生成的lastcommitthd->rpl_thd_ctx.dependency_tracker_ctx().set_last_session_sequence_number(sequence_number);//设置session_parent的值为本次seqnumber的值

经过这个操作后，我们发现这种情况最后last commit恢复成了ORDER_COMMIT的方式。

九、关于binlog_transaction_dependency_history_size参数说明

本参数默认值为25000。代表的是我们说的Writeset历史MAP中元素的个数。如前面分析的Writeset生成过程中修改一行数据可能会生成多个HASH值，因此这个值还不能完全等待于修改的行数，可以理解为如下：

binlog_transaction_dependency_history_size/2=修改的行数 * （1+唯一键个数）

我们通过前面的分析可以发现如果这个值越大那么在Writeset历史MAP中能容下的元素也就越多，生成的last commit就可能更加精确（更加小），从库并发的效率也就可能越高。但是我们需要注意设置越大相应的内存需求也就越高了。

十、没有主键的情况

实际上在函数add_pke中就会判断是否有主键或者唯一键，如果存在唯一键也是可以。Writeset中存储了唯一键的行数据hash值。参考函数add_pke，下面是判断：

if(!((table->key_info[key_number].flags&(HA_NOSAME))==HA_NOSAME))//跳过非唯一的KEYcontinue;

如果没有主键或者唯一键那么下面语句将被触发：

if(writeset_hashes_added==0)ws_ctx->set_has_missing_keys();

然后我们在生成last commit会判断这个设置如下：

if(!write_set_ctx->get_has_missing_keys())//如果没有主键和唯一键那么不更改lastcommit{/*TheWRITESETcommit_parentthenbecomestheminimumoflargestparentfoundusingthehashesoftherowtouchedbythetransactionandthecommitparentcalculatedwithCOMMIT_ORDER.*/；commit_parent=std::min(last_parent,commit_parent);//这里对lastcommit做更改了。降低他的lastcommit}}

因此没有主键可以使用唯一键，如果都没有的话WRITESET设置就不会生效回退到老的ORDER_COMMIT方式。

十一、为什么同一个session执行的事务也能生成同样的last commit

有了前面的基础，我们就很容易解释这种现象了。其主要原因就是Writeset的历史MAP的存在，只要这些事务修改的行没有冲突，也就是主键/唯一键不相同，那么在基于WRITESET的并行复制方式中就可以存在这种现象，但是如果binlog_transaction_dependency_tracking设置为WRITESET_SESSION则不会出现这种现象。

到此，相信大家对“MySQL中基于WRITESET的并行复制方式是什么”有了更深的了解，不妨来实际操作一番吧！这里是亿速云网站，更多相关内容可以进入相关频道进行查询，关注我们，继续学习！