深入MySQL的join查询

JooKS 收录于 DB类

2021-04-03 约 741 字预计阅读 2 分钟

MySQL的join有三种算法，NLJ, BNL, BKA(MySQL 5.6引入)

Index Nested-Loop Join，简称NLJ：

在被驱动表有索引时，会执行NLJ算法，当执行join语句时，

MySQL 5.6的时候引入了Batched Key Access(BKA)算法，对NLJ进行了优化，BKA的原理跟MRR类似，就是在查询被驱动表走索引之前，先对索引字段进行排序，按顺序走索引，减少磁盘IO。

BKA是先把驱动表的符合要求的数据行读进 join_buffer里面，排序后再拿进被驱动表查询。

Block Nested-Loop Join，简称BNL：

在被驱动表无索引时，会执行BNL算法，当执行join语句时，

BNL因为要在内存中将被驱动表的数据与join_buffer中的数据逐个判断，使得其效率非常低。

优化手段：

直接给被驱动表加上合适的索引，走BKA算法；
如果这个join操作并不经常使用，会使得上面建立的索引性价比比较低，因此建立一个临时表，将被驱动表写入临时表，提前过滤数据，然后加上索引，走BKA算法。
BNL算法对join_buffer做N次扫描的操作存在较大缺陷，一个很好的思路就是将驱动表中的数据以哈希表的形式存在join_buffer中，而不是无序数组。但MySQL官方一直没有做这个优化，于是我们可以在业务端来模拟，可以极大降低被驱动表无索引时的开销。

目录