DataFusion 查询引擎 Nested Loop Join

2025-01-06

Nested Loop Join 是最通用的一种 join 实现，原理简单，实现容易。

场景

主要用于 On 子句中没有等值连接条件的 Join 运算。例如：表 t0(a int, b int) 和 t1(c int, d int)

select * from t0 join t1 on t0.a > t1.c 有 On 连接条件但非等值条件，走 Nested Loop Join 算子
select * from t0 join t1 没有任何连接条件且是 inner join，走 Cross Join 算子
select * from t0 left join t1 没有任何连接条件，非 inner join，走 Nested Loop Join 算子
select * from t0 join t1 on t0.a > t1.c and t0.b = t1.d 有 On 连接条件且其中包含等值条件，走 Hash Join 或 Sort Merge Join 算子（根据用户配置）

Nested Loop Join 会参与两个物理阶段优化

projection push down：优化器会尝试将 projection 下推到 Nested Loop Join 算子的输入，如果无法下推，会尝试将 projection 嵌入到 Nested Loop Join 算子中

读取左表所有 partition 的数据到内存中，被所有线程共享。

probe 阶段是分 partition 并行执行的，每个线程不断读取对应 partition 的右表数据，与左表数据进行 join。

以如下数据为例，SQL 为 select t0.a, t1.c from t0 full join t1 on t0.a > t1.c

第一步，先构建两个表的行索引的笛卡尔积

第二步，应用 On 条件过滤行索引

第三步，根据 join 类型调整行索引

第四步，根据行索引结合 projection 输出 join 结果。例如 full join，会输出

构建行索引（左表第 0 和第 1 行已匹配，还剩第 2 行未匹配）

左表行索引	右表行索引
2	NULL

根据行索引结合 projection 输出 join 结果

t0.a	t1.c
1	NULL

所以 select t0.a, t1.c from t0 full join t1 on t0.a > t1.c 的最终执行结果是