京东二面:假如SQL中join了10张表,如何优化性能?
2026/6/25 13:01:07 网站建设 项目流程

用这3步锁定瓶颈

当发现一条10表JOIN的SQL很慢时,千万别直接改SQL,而是按下面流程逐步定位:

1.1 使用EXPLAIN分析执行计划

执行EXPLAIN查看每条关联的访问类型。重点关注:

  • type列:出现ALL(全表扫描)、index(全索引扫描)需要优化;理想是refeq_refconst
  • rows列:估算扫描行数,明显偏大的表考虑加索引。
  • Extra列:出现Using temporary(使用临时表)、Using filesort(文件排序)是性能大敌。

示例:一条ordersjoinusersjoinproducts的SQL

EXPLAIN SELECT o.id, o.amount, u.name, p.title FROM orders o JOIN users u ON o.user_id = u.id JOIN products p ON o.product_id = p.id WHERE o.status = 'PAID';

如果EXPLAIN显示users表的type=ALL,说明user_id没有索引——这是最直接的优化点。

1.2 查看真实SQL执行时间分布

SET profiling = 1; -- 执行你的慢SQL SELECT ...; SHOW PROFILES; SHOW PROFILE FOR QUERY 1;

结果会显示每个阶段(sending data、creating sort index等)的耗时,帮你判断是IO瓶颈还是CPU/排序瓶颈。

1.3 检查数据库参数配置

  • join_buffer_size:太小会导致多次扫描。
  • tmp_table_size/max_heap_table_size:太大会导致磁盘临时表。
  • innodb_buffer_pool_size:是否足够容纳热数据。

二、为什么join 10张表会慢?

MySQL(InnoDB)中,多表JOIN默认采用Nested Loop Join:从第一张表(驱动表)取出一行,然后循环去下一张表匹配;重复这个过程直到所有表关联完。

时间复杂度 ≈扫描驱动表行数 × 每张关联表索引扫描成本

若驱动表有10万行,每张关联表索引扫描成本为1ms,10张表总成本 = 10万 × (10 × 1ms) = 1000秒。

如果MySQL选择Hash Join(MySQL 8.0.18引入)且所有关联条件都能用上索引,性能会大幅提升,但仍受限于内存和构建哈希表的开销。

三、从SQL到架构的7种武器

下面从低成本、易改动的SQL层高成本、长效的架构层,逐级给出具体解决方案,每一种都配完整的示例代码。

武器一:索引优化(最立竿见影)

确保每个ONWHERE条件中的列都有索引。

对于LEFT JOIN,右表关联列必须索引。联合索引要遵循最左前缀原则。

示例:原SQL

SELECT o.order_no, u.name, p.product_name, c.category_name FROM orders o JOIN users u ON o.user_id = u.id JOIN products p ON o.product_id = p.id JOIN categories c ON p.category_id = c.id WHERE o.create_time > '2026-01-01' AND u.vip_level > 2 AND c.status = 'ACTIVE';

排查方法EXPLAIN发现orders表没有用到create_time索引,users表使用全表扫描。

优化方案

-- 给orders表加复合索引 ALTER TABLE orders ADD INDEX idx_create_user (create_time, user_id); -- 给users表加索引 ALTER TABLE users ADD INDEX idx_vip (vip_level); -- 给categories表加索引 ALTER TABLE categories ADD INDEX idx_status (status);

这样每个关联都能使用索引,从全表扫描变为refrange访问。

优点:简单直接,对业务代码零侵入。
缺点:索引过多会影响写入性能,需权衡。
适用场景:关联列选择性好,即重复值少。

武器二:调整JOIN顺序

让小表驱动大表。

Nested Loop Join中,驱动表的行数决定了循环次数。

让结果集最小的表做驱动表。

示例:订单表1000万行,用户黑名单表只有100行。查询“黑名单用户的订单”:

-- 原SQL:可能以大表orders驱动 SELECT o.* FROM orders o JOIN blacklist b ON o.user_id = b.user_id;

优化方案:通过STRAIGHT_JOIN强制小表驱动

SELECT STRAIGHT_JOIN o.* FROM blacklist b JOIN orders o ON b.user_id = o.user_id;

验证:使用EXPLAIN查看第一行是否为blacklist(rows≈100)。

优点:不改变业务逻辑,仅调整顺序。
缺点:需要了解数据分布,不恰当使用可能反而变慢。
适用场景:驱动表与关联表数据量悬殊明显。

武器三:拆分JOIN + 应用层组装

当10张表关联只是为了展示一个列表,且数据量不是天文数字时,可以在Java代码中分批查询,再用Stream合并。

示例:查询订单列表,需要关联用户、商品、地址、支付流水等6张表。

优化前(数据库大JOIN):

SELECT o.id, o.amount, u.name, p.title, a.city, pay.status FROM orders o LEFT JOIN users u ON o.user_id = u.id LEFT JOIN products p ON o.product_id = p.id LEFT JOIN address a ON o.address_id = a.id LEFT JOIN payment pay ON o.pay_id = pay.id WHERE o.create_time > '2026-01-01' LIMIT 20;

优化后(应用层组装):

// 1. 先查主订单,不JOIN任何表 List<Order> orders = orderMapper.selectList( new LambdaQueryWrapper<Order>()

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询