警报之后:重新思考我们如何调查金融犯罪
2026/5/1 10:42:01
“良好的 MySQL 数据库设计能力和优化能力”是后端工程师的核心素养之一。
order与order_item的 1:N 关系,应清晰反映“一个订单包含多个商品项”。Laravel Migrations)。| 范式级别 | 核心要求 | 优点 | 缺点 | 适用场景 |
|---|---|---|---|---|
| 1NF | 原子性(字段不可再分) | 消除重复组 | — | 必须遵守 |
| 2NF | 消除非主键部分依赖 | 消除冗余 | 需多表 JOIN | 事务型系统 |
| 3NF | 消除非主键传递依赖 | 数据一致性高 | 查询复杂 | 核心交易系统 |
| BCNF | 主属性无部分/传递依赖 | 最强一致性 | 实现困难 | 金融等强一致性场景 |
| 反范式 | 引入冗余 | 减少 JOIN、提升读性能 | 更新异常风险 | 报表、搜索、高并发读 |
✅经验法则:
- OLTP(在线交易):优先 3NF,保证 ACID;
- OLAP(分析报表):大胆反范式,甚至宽表(Wide Table);
- 混合场景:主库 3NF + 从库/物化视图反范式。
| 主键类型 | 优点 | 缺点 | 建议 |
|---|---|---|---|
| 自增 INT/BIGINT | 简单、高效、聚簇索引友好 | 分布式扩展难 | 单体应用首选 |
| UUID | 全局唯一、可分布式生成 | 32 字节、无序、聚簇索引碎片 | 分布式系统 |
| ULID / Snowflake ID | 有序、全局唯一、时间可读 | 需额外生成服务 | 高级分布式场景 |
🔸InnoDB 聚簇索引特性:主键决定数据物理存储顺序,主键应尽量短、有序、不变。
TINYINT而非INT存布尔值(尽管 MySQL 无 BOOLEAN);0,'');utf8mb4+utf8mb4_unicode_ci(支持 emoji);DATETIME(时区无关)或TIMESTAMP(自动时区转换),避免字符串存时间。(a, b, c)索引可支持WHERE a=1、a=1 AND b=2,但不支持b=2;SELECT字段全在索引中,避免回表;-- 覆盖索引示例CREATEINDEXidx_user_email_nameONusers(email,name);SELECTnameFROMusersWHEREemail='x@example.com';-- 无需查聚簇索引(a,b)和(a)是冗余的;VARCHAR(255)可建(name(20)),但可能降低选择性。WHERE YEAR(created_at) = 2025❌WHERE created_at BETWEEN '2025-01-01' AND '2025-12-31'✅WHERE user_id = '123'(user_id 是 INT)→ 可能不走索引;LIKE '%xxx':前导通配符无法使用索引;OR条件未全索引:WHERE a=1 OR b=2,若只有a有索引,则b=2部分全表扫描。EXPLAINFORMAT=JSONSELECT...;关注:
type:const>ref>range>index>ALL(避免ALL)key: 实际使用的索引rows: 扫描行数(越少越好)Extra: 出现Using filesort或Using temporary需警惕JOIN代替子查询(MySQL 5.6+ 子查询优化已改善,但仍需测试);LIMIT 1000000, 10,改用“游标分页”(基于上一页最大 ID);INSERT ... VALUES (...), (...), ...比循环单条快 10~100 倍;| 阶段 | 策略 | 关键技术 |
|---|---|---|
| 单机 → 读写分离 | 主从复制 | MySQL Replication, ProxySQL |
| 读写分离 → 分库分表 | 水平拆分 | ShardingSphere, Vitess, 自研中间件 |
| 分库分表 → 弹性扩展 | 分布式数据库 | TiDB, OceanBase(兼容 MySQL 协议) |
✅拆分原则:
- 垂直拆分:按业务模块拆(用户库、订单库);
- 水平拆分:按 shard key(如 user_id)拆,避免跨分片 JOIN。
>1s的查询;ANALYZE TABLE:更新统计信息,帮助优化器选索引;OPTIMIZE TABLE:重建表,减少碎片(InnoDB 一般不需要)。| 反模式 | 后果 | 正确做法 |
|---|---|---|
| 用 JSON 存所有数据 | 无法索引、无法约束、查询慢 | 仅存非结构化辅助数据 |
| 一张表 > 50 个字段 | 可读性差、易锁冲突 | 拆分到关联表 |
| 无外键约束 | 数据不一致 | 在应用层或数据库层保证引用完整性 |
| 所有查询走 ORM 不看 SQL | 生成 N+1、全表扫描 | 审查 ORM 生成的 SQL,必要时写原生查询 |
| 维度 | 核心能力 |
|---|---|
| 设计 | 领域建模 + 范式权衡 + 主键/字段精炼 |
| 索引 | 覆盖索引 + 最左前缀 + 避免失效 |
| 查询 | EXPLAIN 驱动 + 重写优化 + 分页策略 |
| 架构 | 读写分离 → 分库分表 → 分布式 |
| 运维 | 监控慢查 + 统计信息更新 + 容量规划 |
| 哲学 | 业务语义优先,性能为辅;可维护性至上,理论为仆 |
如庖丁所言:“臣以神遇而不以目视,官知止而神欲行。”
真正的数据库高手,
不是熟记所有索引规则,
而是能感知数据流动的“天然纹理”——
在业务需求与系统性能之间,
找到那条“以无厚入有间”的最优路径。