PostgreSQL 表分区实战：Range、List、Hash 分区策略与百万级数据查询优化

当单表数据量突破千万行时，一个简单的 SELECT COUNT(*) 都可能让你等上好几秒。根据 PostgreSQL 官方基准测试，合理使用分区表可以将特定范围查询的性能提升 10-50 倍，同时将 VACUUM 和索引维护的时间从小时级降到分钟级。PostgreSQL 从 10.0 版本开始引入声明式分区（Declarative Partitioning），到 17 版本已经非常成熟——但大多数开发者对它的理解还停留在"听过没用过"的阶段。本文将从实际生产场景出发，带你彻底掌握分区表的设计、实现与性能调优。

📊 一、为什么需要分区？从一个真实案例说起

1.1 不分区的代价

某 SaaS 平台的 events 表存储用户行为日志，每天新增 200 万条记录，一年后总量达到 7 亿行。以下是不分区时的典型问题：

-- 查询最近 7 天的数据，全表扫描噩梦
SELECT COUNT(*) FROM events
WHERE created_at >= NOW() - INTERVAL '7 days';
-- 执行时间：8.3 秒（全表扫描 7 亿行）

问题	不分区	分区后
7 天范围查询	8.3 秒	0.15 秒
`VACUUM` 全表	45 分钟	2 分钟（只清理过期分区）
删除 3 个月前数据	`DELETE` 产生大量 WAL，锁表 10+ 分钟	`DROP PARTITION` 毫秒级完成
索引大小	28 GB（B-Tree 全量）	每个分区索引 300-400 MB
写入性能	高并发时索引膨胀严重	写入分散到各分区，并发更优

⚠️ **警告：**分区不是银弹。表数据低于 500 万行时，分区通常不会带来性能提升，反而增加了管理复杂度。分区的核心收益体现在：大表范围查询、数据生命周期管理（TTL）、以及高频写入场景。

1.2 分区的核心原理

PostgreSQL 声明式分区的原理是表继承 + 约束排除（Constraint Exclusion）。父表（Partitioned Table）不存储数据，数据实际存储在子表（Partitions）中。查询时，PostgreSQL 根据 WHERE 条件自动排除不需要扫描的分区：

-- 查询优化器的执行计划
EXPLAIN SELECT * FROM events
WHERE created_at >= '2026-05-25' AND created_at < '2026-05-26';

-- 输出（只扫描一个分区，而非全表）：
-- Append  (cost=0.00..4521.00 rows=1)
--   -> Seq Scan on events_202605  (cost=0.00..4521.00 rows=1)
--        Filter: (created_at >= '2026-05-25' AND created_at < '2026-05-26')

💡 **提示：**确保 EXPLAIN 输出中只扫描了目标分区。如果看到 Seq Scan on events（父表），说明约束排除没有生效——通常是分区键与 WHERE 条件不匹配导致的。

🔧 二、三大分区策略实战

2.1 Range 分区：时间序列数据的首选

Range 分区按连续区间划分数据，最常用于时间序列场景（日志、订单、事件）。

-- 创建 Range 分区表（按月分区）
CREATE TABLE orders (
    id          BIGSERIAL,
    user_id     BIGINT NOT NULL,
    amount      NUMERIC(12,2) NOT NULL,
    status      VARCHAR(20) NOT NULL,
    created_at  TIMESTAMPTZ NOT NULL DEFAULT NOW()
) PARTITION BY RANGE (created_at);

-- 创建各月分区
CREATE TABLE orders_202601 PARTITION OF orders
    FOR VALUES FROM ('2026-01-01') TO ('2026-02-01');

CREATE TABLE orders_202602 PARTITION OF orders
    FOR VALUES FROM ('2026-02-01') TO ('2026-03-01');

CREATE TABLE orders_202603 PARTITION OF orders
    FOR VALUES FROM ('2026-03-01') TO ('2026-04-01');

-- 继续创建后续月份...

-- 为每个分区创建索引（分区键 + 常用查询列）
CREATE INDEX idx_orders_202601_created_at ON orders_202601 (created_at);
CREATE INDEX idx_orders_202601_user_id ON orders_202601 (user_id);
CREATE INDEX idx_orders_202602_created_at ON orders_202602 (created_at);
CREATE INDEX idx_orders_202602_user_id ON orders_202602 (user_id);

📌 记住：分区表的索引不会自动创建——你需要在每个分区上单独创建索引。PostgreSQL 11+ 支持在父表上 CREATE INDEX，会自动在所有分区上创建，但已有分区必须先手动处理。

自动创建未来分区是生产环境的刚需。以下是用 pg_partman 扩展实现的自动化方案：

-- 安装 pg_partman 扩展
CREATE EXTENSION pg_partman;

-- 配置自动分区：按月创建，预创建 3 个月，保留 12 个月
SELECT partman.create_parent(
    p_parent_table    := 'public.orders',
    p_control         := 'created_at',
    p_type            := 'range',
    p_interval        := '1 month',
    p_premake         := 3,          -- 预创建未来 3 个月
    p_retention       := '12 months', -- 自动删除 12 个月前的分区
    p_retention_keep_table := false   -- false = DROP，true = DETACH
);

-- 运行维护作业（建议用 pg_cron 每天执行一次）
SELECT partman.run_maintenance();

2.2 List 分区：枚举值分区

List 分区按离散值划分，适合按地区、租户、状态等有限枚举值分区的场景。

-- 多租户 SaaS：按租户 ID 分区
CREATE TABLE tenant_data (
    id          BIGSERIAL,
    tenant_id   VARCHAR(10) NOT NULL,
    payload     JSONB NOT NULL,
    created_at  TIMESTAMPTZ NOT NULL DEFAULT NOW()
) PARTITION BY LIST (tenant_id);

-- 每个大租户独立分区（数据隔离 + 独立备份）
CREATE TABLE tenant_data_acme PARTITION OF tenant_data
    FOR VALUES IN ('acme');

CREATE TABLE tenant_data_globex PARTITION OF tenant_data
    FOR VALUES IN ('globex');

-- 小租户共享默认分区
CREATE TABLE tenant_data_default PARTITION OF tenant_data DEFAULT;

-- 查询自动路由到正确分区
SELECT * FROM tenant_data WHERE tenant_id = 'acme';
-- 只扫描 tenant_data_acme 分区

⚠️ 警告：List 分区没有"范围"概念，每个分区的值必须明确列举。新增枚举值时必须手动添加对应分区，否则插入会报错——除非你设置了 DEFAULT 分区。建议始终保留一个 DEFAULT 分区作为兜底。

2.3 Hash 分区：均匀分散热点

Hash 分区通过哈希函数将数据均匀分布到各分区，适合没有明显范围特征但需要分散写入压力的场景。

-- 用户表按 user_id 哈希分散到 8 个分区
CREATE TABLE users (
    id          BIGSERIAL,
    username    VARCHAR(50) NOT NULL,
    email       VARCHAR(255) NOT NULL,
    profile     JSONB,
    created_at  TIMESTAMPTZ NOT NULL DEFAULT NOW()
) PARTITION BY HASH (id);

-- 创建 8 个哈希分区（数量必须是 2 的幂次）
CREATE TABLE users_p0 PARTITION OF users FOR VALUES WITH (MODULUS 8, REMAINDER 0);
CREATE TABLE users_p1 PARTITION OF users FOR VALUES WITH (MODULUS 8, REMAINDER 1);
CREATE TABLE users_p2 PARTITION OF users FOR VALUES WITH (MODULUS 8, REMAINDER 2);
CREATE TABLE users_p3 PARTITION OF users FOR VALUES WITH (MODULUS 8, REMAINDER 3);
CREATE TABLE users_p4 PARTITION OF users FOR VALUES WITH (MODULUS 8, REMAINDER 4);
CREATE TABLE users_p5 PARTITION OF users FOR VALUES WITH (MODULUS 8, REMAINDER 5);
CREATE TABLE users_p6 PARTITION OF users FOR VALUES WITH (MODULUS 8, REMAINDER 6);
CREATE TABLE users_p7 PARTITION OF users FOR VALUES WITH (MODULUS 8, REMAINDER 7);

-- 查询自动定位到对应分区
SELECT * FROM users WHERE id = 12345;
-- 只扫描 users_p1（12345 % 8 = 1）

💡 提示：Hash 分区的关键限制是分区数量在创建时确定，后续扩展非常麻烦（需要 DETACH + 重新哈希 + ATTACH）。如果预期数据会持续增长，建议初始多分几个分区（如 16 或 32 个），宁可前期空一些也不要后期扩展。

2.4 三种分区策略对比

维度	Range 分区	List 分区	Hash 分区
分区键类型	连续值（时间、ID范围）	枚举值（地区、租户）	任意可哈希类型
数据分布	可能不均匀	取决于枚举值分布	近似均匀
范围查询优化	✅ 最优	❌ 不适用	❌ 不适用
等值查询优化	✅ 良好	✅ 最优	✅ 良好
新增分区	简单（ADD PARTITION）	简单（ADD PARTITION）	困难（需重建）
删除旧数据	DROP 分区（毫秒级）	DROP 分区（毫秒级）	不适用
适用场景	日志、订单、时序数据	多租户、按地区分数据	无明显模式的热表
典型应用	⭐⭐⭐⭐⭐ 最常用	⭐⭐⭐⭐ 常用	⭐⭐ 较少使用

🚀 三、分区表的性能调优与进阶技巧

3.1 索引策略：分区级 vs 全局级

分区表的索引设计直接影响查询性能。核心原则是：在分区级别创建索引，而非在父表上创建全局索引。

-- ✅ 推荐：在每个分区上创建局部索引
CREATE INDEX idx_orders_202605_user_id ON orders_202605 (user_id);
CREATE INDEX idx_orders_202605_status ON orders_202605 (status)
    WHERE status IN ('pending', 'processing');  -- 部分索引，更省空间

-- ✅ PostgreSQL 11+：父表索引自动传播到所有分区
CREATE INDEX idx_orders_created_at ON orders (created_at);
-- 已有分区自动创建索引，未来新增分区也会自动创建

-- ❌ 避免：跨分区的全局唯一索引
-- 分区表不支持 INCLUDE 子句的唯一约束（PG 15 之前）
-- 需要改为：分区键必须包含在唯一约束中
ALTER TABLE orders ADD CONSTRAINT uq_orders_id_created
    UNIQUE (id, created_at);  -- 必须包含分区键 created_at

⚠️ 警告：分区表上的唯一约束必须包含分区键。这是因为 PostgreSQL 的唯一约束只在单个分区内生效——跨分区的唯一性无法保证。如果你需要全局唯一的 id，考虑使用 BIGSERIAL（序列天然全局唯一）或 UUID。

部分索引（Partial Index）在分区上效果极佳，因为单个分区的数据量已经很小，部分索引可以进一步压缩体积：

-- 只索引"活跃"订单（约占总量 5%）
CREATE INDEX idx_orders_202605_active ON orders_202605 (user_id, created_at)
    WHERE status NOT IN ('completed', 'cancelled');
-- 索引大小：约 15 MB（全量索引的 1/20）

3.2 分区裁剪（Partition Pruning）的陷阱

PostgreSQL 有两种机制来排除不相关的分区：约束排除（Constraint Exclusion） 和 分区裁剪（Partition Pruning）。理解它们的区别是避免性能陷阱的关键。

-- 场景一：约束排除（静态分析 WHERE 条件）
-- ✅ 能正确裁剪
SELECT * FROM orders WHERE created_at >= '2026-05-01'
                       AND created_at < '2026-06-01';
-- 只扫描 orders_202605

-- 场景二：参数化查询中的陷阱
-- ❌ 可能扫描所有分区！
PREPARE stmt AS SELECT * FROM orders WHERE created_at = $1;
EXECUTE stmt ('2026-05-15');
-- 在 PG 11 之前，PREPARE 语句不会触发约束排除
-- PG 11+ 的分区裁剪可以正确处理，但需确认 enable_partition_pruning = on

-- 场景三：函数中的隐式转换
-- ❌ 隐式类型转换可能导致裁剪失败
SELECT * FROM orders WHERE created_at::date = '2026-05-15';
-- ::date 转换破坏了与分区键的直接匹配，可能扫描全分区

-- ✅ 正确写法：保持类型一致
SELECT * FROM orders
WHERE created_at >= '2026-05-15T00:00:00Z'
  AND created_at < '2026-05-16T00:00:00Z';

📌 **记住：**始终用 EXPLAIN (ANALYZE, BUFFERS) 验证分区裁剪是否生效。如果看到 Seq Scan on 父表名（而非分区名），说明裁剪失败了。常见原因包括：分区键上使用函数、隐式类型转换、以及 OR 条件混合了分区键和非分区键。

3.3 生产环境的分区管理自动化

手动管理分区在生产环境中是不可接受的。以下是完整的自动化方案，使用 pg_cron + pg_partman 实现无人值守：

-- 步骤一：安装必要扩展
CREATE EXTENSION IF NOT EXISTS pg_cron;
CREATE EXTENSION IF NOT EXISTS pg_partman;

-- 步骤二：初始化分区管理
SELECT partman.create_parent(
    p_parent_table    := 'public.orders',
    p_control         := 'created_at',
    p_type            := 'range',
    p_interval        := '1 month',
    p_premake         := 3,
    p_retention       := '12 months',
    p_retention_keep_table := true  -- DETACH 而非 DROP（可恢复）
);

-- 步骤三：配置维护作业（每天凌晨 2 点执行）
SELECT cron.schedule(
    'partman-maintenance',
    '0 2 * * *',
    $$SELECT partman.run_maintenance()$$
);

-- 步骤四：监控分区状态
SELECT parent_table,
       partition_type,
       partition_interval,
       partition_count,
       premake
FROM partman.part_config;

-- 查看当前分区列表
SELECT inhrelid::regclass AS partition_name,
       pg_get_expr(c.relpartbound, c.oid, true) AS bounds,
       pg_size_pretty(pg_relation_size(c.oid)) AS size
FROM pg_inherits i
JOIN pg_class c ON c.oid = i.inhrelid
WHERE i.inhparent = 'orders'::regclass
ORDER BY c.relname;

以下是一个完整的分区管理监控查询，可用于定期巡检：

-- 分区健康检查：数据分布、空间占用、膨胀率
WITH partition_stats AS (
    SELECT
        c.relname AS partition_name,
        pg_get_expr(c.relpartbound, c.oid, true) AS bounds,
        pg_relation_size(c.oid) AS size_bytes,
        (SELECT count(*) FROM ONLY orders_202605) AS row_count,
        c.oid
    FROM pg_inherits i
    JOIN pg_class c ON c.oid = i.inhrelid
    WHERE i.inhparent = 'orders'::regclass
)
SELECT
    partition_name,
    bounds,
    pg_size_pretty(size_bytes) AS disk_size,
    row_count,
    CASE WHEN row_count > 0
         THEN pg_size_pretty(size_bytes / row_count)
         ELSE 'N/A'
    END AS avg_row_size
FROM partition_stats
ORDER BY partition_name;

3.4 将已有大表转换为分区表

这是生产环境中最常见的需求，也是最容易翻车的操作。推荐使用 pg_repack 或逻辑复制实现零停机迁移：

-- 方案一：pg_dump/pg_restore（适合停机窗口）
-- 步骤 1：创建新的分区表结构
CREATE TABLE orders_new (LIKE orders INCLUDING ALL)
    PARTITION BY RANGE (created_at);
CREATE TABLE orders_new_202605 PARTITION OF orders_new
    FOR VALUES FROM ('2026-05-01') TO ('2026-06-01');
-- ... 创建其他分区

-- 步骤 2：迁移数据
INSERT INTO orders_new SELECT * FROM orders;

-- 步骤 3：原子切换（短暂停锁）
BEGIN;
ALTER TABLE orders RENAME TO orders_old;
ALTER TABLE orders_new RENAME TO orders;
COMMIT;

-- 方案二：逻辑复制零停机迁移（PG 15+ 推荐）
-- 使用 CREATE PUBLICATION / SUBSCRIPTION 实现在线迁移
-- 详见 PostgreSQL 官方文档 "Logical Replication" 章节

⚠️ 警告：将已有大表转换为分区表没有 ALTER TABLE ... PARTITION BY 这种便捷语法（截至 PG 17）。你必须创建新表、迁移数据、重命名三步走。务必在低峰期操作，并提前在 staging 环境验证完整流程。

⚠️ 四、分区表的常见坑与避坑指南

以下是生产环境中最常见的分区相关问题：

❌ 坑一：分区键选择错误

-- ❌ 错误：按 user_id 分区，但查询主要是按时间范围
CREATE TABLE events (...) PARTITION BY RANGE (user_id);
-- 结果：时间范围查询扫描所有分区，等于没分区

-- ✅ 正确：按查询最频繁的范围条件分区
CREATE TABLE events (...) PARTITION BY RANGE (created_at);

❌ 坑二：分区数量爆炸

-- ❌ 危险：按天分区，运行 3 年 = 1095 个分区
-- PG 的查询规划器在分区数超过 200 时会明显变慢

-- ✅ 推荐：按月分区 + 按需 DETACH 旧分区
-- 保持活跃分区在 24-36 个以内（2-3 年数据）

❌ 坑三：忘记在分区键上创建索引

-- ❌ 常见遗漏：只在 user_id 上建索引，没在 created_at 上建
-- 范围查询需要 created_at 索引来配合分区裁剪

-- ✅ 正确：分区键 + 常用查询列都要建索引
CREATE INDEX idx_orders_created_at ON orders_202605 (created_at);
CREATE INDEX idx_orders_user_id ON orders_202605 (user_id);
CREATE INDEX idx_orders_composite ON orders_202605 (user_id, created_at DESC);

❌ 坑四：唯一约束不含分区键

-- ❌ 报错：ERROR: unique constraint on partitioned table must include all
--         partitioning columns
ALTER TABLE orders ADD CONSTRAINT uq_orders_id UNIQUE (id);

-- ✅ 正确：唯一约束必须包含分区键
ALTER TABLE orders ADD CONSTRAINT uq_orders_id UNIQUE (id, created_at);

✅ 五、总结与最佳实践

分区表不是万能的，但在正确的场景下，它是 PostgreSQL 性能优化的杀手锏。以下是核心决策框架：

**何时分区：**单表超过 500 万行，且有明显的时间范围查询或数据生命周期需求
**选择策略：**时间序列用 Range（最常见），多租户用 List，无模式热表用 Hash
**分区粒度：**推荐按月分区，保持活跃分区 24-36 个
**索引设计：**分区键必建索引，善用部分索引压缩体积
**自动化：**必须用 pg_partman + pg_cron 实现自动分区管理
**迁移策略：**大表转分区用逻辑复制零停机方案

⚡ 关键结论：分区表的价值不仅在于查询性能提升，更在于运维效率的飞跃——DROP PARTITION 替代 DELETE，分区级备份替代全表备份，索引维护从小时级降到分钟级。如果你的 PostgreSQL 数据表正在快速增长，现在就是引入分区的最佳时机。

相关工具推荐：

🔧 pg_partman — 分区自动管理扩展
🔧 pg_cron — PostgreSQL 定时任务
🔧 pg_repack — 在线索缩与表重组
🔧 pg_stat_statements — 查询性能分析
🔧 jsjson.com JSON 格式化工具 — API 返回数据的格式化与验证