任务执行日志自动归档:历史数据膨胀拖慢查询?定时清理 + 冷热数据分离
一、问题背景:日志数据的"熵增困境" 你是否遇到过这样的场景:系统运行一段时间后,任务执行日志表的数据量达到数十亿条,导致: 查询变慢:简单的日志查询需要数秒甚至数分钟 存储成本飙升:SSD 存储费用持续增长 备份困难:全量备份耗时过长 DDL 操作阻塞:添加索引或修改表结构需要长时间锁表 这就是典型的历史数据膨胀问题。任务执行日志通常具有"写多读少"的特点,超过90%的日志数据写入后很少被访问,但却占用着宝贵的存储资源和查询性能。 二、核心概念:冷热数据分离原理 2.1 数据生命周期模型 ┌──────────────────────────────────────────────────────────────────┐ │ 数据生命周期 │ ├──────────────────────────────────────────────────────────────────┤ │ │ │ 热数据 ──► 温数据 ──► 冷数据 ──► 归档数据 ──► 删除 │ │ (7天) (30天) (90天) (365天) │ │ │ │ │ │ │ │ │ │ ▼ ▼ ▼ ▼ │ ....