100个微服务100种日志格式:排一次故障要开10个面板,直到统一了
去年我们团队跑了差不多半年微服务,拆分得挺爽——订单、支付、库存、物流、用户中心,每个服务独立开发独立部署。架构图上画得漂漂亮亮。 直到有一次线上故障,把我整破防了。 一个下单请求超时,从网关一路追下去:Gateway → 订单服务 → 库存服务 → 支付服务 → 回调通知。五个服务,五个开发者写的日志,五种不同的格式。 订单服务的日志长这样: 2026-06-15 14:23:11.456 [http-nio-8080-exec-3] INFO c.o.s.OrderService - 订单创建成功,订单号: ORD20260615001 库存服务的日志长这样: [INFO] 2026/06/15 14:23:12.789 - StockServiceImpl: 扣减库存成功 [skuId=SKU8823, qty=1] 支付服务的日志干脆连时间戳格式都不一样: {"level":"info","msg":"支付回调处理完成","tradeNo":"TRD20260615001","time":"2026-06-15T14:23:13.456+08:00"} 我在 Kibana....