Taosd 服务异常导致的系统事故

【TDengine 使用环境】
生产环境

【TDengine 版本】

3.3.6.0

【操作系统以及版本】

CentOS 8.2 64bit

【部署方式】非容器部署

【集群节点数】

1

【描述业务影响】

灾难

【问题复现路径/shan】

在2025-12-28 上午6:30左右突然应用无法连接taosd 使用的是TAOS-RS 连接器 然后登录服务器执行 systemctl restart taosd 后恢复

【遇到的问题:问题现象及影响】

jdbc丢失链接 应用无法连接到TDengine

【资源配置】

【报错完整截图】

从这个CPU曲线图上看好像是taosd挂掉了 但是当时我看服务器进程还是在的 重启后就正常可

出现故障的时候,首先确认一下 taosd 服务是否正常、taosadapter服务是否正常?

jdbc丢失链接 应用无法连接到TDengine:是链接超时,还是有返回错误码?

只是重启了 taosd 服务就恢复正常了,没有重启taosadapter吧?

如果再次初夏,可以看一下taosd 有什么日志输出。

当时我通过 ps 命令是能看到 taosd taosadapter 进程是在的 在出问题的过程当中日志里面出现的问题带 错误标志的有下面的

12/28 06:14:41.930641 00593384 C UTL FATAL colDataKeepFirstNRows: newLen:-1 old:565372

12/28 06:16:31.683649 00593537 C UTL FATAL colDataKeepFirstNRows: newLen:-1 old:554652

12/28 06:19:06.926130 00001522 C UTL FATAL colDataKeepFirstNRows: newLen:-1 old:566370

12/28 06:19:59.464849 00001514 C UTL FATAL colDataKeepFirstNRows: newLen:-1 old:566928

12/28 06:21:24.431092 00001511 C UTL FATAL colDataKeepFirstNRows: newLen:-1 old:548514

12/28 06:21:48.436452 00593536 C UTL FATAL colDataKeepFirstNRows: newLen:-1 old:546244

12/28 06:22:18.795663 00001525 C UTL FATAL colDataKeepFirstNRows: newLen:-1 old:546244

12/28 06:22:32.181989 00001517 C UTL FATAL colDataKeepFirstNRows: newLen:-1 old:568602

12/28 06:23:06.326545 00001512 C UTL FATAL colDataKeepFirstNRows: newLen:-1 old:561348

12/28 06:23:18.449366 00593385 C UTL FATAL colDataKeepFirstNRows: newLen:-1 old:546798

12/28 06:23:32.087825 00001520 C UTL FATAL colDataKeepFirstNRows: newLen:-1 old:545166

这几个典型的报错 其中12/28 06:23:18.449366 00593385 C UTL FATAL colDataKeepFirstNRows: newLen:-1 old:546798

12/28 06:23:32.087825 00001520 C UTL FATAL colDataKeepFirstNRows: newLen:-1 old:545166是交叉每隔一段时间打印一次 图片中的报错是已经不可用了

@TDuser_OEzS_1621

应该某个sql 触发了 taosd 服务的bug,也可能是后续版本已经修改过,请升级到最新版本再观察一下。