3.3.8.0版本, 出现卡死问题, 无法访问数据库

TDuser_WEy1_1880 · 2026 年1 月 10 日 10:01

【TDengine 使用环境】
生产环境

【TDengine 版本】

TDengine TSDB-OSS ver:3.3.8.0

【操作系统以及版本】

CentOS 7.9

【部署方式】非容器部署

【集群节点数】1

【集群副本数】1

【描述业务影响】

物联网数据存储测试, 数据量不大. 1分钟存储400条数据;

【问题复现路径/shan】做过哪些操作出现的问题

服务器运行一段时间会出现这个卡死问题.

【遇到的问题：问题现象及影响】

卡死;

影响整个服务, 无法读取, 无法写入数据.

【资源配置】

32核, 64GB, 2T阵列(剩余40%空间);

【报错完整截图】（不要大段的粘贴报错代码，论坛直接看报错代码不直观）

TDuser_OEzS_1621 · 2026 年1 月 12 日 01:02

从这些日志看，没有什么相关的异常。

taos shell 还能连接上吗？如果可以的话，请执行如下命令查看一下集群的情况：

show dnodes;
show mnodes;

show vnodes;

TDuser_WEy1_1880 · 2026 年1 月 12 日 01:17

taos shell 可以连接上, 但是其他程序访问不上.

1月10日重启的taosd, 昨天(1月11日)又出现了. 现在又是这个问题中.

TDuser_WEy1_1880 · 2026 年1 月 12 日 04:37

看这个失败的日志,有一个提示vgId: 1 , 但是并不存在这样一个vgroup;

TDuser_WEy1_1880 · 2026 年1 月 12 日 04:47

重复这个操作:

TDuser_WEy1_1880 · 2026 年1 月 12 日 06:10

开始出问题的地方:

TDuser_OEzS_1621 · 2026 年1 月 12 日 06:10

那应用程序无法访问的时候，返回的是什么错误码？

TDuser_WEy1_1880 · 2026 年1 月 12 日 06:38

没有任何日志输出

TDuser_WEy1_1880 · 2026 年1 月 12 日 07:00

今天上午有这么一串错误日志

TDuser_OEzS_1621 · 2026 年1 月 12 日 08:41

这个不是错误，你看前面只是一个 INFO。如果是 ERROR 才是错误。

不是服务端的日志，我是说应用程序无法访问的时候，应用程序应该也输出一些日志来协助定位，包括服务端返回的错误码。

TDuser_WEy1_1880 · 2026 年1 月 12 日 09:31

应用程序是Java端的, 没有日志输出.

TDuser_OEzS_1621 · 2026 年1 月 12 日 09:45

应用程序也不设置超时吗？如果服务端不返回的话，就一直等？

TDuser_WEy1_1880 · 2026 年1 月 12 日 10:25

配置了的,

<property name="maxWait" value="60000"></property>

TDuser_WEy1_1880 · 2026 年1 月 13 日 07:49

今天早上凌晨2点多, 又开始出现问题了, 生产环境出现有的能查询, 有的查询不出来数据(数据稍多点的, 如超过500行记录); 然后代码调试, 出现如下错误:

TDuser_WEy1_1880 · 2026 年1 月 13 日 07:52

systemctl restart taosd 命令重启, 会等很久都没有反应, 我们直接kill掉进程, 它就自动重启了, 然后都恢复正常.

TDuser_OEzS_1621 · 2026 年1 月 13 日 08:54

这种问题无法简单交流就能分析出来，可能还需要打开 debug调试开关，详细查看服务日志才能定位。

TDuser_WEy1_1880 · 2026 年1 月 13 日 08:57

可以远程分析一下不? 出现的频率有点高. 感觉几乎每天都出现了.

TDuser_OEzS_1621 · 2026 年1 月 13 日 08:58

可以。加个微信联系吧：13611161621

TDuser_WEy1_1880 · 2026 年1 月 13 日 09:00

好的, 谢谢

system · 2026 年2 月 12 日 09:01

此话题已在最后回复的 30 天后被自动关闭。不再允许新回复。