时序库v3.1.1.0,多客户端连接偶发连接数暴增导致时序库假死未响应

【TDengine 使用环境】
生产环境 /测试/ Poc/预生产环境

生产环境

【TDengine 版本】

V3.1.1.0

【操作系统以及版本】

centos7.9

【部署方式】容器/非容器部署

非容器部署

【集群节点数】

1

【集群副本数】

1

【描述业务影响】

同事反映时序库查询无响应,排查发现时序库连接数从140左右暴增到800以上,重启后时序库服务恢复。

【问题复现路径/shan】做过哪些操作出现的问题

连接客户端比较多且都是直连时序库。

【遇到的问题:问题现象及影响】

同事反映时序库查询无响应,排查发现时序库连接数从140左右暴增到800以上且连接无法释放,重启后时序库服务恢复。

【资源配置】

cpu 32核心、内存128G

【报错完整截图】(不要大段的粘贴报错代码,论坛直接看报错代码不直观)

想咨询下各位老师,这种问题时序库服务有没有应对政策或有没有相关管理的参数配置来防止雪崩的出现或者时序库服务对连接这块内部是怎么管理的,我们也好遵循时序库的管理机制去约束客户端。:folded_hands:

连接数目前版本没有做限制,只是企业版有一个 ip 白名单的功能。
但您这个版本太老了,请先升级到最新的 3.3.8.8版本吧,如果还有问题,再来针对性分析。