Taos3.3.6.0 taosd CPU负荷高

【TDengine 使用环境】
生产环境

【TDengine 版本】

3.3.6.0

【操作系统以及版本】

KylnSec3.3

【部署方式】

非容器部署

【集群节点数】

1

【集群副本数】

1

【描述业务影响】

taosd进程CPU负荷占比过高

【问题复现路径/shan】做过哪些操作出现的问题

【遇到的问题:问题现象及影响】

taosd占用大量的CPU负荷,尤其是vnode-st-reader线程

[sfhn@kylinserver4 log]$ top -Hp 14614
top - 11:28:16 up 64 days, 19:58, 23 users, load average: 7.32, 8.56, 45.61
Threads: 325 total, 8 running, 317 sleeping, 0 stopped, 0 zombie
%Cpu(s): 45.6 us, 4.1 sy, 0.0 ni, 50.2 id, 0.0 wa, 0.0 hi, 0.1 si, 0.0 st
KiB Mem : 24227520 total, 4807616 free, 6315500 used, 13104404 buff/cache
KiB Swap: 33554428 total, 31385596 free, 2168832 used. 16517360 avail Mem

PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
14944 root 20 0 24.8g 3.4g 9480 R 97.7 14.9 11:19.70 vnode-st-reader
14949 root 20 0 24.8g 3.4g 9480 R 97.3 14.9 11:21.29 vnode-st-reader
14945 root 20 0 24.8g 3.4g 9480 R 97.0 14.9 11:20.48 vnode-st-reader
14948 root 20 0 24.8g 3.4g 9480 R 97.0 14.9 11:20.07 vnode-st-reader
14947 root 20 0 24.8g 3.4g 9480 R 96.7 14.9 11:20.90 vnode-st-reader
14943 root 20 0 24.8g 3.4g 9480 R 96.3 14.9 11:19.86 vnode-st-reader
14950 root 20 0 24.8g 3.4g 9480 R 96.3 14.9 11:20.34 vnode-st-reader
14946 root 20 0 24.8g 3.4g 9480 R 96.0 14.9 11:20.78 vnode-st-reader
14654 root 20 0 24.8g 3.4g 9480 S 1.7 14.9 0:08.13 dnode-cli
14640 root 20 0 24.8g 3.4g 9480 S 1.3 14.9 0:07.52 taosd
14652 root 20 0 24.8g 3.4g 9480 S 1.3 14.9 0:08.17 dnode-cli
14653 root 20 0 24.8g 3.4g 9480 S 1.3 14.9 0:08.17 dnode-cli
14655 root 20 0 24.8g 3.4g 9480 S 1.3 14.9 0:08.11 dnode-cli
14644 root 20 0 24.8g 3.4g 9480 S 1.0 14.9 0:06.17 trans-svr-work
14649 root 20 0 24.8g 3.4g 9480 S 1.0 14.9 0:03.20 trans-svr-work
14643 root 20 0 24.8g 3.4g 9480 S 0.7 14.9 0:03.27 trans-svr-work
14645 root 20 0 24.8g 3.4g 9480 S 0.7 14.9 0:03.31 trans-svr-work
14648 root 20 0 24.8g 3.4g 9480 S 0.7 14.9 0:03.17 trans-svr-work
14650 root 20 0 24.8g 3.4g 9480 S 0.7 14.9 0:03.31 trans-svr-work
18023 root 20 0 24.8g 3.4g 9480 S 0.7 14.9 0:00.39 snode-stream-ru
14646 root 20 0 24.8g 3.4g 9480 S 0.3 14.9 0:03.17 trans-svr-work
14647 root 20 0 24.8g 3.4g 9480 S 0.3 14.9 0:00.06 trans-svr-work
14663 root 20 0 24.8g 3.4g 9480 S 0.3 14.9 0:01.11 tmr
14722 root 20 0 24.8g 3.4g 9480 S 0.3 14.9 0:00.04 mnode-status
15270 root 20 0 24.8g 3.4g 9480 S 0.3 14.9 0:00.46 snode-stream-ru
15273 root 20 0 24.8g 3.4g 9480 S 0.3 14.9 0:00.44 snode-stream-ru
15283 root 20 0 24.8g 3.4g 9480 S 0.3 14.9 0:00.44 snode-stream-ru
15284 root 20 0 24.8g 3.4g 9480 S 0.3 14.9 0:00.43 snode-stream-ru
15293 root 20 0 24.8g 3.4g 9480 S 0.3 14.9 0:00.59 snode-stream-tr
15305 root 20 0 24.8g 3.4g 9480 S 0.3 14.9 0:02.15 dnode-monitor
15308 root 20 0 24.8g 3.4g 9480 S 0.3 14.9 0:00.06 mnode-timer
15965 root 20 0 24.8g 3.4g 9480 S 0.3 14.9 0:00.47 snode-stream-ru
15967 root 20 0 24.8g 3.4g 9480 S 0.3 14.9 0:00.45 snode-stream-ru
15968 root 20 0 24.8g 3.4g 9480 S 0.3 14.9 0:00.47 snode-stream-ru
15970 root 20 0 24.8g 3.4g 9480 S 0.3 14.9 0:00.46 snode-stream-ru
15975 root 20 0 24.8g 3.4g 9480 S 0.3 14.9 0:00.46 snode-stream-ru
15976 root 20 0 24.8g 3.4g 9480 S 0.3 14.9 0:00.46 snode-stream-ru
15979 root 20 0 24.8g 3.4g 9480 S 0.3 14.9 0:00.46 snode-stream-ru
15980 root 20 0 24.8g 3.4g 9480 S 0.3 14.9 0:00.46 snode-stream-ru
15981 root 20 0 24.8g 3.4g 9480 S 0.3 14.9 0:00.48 snode-stream-ru
18025 root 20 0 24.8g 3.4g 9480 S 0.3 14.9 0:00.39 snode-stream-ru
14614 root 20 0 24.8g 3.4g 9480 S 0.0 14.9 0:02.44 taosd
14624 root 20 0 24.8g 3.4g 9480 S 0.0 14.9 0:00.25 log
14651 root 20 0 24.8g 3.4g 9480 S 0.0 14.9 0:00.00 trans-accept
14656 root 20 0 24.8g 3.4g 9480 S 0.0 14.9 0:00.04 dnode-sta-cli
14657 root 20 0 24.8g 3.4g 9480 S 0.0 14.9 0:00.00 dnode-sync-cli

【资源配置】

i7-10700 CPU @ 2.90GHz 16核心,24G RAM,500G SSD

【报错完整截图】(不要大段的粘贴报错代码,论坛直接看报错代码不直观)

cpu负载高,与很多因素有关,比如 cpu性能、磁盘性能、具体执行的业务(查询的具体语句、流计算的语句、写入方式导致的存储结构)等,需要综合所有相关因素,才能判断当时的cpu负载是否正常。