高可用部署

TDuser_6AwR_3044 · 2026 年3 月 11 日 01:18

【TDengine 使用环境】
测试

【TDengine 版本】

3.3.5.2

【操作系统以及版本】

ubuntu 24.04

【部署方式】容器/非容器部署

helm chart

【集群节点数】

3

【集群副本数】

3

【描述业务影响】

【问题复现路径/shan】做过哪些操作出现的问题

【遇到的问题：问题现象及影响】

使用社区版3.3.5.2部署高可用模式，删除其中一个节点的数据后重新启动数据不会自动同步，节点也没有重新加入集群

【资源配置】

【报错完整截图】（不要大段的粘贴报错代码，论坛直接看报错代码不直观）

TDuser_kHdl_4558 · 2026 年3 月 12 日 02:38

删除一节点数据是指的如何删除？如果配置信息全部删除了，那就得重建节点，然后通过restore节点恢复。

TDuser_6AwR_3044 · 2026 年3 月 12 日 02:41

我是通过Helm chart包部署的，数据存储在pvc中，将原本的3副本节点先缩成2个节点，然后删除tdengine-2 pod的pvc数据，再重新扩容成3个副本，tdengine-2的pvc目录数据没有从其它两个节点自动同步。

TDuser_kHdl_4558 · 2026 年3 月 12 日 03:34

这种类似删除节点再添加，得手工进行restore操作。

TDuser_6AwR_3044 · 2026 年3 月 12 日 03:40

restore dnode <dnode_id>；# 恢复dnode上的mnode，所有vnode和qnode
restore mnode on dnode <dnode_id>；# 恢复dnode上的mnode
restore vnode on dnode <dnode_id> ；# 恢复dnode上的所有vnode
restore qnode on dnode <dnode_id>；# 恢复dnode上的qnode
是通过这几个命令恢复吗？我尝试过也没有恢复成功，这个是bug吗？

TDuser_kHdl_4558 · 2026 年3 月 12 日 06:55

show dnodes;
show vnodes;
这两个命令的输出，请贴下，我看下状态。

TDuser_6AwR_3044 · 2026 年3 月 12 日 07:49

TDuser_6AwR_3044 · 2026 年3 月 16 日 00:38

请问这个是什么原因？有解决办法吗？

TDuser_kHdl_4558 · 2026 年3 月 16 日 07:21

当恢复时，需要将节点3重建，让其状态为ready。这时其数据为空mnode、vnode均为不正常。
然后执行restore，如果还有问题，请上传节点3日志，或提供远程，我们看下。

TDuser_6AwR_3044 · 2026 年3 月 16 日 07:34

总结

此文本将被隐藏

TDuser_6AwR_3044 · 2026 年3 月 16 日 07:36

日志文件内容比较多，我要全部贴在这里吗？

TDuser_kHdl_4558 · 2026 年3 月 16 日 07:37

只要节点3名称为taosdlog.?的最近一个文件，压缩后上传上来。

TDuser_6AwR_3044 · 2026 年3 月 16 日 08:10

不允许上传压缩包

TDuser_kHdl_4558 · 2026 年3 月 16 日 12:03

最终结论：开源版本不支持restore操作，此为高级运维命令，开源版本不支持。https://docs.taosdata.com/operation/maintenance/

system · 2026 年4 月 15 日 12:03

此话题已在最后回复的 30 天后被自动关闭。不再允许新回复。