【TDengine 使用环境】
测试
【TDengine 版本】
tdengine/tdengine:3.3.6.13
【操作系统以及版本】
ubuntu 24.04
【部署方式】容器/非容器部署
helm chart
【集群节点数】
3
【集群副本数】
3
【描述业务影响】
【问题复现路径/shan】做过哪些操作出现的问题
创建三副本的 Mnode,保证 Mnode 高可用
CREATE mnode on dnode 2;
CREATE mnode on dnode 3;
创建数据库和账密:
create user test pass ‘TKmZTPoxdR1’ sysinfo 1 createdb 1;
create database test replica 3;
grant all on test to test;
使用k8s命令将pod副本数缩减为2个(kubectl -n system scale sts tdengine --replicas=2),等待10分钟以上再扩容为3个(kubectl -n system scale sts tdengine --replicas=3在此期间持续写入数据)
【遇到的问题:问题现象及影响】
执行上述操作后,集群异常无法访问数据库,且数据写入有超时和失败现象
【资源配置】
【报错完整截图】(不要大段的粘贴报错代码,论坛直接看报错代码不直观)
Zelv
(ZeLv)
2
TDengine 的副本设置为 3 了,不是随便就删除一个节点还可以工作的。这个副本和 k8s 的 replica 不一样,不能随便这么弄的。不太建议在k8s 里面部署
但是官方文档里有提到可以使用k8s部署,那您建议使用哪种方式部署?
单独机器部署是指使用docker方式部署吗? k8s部署这种异常有解决办法吗?
我使用docker-compose基于裸机部署的集群,服务重启后集群也会异常,启动服务的配置如下:
节点1:
services:
taos1:
image: tdengine/tdengine:3.3.6.13
container_name: taos1
environment:
- TAOS_FQDN=taos1
network_mode: “host”
volumes:
- /data/taos/dnode/data:/var/lib/taos
- /data/taos/dnode/log:/var/log/taos
节点2:
services:
taos2:
image: tdengine/tdengine:3.3.6.13
container_name: taos2
environment:
- TAOS_FQDN=taos2
- TAOS_FIRST_EP=taos1:6030
network_mode: “host”
volumes:
- /data/taos/dnode/data:/var/lib/taos
- /data/taos/dnode/log:/var/log/taos
节点3:
services:
taos3:
image: tdengine/tdengine:3.3.6.13
container_name: taos3
environment:
-
TAOS_FQDN=taos3
-
TAOS_FIRST_EP=taos1:6030
network_mode: “host”
volumes:
-
/data/taos/dnode/data:/var/lib/taos
-
/data/taos/dnode/log:/var/log/taos
集群状态异常