【TDengine 使用环境】
生产环境
【TDengine 版本】
3.3.6.13
【操作系统以及版本】
Ubuntu 24
【部署方式】容器/非容器部署
容器
【集群节点数】
1
【集群副本数】
1
【描述业务影响】
无法升级
【问题复现路径/shan】做过哪些操作出现的问题
一直用docker部署,部署完成后就修改了root密码,全程docker
最初安装版本3.3.2.0。
3.3.2.0–>3.3.7.0 因那时不知道有TAOS_ROOT_PASSWORD参数启动失败,所以回退到了3.3.6.13。固最终是3.3.2.0–>3.3.6.13可以正常升级。
3.3.6.13–>3.3.8.4时启动失败。
keep从365d调整为90d
【遇到的问题:问题现象及影响】
一直用docker部署,部署完成后就修改了root密码,最开始时3.3.2.0–>3.3.6.13可以正常升级。
今日从3.3.6.13–>3.3.8.4时启动失败,加不加-e TAOS_ROOT_PASSWORD=123456hahahah指定密码都不行。
加了环境变量TAOS_ROOT_PASSWORD在3.3.6.13、3.3.7.0、3.3.8.4三个版本都无法启动。
不加环境变量TAOS_ROOT_PASSWORD只能在3.3.6.13启动,我确定root密码没错,在3.3.6.13版本中启动以后可以用密码正常进入explorer。
另外还有一个问题就是感觉数据库keep未生效,我们的数据每天稳定增长,对于其中一个数据库前期设置keep=365d,保存了5个月数据,磁盘占用vnode56=147G,vnode55=155。此时整个磁盘占用过高决定调整keep=90d,设置之后过了一会查询90天之前的数据确实没了,但是磁盘一直未释放且一直在增长,截止发帖时已经占用170G+159G。
keep参数是设置在数据库上而非超级表

【资源配置】
8核32G
【报错完整截图】(不要大段的粘贴报错代码,论坛直接看报错代码不直观)
补充磁盘空间占用压缩比,感觉不正常,原始数据比实际占用的空间还小,原始数据raw_data占用200G左右,但是data1+data2+data3占用329G
您好,keep 的参数修改后并不会立即释放空间,需要等待一个 trim 的周期,这个周期由配置参数 trimVDbIntervalSec 控制,默认是一小时一次,也就是一小时后才会开始释放空间。
我过了好多天看了还是一样的,空间未释放。
我们的数据有一个特性,数据不是实时采集,而是第二天上报头一天的数据,可如果某些设备第二天没有网络或者未开机就会到后面开机且网络正常才上报。
时间戳的精度我们期望是到天级别,但PRECISION只能允许到毫秒,我们就在应用层做了处理,写入对应日期数据时时分秒这些都设置为0.
时间是以设备自身统计上报的为准,因设备自身的时间不对、未开机无网络等情况,最终会产生蛮多的乱序写的,我看得论坛有说到乱序只是针对某个子表,一个子表中所有行时间戳一定一样的,比如是2025-11-20。
所以空间未释放和压缩率异常是不是我设置的这些机制有问题吗 
乱序写入不会影响空间的释放,您可以先手动执行下 trim database。在观察下。
乱序写入确实会导致压缩率异常。
Authentication failure on one pod after cluster upgrade from 3.3.6.9 to 3.3.7.5 · Issue #33566 · taosdata/TDengine · GitHub 可以看看这个 issue,这个变量应该正常可以使用。你可以查一下你的操作是不是有问题,我们本地也会再进行测试。
修改完密码以后,docker 升级失败,我们复现了。
原因:手动修改,密码没有在 docker 生效,下个版本通过修改 entrypoint.sh 修复
现在的解决方案:
如果是手动修改的密码,需要在 data 目录 touch 一个空文件 .docker-entrypoint-root-password-changed
如果是通过-e 设置的密码, 则升级没有问题。
system
(system)
关闭
9
此话题已在最后回复的 10 天后被自动关闭。不再允许新回复。