TDengine在边缘端部署,因为边缘端设备会经常性出现直接断电关机的问题,会出现TDengine无法正常启动(WAL文件损坏),要如何解决边缘设备重启后,TDengine还能正常使用的问题(允许少量数据丢失),有什么好的解决方案或者思路?
能不能提供一下出错的WAL我们分析一下原因?WAL 是具备错误部分自动跳过功能,另外如果WAL内容不需要重放可以手动删除
因为边缘端设备很多,都在工厂现场,不能采用手动删除来解决这种问题 。我提供一些Wal文件给你这边,要如何发给你?
我刚咨询了同事,这个原因是清楚的,就是非正常断电操作系统不能保证所有数据写入完整,后续考虑在重启taosd时增加选项忽略错误来解决,目前我觉得可以在系统启动时增加启动任务清理wal就可以解决这个问题。
您好,我们这边做了测试,直接删除还是不行的,删除后重启taosd服务,会直接卡死,需要边缘盒子reboot(ubuntu20.04), reboot之后正常;也出现过删除后连接数据库不成功, 或者是连接成功了,但是数据库表打不开。我们这边评测taosd的性能的确非常好,所以想把边缘端的InfluxDB换成taosd,目前主要就碰到这种非正常断电关机无法正常启动的问题。恳请官方能协助解决这个问题,就像您这边提到的,重启taosd时把增加忽略错误来解决这个问题的计划尽早提上议程。非常感谢!
删除 taosd WAL 文件以后,重启服务过程卡住了?
这个情况还比较复杂,我找我同事和你联系下吧。
是的,重启服务卡住了,重启不了
好的,非常感谢
您好,能否近期安排同事和我联系下