虽然宕机事故已经在昨天完全解决,但是想起来还是十分让人后怕。

因此特地把整个事情的过程记录下来,为以后的安装工作做一个不小的警示。

起因

事情的起因是想要在云服务器上挂载Aria2和AriaNG,使用rclone直接挂载到onedrive对应目录中。这个之前就尝试过相关步骤,但是由于不熟悉相关开机自启动脚本而作罢。

在翻阅了B站的相关材料后,打算重新尝试挂载过程。因为本地环境下载速度实在不是很理想,加之想要充分发挥服务器的潜能,依照大佬的教程手动配置Aria2离线下载网盘并自动上传,开始实施搭建。

经过

搭建过程看起来并不复杂,可实施起来并没有看起来那么简单。

在执行完某一条指令后,我的服务器硬盘突然显示已经满载。

平时我也是比较注意系统的干净的,共40G的系统盘大概用了15G左右。但是不论是使用宝塔面板和是远程连接,均显示在根目录下的/dev/vda1文件占用了39.9G文件。

这可让我感到一点不解。盲猜可能是命令有问题。再三思索下删除了这个奇怪的文件。删除的过程很慢,我却不知道其实这个时候已经犯了很大的错误。在三分钟后,一切仿佛恢复了正常。

还没等我执行下一条命令,整个磁盘又诡异的显示满载。同样的,我又删除了那个看起来的罪魁祸首。三分钟后,远程连接显示中断了。而我还没有意识到问题的严重性。

第一次尝试

平时连接丢失的情况也是有的,但是这一个似乎有点不一样,甚至是从未遇到过。连续十多次显示连接不上,我隐约感觉到事情有点不大对劲,立刻申请了阿里云工单,请专业人士来解决问题。

经过漫长的等待,阿里云工程师告诉我根目录下的/dev文件全部丢失,无法恢复。解决办法是当前系统盘做一个快照,制作成云盘以后挂载到服务器上,服务器要重装,把需要的文件从挂载的云盘上复制下来。

解决方法

由于时间比较晚了,只能等到第二天实施了。

第二次尝试

大清早起来我又申请了一个新的工单,经过电话联系说明相关情况后,另一位工程师开始折腾了。

首先,挂载云盘就让售后小哥死了不少脑细胞。搭载云盘

挂载显示一直不生效。

终于挂载成功以后,我以为解决了问题,实际上最大的问题没有解决。

我不知道哪些文件是有用的

面队众多的文件夹,我有些茫然。

服务器累计停机超过了24小时。

结果

怎么办才好了?

最终的最终还是选择了最最最稳妥的办法。

云盘释放,系统重装,把oss中的一天前的备份导进来。

由于对于数据库的操作不过关,还又请求了来自淘宝的援助。

最终,在宕机将近30小时后,整个服务器又恢复了正常。

后记

这次宕机时了解服务器以来最严重的事故,造成了巨大的损失。

这也给我提了一个醒,以后要常备份,少操作。

Last modification:August 16, 2022
求观众老爷打赏,揭不开锅了。