虽然宕机事故已经在昨天完全解决,但是想起来还是十分让人后怕。
因此特地把整个事情的过程记录下来,为以后的安装工作做一个不小的警示。
起因
事情的起因是想要在云服务器上挂载Aria2和AriaNG,使用rclone直接挂载到onedrive对应目录中。这个之前就尝试过相关步骤,但是由于不熟悉相关开机自启动脚本而作罢。
在翻阅了B站的相关材料后,打算重新尝试挂载过程。因为本地环境下载速度实在不是很理想,加之想要充分发挥服务器的潜能,依照大佬的教程手动配置Aria2离线下载网盘并自动上传,开始实施搭建。
经过
搭建过程看起来并不复杂,可实施起来并没有看起来那么简单。
在执行完某一条指令后,我的服务器硬盘突然显示已经满载。
平时我也是比较注意系统的干净的,共40G的系统盘大概用了15G左右。但是不论是使用宝塔面板和是远程连接,均显示在根目录下的/dev/vda1文件占用了39.9G文件。
这可让我感到一点不解。盲猜可能是命令有问题。再三思索下删除了这个奇怪的文件。删除的过程很慢,我却不知道其实这个时候已经犯了很大的错误。在三分钟后,一切仿佛恢复了正常。
还没等我执行下一条命令,整个磁盘又诡异的显示满载。同样的,我又删除了那个看起来的罪魁祸首。三分钟后,远程连接显示中断了。而我还没有意识到问题的严重性。
第一次尝试
平时连接丢失的情况也是有的,但是这一个似乎有点不一样,甚至是从未遇到过。连续十多次显示连接不上,我隐约感觉到事情有点不大对劲,立刻申请了阿里云工单,请专业人士来解决问题。
经过漫长的等待,阿里云工程师告诉我根目录下的/dev文件全部丢失,无法恢复。解决办法是当前系统盘做一个快照,制作成云盘以后挂载到服务器上,服务器要重装,把需要的文件从挂载的云盘上复制下来。
由于时间比较晚了,只能等到第二天实施了。
第二次尝试
大清早起来我又申请了一个新的工单,经过电话联系说明相关情况后,另一位工程师开始折腾了。
首先,挂载云盘就让售后小哥死了不少脑细胞。
挂载显示一直不生效。
终于挂载成功以后,我以为解决了问题,实际上最大的问题没有解决。
我不知道哪些文件是有用的
面队众多的文件夹,我有些茫然。
服务器累计停机超过了24小时。
结果
怎么办才好了?
最终的最终还是选择了最最最稳妥的办法。
云盘释放,系统重装,把oss中的一天前的备份导进来。
由于对于数据库的操作不过关,还又请求了来自淘宝的援助。
最终,在宕机将近30小时后,整个服务器又恢复了正常。
后记
这次宕机时了解服务器以来最严重的事故,造成了巨大的损失。
这也给我提了一个醒,以后要常备份,少操作。
版权属于:小升博
本文链接:https://blog.diz7.com/archives/stop.html
转载时须注明出处及本声明
7 comments
??????
写得好好哟,我要给你生猴子!
(・∀・(・∀・(・∀・*)
可怕
超哥是狗
不,我是你爹