2010年5月4日星期二

数据故障与备份

今天到公司,我听到了一个惨绝人寰的消息,公司的存储服务器出了故障,硬盘完蛋了。找DELL的工程师来诊断,他们认为有一部分数据已经无法找回来,只能考虑恢复4月18号的备份,教科书上总是千叮万嘱备份的重要性,今天总算让我遇到了一次大的。

从这次故障我发现了另外一些问题:

除了定期的异地备份以外,我们没有在实验室内的异设备的备份,指望RAID还是不灵的。就备份服务器来说,简单的堆一个多硬盘的机器,定期从存储服务器上复制即可,这样也免得一次故障就导致回档几个星期。

另外,游戏的分析数据都塞在一个数据库中,结果导致数据库太大,无法备份。应该按照时间分割成若干的小的数据库,这样对早期的数据库备份就会容易的多。

ps:第二天数据全部恢复了,虽说也是DELL这帮工程师搞的,但是我还是认为他们就是一群水货,太不专业了。

没有评论:

发表评论