今天心情TNND很不爽。早上七点钟起来想撒尿了回去睡个回笼觉,不料电话响了,这时候电话响一定不是什么好事。果不其然,接到上级的电话说一个客户的一台P570昨晚三点多宕机了,系统宕机了当然Oracle数据库也宕了,叫我赶紧打车过去。五分钟后出门,不知道咋地,深圳这二天到处大塞车,八点多到客户监控中心,小机已经起来了,oracle也起来了。客户要宕机原因,登录上去检查,oracle的alert.log没有记录任何错误信息,系统的errpt、mail也没有发现什么异常的错误,去机房检查,指示灯一切正常,以我现有的能力实在是找不真正宕机的原因,打算跟客户汇报一下情况,不料麻烦就来了。客户管事的说今天一定要原因,如果我搞不定打电话叫我们公司派个老鸟来,如果你们老鸟还搞不定你们去请IBM的原厂工程师来,在老鸟没来之前,我不能离开。咋的,扣人啊,我顶你个肺啊……!这种情况,就算IBM的原厂工程师来了也不一定能搞得定,是系统就会有出问题的一天,并不是所有的问题都答案,或者不能马上有答案的。等了快一个小时,老鸟来了,结果一样,无法确定原因。最后的解决办法是取DUMP文件回去分析。说实话,DUMP这玩意儿也很难分析出原因,也不是一天二天就能得出结论的,不过总之得给客户一个交待才说得过去啊。就在要离开的时候,客户的另一台PC SERVER也重启了,跟先前的570一样,也没有找到一个确切的原因,日志没有记录。下午,另一个客户数据库报ORA-07445的错误,这是一个RAC的环境,前天因为客户的工程师自己把的所有归档删除了重组了Data Guard,是另一个兄弟过去处理的,不知道搞定了没有。唉,可能天天呆机房时间太久的原因,头从中午痛到现在,总之今天很郁闷,本想把这几天技术上的问题总结一下的,周末再说吧。
-The End-