天道酬勤

Oracle and My Life

Feeling…..

leave a comment

熬了几个晚上,昨晚以平均100公里的时事回深圳了,成功帮助客户把Oracle系统从windows 32位平台迁移到新平台:AIX6105+ORACLE10.2.0.50+IBM DS4K。这次出差与以往不同的是与技术总监一起,一个有着20+年IT经验的前辈,感悟太多,从他身上看到自己太多不足。读书十多年,老师们都在强调书要反复读才能温故而知新,理论联系实际等诸如此类的话。这些让我想起EYGLE说的话:“有些故障要去猜测”。猜绝不是瞎猜,是有根据的推测,那么绝对少不了扎实的基础;再看看cui hua把bbed玩得出神入化的人又有多少。当然,bbed只不过是一个工具而已,我只想提醒自己,对基础理论知识的学习还必须加强。平时以为自己懂了,但在接受实战的检验时我没懂。记得biti大师说过,如果没有把concept看过N(N>=5)遍的,不是一个合格的DBA,一个合格的DBA不仅仅只知道数据库的知识,什么OS、storage、network都要“略知一二”。这次系统迁移后测试发现,一个简单的SQL的性能既然还不如WINDOWS平台上的,对SQL调优之后并没有明显的改善,最后问题在存储系统上,调整之后至少快了6倍,当然新机器的性能也高了些。以上这些,有人会觉得都是些老生常谈的事,但对我自己来说,不同时期会有不同的感悟,或者说感觉的强度不一样,希望自己能真正做好。

做好一件事,身边的人的支持很重要,这次出差的几天中,老婆没有过多的“骚扰”电话,也许要带宝宝没时间, :lol:

BTW,今天是老婆的生日,在此对老婆说声:生日快乐!辛苦了!也谢谢我亲爱的老姐,一直细心照顾我们,照顾果果,正是有了你的细心照顾,我才能安心工作。

Written by ochef

October 19th, 2010 at 1:43 AM

Posted in Life

Tagged with

Baby,we love you!

3 comments

我家宝宝(果果)于2010年08月06日 17:10出生了,是个小美女噢!近来太累,改天记录当爹的经历,哈哈!
Updated @ 2010-11-01 17:10
我出生二天了
0079
我一个月了
DSC_0079
妈妈带我去我游泳了
DSC_0115
我是小光头, :D :D
DSC_0002
奥特曼打小怪兽
DSC_0023
看妈妈
DSC_0021
-The End-

Written by ochef

August 10th, 2010 at 10:22 PM

Posted in Life

Tagged with

ORA-00600:[2103],[1],[0],[1],[900]的处理

3 comments

上周四中午刚放下订餐电话,手机响起鸟,客户的一套AIX 5.2 ML04  +  Oracle 10.2.0.3.0 (+Dataguard)的系统挂了,业务中断。收拾东西下楼打车赶往客户机房,大致半小时后到达客户机房登录系统检查发现系统报:“ORA-00600: internal error code, arguments: [2103], [1], [0], [1], [900]”错误。[2103]的错误与controlfile有关,[900]是等待的超时时间S。进一步检查发现,问题是出现在每天晚上0点都有crontab调度的系统备份任务:0点将系统置为热备模式—>连接FTP服务器—>CP需要备份的所有件—>最后将系统退出热备模式。metalink [ID 567891.1]说:系统处在热备份模式下,在日志发生切换时获取控制文件队列信息时发生了超时,这个等待时间默认是15分钟(900s)。虽然这里有一个Bug 6018274,但我的习惯是只有在做完了尽可能的尝试之后再认为是bug。

继续检查发现,系统一直在进行kill动作:“Killing enqueue blocker (pid=827572) on resource CF-00000000-00000000”,但遗憾的是这个动作失败了,尝试手工kill,失败。而且此时在系统中只要一发起与log相关的动作系统就挂起,无赖之下想重启oracle(这个想法很邪恶啊,如果待会儿起不来,how?),FT……正常关闭失败(意料中的),abort关机失败,回到OS中kill -9失败。万般无赖之下,只能重启OS,没想到的是AIX重启到一般的时候挂起,此时已经13:30了,还没有吃饭(12点客户叫俺一起去吃饭看到她那表情俺也有点不好意思。)不管了,先搞定系统再说吧。由于这套系统是P690上的一个分区,只要在HMC上使用“Hard Reset”选项了,鼠标移到此分区上检查了又检查了,俺视力5.2的说,但就怕这时看错了的话,后果,你知道的。在这前后几分钟,真有心跳加速的感觉,就怕待会儿库打不开啊。10分钟之后,my god,库顺利的打开了,哎呀,肚子不饿了,起应用一切顺利,先让别人开工吧。

造成ORA-00600 [2103]错误的原因有下:

1) 控制文件存放在I/O非常慢的存储系统上。

2) 频繁的日志切换,或日志文件过小或日志文件组数目过少。

3) 同时使用了异步I/O或多个数据写进程。

4) Oracle软件内部Bug。

5) OS/硬件问题。

讯问过客户工程师,确实在前一天18:30的时候进行数据整理,发生过非常频繁的日志切换,高峰时1分钟达5次日志切换,但在其后一天是正常的,由于环境复杂,暂时先做如下测试:(以影响业务程度最小化且实施难易程度依次列出)

1. 增大日志组成员大小,同时增加日志组数目。

2. 由于业务的特殊性,商讨能否修改备份策略来避开热备份。

3. 根据官方建议打补丁:Patch 5923866,在失效的情况下,将系统升级到10.2.0.4.0之上(最新分布为10.2.0.5.0)

4. 将操作系统从AIX 5.2 ML04升级到AIX 5.2 ML05(Oracle在[ID 406191.1]中建议)

BTW:在我重启完系统后问客户,此套系统应该有Dataguard的吧,答案是肯定的。到这里,可能大家会说为什么不在出问题的时候将系统切换到备机上。其实切换系统更多决定因素不仅仅只在技术层面的。

-The End-

Written by ochef

July 19th, 2010 at 10:00 AM

Posted in Troubleshooting

Tagged with

智齿

1 comment

昨天晚上开始,发现右边牙齿有点痛,开始以为是由于最近天气热加上本人又舍不下最爱的辣椒上了火,到今天越来越痛了,还伴随有点低烧和轻微头晕,原来是长智齿了。这是我第二次切身体会到什么是“牙痛不是病,痛起来真要命”,之前还是读高二的时候牙痛过一次,喝水,讲话都不行,但不是长智齿。此时,俺嘴里含着一片生姜来减轻痛苦,还喝了苦得要命的凉茶再加上消炎药。内事问了一下baidu,就算要拔也要等到消炎不痛了才行,难受中。

维基百科对“智齿”的解释:

智齿,学名第三大臼齿,俗称智慧齿、立事牙、尽头牙,是口腔最靠近喉咙的牙齿,如果全部生长出来一共4颗,上下颚各两颗,一般是于16岁或之后才生长出来,相较于幼儿时期长出的乳齿与儿童时期更换的恒齿,智齿通常是在人类心智已经趋于成熟时才长出,因而得名。在智齿的生长方面,个体差异很大,有的人20岁之前,有的人40、50岁才长,有的人终生不长,这都是正常的。而且四颗智齿也不是都必然会长全,某些人的智齿可能只长1至2颗,有的智齿甚至长到一半就不再生长,这种情况称为智齿阻生。

-The End-

Written by ochef

July 6th, 2010 at 9:56 PM

Posted in Life

Tagged with

无觅相关文章插件,快速提升流量