Добро пожаловать в форум, Guest  >>   Войти | Регистрация | Поиск | Правила | В избранное | Подписаться
Все форумы / Oracle Новый топик    Ответить
 Два разных экземпляра crash одновременно  [new]
Дядя Жора
Member

Откуда: Одесса
Сообщений: 846
Suse Sles 9 SP4 64 bit + Oracle 10.2.0.4 64 bit

Совершенно безобидный скрипт, который отработал на обоих экземплярах одновременно (и который работает уже несколько лет регулярно 1 раз в неделю)
alter database backup controlfile to trace as '/oracle/trc/control_file.trc'
вызвал падение обоих экземпляров.
Металинк вывел меня на Bug 7432601 Правильно ли я его идентифицировал?

log1
------
Sun Jun  6 16:39:04 2010
            alter database backup controlfile to trace as '/oracle/trc/control_file.trc'
Sun Jun  6 16:54:05 2010
Errors in file /u01/app/oracle/admin/arch/bdump/oraarch1_lgwr_11765.trc:
ORA-00494: enqueue [CF] held for too long (more than 900 seconds) by 'inst 1, osid 28821'
Sun Jun  6 16:55:05 2010
System State dumped to trace file /u01/app/oracle/admin/arch/bdump/oraarch1_lgwr_11765.trc
Killing enqueue blocker (pid=28821) on resource CF-00000000-00000000
 by killing session 938.371
Sun Jun  6 17:00:05 2010
Errors in file /u01/app/oracle/admin/arch/bdump/oraarch1_lgwr_11765.trc:
ORA-00494: enqueue [CF] held for too long (more than 900 seconds) by 'inst 1, osid 28821'
Sun Jun  6 17:01:05 2010
System State dumped to trace file /u01/app/oracle/admin/arch/bdump/oraarch1_lgwr_11765.trc
Killing enqueue blocker (pid=28821) on resource CF-00000000-00000000
 by terminating the process
Sun Jun  6 17:16:06 2010
Errors in file /u01/app/oracle/admin/arch/bdump/oraarch1_lgwr_11765.trc:
ORA-00494: enqueue [CF] held for too long (more than 900 seconds) by 'inst 1, osid 28821'
Sun Jun  6 17:17:06 2010
System State dumped to trace file /u01/app/oracle/admin/arch/bdump/oraarch1_lgwr_11765.trc
Killing enqueue blocker (pid=28821) on resource CF-00000000-00000000
 by terminating the process
Sun Jun  6 17:17:37 2010
Errors in file /u01/app/oracle/admin/arch/bdump/oraarch1_lgwr_11765.trc:
ORA-00239: timeout waiting for control file enqueue: held by 'inst 1, osid 28821' for more than 900 seconds
Sun Jun  6 17:17:40 2010
Errors in file /u01/app/oracle/admin/arch/bdump/oraarch1_pmon_11757.trc:
ORA-00470: LGWR process terminated with error
Sun Jun  6 17:17:40 2010
Errors in file /u01/app/oracle/admin/arch/bdump/oraarch1_j002_22391.trc:
ORA-00470: LGWR process terminated with error
ORA-00470: LGWR process terminated with error
Sun Jun  6 17:17:40 2010
Errors in file /u01/app/oracle/admin/arch/bdump/oraarch1_j006_24972.trc:
ORA-27468: "EXFSYS.RLM$EVTCLEANUP" is locked by another process
Sun Jun  6 17:17:40 2010
Errors in file /u01/app/oracle/admin/arch/bdump/oraarch1_j004_23428.trc:
ORA-27468: "EXFSYS.RLM$EVTCLEANUP" is locked by another process
Sun Jun  6 17:17:40 2010
Errors in file /u01/app/oracle/admin/arch/bdump/oraarch1_j007_26427.trc:
ORA-27468: "EXFSYS.RLM$EVTCLEANUP" is locked by another process
Sun Jun  6 17:17:40 2010
PMON: terminating instance due to error 470
Termination issued to instance processes. Waiting for the processes to exit

log2
------
Sun Jun  6 16:39:04 2010
            alter database backup controlfile to trace as '/oracle/trc/control_file.trc'
RSM0 started with pid=43, OS id=16697
RSM0 started with pid=43, OS id=16938
RSM0 started with pid=43, OS id=17036
RSM0 started with pid=43, OS id=17147
RSM0 started with pid=43, OS id=17300
RSM0 started with pid=43, OS id=17393
RSM0 started with pid=43, OS id=17606
RSM0 started with pid=43, OS id=17809
Sun Jun  6 16:54:05 2010
Errors in file /u01/app/oracle/admin/odb1/bdump/odb1ora1_lgwr_20916.trc:
ORA-00494: постановка в очередь [CF] на слишком большое время (more than 900 seconds) захвачена 'inst 1, osid 16608'
Sun Jun  6 16:55:05 2010
System State dumped to trace file /u01/app/oracle/admin/odb1/bdump/odb1ora1_lgwr_20916.trc
Killing enqueue blocker (pid=16608) on resource CF-00000000-00000000
 by killing session 871.33
RSM0 started with pid=43, OS id=18200
RSM0 started with pid=43, OS id=18308
Sun Jun  6 17:00:14 2010
Errors in file /u01/app/oracle/admin/odb1/bdump/odb1ora1_lgwr_20916.trc:
ORA-00494: постановка в очередь [CF] на слишком большое время (more than 900 seconds) захвачена 'inst 1, osid 16608'
Sun Jun  6 17:01:15 2010
System State dumped to trace file /u01/app/oracle/admin/odb1/bdump/odb1ora1_lgwr_20916.trc
Killing enqueue blocker (pid=16608) on resource CF-00000000-00000000
 by terminating the process
RSM0 started with pid=43, OS id=18663
RSM0 started with pid=43, OS id=18751
RSM0 started with pid=43, OS id=18927
RSM0 started with pid=43, OS id=19104
RSM0 started with pid=43, OS id=19169
RSM0 started with pid=43, OS id=19276
RSM0 started with pid=43, OS id=19544
RSM0 started with pid=43, OS id=19594
RSM0 started with pid=43, OS id=19739
Sun Jun  6 17:16:24 2010
Errors in file /u01/app/oracle/admin/odb1/bdump/odb1ora1_lgwr_20916.trc:
ORA-00494: постановка в очередь [CF] на слишком большое время (more than 900 seconds) захвачена 'inst 1, osid 16608'
Sun Jun  6 17:17:24 2010
System State dumped to trace file /u01/app/oracle/admin/odb1/bdump/odb1ora1_lgwr_20916.trc
Killing enqueue blocker (pid=16608) on resource CF-00000000-00000000
 by terminating the process
Sun Jun  6 17:18:03 2010
Errors in file /u01/app/oracle/admin/odb1/bdump/odb1ora1_lgwr_20916.trc:
ORA-00239: истекло время ожидания для постановки в очередь управляющего файла: удерживается 'inst 1, osid 16608' более 900 сек
Sun Jun  6 17:18:04 2010
Errors in file /u01/app/oracle/admin/odb1/bdump/odb1ora1_pmon_20822.trc:
ORA-00470: процесс LGWR завершился с ошибкой
Sun Jun  6 17:18:04 2010
WARNING: inbound connection timed out (ORA-3136)
Sun Jun  6 17:18:04 2010
PMON: terminating instance due to error 470
Termination issued to instance processes. Waiting for the processes to exit

Детонатором по видимому послужило то, что за несколько часов до этого у обоих отваливалось одно из 3-х мест куда архивлоги дублируются (сетевая шАра) выставленная по параметру log_archive_dest_4
7 июн 10, 17:10    [8903994]     Ответить | Цитировать Сообщить модератору
 Re: Два разных экземпляра crash одновременно  [new]
Dimka9
Member

Откуда: Владивосток
Сообщений: 1851
я что-то недоглядел или ты на двух БД в один и тот же момент контрольник в один и тот же файл бэкапил?
8 июн 10, 02:35    [8905547]     Ответить | Цитировать Сообщить модератору
 Re: Два разных экземпляра crash одновременно  [new]
Дядя Жора
Member

Откуда: Одесса
Сообщений: 846
Dimka9
я что-то недоглядел или ты на двух БД в один и тот же момент контрольник в один и тот же файл бэкапил?


Так базы на разных серваках. Соответственно "один и тот же путь" у них разный.
8 июн 10, 11:09    [8906613]     Ответить | Цитировать Сообщить модератору
Все форумы / Oracle Ответить