Добро пожаловать в форум, Guest  >>   Войти | Регистрация | Поиск | Правила | В избранное | Подписаться
Все форумы / Oracle Новый топик    Ответить
Топик располагается на нескольких страницах: [1] 2   вперед  Ctrl      все
 Проблема RMAN+Linux+RAM  [new]
ig7485
Member

Откуда:
Сообщений: 18
Ошибка при выполнении скрипта RMAN ом:
RMAN-00571: ===========================================================
RMAN-00569: =============== ERROR MESSAGE STACK FOLLOWS ===============
RMAN-00571: ===========================================================
RMAN-00601: fatal error in recovery manager
RMAN-03004: fatal error during execution of command
RMAN-10038: database session for channel c1 terminated unexpectedly

скрипт:

RMAN> CONFIGURE RETENTION POLICY TO REDUNDANCY 1;
2> CONFIGURE CONTROLFILE AUTOBACKUP OFF;
3> CONFIGURE CONTROLFILE AUTOBACKUP FORMAT FOR DEVICE TYPE DISK TO '%F';
4> CONFIGURE DATAFILE BACKUP COPIES FOR DEVICE TYPE DISK TO 1;
5> CONFIGURE ARCHIVELOG BACKUP COPIES FOR DEVICE TYPE DISK TO 1;
6> CONFIGURE CHANNEL DEVICE TYPE DISK FORMAT '%U';
7>
8> run {
9> allocate channel c1 type disk;
10> backup database format '/u05/arch/XXXXXX/05092008bd/%d-f-%T-%s-%p';
11> release channel c1;
12> }
13>

Информация в /var/log/message

Sep  5 03:03:32 srv kernel: oom-killer: gfp_mask=0xd0
Sep  5 03:03:32 srv kernel: Mem-info:
Sep  5 03:03:32 srv kernel: DMA per-cpu:
Sep  5 03:03:32 srv kernel: cpu 0 hot: low 2, high 6, batch 1
Sep  5 03:03:32 srv kernel: cpu 0 cold: low 0, high 2, batch 1
Sep  5 03:03:32 srv kernel: cpu 1 hot: low 2, high 6, batch 1
Sep  5 03:03:32 srv kernel: cpu 1 cold: low 0, high 2, batch 1
Sep  5 03:03:32 srv kernel: cpu 2 hot: low 2, high 6, batch 1
Sep  5 03:03:32 srv kernel: cpu 2 cold: low 0, high 2, batch 1
Sep  5 03:03:32 srv kernel: cpu 3 hot: low 2, high 6, batch 1
Sep  5 03:03:32 srv kernel: cpu 3 cold: low 0, high 2, batch 1
Sep  5 03:03:32 srv kernel: Normal per-cpu:
Sep  5 03:03:32 srv kernel: cpu 0 hot: low 32, high 96, batch 16
Sep  5 03:03:33 srv kernel: cpu 0 cold: low 0, high 32, batch 16
Sep  5 03:03:33 srv kernel: cpu 1 hot: low 32, high 96, batch 16
Sep  5 03:03:33 srv kernel: cpu 1 cold: low 0, high 32, batch 16
Sep  5 03:03:33 srv kernel: cpu 2 hot: low 32, high 96, batch 16
Sep  5 03:03:33 srv kernel: cpu 2 cold: low 0, high 32, batch 16
Sep  5 03:03:33 srv kernel: cpu 3 hot: low 32, high 96, batch 16
Sep  5 03:03:33 srv kernel: cpu 3 cold: low 0, high 32, batch 16
Sep  5 03:03:33 srv kernel: HighMem per-cpu:
Sep  5 03:03:33 srv kernel: cpu 0 hot: low 32, high 96, batch 16
Sep  5 03:03:33 srv kernel: cpu 0 cold: low 0, high 32, batch 16
Sep  5 03:03:33 srv kernel: cpu 1 hot: low 32, high 96, batch 16
Sep  5 03:03:33 srv kernel: cpu 1 cold: low 0, high 32, batch 16
Sep  5 03:03:33 srv kernel: cpu 2 hot: low 32, high 96, batch 16
Sep  5 03:03:33 srv kernel: cpu 2 cold: low 0, high 32, batch 16
Sep  5 03:03:33 srv kernel: cpu 3 hot: low 32, high 96, batch 16
Sep  5 03:03:33 srv kernel: cpu 3 cold: low 0, high 32, batch 16
Sep  5 03:03:33 srv kernel: 
Sep  5 03:03:33 srv kernel: Free pages:       15084kB (1664kB HighMem)
Sep  5 03:03:33 srv kernel: Active:452599 inactive:548905 dirty:0 writeback:89880 unstable:235046 free:3771 slab:16571 mapped:445087 pagetables:13287
Sep  5 03:03:33 srv kernel: DMA free:12500kB min:16kB low:32kB high:48kB active:0kB inactive:0kB present:16384kB pages_scanned:62 all_unreclaimable? yes
Sep  5 03:03:33 srv kernel: protections[]: 0 0 0
Sep  5 03:03:33 srv kernel: Normal free:920kB min:928kB low:1856kB high:2784kB active:24kB inactive:789432kB present:901120kB pages_scanned:1240800 all_unreclaimable? yes
Sep  5 03:03:33 srv kernel: protections[]: 0 0 0
Sep  5 03:03:33 srv kernel: HighMem free:1664kB min:512kB low:1024kB high:1536kB active:1810372kB inactive:1406188kB present:3538944kB pages_scanned:0 all_unreclaimable? no
Sep  5 03:03:33 srv kernel: protections[]: 0 0 0
Sep  5 03:03:33 srv kernel: DMA: 1*4kB 0*8kB 1*16kB 2*32kB 4*64kB 1*128kB 1*256kB 1*512kB 1*1024kB 1*2048kB 2*4096kB = 12500kB
Sep  5 03:03:33 srv kernel: Normal: 0*4kB 13*8kB 1*16kB 5*32kB 0*64kB 5*128kB 0*256kB 0*512kB 0*1024kB 0*2048kB 0*4096kB = 920kB
Sep  5 03:03:33 srv kernel: HighMem: 144*4kB 8*8kB 2*16kB 15*32kB 8*64kB 0*128kB 0*256kB 0*512kB 0*1024kB 0*2048kB 0*4096kB = 1664kB
Sep  5 03:03:33 srv kernel: Swap cache: add 2354418, delete 2348184, find 1024504/1391221, race 0+8
Sep  5 03:03:33 srv kernel: 0 bounce buffer pages
Sep  5 03:03:33 srv kernel: Free swap:       1895604kB
Sep  5 03:03:33 srv kernel: 1114112 pages of RAM
Sep  5 03:03:33 srv kernel: 819184 pages of HIGHMEM
Sep  5 03:03:33 srv kernel: 75720 reserved pages
Sep  5 03:03:33 srv kernel: 1636595 pages shared
Sep  5 03:03:33 srv kernel: 6249 pages swap cached
Sep  5 03:03:33 srv kernel: Out of Memory: Killed process 5028 (oracle).

т.е. ясно, что память кончилась и процесс пристрелили

почему кончилась - непонятно т.к. swap практически не используется

Может у кого было что-нибудь подобное?
Прежде всего хотелось бы выяснить сколько RMANу нужно памяти для полного счастья в моем случае?
Посоветуйте, что еще можно посмотреть для прояснения этой ситуации?

И еще несколько,на мой взгляд, существенных дополнений:

RAM сервера - 4Gb

размер архивируемой базы ~ 77 Gb

/u05 - на который идет архивирование - это

[root@srv /]# mount | grep u05
10.0.0.XXX:/u05 on /u05 type nfs (rw,bg,hard,nointr,rsize=32768,wsize=32768,tcp,nfsvers=3,timeo=600,addr=10.0.0.XXX)
[root@srv /]#
т.к. на сервере на котором работает RMAN нет требуемого дискового пространства.

[root@srv /]# uname -a
Linux srv.XXXXXX.dm 2.6.9-22.ELsmp #1 SMP Mon Sep 19 18:32:14 EDT 2005 i686 i686 i386 GNU/Linux
[root@srv /]#

[root@srv etc]# cat ./redhat-release
Red Hat Enterprise Linux ES release 4 (Nahant Update 2)
[root@srv etc]#


SQL> select * from v$version;
 
BANNER
----------------------------------------------------------------
Oracle9i Release 9.2.0.6.0 - Production
PL/SQL Release 9.2.0.6.0 - Production
CORE	9.2.0.6.0	Production
TNS for Linux: Version 9.2.0.6.0 - Production
NLSRTL Version 9.2.0.6.0 - Production


SQL> select name, value from v$parameter where name like 'la%';
 
NAME                         VALUE
---------------------------- -----------------------
large_pool_size              16777216
 
SQL>  
10 сен 08, 12:32    [6168188]     Ответить | Цитировать Сообщить модератору
 Re: Проблема RMAN+Linux+RAM  [new]
ku
Guest
похоже кешируется чтение датафайлов рман'ом. и кеш забивает всю память и не высвобождается.
попробуйте с параметром maxpiecesize ну скажем 1G.
10 сен 08, 14:34    [6169075]     Ответить | Цитировать Сообщить модератору
 Re: Проблема RMAN+Linux+RAM  [new]
Alex Roudnev
Member

Откуда: Валнут Крик, Калифорния
Сообщений: 5547
ku
похоже кешируется чтение датафайлов рман'ом. и кеш забивает всю память и не высвобождается.
попробуйте с параметром maxpiecesize ну скажем 1G.


Убейте стрелялку процессов. А вообще в правильных линуксах ее нету. Я помню бурные дебаты где то в линуксных листах (конкретно у красной шапки) по этому поводу.

А вообще - версию линукса в студию, прежде всего!
10 сен 08, 22:52    [6171104]     Ответить | Цитировать Сообщить модератору
 Re: Проблема RMAN+Linux+RAM  [new]
Alex Roudnev
Member

Откуда: Валнут Крик, Калифорния
Сообщений: 5547
Еще момент.

Дело в том, что для работы с NFS нужно указывать direct и не указывать async в FILESYSTEMIO_OPTIONS (не уверен что параметр так называется - найдете сами). А для обычной файловой системы указывают SETALL. Какой режим хватает RMAN - неизвестно.

Попробуйте поставить DIRECT и попробовать еще раз.
10 сен 08, 22:54    [6171108]     Ответить | Цитировать Сообщить модератору
 Re: Проблема RMAN+Linux+RAM  [new]
Сына
Member

Откуда:
Сообщений: 804
Alex Roudnev

Убейте стрелялку процессов. А вообще в правильных линуксах ее нету. Я помню бурные дебаты где то в линуксных листах (конкретно у красной шапки) по этому поводу.

Отключить oom_killer то можно, но, имха, проблемы все равно будут, он же не зря просыпается.

Автору, если решит отключить эту фичу:
[root@localhost ~]# sysctl vm.oom-kill
vm.oom-kill = 1
[root@localhost ~]#
[root@localhost ~]# echo vm.oom-kill = 0 >> /etc/sysctl.conf
[root@localhost ~]#
[root@localhost ~]# sysctl -q -p
[root@localhost ~]#
[root@localhost ~]# sysctl vm.oom-kill
vm.oom-kill = 0
11 сен 08, 09:59    [6171726]     Ответить | Цитировать Сообщить модератору
 Re: Проблема RMAN+Linux+RAM  [new]
Сына
Member

Откуда:
Сообщений: 804
Alex Roudnev
Еще момент.

Дело в том, что для работы с NFS нужно указывать direct и не указывать async в FILESYSTEMIO_OPTIONS (не уверен что параметр так называется - найдете сами). А для обычной файловой системы указывают SETALL. Какой режим хватает RMAN - неизвестно.

Попробуйте поставить DIRECT и попробовать еще раз.

В чем проблема с asynch?
11 сен 08, 09:59    [6171730]     Ответить | Цитировать Сообщить модератору
 Re: Проблема RMAN+Linux+RAM  [new]
sqlplus
Member

Откуда: sql+
Сообщений: 641
Странно только, что он активный процесс убивает, по идее должен неактивные убивать.
11 сен 08, 10:15    [6171801]     Ответить | Цитировать Сообщить модератору
 Re: Проблема RMAN+Linux+RAM  [new]
Сына
Member

Откуда:
Сообщений: 804
sqlplus
Странно только, что он активный процесс убивает, по идее должен неактивные убивать.

Убивает самый жирный процесс, если не ошибаюсь.
11 сен 08, 10:51    [6172037]     Ответить | Цитировать Сообщить модератору
 Re: Проблема RMAN+Linux+RAM  [new]
ig7485
Member

Откуда:
Сообщений: 18
Alex Roudnev
ku
похоже кешируется чтение датафайлов рман'ом. и кеш забивает всю память и не высвобождается.
попробуйте с параметром maxpiecesize ну скажем 1G.


Убейте стрелялку процессов. А вообще в правильных линуксах ее нету. Я помню бурные дебаты где то в линуксных листах (конкретно у красной шапки) по этому поводу.

А вообще - версию линукса в студию, прежде всего!


Red Hat Enterprise Linux ES release 4 (Nahant Update 2)
ядро
Linux 2.6.9-22.ELsmp #1 SMP Mon Sep 19 18:32:14 EDT 2005 i686 i686 i386 GNU/Linux
Я думаю если просто убрать стрелялку процессов то это будет не совсем правильное решение. Кончиться память еще раз и что дальше?
Меня больше волнует вопрос: почему swap не используется ?
А если не трудно намекните где именно поискать дебаты про поводу стрелялки процессов?
11 сен 08, 11:40    [6172447]     Ответить | Цитировать Сообщить модератору
 Re: Проблема RMAN+Linux+RAM  [new]
__mike__
Member

Откуда: Белгород
Сообщений: 553
была у меня такая проблема
решил так

disk_asynch_io=TRUE
filesystemio_options='SETALL'
11 сен 08, 16:20    [6174880]     Ответить | Цитировать Сообщить модератору
 Re: Проблема RMAN+Linux+RAM  [new]
была такая проблема
Guest
__mike__
была у меня такая проблема
решил так

disk_asynch_io=TRUE
filesystemio_options='SETALL'


а в случае бакапа архивлогов не поможет...
11 сен 08, 19:21    [6175920]     Ответить | Цитировать Сообщить модератору
 Re: Проблема RMAN+Linux+RAM  [new]
ig7485
Member

Откуда:
Сообщений: 18
Alex Roudnev
Еще момент.

Дело в том, что для работы с NFS нужно указывать direct и не указывать async в FILESYSTEMIO_OPTIONS (не уверен что параметр так называется - найдете сами). А для обычной файловой системы указывают SETALL. Какой режим хватает RMAN - неизвестно.

Попробуйте поставить DIRECT и попробовать еще раз.


Я пожалуй пока поэксперементирую с опцией монтирования NFS каталога - "noac"
 noac                 Disable  all forms of attribute caching entirely.  This
                      extracts  a  significant  performance  penalty  but  it
                      allows  two  different  NFS  clients  to get reasonable
                      results when both clients are  actively  writing  to  a
                      common export on the server.

С остальным буду эксперементировать на выходных, боязно как-то на продакшн в рабочие дни.
11 сен 08, 20:07    [6176038]     Ответить | Цитировать Сообщить модератору
 Re: Проблема RMAN+Linux+RAM  [new]
ig7485
Member

Откуда:
Сообщений: 18
была такая проблема
__mike__
была у меня такая проблема
решил так

disk_asynch_io=TRUE
filesystemio_options='SETALL'


а в случае бакапа архивлогов не поможет...


Почему? Оракл и RMAN знают о существованиии файлов архивлогов так же как и о файлах табличных пространств, почему должна быть разница в действии этих настроек для разных файлов оракла?
11 сен 08, 20:24    [6176097]     Ответить | Цитировать Сообщить модератору
 Re: Проблема RMAN+Linux+RAM  [new]
Alex Roudnev
Member

Откуда: Валнут Крик, Калифорния
Сообщений: 5547
Сына
Alex Roudnev
Еще момент.

Дело в том, что для работы с NFS нужно указывать direct и не указывать async в FILESYSTEMIO_OPTIONS (не уверен что параметр так называется - найдете сами). А для обычной файловой системы указывают SETALL. Какой режим хватает RMAN - неизвестно.

Попробуйте поставить DIRECT и попробовать еще раз.

В чем проблема с asynch?


В том что он не работает или по крайней мере раньше не работал с NFS.
11 сен 08, 21:46    [6176228]     Ответить | Цитировать Сообщить модератору
 Re: Проблема RMAN+Linux+RAM  [new]
Alex Roudnev
Member

Откуда: Валнут Крик, Калифорния
Сообщений: 5547
ig7485
Alex Roudnev
ku
похоже кешируется чтение датафайлов рман'ом. и кеш забивает всю память и не высвобождается.
попробуйте с параметром maxpiecesize ну скажем 1G.


Убейте стрелялку процессов. А вообще в правильных линуксах ее нету. Я помню бурные дебаты где то в линуксных листах (конкретно у красной шапки) по этому поводу.

А вообще - версию линукса в студию, прежде всего!


Red Hat Enterprise Linux ES release 4 (Nahant Update 2)
ядро
Linux 2.6.9-22.ELsmp #1 SMP Mon Sep 19 18:32:14 EDT 2005 i686 i686 i386 GNU/Linux
Я думаю если просто убрать стрелялку процессов то это будет не совсем правильное решение. Кончиться память еще раз и что дальше?
Меня больше волнует вопрос: почему swap не используется ?
А если не трудно намекните где именно поискать дебаты про поводу стрелялки процессов?


Убить стрелялку, добавить гига 4 свопа, попробовать дальше. Насколько я помню, от той стрелялки толку никакого, не даром ее нету в большинстве линуксов.
11 сен 08, 21:46    [6176229]     Ответить | Цитировать Сообщить модератору
 Re: Проблема RMAN+Linux+RAM  [new]
Alex Roudnev
Member

Откуда: Валнут Крик, Калифорния
Сообщений: 5547
ig7485
была такая проблема
__mike__
была у меня такая проблема
решил так

disk_asynch_io=TRUE
filesystemio_options='SETALL'


а в случае бакапа архивлогов не поможет...


Почему? Оракл и RMAN знают о существованиии файлов архивлогов так же как и о файлах табличных пространств, почему должна быть разница в действии этих настроек для разных файлов оракла?


Первый параметр относится к raw и ASM но не файловой системе.

Второй параметр относится ко всем файловым системам сразу, раньше NFS не поддерживал aio, сейчас не скажу (надо глянуть).

Да и вообще непонятно, при чем тут режим записи если стреляют рмен за использование виртуальной памяти. Прежде всего уберите эту идиотскую стрелялку, а дальше уже разбирайтесь. От нее в продакшен енвайренментах один лишь вред.
11 сен 08, 21:48    [6176233]     Ответить | Цитировать Сообщить модератору
 Re: Проблема RMAN+Linux+RAM  [new]
Вячеслав Любомудров
Member

Откуда: Владивосток
Сообщений: 18484
Alex Roudnev
ig7485
была такая проблема
__mike__
была у меня такая проблема
решил так

disk_asynch_io=TRUE
filesystemio_options='SETALL'


а в случае бакапа архивлогов не поможет...


Почему? Оракл и RMAN знают о существованиии файлов архивлогов так же как и о файлах табличных пространств, почему должна быть разница в действии этих настроек для разных файлов оракла?


Первый параметр относится к raw и ASM но не файловой системе.
Че, правда что-ли?
12 сен 08, 03:41    [6176657]     Ответить | Цитировать Сообщить модератору
 Re: Проблема RMAN+Linux+RAM  [new]
Сына
Member

Откуда:
Сообщений: 804
Alex Roudnev
В том что он не работает или по крайней мере раньше не работал с NFS.

Не скажу с какой версии в ядро включена поддержка этого добра, но я уже давненько пользую aio на nfs.
12 сен 08, 09:22    [6176879]     Ответить | Цитировать Сообщить модератору
 Re: Проблема RMAN+Linux+RAM  [new]
Сына
Member

Откуда:
Сообщений: 804
Alex Roudnev
Убить стрелялку, добавить гига 4 свопа, попробовать дальше. Насколько я помню, от той стрелялки толку никакого, не даром ее нету в большинстве линуксов.

Ага, и пусть весь мир подождет :) гыыы.
12 сен 08, 09:28    [6176901]     Ответить | Цитировать Сообщить модератору
 Re: Проблема RMAN+Linux+RAM  [new]
Консерва
Member

Откуда:
Сообщений: 2794
Alex Roudnev
ig7485
была такая проблема
__mike__
была у меня такая проблема
решил так

disk_asynch_io=TRUE
filesystemio_options='SETALL'


а в случае бакапа архивлогов не поможет...


Почему? Оракл и RMAN знают о существованиии файлов архивлогов так же как и о файлах табличных пространств, почему должна быть разница в действии этих настроек для разных файлов оракла?


Первый параметр относится к raw и ASM но не файловой системе.


вычитать и умножать учат в школе, учат в школе, учат в школе...
Automatic Storage Management (ASM) is an integrated, high-performance database file system and disk manager. ASM is based on the principle that the database should manage storage instead of requiring an administrator to do it. ASM eliminates the need for you to directly manage potentially thousands of Oracle database files.

ASM groups the disks in your storage system into one or more disk groups. You manage a small set of disk groups and ASM automates the placement of the database files within those disk groups.

ASM provides the following benefits:

http://download.oracle.com/docs/cd/B19306_01/server.102/b14196/asm001.htm#CIADJDJF
12 сен 08, 09:28    [6176907]     Ответить | Цитировать Сообщить модератору
 Re: Проблема RMAN+Linux+RAM  [new]
ig7485
Member

Откуда:
Сообщений: 18
Сына
Alex Roudnev
Убить стрелялку, добавить гига 4 свопа, попробовать дальше. Насколько я помню, от той стрелялки толку никакого, не даром ее нету в большинстве линуксов.

Ага, и пусть весь мир подождет :) гыыы.


Если речь идет о том, что использование свопа сильно замедлит время отклика базы, то в моем случае в этом ничего страшного нет. Архивирование идет по ночам, база в это время не используется. Более того я хочу что бы использовался своп, а у меня же он практически не используется.
Я примерно понял почему у меня убиваются процессы из-за нехватки памяти, при пустом свопе. В Note:452326.1 говорится о том, что это просиходит в случае когда Highmem еще содержит свободные страницы, а в LowMem они уже закончились. Но приложение просит выделить память именно из LowMem. В http://kbase.redhat.com/faq/FAQ_43_8555.shtm говорится и http://kbase.redhat.com/faq/FAQ_85_13111.shtm. говорится как этого избежать. Все дело в ключе vm.lower_zone_protection. Остальсь дело за малым, проверить это.

Отключать oom killer не хочу принципиально.
12 сен 08, 13:38    [6178606]     Ответить | Цитировать Сообщить модератору
 Re: Проблема RMAN+Linux+RAM  [new]
ig7485
Member

Откуда:
Сообщений: 18
Сына
Alex Roudnev
В том что он не работает или по крайней мере раньше не работал с NFS.

Не скажу с какой версии в ядро включена поддержка этого добра, но я уже давненько пользую aio на nfs.


Note:279069.1 Начиная с RedHat Enterprise Linux 4, но с оговорками.
12 сен 08, 13:56    [6178756]     Ответить | Цитировать Сообщить модератору
 Re: Проблема RMAN+Linux+RAM  [new]
Сына
Member

Откуда:
Сообщений: 804
ig7485
Остальсь дело за малым, проверить это.

Не пробовали ядро из последнего апдейта использовать?
12 сен 08, 15:14    [6179342]     Ответить | Цитировать Сообщить модератору
 Re: Проблема RMAN+Linux+RAM  [new]
Alex Roudnev
Member

Откуда: Валнут Крик, Калифорния
Сообщений: 5547
Вячеслав Любомудров
Alex Roudnev
ig7485
была такая проблема
__mike__
была у меня такая проблема
решил так

disk_asynch_io=TRUE
filesystemio_options='SETALL'


а в случае бакапа архивлогов не поможет...


Почему? Оракл и RMAN знают о существованиии файлов архивлогов так же как и о файлах табличных пространств, почему должна быть разница в действии этих настроек для разных файлов оракла?


Первый параметр относится к raw и ASM но не файловой системе.
Че, правда что-ли?


Ну а зачем там тогда второй параметр??
13 сен 08, 02:56    [6181203]     Ответить | Цитировать Сообщить модератору
 Re: Проблема RMAN+Linux+RAM  [new]
Вячеслав Любомудров
Member

Откуда: Владивосток
Сообщений: 18484
Просто все немного наоборот :)
Как раз второй действует только на файловые системы, тогда как первый -- глобально
15 сен 08, 05:47    [6183677]     Ответить | Цитировать Сообщить модератору
Топик располагается на нескольких страницах: [1] 2   вперед  Ctrl      все
Все форумы / Oracle Ответить