Добро пожаловать в форум, Guest  >>   Войти | Регистрация | Поиск | Правила | В избранное | Подписаться
Все форумы / Oracle Новый топик    Ответить
 Oracle FailSafe 4.1.1  [new]
nick348
Member

Откуда: Санкт-Петербург
Сообщений: 64
Добрый день, коллеги

Имеется OracleFailSafe 4.1.1+Windows Server 2012R2 + Oracle Database 12.1.0.2

Проблема такая:

Sample database создается и помещается в кластер нормально.
Если помещать самостоятельно созданную на кластерных дисках базу, то возникают ошибки. Судя по логу, инстанс в группу помещается нормально и переводится в онлайн, но дальше ощущение такое что кластерные службы не могут стартовать базу. В алертлоге старта базы не фиксируется, только останов. В чем может быть проблема? В event-логе такое

далее логи. Если что-то нужно дорассказать/показать дополнительно спрашивайте.
У меня есть несколько кластеров версии 3(.4.1 и 4.2) с базами 10g и 11g - там таких проблем нет. Здесть мне нужен именно 12c кластер (пока для тестов). Oracle 12.2 и OFS 4.2 пробовал - там теже ошибки.
База тестовая создана с нуля через dbca.

Oracle Fail Safe resource tst failed to start.
ORA-01034: ORACLE not available
ORA-27101: shared memory realm does not exist

Вот сам лог помещения базы в группу

27 сентября 2018 г.

Versions
Fail Safe Manager 4.1.1.0
Fail Safe API 4.1.1.0
Fail Safe Server 4.1.1.0

Nodes
v98-tstn-04 Windows Server V6.2
v98-tstn-03 Windows Server V6.2

17:38:40 FS-10370: Adding the resource wgs to group TESTBASE
17:38:40 FS-10371: v98-tstn-04 : Performing initialization processing
17:38:41 FS-10371: v98-tstn-03 : Performing initialization processing
17:38:41 FS-10372: v98-tstn-04 : Gathering resource owner information
17:38:41 FS-10372: v98-tstn-03 : Gathering resource owner information
17:38:41 FS-10373: v98-tstn-04 : Determining owner node of resource wgs
17:38:41 FS-10374: v98-tstn-04 : Gathering cluster information needed to perform the specified operation
17:38:41 FS-10374: v98-tstn-03 : Gathering cluster information needed to perform the specified operation
17:38:41 FS-10375: v98-tstn-03 : Analyzing cluster information needed to perform the specified operation
17:38:41 FS-10652: v98-tstn-04 has Oracle Database version 12.1.0.2 installed in OraDB12Home1
17:38:41 FS-10652: v98-tstn-03 has Oracle Database version 12.1.0.2 installed in OraDB12Home1
17:38:41 FS-10376: v98-tstn-03 : Starting configuration of resource wgs
17:38:41 FS-10378: v98-tstn-03 : Preparing for configuration of resource wgs
17:38:42 FS-10341: Starting verification of database wgs
17:38:42 FS-10343: Starting verification of database instance information for database wgs
17:38:42 FS-10425: Querying the disks used by the database wgs
17:38:42 FS-10404: The database uses a nonclustered disk in one of the system parameters. Value of parameter is C:\ORACLE\ADMIN\tst\ADUMP
17:38:42 FS-10345: Verification of standalone database wgs completed successfully
17:38:42 FS-10380: v98-tstn-03 : Configuring virtual server information for resource wgs
17:38:42 FS-10490: Configuring the Oracle Net listener for wgs
17:38:42 FS-10600: Oracle Net configuration file updated: C:\oracle\product\12.1.0\dbhome_1\network\admin\listener.ora
17:38:42 FS-10600: Oracle Net configuration file updated: C:\oracle\product\12.1.0\dbhome_1\network\admin\tnsnames.ora
17:38:52 FS-10605: Oracle Net listener FslTESTBASE created
17:38:52 FS-10381: v98-tstn-03 : Creating the resource information for resource wgs
17:38:52 FS-10426: Adding the database resource wgs to group TESTBASE
17:38:52 FS-10382: v98-tstn-03 : Bringing resource wgs online
17:39:00 FS-10726: Resource wgs is in a failed state
17:39:00 FS-10012: Failed to bring the cluster resource wgs online. Check the Windows event log for messages
17:39:00 FS-10782: The Oracle Database resource provider failed to bring resource wgs online
17:39:00 FS-10890: Oracle Services for MSCS failed during the add operation
17:39:00 FS-10497: Starting clusterwide rollback of the operation
17:39:00 FS-10488: v98-tstn-03 : Starting rollback of operation
17:39:03 FS-10350: Starting database wgs
17:39:05 ORA-01034: ORACLE not availableORA-27101: shared memory realm does not exist
17:39:05 FS-10600: Oracle Net configuration file updated: C:\oracle\product\12.1.0\dbhome_1\network\admin\tnsnames.ora
17:39:06 FS-10604: Oracle Net listener FslTESTBASE deleted
17:39:06 FS-10999: An internal programming error has occurred
17:39:06 FS-10600: Oracle Net configuration file updated: C:\oracle\product\12.1.0\dbhome_1\network\admin\listener.ora
17:39:06 FS-10489: v98-tstn-03 : Completed rollback of operation
17:39:06 FS-10495: Clusterwide rollback of the operation has been completed
17:39:06 The clusterwide operation failed.
28 сен 18, 16:31    [21689288]     Ответить | Цитировать Сообщить модератору
 Re: Oracle FailSafe 4.1.1  [new]
nick348
Member

Откуда: Санкт-Петербург
Сообщений: 64
nick348,

Еще уточнение. Вне кластера база стартует и работает нормально.
28 сен 18, 16:35    [21689295]     Ответить | Цитировать Сообщить модератору
 Re: Oracle FailSafe 4.1.1  [new]
andrey_anonymous
Member

Откуда: Москва
Сообщений: 16773
автор
17:39:00 FS-10012: Failed to bring the cluster resource wgs online. Check the Windows event log for messages
17:39:00 FS-10782: The Oracle Database resource provider failed to bring resource wgs online
17:39:00 FS-10890: Oracle Services for MSCS failed during the add operation


Никогда не поднимал кластер под win, но что-то оно как-то не дружит с MSCS.
Возможно, все-таки стоит почитать eventlog?

Применительно к БД смущает еще две вещи:
1. Попытка поднять отдельный именованный листенер, оно для зачем? И не конфликтует ли с уже имеющимся листенером по ресурсам (порт)?
автор
17:38:42 FS-10600: Oracle Net configuration file updated: C:\oracle\product\12.1.0\dbhome_1\network\admin\listener.ora
17:38:42 FS-10600: Oracle Net configuration file updated: C:\oracle\product\12.1.0\dbhome_1\network\admin\tnsnames.ora
17:38:52 FS-10605: Oracle Net listener FslTESTBASE created


2. Уверены, что на всех нодах присутствует указанный путь и этот путь доступен пользователю, от которого поднимается экземпляр, на всех нодах?
автор
17:38:42 FS-10404: The database uses a nonclustered disk in one of the system parameters. Value of parameter is C:\ORACLE\ADMIN\tst\ADUMP
28 сен 18, 16:55    [21689324]     Ответить | Цитировать Сообщить модератору
 Re: Oracle FailSafe 4.1.1  [new]
nick348
Member

Откуда: Санкт-Петербург
Сообщений: 64
andrey_anonymous,

Спасибо за помощь, но...

"Никогда не поднимал кластер под win, но что-то оно как-то не дружит с MSCS.
Возможно, все-таки стоит почитать eventlog?"

читал. там фейл при старте базы, который Я привел

Oracle Fail Safe resource tst failed to start.
ORA-01034: ORACLE not available
ORA-27101: shared memory realm does not exist

Листнер отключил - та же проблема. Если проблема в нем почему sample database садится в кластер нормально?

По поводу adump - перенестраивал на кластерный диск - тоже не помогло.
1 окт 18, 10:58    [21690829]     Ответить | Цитировать Сообщить модератору
 Re: Oracle FailSafe 4.1.1  [new]
andrey_anonymous
Member

Откуда: Москва
Сообщений: 16773
nick348
там фейл при старте базы, который Я привел

Листнер отключил - та же проблема. Если проблема в нем почему sample database садится в кластер нормально?

По поводу adump - перенестраивал на кластерный диск - тоже не помогло.

1. И все? что-то не верится.
2. Листенер не надо было "отключить", его надо было почитать на предмет конфликта ресурсов.
А если отключать - то убедиться, что БД настроена на имеющийся листенер - авторегистрация однако.

Теперь про "shared memory realm".
Система такая:
- под никсами первый же процесс экземпляра создает shared memory segment(ы), к которому(ым) при старте подключаются фоновые процессы. Поэтому под никс новый сервис (экземпляр) БД элементарно поднимается из sqlplus
- под win все немного иначе. Все процессы oracle реализованы как threads общего процесса oracle.exe, а shared memory - просто кусок памяти в пределах одного процесса.
Поэтому этот самый процесс необходимо запустить.
Можно даже лапками, но принято - сервисом win.
Соответственно, получение "shared memory realm" при старте сервиса win означает, что что-то идет не так именно при запуске сервиса WIN, еще до того, как oracle начнет создавать свои фоновые процессы.
Потому и чтить надо виндовый event.log, а не оракловый alert.log
Может привилегий каких пользователю не хватает (к примеру, юзер system не имеет привилегий на работу с сетью), может памяти, может UAC протестует...
1 окт 18, 15:54    [21691440]     Ответить | Цитировать Сообщить модератору
 Re: Oracle FailSafe 4.1.1  [new]
nick348
Member

Откуда: Санкт-Петербург
Сообщений: 64
andrey_anonymous,


1. И все? что-то не верится.

В Станиславского играть будем? Нет ничего там. Я бы привел конечно логи, но там реально нет критичных событий кроме этого, а мусорить пост не хочется.

2. Листенер не надо было "отключить", его надо было почитать на предмет конфликта ресурсов.
А если отключать - то убедиться, что БД настроена на имеющийся листенер - авторегистрация однако.

Если он не запущен то какие конфликты? Таки да, если при отключенном листненере оно бы поднялось - дело в конфликте, но нет.
Еще раз говорю - это не первый мой кластер, да и с ораклом не вчера столкнулся. Интересует как раз сталкивался ли кто с версией 4.1.1 и с 3.4 и в чем разница в поведении.

Теперь про "shared memory realm".
Система такая:
- под никсами первый же процесс экземпляра создает shared memory segment(ы), к которому(ым) при старте подключаются фоновые процессы. Поэтому под никс новый сервис (экземпляр) БД элементарно поднимается из sqlplus
- под win все немного иначе. Все процессы oracle реализованы как threads общего процесса oracle.exe, а shared memory - просто кусок памяти в пределах одного процесса.
Поэтому этот самый процесс необходимо запустить.
Можно даже лапками, но принято - сервисом win.
Соответственно, получение "shared memory realm" при старте сервиса win означает, что что-то идет не так именно при запуске сервиса WIN, еще до того, как oracle начнет создавать свои фоновые процессы.
Потому и чтить надо виндовый event.log, а не оракловый alert.log
Может привилегий каких пользователю не хватает (к примеру, юзер system не имеет привилегий на работу с сетью), может памяти, может UAC протестует...

Спасибо, кэп, как работает оракл Я знаю, азы мне обьяснять не надо.
Служба как раз запускается нормально и от system. UAC отключен. Пользователь администратор кластера в группе ora_dba (и system тоже). Отдельностоящая база запускается нормально. Значит дело в кластере

>sc query oracleservicetest3

SERVICE_NAME: oracleservicetest3
TYPE : 10 WIN32_OWN_PROCESS
STATE : 4 RUNNING
(STOPPABLE, PAUSABLE, ACCEPTS_SHUTDOWN)
WIN32_EXIT_CODE : 0 (0x0)
SERVICE_EXIT_CODE : 0 (0x0)
CHECKPOINT : 0x0
WAIT_HINT : 0x0
2 окт 18, 14:36    [21692711]     Ответить | Цитировать Сообщить модератору
 Re: Oracle FailSafe 4.1.1  [new]
Dr. SYS
Member

Откуда:
Сообщений: 21
А Oracle support молчит ?
2 окт 18, 15:09    [21692776]     Ответить | Цитировать Сообщить модератору
 Re: Oracle FailSafe 4.1.1  [new]
nick348
Member

Откуда: Санкт-Петербург
Сообщений: 64
Dr. SYS,

Техподдержки нет, так как Оракл куплен давно, а техподдержкой не заморачивались (обычная мне думается ситуация). Я бы с радостью и металинк бы почитал тоже... но, как говорится, за неимением гербовой бумаги пишем на туалетной..
2 окт 18, 15:28    [21692818]     Ответить | Цитировать Сообщить модератору
 Re: Oracle FailSafe 4.1.1  [new]
andrey_anonymous
Member

Откуда: Москва
Сообщений: 16773
nick348
>sc query oracleservicetest3

SERVICE_NAME: oracleservicetest3
TYPE : 10 WIN32_OWN_PROCESS
STATE : 4 RUNNING
(STOPPABLE, PAUSABLE, ACCEPTS_SHUTDOWN)
WIN32_EXIT_CODE : 0 (0x0)
SERVICE_EXIT_CODE : 0 (0x0)
CHECKPOINT : 0x0
WAIT_HINT : 0x0

А если в этом состоянии подключиться локально плюсом к экземпляру "test3" - что будет?
2 окт 18, 16:27    [21692944]     Ответить | Цитировать Сообщить модератору
 Re: Oracle FailSafe 4.1.1  [new]
nick348
Member

Откуда: Санкт-Петербург
Сообщений: 64
andrey_anonymous,

Connected to an idle instance.
2 окт 18, 17:12    [21693018]     Ответить | Цитировать Сообщить модератору
 Re: Oracle FailSafe 4.1.1  [new]
nick348
Member

Откуда: Санкт-Петербург
Сообщений: 64
andrey_anonymous,

Еще заметил что если после этого делать startup то

SQL> startup
ORA-01078: failure in processing system parameters
ORA-01565: error in identifying file 'g:\oradata\test3\SPFILETEST3.ORA'
ORA-27046: file size is not a multiple of logical block size
OSD-04012: file size mismatch (OS 73)

и spfile сам портится. там остается только параметр связанный с листнером и вверху странный символ.

C"
local_listener="(ADDRESS=(PROTOCOL=TCP)(HOST=<ip ноды на которой база изначально>)(PORT=1521))"
2 окт 18, 17:29    [21693042]     Ответить | Цитировать Сообщить модератору
 Re: Oracle FailSafe 4.1.1  [new]
andrey_anonymous
Member

Откуда: Москва
Сообщений: 16773
Ну вот и причина - spfile кривой :)
Было как-то нечто отдаленно похожее:
ORA-32000
2 окт 18, 17:58    [21693080]     Ответить | Цитировать Сообщить модератору
 Re: Oracle FailSafe 4.1.1  [new]
nick348
Member

Откуда: Санкт-Петербург
Сообщений: 64
andrey_anonymous,

Это я понял. Вопрос в том почему он портится. Потому что при каждом заведении в кластер это происходит.
3 окт 18, 08:51    [21693658]     Ответить | Цитировать Сообщить модератору
 Re: Oracle FailSafe 4.1.1  [new]
andrey_anonymous
Member

Откуда: Москва
Сообщений: 16773
nick348
и вверху странный символ.

Рискну напомнить, что spfile - бинарный.
Т.е. сам по себе - скорее всего нормальный, надо права проконтролировать и убедиться, что он не на nfs-е каком лежит.

nick348
Вопрос в том почему он портится. Потому что при каждом заведении в кластер это происходит.

Ссылку не почитали?
Я тогда дошел до того, что на локальном диске ноды spfile размещать вообще не следует.
Только pfile со ссылкой на shared spfile для старта экземпляра.
Посмотрите на pfile и spfile Sample database (которая успешно размещается), в чем разница (наличие, размещение, контент, привилегии)
3 окт 18, 10:13    [21693741]     Ответить | Цитировать Сообщить модератору
 Re: Oracle FailSafe 4.1.1  [new]
nick348
Member

Откуда: Санкт-Петербург
Сообщений: 64
andrey_anonymous,

Cсылку почитал. Не очень понял причину. У меня хранилка iSCSI и портится только spfile.
Понятно что бинарный.
Лежит на кластерном диске как и должен.
У той что помещается вообще в pfile только ссылка на spfile.
Если так сделать на самодельной базе, то такого не получается - начинает ругаться что не хватает параметров.
Нормальный spfile у standalone базы по контенту другой совсем - он больше по размеру и т.д.
4 окт 18, 11:08    [21694919]     Ответить | Цитировать Сообщить модератору
 Re: Oracle FailSafe 4.1.1  [new]
DВА
Member

Откуда:
Сообщений: 5213
почему resource tst, база wgs, а инстанс test ?
с названиями что-то напутали
4 окт 18, 11:24    [21694946]     Ответить | Цитировать Сообщить модератору
 Re: Oracle FailSafe 4.1.1  [new]
nick348
Member

Откуда: Санкт-Петербург
Сообщений: 64
DВА,

Несколько раз с разными именами переделывал. ошибка одна и та же. В листинги да, мог напутать.
4 окт 18, 11:49    [21694994]     Ответить | Цитировать Сообщить модератору
 Re: Oracle FailSafe 4.1.1  [new]
andrey_anonymous
Member

Откуда: Москва
Сообщений: 16773
nick348
Понятно что бинарный.
Лежит на кластерном диске как и должен.
У той что помещается вообще в pfile только ссылка на spfile.
Если так сделать на самодельной базе, то такого не получается - начинает ругаться что не хватает параметров.
Нормальный spfile у standalone базы по контенту другой совсем - он больше по размеру и т.д.

1. g:\oradata\test3\ - кластерный?
2. По ссылке я тогда пришел к рабочей схеме "локальный нодовый pfile со ссылкой на кластерный spfile", локальных нодовых spfile быть не должно - экземпляр предпочитает их pfile-лу и может путаться в винегрете из локальных и нодовых spfile.
3. Содержимое (s|p)file - не очень понятно, что мешает создать кластерный spfile с требуемым контентом.
4 окт 18, 12:09    [21695028]     Ответить | Цитировать Сообщить модератору
 Re: Oracle FailSafe 4.1.1  [new]
nick348
Member

Откуда: Санкт-Петербург
Сообщений: 64
andrey_anonymous,

1. Кластерный диск g:. Физически он на хранилке iSCSI
2. Так и есть. pfile локальный в %ORA_HOME%\database (ОС windows) с параметрами (листинг ниже), в том числе с параметром spfile. Сам spfile лежит по кластерному пути. Сделан через
create spfile='g:\oradata\test3\spfiletest3.ora' from pfile;

test3.__db_cache_size=3506438144
test3.__java_pool_size=16777216
test3.__large_pool_size=33554432
test3.__oracle_base='C:\oracle'#ORACLE_BASE set from environment
test3.__pga_aggregate_target=3087007744
test3.__sga_target=4630511616
test3.__shared_io_pool_size=234881024
test3.__shared_pool_size=822083584
test3.__streams_pool_size=0
*.audit_file_dest='g:\oradata\test3\adump'
*.audit_trail='db'
*.compatible='12.1.0.2.0'
*.control_files='g:\oradata\test3\control01.ctl','g:\oradata\test3\control02.ctl'
*.db_block_size=8192
*.db_domain=''
*.db_name='test3'
*.db_recovery_file_dest='G:\WGS_BCK'
*.db_recovery_file_dest_size=6420m
*.diagnostic_dest='C:\oracle'
*.dispatchers='(PROTOCOL=TCP)'
*.local_listener='LISTENER_TEST3'
*.log_archive_format='ARC%S_%R.%T'
*.memory_target=7360m
*.nls_language='RUSSIAN'
*.nls_territory='RUSSIA'
*.open_cursors=300
*.processes=300
*.remote_login_passwordfile='EXCLUSIVE'
*.undo_tablespace='UNDOTBS1'
SPFILE=g:\oradata\test3\SPFILETEST3.ORA

3. Вот как раз что мешает и непонятно, так как командой в п2 создается нормальный бинарный spfile (листинг ниже) с которым инстанс прекрасно запускается, база открывается и к ней есть доступ, но он ВНЕЗАПНО портится при помещении в кластер.

C"  C«     фрл: C C"  E test3.__data_transfer_cache_size=0
test3.__db_cache_size=3388997632
test3.__java_pool_size=16777216
test3.__large_pool_size=150994944
test3.__oracle_base='C:\oracle'#ORACLE_BASE set from environment
test3.__pga_aggregate_target=3087007744
test3.__sga_target=4630511616
test3.__shared_io_pool_size=234881024
test3.__shared_pool_size=822083584
test3.__streams_pool_size=0
*.audit_file_dest='g:\oradata\test3\adump'
*.audit_trail='db'
*.compatible='12.1.0.2.0'
*.control_files='g:\oradata\teC C"   st3\control01.ctl','g:\oradata\test3\control02.ctl'
*.db_block_size=8192
*.db_domain=''
*.db_name='test3'
*.db_recovery_file_dest='G:\WGS_BCK'
*.db_recovery_file_dest_size=6420m
*.diagnostic_dest='C:\oracle'
*.dispatchers='(PROTOCOL=TCP)'
*.local_listener='(ADDRESS=(PROTOCOL=IPC)(KEY=REGISTER_FslTESTBASE))'#03.10.2018 10:46:12 by Oracle Fail Safe
*.log_archive_format='ARC%S_%R.%T'
*.memory_target=7360m
*.nls_language='RUSSIAN'
*.nls_territory='RUSSIA'
*.open_cursors=300
*.processes=3C C"  ~W 00
*.remote_login_passwordfile='EXCLUSIVE'
*.undo_tablespace='UNDOTBS1'
C C"  Fe C C"  Ee C C"  De C
4 окт 18, 12:52    [21695094]     Ответить | Цитировать Сообщить модератору
 Re: Oracle FailSafe 4.1.1  [new]
andrey_anonymous
Member

Откуда: Москва
Сообщений: 16773
nick348
andrey_anonymous,

1. Кластерный диск g:. Физически он на хранилке iSCSI
2. Так и есть. pfile локальный в %ORA_HOME%\database (ОС windows) с параметрами (листинг ниже), в том числе с параметром spfile. Сам spfile лежит по кластерному пути. Сделан через
create spfile='g:\oradata\test3\spfiletest3.ora' from pfile;

test3.__db_cache_size=3506438144
...
*.audit_file_dest='g:\oradata\test3\adump'
...
SPFILE=g:\oradata\test3\SPFILETEST3.ORA

ИМХО:
1. Почему __db_cache_size=3506438144 и прочие указаны только для одной ноды кластера?
Если они одинаковые для всех нод, то *.__db_cache_size=3506438144, если разные - то "звездочный" параметр все равно лучше завести.
2. "шаблонный" pfile (используемый для создания spfile) не должен содержать ссылки на spfile (по этой ссылке выходит, что итоговый spfile должен сослаться ссылается сам на себя - индусы могли не предусмотреть).
3. "стартовый" pfile (который лежит в dbs и используется для старта экземпляра без явного указания) не должен содержать ничего кроме SPFILE=g:\oradata\test3\SPFILETEST3.ORA
4. в dbs, где лежит pfile (3), физически не должно быть spfile
4 окт 18, 17:33    [21695550]     Ответить | Цитировать Сообщить модератору
 Re: Oracle FailSafe 4.1.1  [new]
nick348
Member

Откуда: Санкт-Петербург
Сообщений: 64
andrey_anonymous,

1. учту
2. сделал
3.сделал. не помогло
4. так и есть там нет никаких spfile
4 окт 18, 17:58    [21695597]     Ответить | Цитировать Сообщить модератору
Все форумы / Oracle Ответить