Добро пожаловать в форум, Guest  >>   Войти | Регистрация | Поиск | Правила | В избранное | Подписаться
Все форумы / Oracle Новый топик    Ответить
Топик располагается на нескольких страницах: Ctrl  назад   1 .. 5 6 7 8 9 [10] 11 12 13 14 .. 34   вперед  Ctrl
 Re: Оракле оказывается виноват  [new]
Информация
Guest
Кстати, Сбер выложил информацию о сбое и приглашает всех
14 июл 12, 12:25    [12866543]     Ответить | Цитировать Сообщить модератору
 Re: Оракле оказывается виноват  [new]
Информация
Guest
http://banks.cnews.ru/news/line/index.shtml?2012/07/13/496439
14 июл 12, 12:26    [12866545]     Ответить | Цитировать Сообщить модератору
 Re: Оракле оказывается виноват  [new]
flexgen
Member

Откуда: Город на песке
Сообщений: 810
Информация,

Интересно, кто-нибудь уже зарегистрировался?
14 июл 12, 16:13    [12866887]     Ответить | Цитировать Сообщить модератору
 Re: Оракле оказывается виноват  [new]
Bfink
Member

Откуда: Москва
Сообщений: 2797
flexgen,

Да, там кусок alert лога до остановки базы и хронологическое перечисление проблем аварии и последующего восстановления.
Зарегистрировалось человек 30, но сообщения пишут 4-5
14 июл 12, 16:16    [12866892]     Ответить | Цитировать Сообщить модератору
 Re: Оракле оказывается виноват  [new]
Ну и дела
Guest
Bfink
flexgen,

Да, там кусок alert лога до остановки базы и хронологическое перечисление проблем аварии и последующего восстановления.
Зарегистрировалось человек 30, но сообщения пишут 4-5


Борис, и пишут под своими именами, правильно я понял?

Если так, то там будет куда меньше чудо/горе экспертов, чем здесь отписалось и на с-news тем более.
14 июл 12, 17:37    [12867074]     Ответить | Цитировать Сообщить модератору
 Re: Оракле оказывается виноват  [new]
ДохтаР
Member [заблокирован]

Откуда: Новоукраинск
Сообщений: 16864
Ну и дела
Bfink
flexgen,

Да, там кусок alert лога до остановки базы и хронологическое перечисление проблем аварии и последующего восстановления.
Зарегистрировалось человек 30, но сообщения пишут 4-5


Борис, и пишут под своими именами, правильно я понял?

Если так, то там будет куда меньше чудо/горе экспертов, чем здесь отписалось и на с-news тем более.


Результата всервно не будет , потому как экспертам нужна информация ,
логи , настройки , топологиях итд. всех звеньев системы в целом,
которую предоставлять никто не будет.
Либо потому что некому , либо потому что информации нет или она коммерческая тайна.
Посмотрите......
14 июл 12, 17:58    [12867112]     Ответить | Цитировать Сообщить модератору
 Re: Оракле оказывается виноват  [new]
Bfink
Member

Откуда: Москва
Сообщений: 2797
Ну и дела
Bfink
flexgen,

Да, там кусок alert лога до остановки базы и хронологическое перечисление проблем аварии и последующего восстановления.
Зарегистрировалось человек 30, но сообщения пишут 4-5


Борис, и пишут под своими именами, правильно я понял?

Если так, то там будет куда меньше чудо/горе экспертов, чем здесь отписалось и на с-news тем более.


Ну насчет того, свои ли имена используют, я не знаю, но инвайты персональные.
А эксперты все равно пургу будут нести. Зато могут попасться дельные советы
14 июл 12, 18:19    [12867145]     Ответить | Цитировать Сообщить модератору
 Re: Оракле оказывается виноват  [new]
Bfink
Member

Откуда: Москва
Сообщений: 2797
ДохтаР
Ну и дела
пропущено...


Борис, и пишут под своими именами, правильно я понял?

Если так, то там будет куда меньше чудо/горе экспертов, чем здесь отписалось и на с-news тем более.


Результата всервно не будет , потому как экспертам нужна информация ,
логи , настройки , топологиях итд. всех звеньев системы в целом,
которую предоставлять никто не будет.
Либо потому что некому , либо потому что информации нет или она коммерческая тайна.
Посмотрите......


Почему не будет? Там зарегистрировано человек 10 из сбербанка, может и выложат, то что есть. Проблема в том, что алертлог очень малоинформативный. Например, шли сообщения complete checkpoint, потом перестали, а через какое-то время, сообщений по прежнему нет, но логи переключаются и архивер их подхватывает
14 июл 12, 18:27    [12867162]     Ответить | Цитировать Сообщить модератору
 Re: Оракле оказывается виноват  [new]
ДохтаР
Member [заблокирован]

Откуда: Новоукраинск
Сообщений: 16864
Bfink

А эксперты все равно пургу будут нести. Зато могут попасться дельные советы


В этом топике тоже много дельной информации )

Эксперты обычно несут пургу от ЧСВ , или недостатка информации для анализа.
Посмотрим чем будет отличаться закрытый топик от открытого.

Я тоже зарегился.
14 июл 12, 18:32    [12867170]     Ответить | Цитировать Сообщить модератору
 Re: Оракле оказывается виноват  [new]
Андрей Панфилов
Member

Откуда: Москва > Melbourne
Сообщений: 3778
Bfink
Проблема в том, что алертлог очень малоинформативный.
Очень даже информативный: логи переключаются раз в 2 минуты, log switch checkpoint длится 6 минут, всего 16 групп. Начало конца в 16:00 уже было видно.
14 июл 12, 18:51    [12867206]     Ответить | Цитировать Сообщить модератору
 Re: Оракле оказывается виноват  [new]
Ну и дела
Guest
Андрей Панфилов
Bfink
Проблема в том, что алертлог очень малоинформативный.
Очень даже информативный: логи переключаются раз в 2 минуты, log switch checkpoint длится 6 минут, всего 16 групп. Начало конца в 16:00 уже было видно.


И какой вывод? Кто виноват - Оракле или люди в банке?
14 июл 12, 19:12    [12867248]     Ответить | Цитировать Сообщить модератору
 Re: Оракле оказывается виноват  [new]
Тоже там
Guest
Андрей Панфилов
Bfink
Проблема в том, что алертлог очень малоинформативный.
Очень даже информативный: логи переключаются раз в 2 минуты, log switch checkpoint длится 6 минут, всего 16 групп.
В чем ценность этой инфы?
14 июл 12, 19:13    [12867249]     Ответить | Цитировать Сообщить модератору
 Re: Оракле оказывается виноват  [new]
Bfink
Member

Откуда: Москва
Сообщений: 2797
Андрей Панфилов
Bfink
Проблема в том, что алертлог очень малоинформативный.
Очень даже информативный: логи переключаются раз в 2 минуты, log switch checkpoint длится 6 минут, всего 16 групп. Начало конца в 16:00 уже было видно.


И где же сообщения об завершении log switch checkpoint после 17:30?
Перезапуск фоновых процессов тоже не попал в журнал.
14 июл 12, 19:14    [12867250]     Ответить | Цитировать Сообщить модератору
 Re: Оракле оказывается виноват  [new]
flexgen
Member

Откуда: Город на песке
Сообщений: 810
Тоже там
Андрей Панфилов
пропущено...
Очень даже информативный: логи переключаются раз в 2 минуты, log switch checkpoint длится 6 минут, всего 16 групп.
В чем ценность этой инфы?


Ну, на мой взгляд эта информация порождает еще вопросы - каков размер redolog файлов, какой бизнес-процесс порождал такое количество переключений логов и что именно выполнялось. Может, там в цикле 10 миллионов инсертов бежало, и каждый завершался коммитом (случай из жизни, кстати, убедить программиста так не делать смог только директор IT департамента).
14 июл 12, 19:18    [12867261]     Ответить | Цитировать Сообщить модератору
 Re: Оракле оказывается виноват  [new]
Bfink
Member

Откуда: Москва
Сообщений: 2797
Ну и дела
Андрей Панфилов
пропущено...
Очень даже информативный: логи переключаются раз в 2 минуты, log switch checkpoint длится 6 минут, всего 16 групп. Начало конца в 16:00 уже было видно.


И какой вывод? Кто виноват - Оракле или люди в банке?


Виноват, конечно, Oracle - у него журналы застряли, а он ничего связного не сказал. А вот кто ему "помогал" и что делать нужно еще разбираться.
Кстати увидел мое любимое сообщение - "inbound connection timed out (ORA-3136)", у меня оно обычно предвосхищает неприятности, а здесь это произошло вроде после застревания журналов.
14 июл 12, 19:22    [12867269]     Ответить | Цитировать Сообщить модератору
 Re: Оракле оказывается виноват  [new]
Андрей Панфилов
Member

Откуда: Москва > Melbourne
Сообщений: 3778
Bfink
И где же сообщения об завершении log switch checkpoint после 17:30?
А какая разница что там было после 17:30? судя по ORA-609 там уже в 17:18 все стояло колом
14 июл 12, 19:24    [12867275]     Ответить | Цитировать Сообщить модератору
 Re: Оракле оказывается виноват  [new]
Оттуда
Guest
flexgen
Тоже там
пропущено...
В чем ценность этой инфы?


Ну, на мой взгляд эта информация порождает еще вопросы - каков размер redolog файлов, какой бизнес-процесс порождал такое количество переключений логов и что именно выполнялось. Может, там в цикле 10 миллионов инсертов бежало, и каждый завершался коммитом (случай из жизни, кстати.

Это в нормальной ситуации не должно приводить к тому, что в Сбере. Как раз если бы там были миллионы неленивых коммитов, это бы облегчило их проблему.
14 июл 12, 19:28    [12867283]     Ответить | Цитировать Сообщить модератору
 Re: Оракле оказывается виноват  [new]
Андрей Панфилов
Member

Откуда: Москва > Melbourne
Сообщений: 3778
Bfink
Виноват, конечно, Oracle - у него журналы застряли, а он ничего связного не сказал. А вот кто ему "помогал" и что делать нужно еще разбираться.
Оно в 16:00 уже заметно тупило, вероятнее всего тупить начало еще раньше, вопрос в том когда на самом деле заметили и что предпринимали.
14 июл 12, 19:28    [12867286]     Ответить | Цитировать Сообщить модератору
 Re: Оракле оказывается виноват  [new]
Bfink
Member

Откуда: Москва
Сообщений: 2797
flexgen
Тоже там
пропущено...
В чем ценность этой инфы?


Ну, на мой взгляд эта информация порождает еще вопросы - каков размер redolog файлов, какой бизнес-процесс порождал такое количество переключений логов и что именно выполнялось. Может, там в цикле 10 миллионов инсертов бежало, и каждый завершался коммитом (случай из жизни, кстати, убедить программиста так не делать смог только директор IT департамента).


Судя по SCN-ам - миллионы commit-ов. Но и сессий очень-очень много. А бизнес процесс понятен - авторизация пластиковых карт.
14 июл 12, 19:29    [12867290]     Ответить | Цитировать Сообщить модератору
 Re: Оракле оказывается виноват  [new]
Bfink
Member

Откуда: Москва
Сообщений: 2797
Андрей Панфилов
Bfink
Виноват, конечно, Oracle - у него журналы застряли, а он ничего связного не сказал. А вот кто ему "помогал" и что делать нужно еще разбираться.
Оно в 16:00 уже заметно тупило, вероятнее всего тупить начало еще раньше, вопрос в том когда на самом деле заметили и что предпринимали.


И что же там тупило сразу после 16-ти? Сессии с таймаутами они всегда массово прибивают, пара deadlock-ов и все вроде...
14 июл 12, 19:32    [12867293]     Ответить | Цитировать Сообщить модератору
 Re: Оракле оказывается виноват  [new]
ДохтаР
Member [заблокирован]

Откуда: Новоукраинск
Сообщений: 16864
Ну и дела
Андрей Панфилов
пропущено...
Очень даже информативный: логи переключаются раз в 2 минуты, log switch checkpoint длится 6 минут, всего 16 групп. Начало конца в 16:00 уже было видно.


И какой вывод? Кто виноват - Оракле или люди в банке?


Менджемент.
Не те процессы контролирует

Если то что сказал Андрей Панфилов соотвествует действительности .
14 июл 12, 19:43    [12867312]     Ответить | Цитировать Сообщить модератору
 Re: Оракле оказывается виноват  [new]
Ну и дела
Guest
ДохтаР
Ну и дела
пропущено...


И какой вывод? Кто виноват - Оракле или люди в банке?


Менджемент.
Не те процессы контролирует

Если то что сказал Андрей Панфилов соотвествует действительности .


Не мог бы ты/вы обосновать, рассказать подробнее ход мысли.
Я не экперт ни в оракле, ни в менеджменте, а хотелось бы понять хоть и по объяснению/разжеванию.
14 июл 12, 19:47    [12867325]     Ответить | Цитировать Сообщить модератору
 Re: Оракле оказывается виноват  [new]
Андрей Панфилов
Member

Откуда: Москва > Melbourne
Сообщений: 3778
Bfink
И что же там тупило сразу после 16-ти?
не сразу после, а уже в 16:00: с переключением журналов раз в 2 минуты и длительностью чекпойнта 6 минут, база проживет ориентировочно 16/(1/2-1/6) = 48 минут (+/- разные времена переключений, количество активных логов и пр.)
14 июл 12, 19:48    [12867327]     Ответить | Цитировать Сообщить модератору
 Re: Оракле оказывается виноват  [new]
ДохтаР
Member [заблокирован]

Откуда: Новоукраинск
Сообщений: 16864
У меня там кстете нет доступа к логам
Раздел с файлами пустой , где их там искать ?

Или там не равноправие по доступу к информации ?
14 июл 12, 19:49    [12867328]     Ответить | Цитировать Сообщить модератору
 Re: Оракле оказывается виноват  [new]
бырбырбыр
Guest
Андрей Панфилов
Bfink
И что же там тупило сразу после 16-ти?
не сразу после, а уже в 16:00: с переключением журналов раз в 2 минуты и длительностью чекпойнта 6 минут, база проживет ориентировочно 16/(1/2-1/6) = 48 минут (+/- разные времена переключений, количество активных логов и пр.)
чего? :-)
14 июл 12, 19:52    [12867338]     Ответить | Цитировать Сообщить модератору
Топик располагается на нескольких страницах: Ctrl  назад   1 .. 5 6 7 8 9 [10] 11 12 13 14 .. 34   вперед  Ctrl
Все форумы / Oracle Ответить