The OpenNET Project / Index page

[ новости /+++ | форум | wiki | теги | ]

форумы  помощь  поиск  регистрация  майллист  вход/выход  слежка  RSS
"Борьба с kernel panic'ами"
Вариант для распечатки  
Пред. тема | След. тема 
Форумы OpenNET: Виртуальная конференция (Public)
Изначальное сообщение [ Отслеживать ]

"Борьба с kernel panic'ами"  
Сообщение от Wing email(??) on 11-Май-08, 13:27 
Стоит 3 NAS'a на линуксах (генту). Крутится pptpd + tc как шейпер.
Железо на них _абсолютно_ одинаковое:
Intel(R) Core(TM)2 Quad CPU    Q6600  @ 2.40GHz;
MemTotal:      1023196 kB
Сетевухи - интелки с дровами e1000.

Так вот, две из трех тачек время от времени выпадают с kernel panic ;( Никакой зависимости от каких-либо внешних причин проследить не получилось, нагрузка на все 3 одинаковая: ~400 сессий постоянно на каждой, по времени - могут простоять без висяка сутки, а могут месяц.

Вопрос № раз: как бы поточнее определить, что вызывает висяки? Желательно - без перетыканий железа и долгих ковыряний, т.к. железки стоят на потоке и вырубать их нежелательно.

Пытался добиться того, чтобы по кернел-панику сервачки сами ребутались, как фря, подкрутил sysctl:
kernel.panic = 1
kernel.panic_on_oops = 1
Но нихрена не получилось, висят и висят, ребутаться не хотят ;(

Вопрос № два: как сделать, чтобы по панику серваки ребутались сами? ;)

Высказать мнение | Ответить | Правка | Cообщить модератору

 Оглавление

Сообщения по теме [Сортировка по времени | RSS]


1. "Борьба с kernel panic'ами"  
Сообщение от Oyyo on 11-Май-08, 13:37 
знакомая ситуация :) как вариан - подкинуть мониторы, и смотреть на что ругается - делать выводы, куда нужно лезть
Высказать мнение | Ответить | Правка | Наверх | Cообщить модератору

2. "Борьба с kernel panic'ами"  
Сообщение от Wing email(??) on 11-Май-08, 13:50 
>знакомая ситуация :) как вариан - подкинуть мониторы, и смотреть на что
>ругается - делать выводы, куда нужно лезть

Начало вывода не видно - не прокручивается ;) А так - 'fatal exception in interrupt', т.е. теоретически - дрова/железо, НО железо и ядра везде одинаковые, а висяками страдают только 2 из трёх...

Высказать мнение | Ответить | Правка | Наверх | Cообщить модератору

3. "Борьба с kernel panic'ами"  
Сообщение от Oyyo on 11-Май-08, 13:52 
в логах чтонить есть?
Высказать мнение | Ответить | Правка | Наверх | Cообщить модератору

4. "Борьба с kernel panic'ами"  
Сообщение от Wing email(??) on 11-Май-08, 13:54 
>в логах чтонить есть?

До - обычная нормальная работа, после - только старт сислога, и дальше как обычно

Высказать мнение | Ответить | Правка | Наверх | Cообщить модератору

5. "Борьба с kernel panic'ами"  
Сообщение от Oyyo on 11-Май-08, 14:08 
есть 2 варианта, ждать пока не накроится окончательно, либо снимать и тестировать машины.
1 - проц и память можно поганять и в рабочем варианте - компиляцией (пустой) попробовать ядра пособирать или опенофис, можно, и кде - то что помассивнее
2 память, вроде, можно поганять с лайв сд RIPlinux видел пункт в загрузке, но не пробовал

3 могут быть проблемы с мамкой - вознила микротрещина при монтаже памяти или проца... практически не выудить такую поломку только пробовать мать менять
4 у мяня воть накрылся винт 4 бэда вылезло и уже третьи сутки мучусь (время ему пришло)
5 может, сверь память с настройкми биоса, попробуй замедлить шину или задержки увиличить
6 если подумать можно еще чтонить придумать, но для этого нужно что то делать с компом.

Высказать мнение | Ответить | Правка | Наверх | Cообщить модератору

6. "Борьба с kernel panic'ами"  
Сообщение от Wing email(??) on 11-Май-08, 14:19 
>[оверквотинг удален]
>
>3 могут быть проблемы с мамкой - вознила микротрещина при монтаже памяти
>или проца... практически не выудить такую поломку только пробовать мать менять
>
>4 у мяня воть накрылся винт 4 бэда вылезло и уже третьи
>сутки мучусь (время ему пришло)
>5 может, сверь память с настройкми биоса, попробуй замедлить шину или задержки
>увиличить
>6 если подумать можно еще чтонить придумать, но для этого нужно что
>то делать с компом.

Да нет, не могут же возникнуть микротрещины у двух тачек одновременно... А ядра и др. софт пересобирал - никаких проблем в процессе компиляции не вылазило -> врядли проц/память/мать.
Единственное, что мне в голову приходит - кривые дрова к чему-нибуть..

А с хардом - очень сочувствую.. Была подобная беда с БД билинга, возили в контору по срочному восстановлению данных, ночевал там с ихними спецами - так ничего и не восстановили.. Благо был бекап недельной давности =)

2all: вопрос о ребуте после panic'a в силе ;)

Высказать мнение | Ответить | Правка | Наверх | Cообщить модератору

7. "Борьба с kernel panic'ами"  
Сообщение от Oyyo on 11-Май-08, 15:09 
>Да нет, не могут же возникнуть микротрещины у двух тачек одновременно... А ядра и др. софт пересобирал - никаких проблем в процессе компиляции не вылазило -> врядли проц/память/мать.
>Единственное, что мне в голову приходит - кривые дрова к чему-нибуть..

я предпологаю, что 3 машины идентичны как в железе, так и в по, отличия только в бд (пользовательской инфо). А одна же работает без проблем!
ну как вариант - просмотри инфу командой sensors -кажеться температуры напряжения и т.п.
еще рекомендую всеже проверить винты, у меня были ужасно разные глюки, зависал при загрузки ядра! железо прогнал всеми извесными вариантами, ничго подозрительного не нашел
smartctl и mhdd -  утилиткой стартони выбери винт и нажми Ф8 посмотри, как говорят никто не даёт вообще гарантий, что беды не могут появится в перые же дни эксплуатации!
ну проверь еще все шлейфы и разъёмы на качество соединения.
как я предпологаю насы контролируют все сетевы подключения, и вариантов переполнений буферов можно исключить?

>2all: вопрос о ребуте после panic'a в силе ;)

Высказать мнение | Ответить | Правка | Наверх | Cообщить модератору

8. "Борьба с kernel panic'ами"  
Сообщение от demyan (??) on 12-Май-08, 17:14 
>[оверквотинг удален]
>Сетевухи - интелки с дровами e1000.
>
>Так вот, две из трех тачек время от времени выпадают с kernel
>panic ;( Никакой зависимости от каких-либо внешних причин проследить не получилось,
>нагрузка на все 3 одинаковая: ~400 сессий постоянно на каждой, по
>времени - могут простоять без висяка сутки, а могут месяц.
>
>Вопрос № раз: как бы поточнее определить, что вызывает висяки? Желательно -
>без перетыканий железа и долгих ковыряний, т.к. железки стоят на потоке
>и вырубать их нежелательно.

1. Версия ядра?
2. Дисциплины вешаются только на ppp-устройства или еще есть ifb/imq-устройства?
3. Надо смотреть полный call trace, может следует подключить монитор или через netdump

>Пытался добиться того, чтобы по кернел-панику сервачки сами ребутались, как фря, подкрутил
>sysctl:
>kernel.panic = 1
>kernel.panic_on_oops = 1
>Но нихрена не получилось, висят и висят, ребутаться не хотят ;(
>
>Вопрос № два: как сделать, чтобы по панику серваки ребутались сами? ;)
>

у меня работает. перегружается через 5мин:

# grep "panic" /etc/sysctl.conf
kernel.panic=300

Высказать мнение | Ответить | Правка | Наверх | Cообщить модератору

9. "Борьба с kernel panic'ами"  
Сообщение от Wing email(??) on 13-Май-08, 00:26 
>1. Версия ядра?

2.6.23

>2. Дисциплины вешаются только на ppp-устройства или еще есть ifb/imq-устройства?

Только на ppp

>3. Надо смотреть полный call trace, может следует подключить монитор или через
>netdump

Да монитор с клавой подключены, но видно только конец дампа, прокручивать шифт+пг-ап не даёт ;( Прикручивать ради бОльшего разрешения фреймбуфер не хочется...
Возможно на днях netdump попробую, спасибо за идею -)

>у меня работает. перегружается через 5мин:
>
># grep "panic" /etc/sysctl.conf
>kernel.panic=300

Выставил значение "300", посмотрим что будет, благодарю в любом случае!

Высказать мнение | Ответить | Правка | Наверх | Cообщить модератору

Архив | Удалить

Индекс форумов | Темы | Пред. тема | След. тема
Оцените тред (1=ужас, 5=супер)? [ 1 | 2 | 3 | 4 | 5 ] [Рекомендовать для помещения в FAQ]




Спонсоры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2022 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру