The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]



"Раздел полезных советов: Мониторинг аппаратных проблем в  x8..."
Версия для распечатки Пред. тема | След. тема
Форум Разговоры, обсуждение новостей
Исходное сообщение [ Отслеживать ]
Присылайте удачные настройки в раздел примеров файлов конфигурации на WIKI.opennet.ru.
. "Мониторинг аппаратных проблем в  x86_64 сборке Linux" +1 +/
Сообщение от pavlinux (ok), 06-Июн-09, 01:42 
А так же,

Каждый логический процессор в системе, имеет директорию

/sys/devices/system/machinecheck/machinecheckN
(где N - номер процессора)

Эти директории содержат файлы для динамической конфигурации, а именно:

* bankNctl

Содержит 64-х битную маску, включающая или отключающая определенные сообщения,
об исключениях, для текущего ЦПУ. Если все биты маски равны нулю, тогда никакие
сообщения не выдаются.

Остальные файлы конфигурации, хотя и находятся в каждой папке sysfs, но изменения
в любом из них влияют на все процессоры. (думается тяжело было бы реализовывать
различные степени толерантности для разных ядер на одном CPU)

* check_interval

Интервал опроса процессора, в минутах, по умолчанию 5 минут.

* tolerant
Уровни толерантности:

0: Всегда генерировать panic на неисправимых ошибках или записывать в лог исправленные.
1: Генерировать panic или ошибку шины (SIGBUS) на неисправимых ошибках или записывать
    в лог исправленные.
2: Генерировать ошибку шины (SIGBUS) на неисправимых ошибках или записывать в лог исправленные.
3: НИКОГДА не генерировать panic или ошибку шины (SIGBUS), а только записывать лог
(использовать только для тестирования)

По умолчанию: 1

И самое интересный конфиг MCE это  

* trigger

Программа которая будет запущена, когда в sysfs появляется какое-либо событие от MCE.

Например запуск вывода на консоль, экран, или отправка почты

# echo 'mail -t root -s "MCE EVENT: `date "+%m.%d.%Y - %H:%M:%S"`"' > \
                    /sys/devices/system/machinecheck/machinecheck0/trigger

Именно использование trigger удобнее, так как не надо дёргать крон каждые 5 минут.

Так, выше кем-то скопипастенные команды, запишем в триггер, дабы освободить крон

# export MCE_TRIGGER="/sys/devices/system/machinecheck/machinecheck0/trigger"
# echo '/usr/sbin/mcelog --ignorenodev --filter >> /var/log/mcelog' > $MCE_TRIGGER;

Ответить | Правка | Наверх | Cообщить модератору

Оглавление
Раздел полезных советов: Мониторинг аппаратных проблем в  x8..., auto_tips, 06-Июн-09, 00:53  [смотреть все]
Форумы | Темы | Пред. тема | След. тема



Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру