forum.opennet.ru

"Раздел полезных советов: История про Ceph и реплику 1+2"

Форум Разговоры, обсуждение новостей
Версия для распечатки	Пред. тема \| След. тема

Исходное сообщение

[ Отслеживать ]

Заметили полезную информацию ? Пожалуйста добавьте в FAQ на WIKI.

. "История про Ceph и реплику 1+2"	+/–
Сообщение от RomanCh (ok), 14-Ноя-18, 17:40
> Основной задачей было обеспечение надёжности без применения CRUSH Map. Расскажите пожалуйста как Ceph может работать без CRUSH map. Этот алгоритм лежит в центре его вселенной распределения данных. Кстати, вы там команды ниже выдаёте из раздела http://docs.ceph.com/docs/mimic/rados/operations/crush-map/ - адрес его нам как бы намекает. Или я чего-то глубоко не знаю? Тогда хочу пруфлинк на ознакомление. > Ceph: Версия не важно но Очень смелое заявление, особенно для человека который опирается на обработку выхлопа утилит. Который например очень сильно поменялся от jewel к luminous. > то есть 1 SSD на 6 HDD дисков Тоже так себе решение. Официально рекомендовано не более 4х на 1 диск. Иначе, можно запросто получить ужасающую производительность, настолько, что проще жить без SSD сделав журнал на тех же дисках что и данные. И второе - вы же понимаете что в случае отказа 1 SSD из имеющихся 4х вы получаете превращение в тыкву четверти дисков с данными? Т.е. нужен экстренный recovery дающий высокий I/O (настроек обрезающих его я не заметил) на оставшихся живых дисках с парной машины, что с высокой вероятностью может привести к выводу из строя их и как результат (при вашей архитектуре) - полной потере половины данных. Если пользовательские данные хранились через RBD, то фактически это будет эквивалентно потере всех данных. Т.к. данные каждого RBD будут +/- равномерно распределены по всем osd, следовательно каждая RBD у вас будет на 50% потеряна. На практике это обозначает его полную потерю, потому что при попытке чтения смещения указывающего на недоступную PG вы получите D статус процесса. Есть ещё ряд причин по которым делать избыточность = 2 строго не рекомендовано, это ещё сам производитель начиная с jewel версии говорит. В общем, "подумайте о детях" как говорится. > напомню, что проблема с правкой крушмапа осталась в версии до 12.x.x. Напомните пожалуйста что за проблема конкретно. На паре кластеров что я разворачивал и поддерживал никаких проблем не было. > /usr/bin/ceph health detail \| grep active+clean+inconsistent \| awk '{ print $2 }' \| while read a; do /usr/bin/ceph pg repair $a ; done Вот за это... Ну ничего хорошего я не сказал бы ни вам, ни кому быт то ни было ещё. И нет, дело тут не только в безумной цепочке конвейеров, или даже в том что вывод от версии к версии таки может поменяться (используйте API если хотите делать нормально, зачем стыдобищу выкладывать?). Бездумный repair раз в 10 минут на умирающие PG приведёт вас к тому что рано или поздно они перестанут восстанавливаться и ваш кластер превратится в тыкву по сценарию описанному выше. Сами по себе PG не вываливаются, чаще всего (исключив неадекватов в серверной) это симптом проблемного диска. Т.е. надо смотреть после каждого такого развала в smart и как минимум фиксировать его состояние (если не можете сразу менять диски с reallocated и прочим странным), что бы сравнивать с последующим случаем выпадения PG.
Ответить \| Правка \| Наверх \| Cообщить модератору

Оглавление

Раздел полезных советов: История про Ceph и реплику 1+2, auto_tips, 08-Ноя-18, 14:36 [смотреть все]

Я правильно понимаю что это был тест Пьяная обезьянка порезвилась в серверной , Аноним, 08-Ноя-18, 14:36 (1)
для Блястора допишуВидать не все влезло, alex, 08-Ноя-18, 15:23 (2)
Кстати аноним Интересно послушать Ваш опыт в данном распределенном хранилище И, alex, 08-Ноя-18, 16:40 (3)
перед awk не надо grep Денег дали-то Чем закончилось , твой лучший друг, 09-Ноя-18, 22:31 (4) //
- мне же не все события нужны а именно этиДенег пока не дали ушел на Блюстор и зак, alexpn, 09-Ноя-18, 23:04 (5) //
  - в начале нулевых именно здесь на опеннете за связки греп 124 awk grep 124 sed , твой лучший друг, 10-Ноя-18, 12:59 (6) //
    - Логично Учту на будущее Если есть решение проще то опубликуйте, alexpn, 10-Ноя-18, 16:30 (7)
      - собственно ceph pg dump_stuck inconsistent -f json 2 dev null 124 jq -r , rumanzo, 16-Ноя-18, 02:44 (28)
    - bin shCEPH usr bin ceph CEPH health detail 124 grep -oP pg , Аноним, 10-Ноя-18, 17:47 (8)
      - Хорошее использование регулярки, претензия на использование двух утилит там, где, твой лучший друг, 10-Ноя-18, 18:26 (9)
        
        gt оверквотинг удален Да ну Где так серьезно пишут на шелле, что даже с кодре, Аноним, 11-Ноя-18, 13:10 (10)
        
        gt оверквотинг удален Поверьте, писать на шелле с кодревью - это во многих ком, Anonymouss, 11-Ноя-18, 21:44 (12)
        
        Наверно не про _нашу_ страну речь Бюрократическая техноутопия Общему уровню р, Аноним, 12-Ноя-18, 00:54 (13)
        
        usr bin ceph health detail 124 awk active clean inconsistent run usr b, Anonymouss, 11-Ноя-18, 21:38 (11)
        
        Вряд ли быстрее, но красивенько , Аноним, 12-Ноя-18, 01:29 (14)
        
        К каждому коммиту должен быть убедительный рассказ, зачем это сделано, что именн, твой лучший друг, 12-Ноя-18, 15:34 (16)
        
        Перловик на авк может вообще не включая голову Максимум полминуты ман прочитать, Аноним, 12-Ноя-18, 23:54 (19)
        
        Ни хрена Собственно, первая реакция при виде этих закорюк - как раз расчехлить , Crazy Alex, 14-Ноя-18, 03:38 (21)
        
        расчехлиться про яваскрипт именно здесь это сродни камингауту, да и питон туда ж, твой лучший друг, 15-Ноя-18, 09:29 (25)
        
        Я просто оттолкнулся от того, что скрипт запускается из крона без перевода вывод, Anonymouss, 13-Ноя-18, 00:27 (20)
        Использование переменных в system - это не секурно уже лет 20, да и нафига если, Весёлый Пастер, 24-Дек-18, 13:10 (43)
        
        Торопится собственно некудаЗадача развесить флаги востановления и по возможности, alex, 12-Ноя-18, 03:14 (15)
    - А вот мне, кажется, чем более читаем и понятен код, тем лучше Уж лучше иметь мн, Адекват, 14-Ноя-18, 09:35 (22)
      - Твоё право использовать большинство админов , а не меньшинство админов особен, Весёлый Пастер, 24-Дек-18, 13:12 (44)
ну а swap то зачем 16 GB, ещё и на каждом диске те представляешь себе что если , имя, 12-Ноя-18, 17:54 (17) //
- Лучше, чтобы ООМ пришел рандомные osd килять Swap только дает немного времени пр, Аноним, 14-Ноя-18, 15:05 (23) //
  - настоящая беда не в OOM, а лишь в том что ты не удосужился прочесть ни статью, н, имя, 15-Ноя-18, 13:11 (26)
  - Представьте себе, да Иначе лаги начнутся и не закончатся во всем кластере А , щавель, 19-Ноя-18, 14:15 (32)
- отчет об аварии у digital ocean говорит о том, что swap для ceph нужен обязатель, default, 16-Ноя-18, 01:02 (27) //
  - Ссылкой на отчёт поделитесь, Аноним, 02-Дек-18, 18:55 (39)
да будет прикольноможет к тому времени заплатят , alex, 12-Ноя-18, 18:28 (18) //
- Расскажите пожалуйста как Ceph может работать без CRUSH map Этот алгоритм лежит , RomanCh, 14-Ноя-18, 17:40 (24) //
  - Тыва так тыква но как говорится это выбор не мой а заказчик всегда прав, Alex, 18-Ноя-18, 14:32 (31) //
    - Ну а по остальным вопросам , RomanCh, 20-Ноя-18, 19:37 (33)
  - опечатка сорриКогда начинал общатся с заказчиком у них в штате был кршМапперОфиц, alex, 01-Дек-18, 16:16 (37) //
    - Нда, неплохо устроился Вот к чему приводит низкая компетентность управляющего з, RomanCh, 01-Дек-18, 17:46 (38)
Подход, как сама реализация - полный бред Цеф в продакт нести можно только с s, Lantaris, 18-Ноя-18, 09:49 (29) //
- Оказалось не бредомСкоро допишу статью то все это чем закончилосьКак говорится ч, Alex, 18-Ноя-18, 14:31 (30)
- судя по их тестам , эти странные люди убьют данные самостоятельно хоть с ceph, , ., 21-Ноя-18, 09:36 (34) //
  - Заказчик то поди Росреестр - , a2l, 29-Ноя-18, 05:24 (35) //
    - нетРостелеком, alex, 01-Дек-18, 16:12 (36)
      - Насколько я помню, когда у Росреестра эпично бомбанул ceph, то баллон катили име, Аноним, 03-Дек-18, 22:11 (41)
    - Ждём продолжение, AlexZorin, 16-Янв-19, 19:33 (45)
Возможно запустить рабочею osd допустим железка умерла но диски с osd живы на д, Аноним, 02-Дек-18, 19:02 (40)
На этом месте оно перестает быть продом , XoRe, 04-Дек-18, 03:17 (42)

Форумы | Темы | Пред. тема | След. тема

Партнёры:

Хостинг:

Закладки на сайте
Проследить за страницей

Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру