The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]



Вариант для распечатки  
Пред. тема | След. тема 
Форум Разговоры, обсуждение новостей
Режим отображения отдельной подветви беседы [ Отслеживать ]

Оглавление

В OpenZFS выявлена ошибка, которая может привести к повреждению файлов, opennews (??), 23-Ноя-23, (0) [смотреть все]

Сообщения [Сортировка по времени | RSS]


141. "В OpenZFS выявлена ошибка, которая может привести к поврежде..."  +1 +/
Сообщение от аНОНИМ (?), 23-Ноя-23, 17:36 
> Потому что у накопителей свои ECC, и вот просто так "обнулиться" сектор не может.

Странно как-то, "у накопителей свои ECC", но вот параметр BER для накопителей тем не менее приводят: https://documents.westerndigital.com/content/dam/doc-library... (1 ошибка на 10^15 бит). И если его пересчитать в терабайты прочитанного, это будет всего-то сотня терабайт. Откуда сразу следует вывод, что хранить данные на raidz1/raidz2, где каждый блок на каждом диске защищён отдельной чексуммой -- есть смысл.

А кому собственные данные не важны -- ну те ext4 пользуются, вон как диванные эксперты вокруг.

Ответить | Правка | К родителю #63 | Наверх | Cообщить модератору

186. "В OpenZFS выявлена ошибка, которая может привести к поврежде..."  +/
Сообщение от Tron is Whistling (?), 23-Ноя-23, 23:19 
Звон-то вы слышали...
Хоть бы потрудились сами почитать, что запостили.

Начнём с BER.

BER - оно и есть приблизительная оценка частоты срабатывания ECC в обычных условиях работы, без повреждений накопителя. Как часто будет возникать ошибка ECC при чтении в штатных условиях. Я выше написал: если бы не ECC - да, накопителями бы вообще пользоваться невозможно было.

Теперь к вашим баранам.

В том, что вами приведено - это не BER. Это NCER. Non-correctable (там non-recoverable) error ratio.
Это количество бит, среднее, прочитанных, после которого вы получите неисправимый сбойный сектор.

Не 1 на 10^15, а <1 на 10^15. Разницу улавливаете?
Менее одной неисправимой битовой ошибки на 125 прочитанных терабайт. Эту ошибку поймает та самая ECC, и выдаст как нечитаемый сектор. К сожалению да, для современных накопителей в десяток и более ТБ - этот параметр неизмеримо мал. Их только в рейд и ставить.

ECC false positive ratio же на несколько порядков меньше, данные ECC в современных хардах запросто могут весить ~10% и больше от сектора, плюс как правило многоуровневая ECC - одна в коде записи и другая в записываемых данных. А у более надёжных драйвов ещё и цикл WRV бывает добавлен, но это уже детали.

Ответить | Правка | Наверх | Cообщить модератору

187. "В OpenZFS выявлена ошибка, которая может привести к поврежде..."  +/
Сообщение от Tron is Whistling (?), 23-Ноя-23, 23:19 
Почему ныне не приводят BER? Цифирь слишком неприглядная. При штатном чтении многобитовая ошибка - норма жизни. Особенно на черепичках.
Ответить | Правка | Наверх | Cообщить модератору

190. "В OpenZFS выявлена ошибка, которая может привести к поврежде..."  +1 +/
Сообщение от Tron is Whistling (?), 23-Ноя-23, 23:32 
Тут правда я одну вещь не упомянул.

Наличие NCER не значит, что сектор не прочитается хостом вообще совсем никак. Сначала диск попробует перечитать, первые ошибки при отсутствии серьёзного повреждения магнитного слоя обычно статистически не значимы.

Далее оно со 2-3-5-10 попытки скорее всего прочитается. И когда прочитается - сектор будет стёрт и испробован на запись. Если после испробования сектор не пройдёт по числу битовых ошибок в той самой ECC - будет отправлен в другое место диска, получите ремап. На черепичках может быть так лёгкой рукой смахнута в другое место целая группа секторов. Всё это незаметно для хоста, естественно.

То есть само по себе NCER ещё не фатал. Реальную ошибку вы получите только если операция чтения свалится в совсем никак, даже после пары перепозиционирований голов. Диски под рейд настроены делать меньше попыток, диски под бытовуху - больше.

Но тем не менее, средние 125 Тб на 22 Тб хард - это запредельно мало. О времена, о нравы.

---

Диски под видео - отдельный экземпляр, их здесь где-то ниже упомянули - вот эти да, страшное дело - могут просто смахнуть сектор и сделать вид, что прочиталась фигня. Эти диски лучше никуда больше не ставить.

Ответить | Правка | К родителю #186 | Наверх | Cообщить модератору

230. "В OpenZFS выявлена ошибка, которая может привести к поврежде..."  +/
Сообщение от аНОНИМ (?), 24-Ноя-23, 09:15 
> Наличие NCER не значит

Вообще-то как раз и значит, иначе бы его маркетолухи не назвали бы "*NON*-correctable"

Ответить | Правка | Наверх | Cообщить модератору

232. "В OpenZFS выявлена ошибка, которая может привести к поврежде..."  +/
Сообщение от Tron is Whistling (?), 24-Ноя-23, 09:41 
Для начала давай ещё раз поясню, что такое NCER в этом контексте. NCER - это значит, что сектор с первого раза корректно прочитать не удалось. Не просто ECC отработала (это BER, точнее не совсем BER, но опустим), а ECC сказала, что всё, задница. Но это не значит, что его не удастся прочитать со 2 захода например.

Ответить | Правка | Наверх | Cообщить модератору

254. "В OpenZFS выявлена ошибка, которая может привести к поврежде..."  +/
Сообщение от аНОНИМ (?), 24-Ноя-23, 12:23 
> Но это не значит, что его не удастся прочитать со 2 захода например

Это ниоткуда не следует. И в даташите не написано. Значит -- не факт и я имею право предполагать худшее. Речь-то о моих данных.

Примеры обратного были тут где-то рядом.

Ответить | Правка | Наверх | Cообщить модератору

294. "В OpenZFS выявлена ошибка, которая может привести к поврежде..."  +/
Сообщение от Tron is Whistling (?), 24-Ноя-23, 22:01 
Можешь предполагать чего угодно.
Если данные действительно ценные - надо совсем не ZFS обвешиваться.
И порядок денег там будет совершенно другой.
Ответить | Правка | Наверх | Cообщить модератору

222. "В OpenZFS выявлена ошибка, которая может привести к поврежде..."  +/
Сообщение от Аноним (-), 24-Ноя-23, 02:28 
> BER - оно и есть приблизительная оценка частоты срабатывания ECC в обычных
> условиях работы, без повреждений накопителя. Как часто будет возникать ошибка ECC
> при чтении в штатных условиях. Я выше написал: если бы не
> ECC - да, накопителями бы вообще пользоваться невозможно было.

Чувак, у меня есть тупо сыпучая флеха юзаемая как стресстест, где "BER" весьма измеримый, без специальных усилий. И весь твой спич на этом фоне можно назвать бесполезным теоретическим булшитом не стоящим байтов истраченых на него.

Ответить | Правка | К родителю #186 | Наверх | Cообщить модератору

233. "В OpenZFS выявлена ошибка, которая может привести к поврежде..."  +/
Сообщение от Tron is Whistling (?), 24-Ноя-23, 09:43 
То, что у тебя есть сыпучее китайское говно - это не значит, что его надо в серьёзном проде использовать.
Ну, ты - можешь.
И да, то, что ты видишь - далеко не BER.
Это NC + ECC false positive. В китайских поделках встречается очень часто, поэтому что на ECC тоже экономят.
Ответить | Правка | Наверх | Cообщить модератору

327. "В OpenZFS выявлена ошибка, которая может привести к поврежде..."  +/
Сообщение от Аноним (319), 26-Ноя-23, 02:02 
> То, что у тебя есть сыпучее китайское говно - это не значит,
> что его надо в серьёзном проде использовать.

Да вот знаете, чексуммы очень помогают понять что реально подсунули и как это реально работает. Вместо выслушивания голимых теорий высосаных из пальца.

Не нравится флеха? А я и дофига кейсов с энтерпрайзными SSD видел на эту тему. Особенно эффективно получается если его как bcache оформить. И тут то и оказалось что вместо того чтобы сразу и круто помереть - оно при приближении к окончанию ресурса может начать гадить битыми блоками вместо этого. Без всяких IO error. А файлухи на это все реагируют... довольно интересно, скажем так.

При том у фанов XFS/EXT4, это вообше как-то так: на них совершенно ВНЕЗАПНО сверху падает рояль и зашибает их до дырки в асфальте. А потом оказывается что осыпающийся девайс гадил, так то, давно - но без чексум это не видно, а развалилось когда уже живого места в ФС нет. XFSники о чем-то даже догадываются и - вон - пыжатся scrub прикрутить. Получается не очень, но почему-то все это идет вразрез с вашими теориями. Btrfs'ники - вот - за счет чексум - такие плюхи ловили на подлете. В отличие от вон тех счастливчиков.

> Ну, ты - можешь. И да, то, что ты видишь - далеко не BER.

Естественно. Это уже то что за FEC пролезло.

> Это NC + ECC false positive. В китайских поделках встречается
> очень часто, поэтому что на ECC тоже экономят.

Да оно и на энтерпрайзных SSD случается, любители bcache не дадут соврать. Один из аргументов за нормальную интеграцию иерархического кеширования в ФС, там в таких случаях виднее реальное состояние кусков VS запрошенная схема избыточности.

Ответить | Правка | Наверх | Cообщить модератору

229. "В OpenZFS выявлена ошибка, которая может привести к поврежде..."  +/
Сообщение от аНОНИМ (?), 24-Ноя-23, 09:14 
> Не 1 на 10^15, а <1 на 10^15. Разницу улавливаете?

Улавливаю. Жопоруки даже 1e-16 ниасилили.

> и выдаст как нечитаемый сектор.

Это утверждение нуждается в доказательства.

> ECC false positive ratio же на несколько порядков меньше

И это -- тоже. Ну вот прям для конкретного жопоруками сделанного накопителя.

Ответить | Правка | К родителю #186 | Наверх | Cообщить модератору

234. "В OpenZFS выявлена ошибка, которая может привести к поврежде..."  +/
Сообщение от Tron is Whistling (?), 24-Ноя-23, 09:46 
> Улавливаю. Жопоруки даже 1e-16 ниасилили.

1e-15 - это было очень много на те же терабайтные драйвы в 3-4 болвашки.
Объёмы выросли, а частота возникновения ошибок не уменьшилась.

По идее со всем этим ростом размера ECC / улучшения алгоритмов - должно было бы быть лучше, но всё это "съелось" тем, что уменьшился размер ячейки записи + при записи внахлёст, которая обычно используется, всё реально очень плохо.

Всё остальное - беллетристика.


Ответить | Правка | Наверх | Cообщить модератору

297. "В OpenZFS выявлена ошибка, которая может привести к поврежде..."  +/
Сообщение от Аноним (297), 24-Ноя-23, 22:44 
> Эту ошибку поймает та самая ECC, и выдаст как нечитаемый сектор

К сожалению - нет. Всё, что смогла поймать ЕСС, она исправила. Эта ошибка - настоящая, никто её не заметил. Вы получаете блок, в котором ошибка. При больших объёмах вероятность ошибок становится существенной. Поэтому - только контрольные суммы, RAIDZ1/2/3, правильные серверные диски, которые при записи проверяют,что блок записался правильно. Т.е. просто бэкапы тут не помогут, разве что делать несколько и сравнивать их между собой, выбирая ошибки вручную. Получая в процессе записи-чтения бэкапов новые ошибки :)

Ответить | Правка | К родителю #186 | Наверх | Cообщить модератору

299. "В OpenZFS выявлена ошибка, которая может привести к поврежде..."  +/
Сообщение от Tron is Whistling (?), 24-Ноя-23, 23:17 
Вообще-то да, но продолжайте верить в булшит.
Ответить | Правка | Наверх | Cообщить модератору

314. "В OpenZFS выявлена ошибка, которая может привести к поврежде..."  +/
Сообщение от Аноним (297), 25-Ноя-23, 16:04 
> продолжайте верить

в безошибочность ЕСС :)

Ответить | Правка | Наверх | Cообщить модератору

317. "В OpenZFS выявлена ошибка, которая может привести к поврежде..."  +/
Сообщение от Tron is Whistling (?), 25-Ноя-23, 22:39 
Обычно алгоритм ECC ловит немножко больше, чем способен исправить.
Ответить | Правка | Наверх | Cообщить модератору

328. "В OpenZFS выявлена ошибка, которая может привести к поврежде..."  +/
Сообщение от Аноним (319), 26-Ноя-23, 05:19 
> Обычно алгоритм ECC ловит немножко больше, чем способен исправить.

1) Сила FEC в роли абстрактной "чексуммы" совершенно не обязана быть чем-то этаким. Это вообще ниоткуда не следует. Например, насколько я помню, ReedSolomon(223,255) может исправить до 16 байтов на (223 данных + 32 парити), или до 32, если известно где ошибки. Но вот как "generic" чексумма бомбардируемая рандомом он может пропустить абсолютный левак как сошедшееся решение с вероятностью сравнимой с 40-битным CRC, чтоли, насколько я помню оценки (лучше перепроверить). В любом случае - вероятность пропуска левака там крайне далековата от 2^128 и тем более 2^256.

Уход в конские плотности записи для HDD и всякие QLC для флеша - BER разумеется не улучшили.

2) FEC занимает место. И портит циферки в маркетинге, сжирая место под техническое добро которое юзер в заявляемой емкости не видит, а вот производителю за это место заплатить придется. Поэтому его корректирующие возможности разумеется делают по минимуму, необходимому для более-менее беспроблемной работы в гарантийный период, чтобы хранить минимум избыточности. Все остальное - от лукавого. А так чтобы вот прямо ломовой запас, "в космос летим" - только за космические цены. В остальных случаях - на минималках, поэтому уход в стресстестирование этой штуки запросто приведет к отгрузке левака.

Ответить | Правка | Наверх | Cообщить модератору

329. "В OpenZFS выявлена ошибка, которая может привести к поврежде..."  +/
Сообщение от Tron is Whistling (?), 26-Ноя-23, 11:54 
Про объём уже писал, на современных хардах (лет много уже) ECC может добавлять приличный объём к данным.

Более того, в современных HDD минимум два уровня избыточности. Одно - как раз таки линейное кодирование записи, которое можно назвать FEC. Второе ныне - привычное уже многосекторное (обычно трековое) кодирование через интерливер, очень похожее на то, что применялось и применяется на оптических дисках. На RAID-адаптированных, да и не только, бывает плюсом к линейному FEC ещё вторичный посекторный код. На черепичках бывает ещё многоуровневый интерлив.

Поэтому "левак" вы скорее всего получите уже в платформе, нежели с диска.

Ответить | Правка | Наверх | Cообщить модератору

357. "В OpenZFS выявлена ошибка, которая может привести к поврежде..."  +/
Сообщение от Аноним (319), 27-Ноя-23, 02:18 
> Про объём уже писал, на современных хардах (лет много уже) ECC может
> добавлять приличный объём к данным.

Раньше был еще более приличным - в процентном соотношении. В частности 4K сектора вместо 512 насколько я помню делали как раз чтобы улучшить соотношение данные-FEC. На более длинном блоке соотношения могут быть более удачные в плане корректирующей способности VS какой это процент от данных займет. Ну как, сектора должны быть более-менее независимо декодабельны - иначе на запись сектора придется ворочать всю группу а это сложно и хреново. А на 512 байтах - даже небольшая добавка становится заметным % от этого, при умеренной корректирующей способности.

> Более того, в современных HDD минимум два уровня избыточности. Одно - как
> раз таки линейное кодирование записи, которое можно назвать FEC.
> торое ныне - привычное уже многосекторное (обычно трековое) кодирование через
> интерливер, очень похожее на то, что применялось и применяется на оптических дисках.

Идеи interleaving известны давно. Но они хорошо работают в основном от нечитаемости длинного сегмента (типа царапины на оптическом диске). Где этот сегмент превысил бы корректирующие возможности "наивного" 1-уровневого варианта, так размазал проблему на эн субблоков, масштаб проблемы небольшой для каждого субблока и вложенный FEC справляется.

А если траблы вместо этого больше напоминают "осыпон по всей площади" - ну, упс, deinterleave от этого уже сильно меньше поможет и соотношения уже не такие прикольные.

> На RAID-адаптированных, да и не только, бывает плюсом к линейному FEC ещё
> вторичный посекторный код.

RAID адаптированные - в основном так принципиально - отличаются фирмварью, чтобы не уходить надолго в себя "хоть там что", что считается контроллером за отказ девайса и ведет к залету на ребилд райда. Более обычный девайс предпочтет долбиться в нечитаемый сектор намного дольше. И если посмтреть что при этом случается - линух через секунд 15 мучений таймаутит это, пытается reset, retry операции и проч. В зависимости как сложатся пятна на солнце - это может выпасть в крайне неудачное взаимодействие. Которое надолго вклинит IO приведет к считанию девайса выпавшим. В любом случае система потребует мануального внимания и это уже булшит.

> На черепичках бывает ещё многоуровневый интерлив. Поэтому "левак" вы скорее всего
> получите уже в платформе, нежели с диска.

HDD и правда грузят левак скорее как исключение чем правило. А вот SSD, даже энтерпрайзные, прикалываются только в путь. И в каком QLC - сыпется по всей площади, ну и какой особый профит от деинтерлива ожидается? Если много утекло, что так UNC, что сяк, как ни крути. И вопрос сводится в основном к тому какой % площади готовы пожертвовать на FEC в результате.

Ответить | Правка | Наверх | Cообщить модератору

330. "В OpenZFS выявлена ошибка, которая может привести к поврежде..."  +/
Сообщение от Tron is Whistling (?), 26-Ноя-23, 11:57 
И да, 2^256 - это всего-то ничего, 32 байта.
Объём современных ECC на сектор несколько выше, да и на входе интерливера бит очень много.
Получить коллизию внутри сектора в нескольких алгоритмах одновременно с такой длиной, при корректности соседних данных - это надо очень постараться.

Одна из причин, по которой из маркетинга исчезло понятие BER и появилось NCER, кстати.

Ответить | Правка | К родителю #328 | Наверх | Cообщить модератору

356. "В OpenZFS выявлена ошибка, которая может привести к поврежде..."  +/
Сообщение от Аноним (319), 27-Ноя-23, 02:01 
> И да, 2^256 - это всего-то ничего, 32 байта.

И тем не менее, это совершенно астрономическое число. Даже 2^128 попыток обломно делать. А то в 2^128 раз больше 2^128. В вселенной энергии на столько попыток нет, так что можно не париться. Если бы это было правдой. Но увы... FEC не криптографические чексумы, не на это оптимизированы.

> Объём современных ECC на сектор несколько выше,

Их корректирующие способности - и вероятность что левак пролезет - рядом с вон теми цифрами не стояли.

> да и на входе интерливера бит очень много.
> Получить коллизию внутри сектора в нескольких алгоритмах одновременно с такой длиной, при
> корректности соседних данных - это надо очень постараться.

Силу FEC берут без запаса, чтобы едва держал "ожидаемый" средний уровень проблем, на грани. Так то FEC может исправлять много чего - вопрос сколько оверхеда на хранение избыточности жаба не удушит. А удушит, потому что место на FEC тратится, юзеру в емкости девайса не видно, а денег на хранение - стоит.

> Одна из причин, по которой из маркетинга исчезло понятие BER и появилось NCER, кстати.

Наружу юзеру актуальнее скорее это. Тем не менее - я вот за свою жизнь видел эн юзерей с убитыми файлухами где энтерпрайзные SSD пошли бэдами, при том отгружая наружу вот имнено трешак с левым содержимым, без IO error. И лезут юзеры с убитыми ФС где явно труха с накопителя приехала. Btrfs'ники в этом в некоем плюсе, там ор csum failed их порой успевает предупредить о факапе до того как он состоится. Но парочку пулов и им разносило. А вон те без чексумм - иногда красиво вылезают из дырки в асфальте, спрашивая что это было. Откуда-то ВНЕЗАПНО упал рояль. А чего ему не быть внезапным то без чексум ФС? :)

Ну и вот глядя на такие приколы я и пришел к выводу что лишний слой чексум - очень даже и неплохая идея. На практике довольно много всякой хрени хайлайтит, верифицируя end to end. ИМХО намного более работоспособная тема. И вот там параноики могут уже и криптографический хеш типа SHA256 или blake2 какого втулить, а вот ЭТО уже пробить - ну... попробуйте! Однако это таки еще +32 байта сверху, и само по себе FECом быть не умеет. Ассистентом, детектирующим какая копия верная - еще может быть.

Ответить | Правка | Наверх | Cообщить модератору

371. "В OpenZFS выявлена ошибка, которая может привести к поврежде..."  +/
Сообщение от Tron is Whistling (?), 27-Ноя-23, 14:10 
> Силу FEC берут без запаса, чтобы едва держал "ожидаемый" средний уровень проблем,

Вы про китайский хлам или что? Так-то нормальные производители FEC берут с хорошим запасом, им не улыбаются ни массовые RMA, ни class action в случае чего.

> энтерпрайзные SSD пошли бэдами, при том отгружая наружу вот имнено трешак с левым содержимым

Какой-то подвальный энтерпрайз или битый контроллер? Битый контроллер или память контроллера развалит всё содержимое, да. Прохождение шлака через корректно работающий ECC на контроллере без I/O error - исключено.

> лишний слой чексум - очень даже и неплохая идея

Всё бы ничего, но вместе с этим слоем в нагрузку идут чугунные скороходы.


Ответить | Правка | Наверх | Cообщить модератору

373. "В OpenZFS выявлена ошибка, которая может привести к поврежде..."  +/
Сообщение от Аноним (319), 27-Ноя-23, 21:16 
>> Силу FEC берут без запаса, чтобы едва держал "ожидаемый" средний уровень проблем,
> Вы про китайский хлам или что? Так-то нормальные производители FEC берут с
> хорошим запасом, им не улыбаются ни массовые RMA, ни class action

А нормальные производители - это кто? А то если взять допустим самсунь - у них например фирмвари по жизни горбатые. И ничего, живут с этим как-то. Хотя на мой вкус там class action давно пора бы, чтоб не смели такой треш в фирмварях на бошки юзеров отгружать. И это - один из топовых производителей флешатины на планете.

Так что оно вот реально делается чтобы не было массоых факапов в период гарантии, соответствие заявленному "на грани" - и не более того. И чем массовее нечто - тем меньше margin, ибо экономия даже центов отливается в солидный куш. Так что в этом смысле, энтерпрайзное железо обычно менее лажовое чем потребительское, но уверенность что там факапов не бывает - не от мира сего.

>> энтерпрайзные SSD пошли бэдами, при том отгружая наружу вот имнено
>> трешак с левым содержимым
> Какой-то подвальный энтерпрайз или битый контроллер?

Если так выкабениваться - весь самсунг можно этим термином назвать. А они по моему #1 по производству флеша на планете на ваше горе.

> Битый контроллер или память контроллера развалит всё содержимое, да.

Прелесть чексум в том что они все это еще и обнаруживают. В случае избыточности - еще и в моменты пока оно вполне себе корректируемо было - и можно вовремя отреагировать. А если проблему игнорить, она усугубится - и все разлетится к хренам.

> Прохождение шлака через корректно работающий ECC на контроллере без I/O
> error - исключено.

Я своим глазам и недовольным юзерям постящим логи верю больше чем каким-то теоретикам с опеннета, камлающим на непогрешимость проприетарных блобварей. Хотя бы потому что им врать резона нет, они приходят узнать "а как мне это починить". Или в случае btrfs - узнать баг btrfs ли это или что-то иное. А им и грят - мол, чуваки, меняйте ASAP свой накопитель, он у вас сыпется! Это нормальные "рабочие процессы" вокруг файлух видимые мне. Вы с ними спорить удумали? По моему спорить с наблюдаемыми фактами - тупая затея. К ним можно только адаптироваться - и желательно подрихтовать дизайны и дефолты файлух. Дада, и DUP в metadata бтрфсники вернули на SSD не от хорошей жизни. А потому что выживаемость ФС повышает.

>> лишний слой чексум - очень даже и неплохая идея
> Всё бы ничего, но вместе с этим слоем в нагрузку идут чугунные скороходы.

Это не скороходы, это гипердрайв. Да, специфичный, но - за освоение более чем воздается. А вы можете воооон там этажерку из LVM/dm/md и прочь себе слепить, чо. Получите подобие таких фич, но правда, рекаверить будет не сильно проще, а управление - намного геморройнее. Ну вот и выбирайте, как оно вам... хотя можно и технологией страуса, но так я бы никогда и не узнал о вон тех взбрыках. И глядишь верил бы таким сказочникам с опеннета как dурак. А вот тут я могу с чистой совестью отправить таких сказочников с их идеальным железом курить бамбук - наблюдаемые данные были другими и не стыкуются с этим спичем. Значит это хреновая теория и она идет в треш.

Ответить | Правка | Наверх | Cообщить модератору

333. "В OpenZFS выявлена ошибка, которая может привести к поврежде..."  +/
Сообщение от Tron is Whistling (?), 26-Ноя-23, 12:08 
Ну смотри - пока ты искал битвротики в ECC - твоя ZFS тебе незаметно порола данные, выдавая нули вместо блоков при определённом схождении звёзд. Появление подобного бага было вполне ожидаемо, учитывая монструозность этого поделия - с самого начала его существования.
Ответить | Правка | К родителю #314 | Наверх | Cообщить модератору

335. "В OpenZFS выявлена ошибка, которая может привести к поврежде..."  +/
Сообщение от Tron is Whistling (?), 26-Ноя-23, 12:21 
И вот конкретно поэтому лучше выбирать простые как доска стеки - ECC накопителя, спасающий в общем и целом от битовых ошибок при чтении, RAID, спасающий от реальных uncorrectable, и простую как доска файлуху - в моём случае это либо ext4 либо ocfs2 (где кластеры). С этого всего в случае термоядерного 3.14ца можно хотя бы что-то руками достать, в отличие от. Дальше идёт платформа с ECC у памяти - ага, основной вероятный источник повреждения данных. И бэкапы. К которым, я правда, за 15 лет ни разу не обращался из-за нарушения целостности данных, и которые пока пригодились только исправлять последствия кривых лапок у самих юзверей.
Ответить | Правка | Наверх | Cообщить модератору

358. "В OpenZFS выявлена ошибка, которая может привести к поврежде..."  +/
Сообщение от Аноним (319), 27-Ноя-23, 02:20 
> И вот конкретно поэтому лучше выбирать простые как доска стеки

Глядя на количество юзеров которым энтерпрайзне SSD вынесли ЭТО внезапным роялем, а также сколько кривого железа btrfs отловил из того что на виду - вы имхо это у себя и практикуйте. И там камлайте на супер-девайсы, думая что все ЗБС. Без средств для измерения что и правда - ЗБС.

Ответить | Правка | Наверх | Cообщить модератору

Архив | Удалить

Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема




Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру