forum.opennet.ru

Форум Разговоры, обсуждение новостей
Вариант для распечатки		Пред. тема \| След. тема
Режим отображения отдельной подветви беседы		[ Отслеживать ]

Оглавление

Дэниэл Бернштейн выступил с инициативой создания Си-компилят..., opennews (??), 22-Дек-15, (0) [смотреть все] +1

OpenNews В DNS-сервере BIND устранен серьёзный сбой, возникший из-за изменений , Sw00p aka Jerom (?), 14:41 , 22-Дек-15, (12) +4 //

А бага в чём в том, что хочет переписать ДЖБ, именно компилятор, а не стандарт , Sw00p aka Jerom (?), 14:56 , 22-Дек-15, (21)

Курс долллара взлетел - хотел бы ирония пс ДЖБ один из тех кто себя зарекоменд, Sw00p aka Jerom (?), 15:05 , 22-Дек-15, (25) +3

Почему только или , Аноним (-), 06:20 , 23-Дек-15, (136) +1

Потому что логическое или для истинности всего выражения не требует истинности т, Никто (??), 12:23 , 23-Дек-15, (143)

Завидовать нехорошо, тем более адепту микрософт, которое гребет бабло с патенто, Иван Ер0хин (?), 15:38 , 22-Дек-15, (38) +3

дополню выдержкой из той новости про бинд В частности, начиная с GCC 4 9 по ум, Sw00p aka Jerom (?), 15:00 , 22-Дек-15, (23) +3

Все, кому это надо, решают проблему прибитой гвоздями версией компилятора и ключ, Crazy Alex (ok), 15:33 , 22-Дек-15, (36) +1

эм, давно пакет делали deb rpm под современные версии дистрибутивов два centos, й (?), 01:36 , 23-Дек-15, (130) –1

Т е он декларирует что его копилятор не будет развиваться вдруг в С17 напишут , Вареник (?), 21:58 , 22-Дек-15, (111)

Кстати, да Уже сколько лет никакого движения ни в djbdns, ни в qmail 8230 , Moomintroll (ok), 10:25 , 23-Дек-15, (140)

qmail никакого движения не нужно, как ни странно это звучит Всё что нужно можно, Аноним (-), 16:19 , 23-Дек-15, (151) +1

без хэшей, подписанных коммитов и контрольных сумм , Аноним (-), 14:48 , 22-Дек-15, (15)

Правильно говорит Для проектов уровня ядра Linux, Android, Firefox и Chrome каж, Аноним (-), 14:07 , 22-Дек-15, (4) +2 //

Android и Chromium гуглом собираются clang ом, что как бы намекает , Аноним (-), 17:51 , 22-Дек-15, (72) //

У clang ситуация ровно такая же Если древний код с UB то каждая новая версия - , Crazy Alex (ok), 00:59 , 23-Дек-15, (127) +2

Действительно, надо прекратить выпускать новые релизы GCC , Аноним (-), 00:01 , 23-Дек-15, (122) +1
А каждый новый релиз защищённого компилятора, значит, всегда будет праздником , dq0s4y71 (??), 16:47 , 23-Дек-15, (153) +3 //

Именно Проекты уровня ядра Linux, Android, Firefox и Chrome тм не будут собира, Andrey Mitrofanov (?), 17:56 , 23-Дек-15, (156)

Rust, D, или что-то такое 8212 в любом случае если C четко определить семанти, Deepwalker (??), 14:09 , 22-Дек-15, (5) +6 //

Отличная идея Давайте назовём его Java Хотя, постойте 8230 , Аноним (-), 14:17 , 22-Дек-15, (7) //

Джава это такой электровеник со встроенным веником GC, который постоянно тормози, Чаёвник (?), 16:14 , 22-Дек-15, (53) +2 //

Вы определитесь 8212 вам производительность или undefined, unspecified beha, Аноним (-), 18:10 , 22-Дек-15, (75) –1

А как предсказуемое поведение повлияет на производительность Вот это вот int i , www2 (ok), 18:55 , 22-Дек-15, (89) +1

А кто гарантирует, что n sizeof m 0 TYPE_MAX Да, можно сделать доп п, pavlinux (ok), 19:57 , 22-Дек-15, (101)
Медленнее будет работать проверка указателя перед его первым использованием Медл, Аноним (-), 19:59 , 22-Дек-15, (102)
А что вы до Явы докопались, она в NASA, точнее уже на Марсе, на марсаходах работ, pavlinux (ok), 20:42 , 22-Дек-15, (106) +1

откуда инфа , Аноним (-), 22:34 , 22-Дек-15, (117) –1

Вот ты тёмный, братишка Ещё скажи что не в курсе о том что питон на луне вместе, Онаним (?), 13:57 , 23-Дек-15, (146) +1

Мерзкие, склизкие, земноводные гады зависть, Andrey Mitrofanov (?), 14:25 , 23-Дек-15, (147) –1

Google nasa mars java , pavlinux (ok), 00:51 , 25-Дек-15, (173) +2

Написали helloworld на Java А сопровождать сотни тысяч строк кода на C приход, Вареник (?), 22:03 , 22-Дек-15, (112) –2

Не осилили лабы в политехе, как и все Си-хейтеры Ассемблер тоже завалили Паска, Чаёвник (?), 22:34 , 22-Дек-15, (116) +1

Шура, не трогайт белоснежный Си своими кривыми приплюснутыми лапами, Бармаглот (?), 01:53 , 23-Дек-15, (132) +2
Более того бОльшая половина софта БОльшая половина - это сильно А бигдата - эт, Классический Анонимух (?), 07:25 , 23-Дек-15, (137) +2

Бигдата Мммм Я забыл, каждый день он нужен тысячам мильёнов для ежедневных з, Чаёвник (?), 11:18 , 23-Дек-15, (141) –1
Мне вот интересно, что нынче студентота подразумевает под бигдатой SAP Или уже, Anonim (??), 17:29 , 23-Дек-15, (154) –1

У меня первый телефон, 15 лет назад, был с игрушками и приложениями на джаве С , Классический Анонимух (?), 07:27 , 23-Дек-15, (138) –2

Да, такие маленькие убогие кастратики, типа Siemens M55 и Sony X100 Помню носил, Чаёвник (?), 11:35 , 23-Дек-15, (142)

Перечитай новость еще раз Речь идет о поведении компилятора, а не о изменениях , angra (ok), 14:27 , 22-Дек-15, (8) +1 //

Он эе по факту пытается стандартизировать undefined, unppecified и impleentation, Crazy Alex (ok), 14:50 , 22-Дек-15, (18) +4 //

Во-первых, это нельзя решать ни новой реализацией очевидно , ни новым стандарто, Аноним (-), 18:13 , 22-Дек-15, (76)

Ерунда 1 стандарт врубается по соответствующему ключику Если ты не знаешь, что, Crazy Alex (ok), 01:07 , 23-Дек-15, (129)

Да, он покушается именно, что на стандарт его действительно надо доопределить О, freehck (ok), 14:30 , 23-Дек-15, (148)

Некоторые любят решать уже решённые проблемы http ispras linuxbase org index p, Аноним (-), 18:17 , 22-Дек-15, (77) +2 //

Некоторые любят придумать чушь за автора и научить его, как эту чушь исправить, , angra (ok), 18:30 , 22-Дек-15, (82) +2

У языка как такового нет ABI ABI есть у программ и библиотек, диктуемое отчасти, Аноним (-), 18:53 , 22-Дек-15, (87)

Раз в полгода в списке рассылки gcc или clang появляется какой-нибудь чудак с по, Аноним (-), 14:16 , 22-Дек-15, (6) +3 //

Вы сравниваете теплое с фиолетовым 8211 т е выкладки и инновационные предл, Нимано (?), 14:48 , 22-Дек-15, (16) +3 //

Это вещи одного порядка И если уж вы так любите апеллировать к авторитетам, под, Аноним (-), 16:30 , 22-Дек-15, (59) //

Угу, угу Ну, не все умеют в телепатию GCC-онляи костыль, в виде повторяющегося O, Нимано (?), 17:27 , 22-Дек-15, (71)

Угу, угу А и не надо Непонятно 8212 переспросите Только, если бы вы действи, Аноним (-), 17:51 , 22-Дек-15, (73) +2

О, кстати 171 Расширенный 187 синтаксис ассемблерных вставок gcc, помимо сам, Аноним (-), 17:59 , 22-Дек-15, (74) +1

Повторю слова автора по ссылке Ok, I admit it I m surprised Не знал, что кром, Владимир (??), 18:23 , 22-Дек-15, (79)

И что, это уже не костыль Ну-ну О великий просветитель, зачем вы вообще приплел, Нимано (?), 19:02 , 22-Дек-15, (90)

Нет Суперскалярный процессор с внеочередным исполнением волен исполнять в произв, Аноним (-), 19:37 , 22-Дек-15, (98)

Ну-ну Особенно приведенный вами вами код соберите с ним ядро и наслаждайтесь ск, Нимано (?), 04:35 , 23-Дек-15, (134)

Лучше на D перейти В нём уже есть вся эта защита и код на нём намного красивей п, А (??), 14:41 , 22-Дек-15, (11) –2 //

Тут смысл в другом Изобрести золотую пулю И рыбку съесть Типа и код не на, Вареник (?), 22:11 , 22-Дек-15, (113)
эм, у меня под боком есть серверный линукс программы на c и на go в нём есть, а, й (?), 01:39 , 23-Дек-15, (131)

Что за бред, простите Оптимизатор - это одно UB - совсем другое Я, в общем-то, Crazy Alex (ok), 14:46 , 22-Дек-15, (13) +1 //

Смысл в том, чтобы ввести предсказуемое поведение в компилятор, для того чтобы н, ram_scan (?), 15:23 , 22-Дек-15, (31) //

Ну, то есть соответствующий софт ничем больше будет не собрать , Crazy Alex (ok), 15:59 , 22-Дек-15, (45)
Пример такого компилятора в студию Я вот тоже считаю, определить UB - это бред, , Аноним (-), 18:18 , 22-Дек-15, (78) –1 //

Любой современный Dead store elimination считается безопасной оптимизацией и пр, Аноним (-), 18:34 , 22-Дек-15, (83)

Удаление присваивания возможно _только_ в случае, если компилятор может _доказат, Аноним (-), 18:47 , 22-Дек-15, (86)

gt оверквотинг удален Чтобы доказать прямое, программу тоже надо собирать с LT, Аноним (-), 19:09 , 22-Дек-15, (92)

Не всегда Я привел пример, когда это не требуется, и компиляторы так работают и, Аноним (-), 19:22 , 22-Дек-15, (96)

Почему в 0 а не в INT_MAX Почему они вообще должны инициализироваться Полагаю , Мяут (ok), 14:47 , 22-Дек-15, (14) //

Т е ты действительно не умеешь в биты Потому, что не круто плодить неиспользуем, Pickle (?), 15:06 , 22-Дек-15, (26) +1 //

gcc уже давным давно выдает варнинг при попытке использования неинициализированн, Аноним (-), 15:20 , 22-Дек-15, (30) +4 //

Только в самых тривиальных случаях code include stdio h include stdlib h int , Аноним (-), 15:59 , 22-Дек-15, (44) +1

А вы на шкаф залезьте c Естественно нет У компилятора С просто нет информаци, Аноним (-), 16:12 , 22-Дек-15, (51)
gcc -O2 -Wall unused cunused c 12 3 предупреждение b is used uninitialized i, Аноним (66), 17:06 , 22-Дек-15, (66)

gcc --versiongcc GCC 4 9 2 20150212 Red Hat 4 9 2-6 во втором случае gcc -Wu, Аноним (-), 17:15 , 22-Дек-15, (68) –1

Ключевое слово -O2, анализатор намертво прибит к оптимизатору , Аноним (66), 05:19 , 23-Дек-15, (135) +1

Меня смущают люди, которые используют неинициализированные переменные, кроме как, Pickle (?), 16:08 , 22-Дек-15, (50)

Добавил я к тому, что я уже на автомате делаю, что-то типа int i 0 , Pickle (?), 16:14 , 22-Дек-15, (54) –1

Не делайте так больше никогда Рискуете пропустить важный варнинг от компилятора, Аноним (-), 16:18 , 22-Дек-15, (56) +2

Иногда инициализация заключается в передаче указателя на переменную в функцию На, Аноним (-), 16:17 , 22-Дек-15, (55)
Бывают особые случаи https www schneier com blog archives 2008 05 random_numbe, ACCA (ok), 23:06 , 22-Дек-15, (119)

Это не особые случаи , а ССЗБ, заслуженно наступивший на грабли , Аноним (-), 12:58 , 23-Дек-15, (145)

UB это некорректная программа, а не нет единственно правильного поведения Uns, all_glory_to_the_hypnotoad (ok), 23:45 , 22-Дек-15, (120)

очень интересно было бы понять что такое предсказуемый язык и что понимается под, Аноним (-), 14:50 , 22-Дек-15, (17) //

одно можно сказать - это как минимум функциональный язык, привет Rust , Аноним (-), 18:55 , 22-Дек-15, (88) +1 //

все дело в разруливании указателей - в ржавчине можно явно утверждать а не гада, Аноним (-), 01:02 , 23-Дек-15, (128)

Безнадежная идея Лучше уж сразу взять язык со ссылочной прозрачностью Проблем, Аноним (-), 14:54 , 22-Дек-15, (20)
Настолько что сразу начали бы писать гoвнокод который будучи скомпиленным другим, Аноним (-), 15:10 , 22-Дек-15, (27) +2 //

Получила функция на вход const char и откуда компилятору знать где тут границы, Аноним (-), 15:18 , 22-Дек-15, (28) +2 //

Описывайте указатель на буфер, чтобы через sizeof размер вычислялся, и чтобы н, ram_scan (?), 15:27 , 22-Дек-15, (33) –2 //

p alloc_foo 100500 do_bar p Давайте расскажите мне как КОМПИЛЯТОР узнает раз, Аноним (-), 15:29 , 22-Дек-15, (35) +2

Ладно ты технически безграмотен, но неужели совсем нет воображения чтобы подумат, Аноним (-), 15:57 , 22-Дек-15, (43) –2

Откуда компилятору знать что alloc_foo вообще выделяет память Откуда компилятор, Аноним (-), 16:05 , 22-Дек-15, (48) +2

И кстати вдогонку рантайм кост всего этого дерьма вы себе представляете , Аноним (-), 16:07 , 22-Дек-15, (49) +1

Еще один указатель на p sizeof DATA и все См реализацию управления памятью чут, Аноним (-), 17:11 , 22-Дек-15, (67) –2

Тем более все компиляторы хранят размеры выделенной памяти для того, чтоб free p, Аноним (-), 17:17 , 22-Дек-15, (69) –1

Штука в том, что по невалидному указателю все эти метаданные можно повредить и, Аноним (-), 18:27 , 22-Дек-15, (80) +3

Проверкой сигнатуры в блоке памяти до указанного указателя Проверкой указателя , www2 (ok), 19:12 , 22-Дек-15, (93) –1

Т е вас устроит безопасность по пятницам Я-то думал, мы хотим повысить надеж, Аноним (-), 20:07 , 22-Дек-15, (104)

Миллион способов однозначно получить информацию о размерах буффера по адресу, на, Аноним (-), 15:55 , 22-Дек-15, (42) –1 //

Глобальной таблицы чего Кто в нее будет писать p mmap NULL, 100500, PROT_RE, Аноним (-), 16:33 , 22-Дек-15, (60) +1

А как free p знает сколько памяти освобождать Учите матчасть , Аноним (-), 17:05 , 22-Дек-15, (65) –2

Вы бы сами подучили Не malloc free единым, как говорится , Аноним (-), 18:29 , 22-Дек-15, (81) +2
Прочитай про разницу между компиляций и исполнением Подумай, в какой момент вып, angra (ok), 18:37 , 22-Дек-15, (84) +1
выделением освобождением памяти занимается ядро, а free - это syscall, Аноним (-), 19:06 , 22-Дек-15, (91)

Что O_o, Аноним (-), 19:13 , 22-Дек-15, (94) +2
Садись, два free - это библиотечная функция, она работает с кучей А уже место , www2 (ok), 19:16 , 22-Дек-15, (95)

Можно вернуть страницу целиком , Аноним (-), 19:53 , 22-Дек-15, (99)

malloc и free дают возвращают страницы , Вареник (?), 22:17 , 22-Дек-15, (114) –1

Теоретически, mmap - реализации это могут, Аноним (-), 01:57 , 23-Дек-15, (133) +1
Речь о том, что free может вернуть страницу, если в ней больше не осталось испол, Аноним (-), 18:04 , 23-Дек-15, (158)

Не пиши больше, иди ёжиков культивируй , pavlinux (ok), 21:17 , 22-Дек-15, (109)

Мануалы не читаем, команды пишем , Вареник (?), 22:18 , 22-Дек-15, (115)

Вообще, тут можно сделать библиотечную обвязку для mmap, которая будет запоминат, www2 (ok), 19:31 , 22-Дек-15, (97) –1

Боюсь, что прокатит ваш вариант Начиная с того, что появляется дополнительный и, Аноним (-), 20:01 , 22-Дек-15, (103)

не прокатит, Аноним (-), 20:12 , 22-Дек-15, (105)

Больше хорошего и разного гoвнокода 171 Лучшее враг хорошего 187 Хотя, это с, vi (ok), 20:43 , 22-Дек-15, (107) –1

Насколько Ермолова играла бы лучше вечером, если бы она днём, понимаете, работа, Какаянахренразница (ok), 15:19 , 22-Дек-15, (29) +1
А разве -Wall -Wextra -Werror -pedantic-errors не будет достаточно для исключени, Аноним (-), 15:26 , 22-Дек-15, (32) //

За это Бернштейну грант не дадут , Аноним (-), 15:27 , 22-Дек-15, (34) +1
Если нужно именно исключение из кода возможности UB, то нужен не компилятор, а с, тоже Аноним (ok), 15:42 , 22-Дек-15, (39) +1
UB далеко не всегда можно определить в compile time Кстати, сюда добавь ещё cla, Аноним (-), 15:59 , 22-Дек-15, (46) –1
Ололо Наивные юноши думают что компилятор спасет их от необходимости думать co, Аноним (-), 16:22 , 22-Дек-15, (57) //

Еще один любитель залезать на шкаф , Аноним (-), 16:27 , 22-Дек-15, (58) –1 //

Цитата А разве -Wall -Wextra -Werror -pedantic-errors не будет достаточно для и, Аноним (-), 16:43 , 22-Дек-15, (61) +1

если убрать из С неопределённое поведение, это уже будет не С, Нанобот (ok), 15:35 , 22-Дек-15, (37)
Мужик не слышал про CompCert , Аноним (-), 15:51 , 22-Дек-15, (40) //

Напиши ему , Аноним (-), 16:55 , 22-Дек-15, (62)

какая разница, если всё равно это будет иметь эффект лишь только на этом эталонн, XXasd (?), 16:03 , 22-Дек-15, (47)
кажется речь про LLVM RUST , Аноним (-), 16:14 , 22-Дек-15, (52) +2 //

Нет, речь про C компилятор, Аноним (-), 16:55 , 22-Дек-15, (63) –1

Go уже придуман , Аноним (-), 16:58 , 22-Дек-15, (64) –1 //

Трололо У Go значительная часть криптографии, включая реализацию curve25519 от , Аноним (-), 17:25 , 22-Дек-15, (70)

Больше 70 комментариев с вопросами и поучениями, которые Бернштейн предусмотрел , angra (ok), 18:42 , 22-Дек-15, (85) //

Так он и ответил в стиле местных комментариев - мне кажется, это было бы круто,, Аноним (-), 19:56 , 22-Дек-15, (100)

Гёдель смотрит с недоумением , Аноним (-), 20:47 , 22-Дек-15, (108) +1 //

да-да, и в то же самое время грустно и свирепо , Аноним (-), 00:03 , 23-Дек-15, (124) +1
вы про неполноту или про всякую программу, которую можно сократить на одну коман, Аноним (-), 15:56 , 23-Дек-15, (149)

Да-да, мы помним как в Debian именно так и улучшили именно криптуху , . (?), 21:37 , 22-Дек-15, (110) +1
IMHO, в плане безопасности сейчас большую пользу принесёт статический анализатор, Аноним (-), 23:03 , 22-Дек-15, (118)
а потом через Х лет мы на этот компилятор должны будем наложить 100 сторонних па, абвгдейка (ok), 00:17 , 23-Дек-15, (126) +1
Вот интересно, ему заняться больше нечем, кроме как велики изобретать В наше вр, Аноним (-), 09:20 , 23-Дек-15, (139) –1 //

Ага, и код всех немного староватых сишных программ на них переписывай , Anonim (??), 14:53 , 24-Дек-15, (169)

Больше всего я не люблю, когда мне говорят, что делать и чего не делать Я полн, robux (ok), 12:36 , 23-Дек-15, (144) //

но это тоже ведь попытка заставить делать , Аноним (-), 20:23 , 23-Дек-15, (161)
А потом получается жутко неудобный и костыльный epoll , чисто потому, что делат, nuclight (??), 17:41 , 29-Дек-15, (179) –1

Уважаемые эксперты данной темы форума - извиняюсь за оффтопик, но посоветуйте по, Аноним (-), 16:00 , 23-Дек-15, (150) –1 //

Освоение указателей в С С - это 5 теории, которую можно вычитать в любом учеб, тоже Аноним (ok), 16:44 , 23-Дек-15, (152) //

Их у меня есть - сколько не пытался - приходится погружаться в какие-то дебри и , Аноним (-), 17:59 , 23-Дек-15, (157) –1 //

Чтобы грамотно и эффективно пользоваться языком, вам придется в какой-то мере м, Аноним (-), 18:19 , 23-Дек-15, (159)

меня интересуют именно указатели, Аноним (-), 19:40 , 23-Дек-15, (160) –2

Тогда вот вам хорошая старая книга http lib ru CTOTOR IBMPC abel txt_with-big, тоже Аноним (ok), 23:01 , 23-Дек-15, (162)

шутку оценил сенкс еще bredly pak забыли и нортонгайды, спасибо конечноКогда, privation (?), 23:22 , 23-Дек-15, (163) –1

Никаких шуток Чтобы понять указатели, нужно понять адресную арифметику и RTTI, , тоже Аноним (ok), 00:12 , 24-Дек-15, (164)

OK - спасибо, мне знакома эта книженция В общем понятно - копать в сторону ассе, Аноним (-), 00:55 , 24-Дек-15, (165)

Си - низкоуровневый язык Некоторые называют это системный Почти ассемблер И, Andrey Mitrofanov (?), 10:02 , 24-Дек-15, (167)

С абстракциями, ООП, SOLID, DRY проблем как раз нет, просто есть сложности с осв, Аноним (-), 13:21 , 24-Дек-15, (168) –2

Если речь об обычных указателях, то с синтаксисом там как раз всё просто Все три, Аноним (-), 15:03 , 24-Дек-15, (170) +1

gt оверквотинг удален премного благодарен за растолкованные нюансы и ваше врем, Аноним (-), 15:40 , 24-Дек-15, (171) –1

Странный, однако, способ бороться с архитектурными дизайнерскими проблемами са, anonim (ok), 17:31 , 23-Дек-15, (155)
Как можно с бесстыжей рожей называть себя экспертом и при этом предлагать полн, Kodir (ok), 00:08 , 25-Дек-15, (172) –1 //

Как можно с бестыжей рожей утверждать, что всякие Дэ и Го со своими сборщиками м, LittleBuster (ok), 08:57 , 28-Дек-15, (178) +1

Просто он предлагает выпустить компилятор с дополнительными замечаниями типа D, Аноним (-), 21:30 , 30-Дек-15, (180)
Такой компилятор, а точнее язык, уже есть - C99 Левое какое-то предложение U, rihad2 (?), 17:52 , 16-Янв-16, (182)
Дураку дай хоть танк - он его угробит По факту проблема не в языках, а в отсу, bOOster (ok), 12:35 , 18-Янв-16, (183)
все, кто там вякает, что типа язык СИ хуже моего любимого бренфака - назовите , pripolz (?), 17:37 , 07-Июл-17, (184)

Сообщения [Сортировка по времени | RSS]

59. "Дэниэл Бернштейн выступил с инициативой создания Си-компилят..." +/–

Сообщение от Аноним (-), 22-Дек-15, 16:30

> Вы сравниваете теплое с фиолетовым – т.е. выкладки и "инновационные" предложения очередного диванного теоретика, с соображениями вполне известного и уже доказавшего, что он "небалабол" DJB?
Это вещи одного порядка. И если уж вы так любите апеллировать к авторитетам, подумайте, почему в стандарте C вообще (и до сих пор) существуют undefined behavior и unspecified behavior.
> Не Мерседес, а Запорожец, не в лотто а в карты ..." oO
Полностью разделяю ваше восхищение (вашим умением передёргивать).
http://blog.cr.yp.to/20140517-insns.html
Фэйла здесь нет, я о нём и не говорил. Просто те, кому *действительно* нужна защита от timing attacks, находят пути её реализовать[1], для остальных это — пустая потеря производительности (и времени автономной работы от батарей).
[1] https://git.kernel.org/cgit/linux/kernel/git/next/linux-next...

Ответить | Правка | Наверх | Cообщить модератору

71. "Дэниэл Бернштейн выступил с инициативой создания Си-компилят..." +/–

Сообщение от Нимано (?), 22-Дек-15, 17:27

> Это вещи одного порядка.
Угу, угу.
> Полностью разделяю ваше восхищение (вашим умением передёргивать).
Ну, не все умеют в телепатию.
> . Просто те, кому
> *действительно* нужна защита от timing attacks, находят пути её реализовать[1],
GCC-онляи костыль, в виде повторяющегося OPTIMIZER_HIDE_VAR(neq), для – это да, оптимальнейшее решение!

Ответить | Правка | Наверх | Cообщить модератору

73. "Дэниэл Бернштейн выступил с инициативой создания Си-компилят..." +2 +/–

Сообщение от Аноним (-), 22-Дек-15, 17:51

>> Это вещи одного порядка.
> Угу, угу.
Угу, угу.
>> Полностью разделяю ваше восхищение (вашим умением передёргивать).
> Ну, не все умеют в телепатию.
А и не надо. Непонятно — переспросите. Только, если бы вы действительно иногда читали блог так рьяно защищаемого вами Бернштейна, вам было бы понятно.
>> . Просто те, кому
>> *действительно* нужна защита от timing attacks, находят пути её реализовать[1],
> GCC-онляи костыль, в виде повторяющегося OPTIMIZER_HIDE_VAR(neq), для – это да,
> оптимальнейшее решение!
1. http://lxr.free-electrons.com/ident?i=OPTIMIZER_HIDE_VAR
Это к вопросу у gcc-only.
2. http://lxr.free-electrons.com/source/include/linux/compiler-...
#define OPTIMIZER_HIDE_VAR(var)                                         \
        __asm__ ("" : "=r" (var) : "" (var))
В отличие от вас, я умею в телепатию. Моя телепатия говорит мне, что вы не знаете, что такое суперскалярный процессор с внеочередным исполнением. Ещё моя телепатия говорит мне, что вы гуманитарий: саркастически называя код __asm__ ("" : "=r" (var) : "" (var)) оптимальнейшим решением, вы вступаете в противоречие с самим собой, так как ранее вставали на сторону Бернштейна в его требовании обеспечить постоянное время выполнения команд сравнения (что, как раз-таки, неоптимально). В отличие от этого требования Бернштейна, конструкция __asm__ ("" : "=r" (var) : "" (var)) действительно оптимальна в том смысле, что является лишь указанием компилятору, не внося дополнительных задержек времени исполнения в сгенерированный код, и весь негативный эффект от её применения — запрет компилятору переупорядочивать в сгенерированном коде команды, зависимость по данным между которыми компилятору неочевидна. Фактически, на этапе выборки команд процессор всё равно может переупорядочить их, хотя это переупорядочивание потенциально гораздо менее опасно, чем то, что мог бы выполнить компилятор.

Ответить | Правка | Наверх | Cообщить модератору

74. "Дэниэл Бернштейн выступил с инициативой создания Си-компилят..." +1 +/–

Сообщение от Аноним (-), 22-Дек-15, 17:59

> 1. http://lxr.free-electrons.com/ident?i=OPTIMIZER_HIDE_VAR
> Это к вопросу у gcc-only.
О, кстати!
«Расширенный» синтаксис ассемблерных вставок gcc, помимо самого gcc, поддерживают, как минимум, clang, Sun Studio и Intel C Compiler[1].
И компилятор из состава Freescale CodeWarrior[2].
Это всё к вопросу о gcc-only.
[1] https://gcc.gnu.org/ml/gcc/2015-12/msg00124.html
[2] https://gcc.gnu.org/ml/gcc/2015-12/msg00123.html

Ответить | Правка | Наверх | Cообщить модератору

79. "Дэниэл Бернштейн выступил с инициативой создания Си-компилят..." +/–

Сообщение от Владимир (??), 22-Дек-15, 18:23

Повторю слова автора по ссылке:
Ok, I admit it:  I'm surprised.
Не знал, что кроме шланга еще кто-то в это может.

Ответить | Правка | Наверх | Cообщить модератору

90. "Дэниэл Бернштейн выступил с инициативой создания Си-компилят..." +/–

Сообщение от Нимано (?), 22-Дек-15, 19:02

> 1. http://lxr.free-electrons.com/ident?i=OPTIMIZER_HIDE_VAR
> Это к вопросу у gcc-only.
И что, это уже не костыль?
> В отличие от вас, я умею в телепатию. Моя телепатия говорит мне,
> что вы не знаете, что такое суперскалярный процессор с внеочередным исполнением.
Ну-ну. О великий просветитель, зачем вы вообще приплели сюда суперскалярность?
> Ещё моя телепатия говорит мне, что вы гуманитарий:
Хоспади, д'Артаньян, Вы?
> вступаете в противоречие с самим собой, так как ранее вставали на
> сторону Бернштейна в его требовании обеспечить постоянное время выполнения команд сравнения
Аноним не читатель?
> consider adding AES support to their instruction
> sets. For example, a CPU could support fast constant-time
для анонимов: специальные комманды под это дело.
И ведь таки потом AES-NI запилили, не?
> том смысле, что является лишь указанием компилятору,
Ну, если побочный эффект – указание, то да.
> запрет компилятору переупорядочивать в сгенерированном коде команды,
> зависимость по данным между которыми компилятору неочевидна.
Н-да, а сколько пафоса то было.
В первую очередь, это запрет на оптимизацию.
Т.к. для конечный пользователь  вызывает crypto_memneq
static inline int crypto_memneq(const void *a, const void *b, size_t size)
{
         return __crypto_memneq(a, b, size) != 0UL ? 1 : 0;
}

> return __crypto_memneq(a, b, size) != 0UL ? 1 : 0;
т.е. получает 0 или 1.
Я не знаю, как конкретно называется используемая техника в гцц, но тa же классическая "abstract interpretation" при первом же проходе засветит только на раз, что:
( как только neq != 0 => нефиг далее маятся дурью, можно делать ret, т.к. ответ более  "не меняется").
А так – там эдакая костыльная вставка на асме,  означающая (на сей момент) для компилятора: "неведомая магия с neq в качестве in/out", оптимизировать низзя.
Разъясняю на пальцах:
> __asm__ ("" : "=r" (var) : "" (var))
Темплейт-то пустой. Просто здесь объявляется, что "neq" идет в in/out, а сам темплейт гцц (пока) не парсится.
А теперь, вопрос на засыпку: что будет, когда гцц/шланг научатся парсить темплейт  – и соответсвенно "узнают" о том, что neq там не применяется?
И чем это лучше UD?

Ответить | Правка | К родителю #73 | Наверх | Cообщить модератору

98. "Дэниэл Бернштейн выступил с инициативой создания Си-компилят..." +/–

Сообщение от Аноним (-), 22-Дек-15, 19:37

>> 1. http://lxr.free-electrons.com/ident?i=OPTIMIZER_HIDE_VAR
>> Это к вопросу у gcc-only.
> И что, это уже не костыль?
Нет.
>> В отличие от вас, я умею в телепатию. Моя телепатия говорит мне,
>> что вы не знаете, что такое суперскалярный процессор с внеочередным исполнением.
> Ну-ну. О великий просветитель, зачем вы вообще приплели сюда суперскалярность?
Суперскалярный процессор с внеочередным исполнением волен исполнять в произвольном порядке команды, если между ними нет барьеров или зависимостей по данным. Компилятор для суперскалярного процессора с внеочередным исполнением использует это его свойство, самостоятельно, *уже на этапе компиляции* переупорядочивая некоторые команды там, где это может быть выгодно, что потенциально может спровоцировать процессор на ещё одно переупорядочивание во время выполнения (например, из-за различного расстояния до данных, адресуемых a или b, в иерархии кэшей).
Если бы тот код писался для тривиального конвеера, в функции __crypto_memneq_16() не было бы ни одной строки OPTIMIZER_HIDE_VAR(neq);. Задача разработчиков функции — постоянное время её исполнения вне зависимости от входных данных, и часть этой задачи они решают строгим упорядочиванием составляющих эту функцию команд.
>> Ещё моя телепатия говорит мне, что вы гуманитарий:
> Хоспади, д'Артаньян, Вы?
Да.
>> вступаете в противоречие с самим собой, так как ранее вставали на
>> сторону Бернштейна в его требовании обеспечить постоянное время выполнения команд сравнения
> Аноним не читатель?
>> consider adding AES support to their instruction
>> sets. For example, a CPU could support fast constant-time
> для анонимов: специальные комманды под это дело.
> И ведь таки потом AES-NI запилили, не?
Аноним не читатель. Я понятия не имею, зачем вы приплели AES-NI в свой второй пост и повторяете здесь. Речь шла о командах сравнения. AES-NI — не команда сравнения.
>> том смысле, что является лишь указанием компилятору,
> Ну, если побочный эффект – указание, то да.
Указание — единственный эффект этой конструкции.
>> запрет компилятору переупорядочивать в сгенерированном коде команды,
>> зависимость по данным между которыми компилятору неочевидна.
> Н-да, а сколько пафоса то было.
> В первую очередь, это запрет на оптимизацию.
Набор слов.
>[оверквотинг удален]
>> return __crypto_memneq(a, b, size) != 0UL ? 1 : 0;
> т.е. получает 0 или 1.
> Я не знаю, как конкретно называется используемая техника в гцц, но тa
> же классическая "abstract interpretation" при первом же проходе засветит только на
> раз, что:
>  ( как только neq != 0 => нефиг далее маятся дурью,
> можно делать ret, т.к. ответ более  "не меняется").
> А так – там эдакая костыльная вставка на асме,  означающая (на
> сей момент) для компилятора: "неведомая магия с neq в качестве in/out",
> оптимизировать низзя.
Эта вставка вводит фиктивную зависимость по данным между обращениями к neq. Вы правильно поняли часть её назначения: гарантировать, что сгенерированный компилятором код будет в точности, без изъятий соответствовать коду, написанному на C. Это вторая часть решения задачи обеспечения постоянного времени выполнения функции.
Однако ваше опасение справедливо лишь для случаев, когда значения аргументов a и b, а также константные смещения относительно них известны компилятору во время компиляции. На практике, в ядре таких случаев нет. Вы правильно поняли назначение конструкции, но исходите из ошибочной посылки.
> Разъясняю на пальцах:
>> __asm__ ("" : "=r" (var) : "" (var))
> Темплейт-то пустой. Просто здесь объявляется, что "neq" идет в in/out, а сам
> темплейт гцц (пока) не парсится.
Совершенно верно, это фиктивная зависимость по данным. Но предотвращает она не dead code elimination (тогда здесь было бы достаточно спецификатора volatile при объявлении neq), а переупорядочивание выражений друг относительно друга.
> А теперь, вопрос на засыпку: что будет, когда гцц/шланг научатся парсить темплейт
>  – и соответсвенно "узнают" о том, что neq там не
> применяется?
> И чем это лучше UD?
gcc или clang никогда не научатся разбирать содержимое ассемблерных вставок by design. Это контракт. Вопрос не имеет смысла.

Ответить | Правка | Наверх | Cообщить модератору

134. "Дэниэл Бернштейн выступил с инициативой создания Си-компилят..." +/–

Сообщение от Нимано (?), 23-Дек-15, 04:35

>>  И что, это уже не костыль?
> Нет.
Ну-ну. Особенно приведенный вами вами код.
> __asm__ ("" : "=r" (var) : "" (var))
соберите с ним ядро и наслаждайтесь скоростью (намек: шланг хоть ругается на "invalid constraint", а гцц "кушает" и не обляпывается, генерируя

cmp     rdx, 16
        jne     .L5
        ret

Но ладно, не будем придираться. Просто "некостыльность" обычно несколько иначе выглядит.
>  строгим упорядочиванием составляющих эту функцию команд.
Гм, намекну:
Берем оригинальный код и делаем так:

    unsigned long neq = 0;
    unsigned long tmp1, tmp2;
#ifdef CONFIG_HAVE_EFFICIENT_UNALIGNED_ACCESS
    if (sizeof(unsigned long) == 8) {
        tmp1 = *(unsigned long *)(a)   ^ *(unsigned long *)(b);
        tmp2 = *(unsigned long *)(a + 8) ^ *(unsigned long *)(b + 8);
        neq |= tmp1;
        OPTIMIZER_HIDE_VAR(neq);
        neq |= tmp2;
        OPTIMIZER_HIDE_VAR(neq);

Для gcc49 -O2 -DCONFIG_HAVE_EFFICIENT_UNALIGNED_ACCESS на выходе у нас будет:

        cmp     rdx, 16
        jne     .L5
        mov     rdx, QWORD PTR [rdi+8]
        xor     rdx, QWORD PTR [rsi+8]
        mov     rax, QWORD PTR [rdi]
        xor     rax, QWORD PTR [rsi]
        or      rax, rdx
        ret

Вот это вам выдаст шланг37 -O2
# BB#1:                                 # %sw.bb
        mov     rax, qword ptr [rsi]
        mov     rcx, qword ptr [rsi + 8]
        xor     rax, qword ptr [rdi]
        xor     rcx, qword ptr [rdi + 8]
        #APP
        #NO_APP
        or      rax, rcx
        #APP
        #NO_APP
        pop     rbp
        ret

ВНЕЗАПНО – и там и там – совершенно неотличимо от оригинала!1
Делаем такой же фокус для ветки else:

        movzx   edx, BYTE PTR [rdi+1]
        movzx   eax, BYTE PTR [rdi]
        xor     dl, BYTE PTR [rsi+1]
        xor     al, BYTE PTR [rsi]
        movzx   edx, dl
        movzx   eax, al
        or      rax, rdx

Опять же, как и ожидалось,  сгенерированный код одинаков в обоих случаях, но и не соответствует порядку "составляющих эту функцию команд".
Да и чего ему соответствовать, когда костыляние OPTIMIZER_HIDE_VAR(var) не дает убрать лишние OR (и заодно "закрепляет" их очередность, да, хотя от этого мало что меняется – вариации в тайминге будут полюбому наамного больше зависить от кэшмисов).

> Указание — единственный эффект этой конструкции.
> Эта вставка вводит фиктивную зависимость по данным между обращениями к neq.
Нет.

neq = neq | expr = (a ^ b);
OPTIMIZER_HIDE_VAR(neq);
neq = neq | expr2 = (a2 ^ b2);

ничто не мешает компилятору вынести expr1,2 и т.д отдельно
Вот это вводит фиктивную зависимость по данным:
tmp = a ^ b;
OPTIMIZER_HIDE_VAR(neq);
OPTIMIZER_HIDE_VAR(tmp);
neq |= tmp;

Только она там нужна, как рыбе зонтик, ибо еще раз повторюсь – разброс в тайминге из-за кэша будет куда выше, чем из-за очередности выполнения (X)OR r, mem .
А вот преждевременное "or foo,bar; jnz quit" после сравнения первого байта – будет, как бы, очень заметно.
> правильно поняли часть её назначения: гарантировать, что сгенерированный компилятором
> код будет в точности, без изъятий соответствовать коду, написанному на C.
Там, наверху, можно посмотреть на "соответствование".
> Это вторая часть решения задачи обеспечения постоянного времени выполнения функции.
На сферическо-вакуумных суперскалярах – вполне.  А так, см. тайминги для xor/or r/m и "сколько стоит кэшмисс".

> Однако ваше опасение справедливо лишь для случаев, когда значения аргументов a и
> b, а также константные смещения относительно них известны компилятору во время
> компиляции.
Компилятору достаточно того, что любое значение neq !=0 возвращает в итоге единицу.
Это, и зависимость neq от (a xor b) позволяет вообще выкинуть neq и сразу проверять результат XORа.
> Совершенно верно, это фиктивная зависимость по данным. Но предотвращает она не dead
> code elimination (тогда здесь было бы достаточно спецификатора volatile при объявлении
> neq), а переупорядочивание выражений друг относительно друга.
Хоть в ядро бы глянули, что там по этому поводу писали и чего опасались:
https://github.com/torvalds/linux/commit/6bf37e5aa90f18baf5a...
> crypto_memneq is declared noinline, placed in its own source file,
> and compiled with optimizations that might increase code size disabled
> ("Os") because a smart compiler (or LTO) might notice that the return
> value is always compared against zero/nonzero, and might then
> reintroduce the same early-return optimization that we are trying to
> avoid.
https://github.com/torvalds/linux/commit/fe8c8a126806fea4465...
> Instead of disabling compiler optimizations, use a dummy inline assembly
> (based on RELOC_HIDE) to block the problematic kinds of optimization,
> The dummy inline assembly is added after every OR, and has the
> accumulator variable as its input and output. The compiler is forced to
> assume that the dummy inline assembly could both depend on the
> accumulator variable and change the accumulator variable, so it is
> forced to compute the value correctly before the inline assembly, and
> cannot assume anything about its value after the inline assembly.
Хотя, о чем это я – этож опеннет.
> gcc или clang никогда не научатся разбирать содержимое ассемблерных вставок by design.
> Это контракт. Вопрос не имеет смысла.
В вашей вселенной – возможно и контракт. В моей об этом речи нет:
https://gcc.gnu.org/onlinedocs/gcc/Extended-Asm.html#Assembl...
Да и ваш "пример" с
>  __asm__ ("" : "=r" (var) : "" (var))
отлично показал "надежность" этого "контракта".

Ответить | Правка | Наверх | Cообщить модератору

Архив | Удалить

Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема

Партнёры:

Хостинг:

Закладки на сайте
Проследить за страницей

Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру


	59. "Дэниэл Бернштейн выступил с инициативой создания Си-компилят..."	+/–
	Сообщение от Аноним (-), 22-Дек-15, 16:30
	> Вы сравниваете теплое с фиолетовым – т.е. выкладки и "инновационные" предложения очередного диванного теоретика, с соображениями вполне известного и уже доказавшего, что он "небалабол" DJB? Это вещи одного порядка. И если уж вы так любите апеллировать к авторитетам, подумайте, почему в стандарте C вообще (и до сих пор) существуют undefined behavior и unspecified behavior. > Не Мерседес, а Запорожец, не в лотто а в карты ..." oO Полностью разделяю ваше восхищение (вашим умением передёргивать). http://blog.cr.yp.to/20140517-insns.html Фэйла здесь нет, я о нём и не говорил. Просто те, кому действительно нужна защита от timing attacks, находят пути её реализовать[1], для остальных это — пустая потеря производительности (и времени автономной работы от батарей). [1] https://git.kernel.org/cgit/linux/kernel/git/next/linux-next...
	Ответить \| Правка \| Наверх \| Cообщить модератору


	71. "Дэниэл Бернштейн выступил с инициативой создания Си-компилят..."	+/–
	Сообщение от Нимано (?), 22-Дек-15, 17:27
	> Это вещи одного порядка. Угу, угу. > Полностью разделяю ваше восхищение (вашим умением передёргивать). Ну, не все умеют в телепатию. > . Просто те, кому > действительно нужна защита от timing attacks, находят пути её реализовать[1], GCC-онляи костыль, в виде повторяющегося OPTIMIZER_HIDE_VAR(neq), для – это да, оптимальнейшее решение!
	Ответить \| Правка \| Наверх \| Cообщить модератору


	73. "Дэниэл Бернштейн выступил с инициативой создания Си-компилят..."	+2 +/–
	Сообщение от Аноним (-), 22-Дек-15, 17:51
	>> Это вещи одного порядка. > Угу, угу. Угу, угу. >> Полностью разделяю ваше восхищение (вашим умением передёргивать). > Ну, не все умеют в телепатию. А и не надо. Непонятно — переспросите. Только, если бы вы действительно иногда читали блог так рьяно защищаемого вами Бернштейна, вам было бы понятно. >> . Просто те, кому >> действительно нужна защита от timing attacks, находят пути её реализовать[1], > GCC-онляи костыль, в виде повторяющегося OPTIMIZER_HIDE_VAR(neq), для – это да, > оптимальнейшее решение! 1. http://lxr.free-electrons.com/ident?i=OPTIMIZER_HIDE_VAR Это к вопросу у gcc-only. 2. http://lxr.free-electrons.com/source/include/linux/compiler-... #define OPTIMIZER_HIDE_VAR(var) \ __asm__ ("" : "=r" (var) : "" (var)) В отличие от вас, я умею в телепатию. Моя телепатия говорит мне, что вы не знаете, что такое суперскалярный процессор с внеочередным исполнением. Ещё моя телепатия говорит мне, что вы гуманитарий: саркастически называя код __asm__ ("" : "=r" (var) : "" (var)) оптимальнейшим решением, вы вступаете в противоречие с самим собой, так как ранее вставали на сторону Бернштейна в его требовании обеспечить постоянное время выполнения команд сравнения (что, как раз-таки, неоптимально). В отличие от этого требования Бернштейна, конструкция __asm__ ("" : "=r" (var) : "" (var)) действительно оптимальна в том смысле, что является лишь указанием компилятору, не внося дополнительных задержек времени исполнения в сгенерированный код, и весь негативный эффект от её применения — запрет компилятору переупорядочивать в сгенерированном коде команды, зависимость по данным между которыми компилятору неочевидна. Фактически, на этапе выборки команд процессор всё равно может переупорядочить их, хотя это переупорядочивание потенциально гораздо менее опасно, чем то, что мог бы выполнить компилятор.
	Ответить \| Правка \| Наверх \| Cообщить модератору


	74. "Дэниэл Бернштейн выступил с инициативой создания Си-компилят..."	+1 +/–
	Сообщение от Аноним (-), 22-Дек-15, 17:59
	> 1. http://lxr.free-electrons.com/ident?i=OPTIMIZER_HIDE_VAR > Это к вопросу у gcc-only. О, кстати! «Расширенный» синтаксис ассемблерных вставок gcc, помимо самого gcc, поддерживают, как минимум, clang, Sun Studio и Intel C Compiler[1]. И компилятор из состава Freescale CodeWarrior[2]. Это всё к вопросу о gcc-only. [1] https://gcc.gnu.org/ml/gcc/2015-12/msg00124.html [2] https://gcc.gnu.org/ml/gcc/2015-12/msg00123.html
	Ответить \| Правка \| Наверх \| Cообщить модератору


	79. "Дэниэл Бернштейн выступил с инициативой создания Си-компилят..."	+/–
	Сообщение от Владимир (??), 22-Дек-15, 18:23
	Повторю слова автора по ссылке: Ok, I admit it: I'm surprised. Не знал, что кроме шланга еще кто-то в это может.
	Ответить \| Правка \| Наверх \| Cообщить модератору


	90. "Дэниэл Бернштейн выступил с инициативой создания Си-компилят..."	+/–
	Сообщение от Нимано (?), 22-Дек-15, 19:02
	> 1. http://lxr.free-electrons.com/ident?i=OPTIMIZER_HIDE_VAR > Это к вопросу у gcc-only. И что, это уже не костыль? > В отличие от вас, я умею в телепатию. Моя телепатия говорит мне, > что вы не знаете, что такое суперскалярный процессор с внеочередным исполнением. Ну-ну. О великий просветитель, зачем вы вообще приплели сюда суперскалярность? > Ещё моя телепатия говорит мне, что вы гуманитарий: Хоспади, д'Артаньян, Вы? > вступаете в противоречие с самим собой, так как ранее вставали на > сторону Бернштейна в его требовании обеспечить постоянное время выполнения команд сравнения Аноним не читатель? > consider adding AES support to their instruction > sets. For example, a CPU could support fast constant-time для анонимов: специальные комманды под это дело. И ведь таки потом AES-NI запилили, не? > том смысле, что является лишь указанием компилятору, Ну, если побочный эффект – указание, то да. > запрет компилятору переупорядочивать в сгенерированном коде команды, > зависимость по данным между которыми компилятору неочевидна. Н-да, а сколько пафоса то было. В первую очередь, это запрет на оптимизацию. Т.к. для конечный пользователь вызывает crypto_memneq static inline int crypto_memneq(const void a, const void b, size_t size) { return __crypto_memneq(a, b, size) != 0UL ? 1 : 0; } > return __crypto_memneq(a, b, size) != 0UL ? 1 : 0; т.е. получает 0 или 1. Я не знаю, как конкретно называется используемая техника в гцц, но тa же классическая "abstract interpretation" при первом же проходе засветит только на раз, что: ( как только neq != 0 => нефиг далее маятся дурью, можно делать ret, т.к. ответ более "не меняется"). А так – там эдакая костыльная вставка на асме, означающая (на сей момент) для компилятора: "неведомая магия с neq в качестве in/out", оптимизировать низзя. Разъясняю на пальцах: > __asm__ ("" : "=r" (var) : "" (var)) Темплейт-то пустой. Просто здесь объявляется, что "neq" идет в in/out, а сам темплейт гцц (пока) не парсится. А теперь, вопрос на засыпку: что будет, когда гцц/шланг научатся парсить темплейт – и соответсвенно "узнают" о том, что neq там не применяется? И чем это лучше UD?
	Ответить \| Правка \| К родителю #73 \| Наверх \| Cообщить модератору


	98. "Дэниэл Бернштейн выступил с инициативой создания Си-компилят..."	+/–
	Сообщение от Аноним (-), 22-Дек-15, 19:37
	>> 1. http://lxr.free-electrons.com/ident?i=OPTIMIZER_HIDE_VAR >> Это к вопросу у gcc-only. > И что, это уже не костыль? Нет. >> В отличие от вас, я умею в телепатию. Моя телепатия говорит мне, >> что вы не знаете, что такое суперскалярный процессор с внеочередным исполнением. > Ну-ну. О великий просветитель, зачем вы вообще приплели сюда суперскалярность? Суперскалярный процессор с внеочередным исполнением волен исполнять в произвольном порядке команды, если между ними нет барьеров или зависимостей по данным. Компилятор для суперскалярного процессора с внеочередным исполнением использует это его свойство, самостоятельно, уже на этапе компиляции переупорядочивая некоторые команды там, где это может быть выгодно, что потенциально может спровоцировать процессор на ещё одно переупорядочивание во время выполнения (например, из-за различного расстояния до данных, адресуемых a или b, в иерархии кэшей). Если бы тот код писался для тривиального конвеера, в функции __crypto_memneq_16() не было бы ни одной строки OPTIMIZER_HIDE_VAR(neq);. Задача разработчиков функции — постоянное время её исполнения вне зависимости от входных данных, и часть этой задачи они решают строгим упорядочиванием составляющих эту функцию команд. >> Ещё моя телепатия говорит мне, что вы гуманитарий: > Хоспади, д'Артаньян, Вы? Да. >> вступаете в противоречие с самим собой, так как ранее вставали на >> сторону Бернштейна в его требовании обеспечить постоянное время выполнения команд сравнения > Аноним не читатель? >> consider adding AES support to their instruction >> sets. For example, a CPU could support fast constant-time > для анонимов: специальные комманды под это дело. > И ведь таки потом AES-NI запилили, не? Аноним не читатель. Я понятия не имею, зачем вы приплели AES-NI в свой второй пост и повторяете здесь. Речь шла о командах сравнения. AES-NI — не команда сравнения. >> том смысле, что является лишь указанием компилятору, > Ну, если побочный эффект – указание, то да. Указание — единственный эффект этой конструкции. >> запрет компилятору переупорядочивать в сгенерированном коде команды, >> зависимость по данным между которыми компилятору неочевидна. > Н-да, а сколько пафоса то было. > В первую очередь, это запрет на оптимизацию. Набор слов. >[оверквотинг удален] >> return __crypto_memneq(a, b, size) != 0UL ? 1 : 0; > т.е. получает 0 или 1. > Я не знаю, как конкретно называется используемая техника в гцц, но тa > же классическая "abstract interpretation" при первом же проходе засветит только на > раз, что: > ( как только neq != 0 => нефиг далее маятся дурью, > можно делать ret, т.к. ответ более "не меняется"). > А так – там эдакая костыльная вставка на асме, означающая (на > сей момент) для компилятора: "неведомая магия с neq в качестве in/out", > оптимизировать низзя. Эта вставка вводит фиктивную зависимость по данным между обращениями к neq. Вы правильно поняли часть её назначения: гарантировать, что сгенерированный компилятором код будет в точности, без изъятий соответствовать коду, написанному на C. Это вторая часть решения задачи обеспечения постоянного времени выполнения функции. Однако ваше опасение справедливо лишь для случаев, когда значения аргументов a и b, а также константные смещения относительно них известны компилятору во время компиляции. На практике, в ядре таких случаев нет. Вы правильно поняли назначение конструкции, но исходите из ошибочной посылки. > Разъясняю на пальцах: >> __asm__ ("" : "=r" (var) : "" (var)) > Темплейт-то пустой. Просто здесь объявляется, что "neq" идет в in/out, а сам > темплейт гцц (пока) не парсится. Совершенно верно, это фиктивная зависимость по данным. Но предотвращает она не dead code elimination (тогда здесь было бы достаточно спецификатора volatile при объявлении neq), а переупорядочивание выражений друг относительно друга. > А теперь, вопрос на засыпку: что будет, когда гцц/шланг научатся парсить темплейт > – и соответсвенно "узнают" о том, что neq там не > применяется? > И чем это лучше UD? gcc или clang никогда не научатся разбирать содержимое ассемблерных вставок by design. Это контракт. Вопрос не имеет смысла.
	Ответить \| Правка \| Наверх \| Cообщить модератору


	134. "Дэниэл Бернштейн выступил с инициативой создания Си-компилят..."	+/–
	Сообщение от Нимано (?), 23-Дек-15, 04:35
	>> И что, это уже не костыль? > Нет. Ну-ну. Особенно приведенный вами вами код. > __asm__ ("" : "=r" (var) : "" (var)) соберите с ним ядро и наслаждайтесь скоростью (намек: шланг хоть ругается на "invalid constraint", а гцц "кушает" и не обляпывается, генерируя cmp rdx, 16 jne .L5 ret Но ладно, не будем придираться. Просто "некостыльность" обычно несколько иначе выглядит. > строгим упорядочиванием составляющих эту функцию команд. Гм, намекну: Берем оригинальный код и делаем так: unsigned long neq = 0; unsigned long tmp1, tmp2; #ifdef CONFIG_HAVE_EFFICIENT_UNALIGNED_ACCESS if (sizeof(unsigned long) == 8) { tmp1 = (unsigned long )(a) ^ (unsigned long )(b); tmp2 = (unsigned long )(a + 8) ^ (unsigned long )(b + 8); neq \|= tmp1; OPTIMIZER_HIDE_VAR(neq); neq \|= tmp2; OPTIMIZER_HIDE_VAR(neq); Для gcc49 -O2 -DCONFIG_HAVE_EFFICIENT_UNALIGNED_ACCESS на выходе у нас будет: cmp rdx, 16 jne .L5 mov rdx, QWORD PTR [rdi+8] xor rdx, QWORD PTR [rsi+8] mov rax, QWORD PTR [rdi] xor rax, QWORD PTR [rsi] or rax, rdx ret Вот это вам выдаст шланг37 -O2 # BB#1: # %sw.bb mov rax, qword ptr [rsi] mov rcx, qword ptr [rsi + 8] xor rax, qword ptr [rdi] xor rcx, qword ptr [rdi + 8] #APP #NO_APP or rax, rcx #APP #NO_APP pop rbp ret ВНЕЗАПНО – и там и там – совершенно неотличимо от оригинала!1 Делаем такой же фокус для ветки else: movzx edx, BYTE PTR [rdi+1] movzx eax, BYTE PTR [rdi] xor dl, BYTE PTR [rsi+1] xor al, BYTE PTR [rsi] movzx edx, dl movzx eax, al or rax, rdx Опять же, как и ожидалось, сгенерированный код одинаков в обоих случаях, но и не соответствует порядку "составляющих эту функцию команд". Да и чего ему соответствовать, когда костыляние OPTIMIZER_HIDE_VAR(var) не дает убрать лишние OR (и заодно "закрепляет" их очередность, да, хотя от этого мало что меняется – вариации в тайминге будут полюбому наамного больше зависить от кэшмисов). > Указание — единственный эффект этой конструкции. > Эта вставка вводит фиктивную зависимость по данным между обращениями к neq. Нет. neq = neq \| expr = (a ^ b); OPTIMIZER_HIDE_VAR(neq); neq = neq \| expr2 = (a2 ^ b2); ничто не мешает компилятору вынести expr1,2 и т.д отдельно Вот это вводит фиктивную зависимость по данным: tmp = a ^ b; OPTIMIZER_HIDE_VAR(neq); OPTIMIZER_HIDE_VAR(tmp); neq \|= tmp; Только она там нужна, как рыбе зонтик, ибо еще раз повторюсь – разброс в тайминге из-за кэша будет куда выше, чем из-за очередности выполнения (X)OR r, mem . А вот преждевременное "or foo,bar; jnz quit" после сравнения первого байта – будет, как бы, очень заметно. > правильно поняли часть её назначения: гарантировать, что сгенерированный компилятором > код будет в точности, без изъятий соответствовать коду, написанному на C. Там, наверху, можно посмотреть на "соответствование". > Это вторая часть решения задачи обеспечения постоянного времени выполнения функции. На сферическо-вакуумных суперскалярах – вполне. А так, см. тайминги для xor/or r/m и "сколько стоит кэшмисс". > Однако ваше опасение справедливо лишь для случаев, когда значения аргументов a и > b, а также константные смещения относительно них известны компилятору во время > компиляции. Компилятору достаточно того, что любое значение neq !=0 возвращает в итоге единицу. Это, и зависимость neq от (a xor b) позволяет вообще выкинуть neq и сразу проверять результат XORа. > Совершенно верно, это фиктивная зависимость по данным. Но предотвращает она не dead > code elimination (тогда здесь было бы достаточно спецификатора volatile при объявлении > neq), а переупорядочивание выражений друг относительно друга. Хоть в ядро бы глянули, что там по этому поводу писали и чего опасались: https://github.com/torvalds/linux/commit/6bf37e5aa90f18baf5a... > crypto_memneq is declared noinline, placed in its own source file, > and compiled with optimizations that might increase code size disabled > ("Os") because a smart compiler (or LTO) might notice that the return > value is always compared against zero/nonzero, and might then > reintroduce the same early-return optimization that we are trying to > avoid. https://github.com/torvalds/linux/commit/fe8c8a126806fea4465... > Instead of disabling compiler optimizations, use a dummy inline assembly > (based on RELOC_HIDE) to block the problematic kinds of optimization, > The dummy inline assembly is added after every OR, and has the > accumulator variable as its input and output. The compiler is forced to > assume that the dummy inline assembly could both depend on the > accumulator variable and change the accumulator variable, so it is > forced to compute the value correctly before the inline assembly, and > cannot assume anything about its value after the inline assembly. Хотя, о чем это я – этож опеннет. > gcc или clang никогда не научатся разбирать содержимое ассемблерных вставок by design. > Это контракт. Вопрос не имеет смысла. В вашей вселенной – возможно и контракт. В моей об этом речи нет: https://gcc.gnu.org/onlinedocs/gcc/Extended-Asm.html#Assembl... Да и ваш "пример" с > __asm__ ("" : "=r" (var) : "" (var)) отлично показал "надежность" этого "контракта".
	Ответить \| Правка \| Наверх \| Cообщить модератору