forum.opennet.ru

Составление сообщения

Исходное сообщение

"Новости Ubuntu: отказ от CD, удаление Mono, акцент на 64-раз..."
Отправлено Аноним, 06-Ноя-11 17:21

> Ну "спец" же =) Вроде одни преумущества, но на практике 32-х битный
> (generic) код довольно часто почему-то быстрее 64х-битного: то ли лишний уровень
> в TLB даёт о себе знать, то ли префиксы кодманд и адресность становятся
> бутылочным горлышком для декодера - неизвестно,
Не думаю. Декодер успевает распихивать команды на кучи блоков, изображая "как-бы 8-ядерный" х86 и прочие гипертрединги, так что в результате роялит именно распределение нагрузки на блоки, которые находятся за ним. Поэтому врядли он является узким местом. Например, недавний тест фороникса очень недвусмысленно демонстрирует поведение бульдозера, при том это поведение формируется распределением нагрузки на блоки. Ну то-есть скорость целочисленных операций перестает существенно расти после того как закончатся неозадаченные целочисленные блоки, что ожидаемо, ну и так далее ;). Гипертрединг тоже похоже преследует цель догрузить блоки за декодером. На изображение полноценного честного ядра конечно остатков возможностей блоков не хватает, но свои 15-20% на сильно многопоточных случаях получить все-таки удается. С чего бы быть хоть какому-то приросту, если в декодер все уткнулось?
> т.к. "спец" решил об этом умолчать =)
Не, плюсов совсем без минусов не бывает. Еще и код и данные жирнее, значит реже будут в кеш попадать целиком. С другой стороны, кеши нынче у х64 процов весьма жирные и наврядли это сильная проблема в большинстве случаев. И в целом по шинам надо передавать несколько больше данных, и это может упереться и в оперативку и в размер кеша. Ну и оперативку нынче понапихали многоканальную, с нехилым бандвизом. Наверное не для красоты.
Понятно что в целом есть возможности проиграть 32-битному коду в некоторых случаях. С другой стороны, годный алгоритм критичный к скорости - должен быть не сильно жирным и целиком влезать в кеш, а когда это случилось, наличие 64-битной арифметики, кучи регистров и гарантированное наличие SSE2 вполне могут обеспечить победу.

Исходное сообщение
"Новости Ubuntu: отказ от CD, удаление Mono, акцент на 64-раз..." Отправлено Аноним, 06-Ноя-11 17:21
> Ну "спец" же =) Вроде одни преумущества, но на практике 32-х битный > (generic) код довольно часто почему-то быстрее 64х-битного: то ли лишний уровень > в TLB даёт о себе знать, то ли префиксы кодманд и адресность становятся > бутылочным горлышком для декодера - неизвестно, Не думаю. Декодер успевает распихивать команды на кучи блоков, изображая "как-бы 8-ядерный" х86 и прочие гипертрединги, так что в результате роялит именно распределение нагрузки на блоки, которые находятся за ним. Поэтому врядли он является узким местом. Например, недавний тест фороникса очень недвусмысленно демонстрирует поведение бульдозера, при том это поведение формируется распределением нагрузки на блоки. Ну то-есть скорость целочисленных операций перестает существенно расти после того как закончатся неозадаченные целочисленные блоки, что ожидаемо, ну и так далее ;). Гипертрединг тоже похоже преследует цель догрузить блоки за декодером. На изображение полноценного честного ядра конечно остатков возможностей блоков не хватает, но свои 15-20% на сильно многопоточных случаях получить все-таки удается. С чего бы быть хоть какому-то приросту, если в декодер все уткнулось? > т.к. "спец" решил об этом умолчать =) Не, плюсов совсем без минусов не бывает. Еще и код и данные жирнее, значит реже будут в кеш попадать целиком. С другой стороны, кеши нынче у х64 процов весьма жирные и наврядли это сильная проблема в большинстве случаев. И в целом по шинам надо передавать несколько больше данных, и это может упереться и в оперативку и в размер кеша. Ну и оперативку нынче понапихали многоканальную, с нехилым бандвизом. Наверное не для красоты. Понятно что в целом есть возможности проиграть 32-битному коду в некоторых случаях. С другой стороны, годный алгоритм критичный к скорости - должен быть не сильно жирным и целиком влезать в кеш, а когда это случилось, наличие 64-битной арифметики, кучи регистров и гарантированное наличие SSE2 вполне могут обеспечить победу.

Ваше сообщение

Имя*:

EMail:

Для отправки ответов на email укажите знак ! перед адресом, например, !user@host.ru (!! - не показывать email).
Более тонкая настройка отправки ответов производится в профиле зарегистрированного участника форума.

Заголовок*:

Сообщение*:

>> Ну "спец" же =) Вроде одни преумущества, но на практике 32-х битный 
>> (generic) код довольно часто почему-то быстрее 64х-битного: то ли лишний уровень 
>> в TLB даёт о себе знать, то ли префиксы кодманд и адресность становятся 
>>  бутылочным горлышком для декодера - неизвестно,

> Не думаю. Декодер успевает распихивать команды на кучи блоков, изображая "как-бы 8-ядерный" 
> х86 и прочие гипертрединги, так что в результате роялит именно распределение 
> нагрузки на блоки, которые находятся за ним. Поэтому врядли он является 
> узким местом. Например, недавний тест фороникса очень недвусмысленно демонстрирует поведение 
> бульдозера, при том это поведение формируется распределением нагрузки на блоки. Ну 
> то-есть скорость целочисленных операций перестает существенно расти после того как закончатся 
> неозадаченные целочисленные блоки, что ожидаемо, ну и так далее ;). Гипертрединг 
> тоже похоже преследует цель догрузить блоки за декодером. На изображение полноценного 
> честного ядра конечно остатков возможностей блоков не хватает, но свои 15-20% 
> на сильно многопоточных случаях получить все-таки удается. С чего бы быть 
> хоть какому-то приросту, если в декодер все уткнулось?

>> т.к. "спец" решил об этом умолчать =)

> Не, плюсов совсем без минусов не бывает. Еще и код и данные 
> жирнее, значит реже будут в кеш попадать целиком. С другой стороны, 
> кеши нынче у х64 процов весьма жирные и наврядли это сильная 
> проблема в большинстве случаев. И в целом по шинам надо передавать 
> несколько больше данных, и это может упереться и в оперативку и 
> в размер кеша. Ну и оперативку нынче понапихали многоканальную, с нехилым 
> бандвизом. Наверное не для красоты.

> Понятно что в целом есть возможности проиграть 32-битному коду в некоторых случаях. 
> С другой стороны, годный алгоритм критичный к скорости - должен быть 
> не сильно жирным и целиком влезать в кеш, а когда это 
> случилось, наличие 64-битной арифметики, кучи регистров и гарантированное наличие SSE2 
> вполне могут обеспечить победу.

При общении не допускается: неуважительное отношение к собеседнику, хамство, унизительное обращение, ненормативная лексика, переход на личности, агрессивное поведение, обесценивание собеседника, провоцирование флейма голословными и заведомо ложными заявлениями. Не отвечайте на сообщения, явно нарушающие правила - удаляются не только сами нарушения, но и все ответы на них. Лог модерирования.

Партнёры:

Хостинг:

Закладки на сайте
Проследить за страницей

Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру