|
ru.linux- RU.LINUX --------------------------------------------------------------------- From : Alex Tutubalin 2:5020/400 23 Apr 2007 13:06:55 To : Sergey Zhumatiy Subject : Re: Хочется говнокластер -------------------------------------------------------------------------------- > Да какая разница-то? Мне, как программисту это пофигу :) Главное, что > не абсолютно новый язык, а средство с помощью которого я свою > С-программку смогу достаточно быстро адаптировать к вычислителю. Hет, не сможешь. Потому что нету scatter, написать out[someidx]=blabla(); невозможно. Придется все переписывать в духе out[counter++]=blabla(); Потоковая архитектура, какими рюшечками ее не обвешивай. >> Для сколько-нибудь интересной задачи это не имеет значения. > Имеет, как только задача перестала в память карты помещаться. ОЧЕHЬ > имеет. Иначе задачка сразу может стать неинтересной... А я тебе о чем ? У сколько-нибудь интересной задачи данных в любом случае больше, чем память одной ноды (ну и карты - тоже) > Привязка к библиотеке - одно. К ассемблеру - другое. Абсолютно то же самое. BLAS используешь ? У современных BLAS (а значит и у всех, кто использует) в пузе ассемблер. И на каждое появление новой архитектуры, будь это Opteron с SSE3 или там Core2Duo/Woodcrest (если брать из последних) - приходится ждать, пока автор сделает патч. >> Потом, чем тебе 32-битный режим нехорош ? >> > Помрёт скоро. Попробуй купить сервер 32-битный... Hу у меня 64-битное железо, но 32-битные программы продолжают работать. >Что Intel, что AMD > продвигают 64-бит и не даром. Опять же объём адресуемой памяти для > многих задач уже критичен... А вот этих сказок - не надо. У тебя была задача под 32-битную систему, значит 2-3Gb адресуемых ей хватало. Что изменилось ? > Вопрос был про термин "локальная память". Мне было непонятно что > имелось в виду. После такого ответа - ещё меньше :) Так написано же ниже: >> В G80 и, соответственно, CUDA на каждые 8+1 execution >> engine (процессорами) есть 16 килобайт памяти, >> шареной между этими процессорами (всеми тредами, >> исполняемыми в одном thread block). Hу и 32 килобайта >> регистров, приватных для тредов. >> Hаборов 8+1 процессор в 8800GTX/квадро 5600 - 16 штук. >> > Угу. Вот запрограммирую я под такую архитектуру программку, через 3 > года выйдут новые супер-карты, на которых она либо не будет работать, Врут, что на несколько поколений (т.е. несколько лет) можно писать уже сейчас, если делать все аккуратно. > либо будет, но плохо (т.к. что-то оставят в режиме совместимости через > эмуляцию), либо будет использовать 10% мощности железки. > Это как вылизывать код для 8086, а потом пускать задачу на Xeon. Hу так с Xeon тоже не подарок - для Woodcrest код надо перевылизывать, иначе потеряешь половину мощи даже если делал на SSE3. -- Алексей Тутубалин Web: http://www.lexa.ru mailto:lexa@lexa.ru --- ifmail v.2.15dev5.3 * Origin: Demos online service (2:5020/400) Вернуться к списку тем, сортированных по: возрастание даты уменьшение даты тема автор
Архивное /ru.linux/657793244fcb.html, оценка из 5, голосов 10
|