Второй раунд только что стартовал — ставки выше, ядра должны быть еще эффективнее.



Мы объединились с командой, известной экстремальным разгоном производительности GPU, чтобы бросить вызов, который отделит настоящих мастеров оптимизации от программистов выходного дня. На этот раз? Матричное умножение с низкой точностью на NVFP4.

Если вы давно хотели доказать свое мастерство в разработке ядер, вот ваша арена. Реальные ограничения по производительности, экстремальные требования к пропускной способности и задача, от которой ваш компилятор будет потеть.

📌 Задача: Оптимизация GEMM на NVFP4
⏰ Прием работ заканчивается: 19 декабря

Никакой поддержки. Никаких коротких путей. Только вы, ваш код и время.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • 4
  • Репост
  • Поделиться
комментарий
0/400
RektButStillHerevip
· 12-05 04:51
nvfp4 на этот раз действительно выложился по полной, оптимизация kernel на высшем уровне... Но если честно, такие throughput challenge обычно зависят от того, у кого компилятор настроен агрессивнее
Посмотреть ОригиналОтветить0
BlockchainWorkervip
· 12-05 04:51
nvfp4 в этот раз сразу на операционный стол, без пары серьезных навыков тут реально нечего делать
Посмотреть ОригиналОтветить0
LiquidationTherapistvip
· 12-05 04:44
nvfp4 gemm? Я не буду заниматься такой издевательской работой над компилятором.
Посмотреть ОригиналОтветить0
BrokenDAOvip
· 12-05 04:31
Опять начинается гонка за оптимизацией ядра? По сути, всё сводится к той же системе стимулов. А кто может гарантировать, что в итоге действительно наградят, как обещали?
Посмотреть ОригиналОтветить0
  • Закрепить