A segunda ronda já começou — a fasquia está mais alta e os kernels têm de ser mais eficientes.
Juntámo-nos a uma equipa conhecida por levar o desempenho das GPUs ao limite para lançar um desafio que vai separar os verdadeiros mestres da optimização dos programadores de fim de semana. Desta vez? Multiplicação de matrizes em baixa precisão com NVFP4.
Se tens vontade de mostrar o teu talento em engenharia de kernels, este é o teu palco. Falamos de restrições de desempenho reais, exigências rigorosas de throughput e um problema capaz de fazer suar o teu compilador.
📌 Tarefa: optimização de GEMM com NVFP4 ⏰ Submissões terminam: 19 de dezembro
Nada de ajudas. Nada de atalhos. Só tu, o teu código e o relógio.
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
13 gostos
Recompensa
13
4
Republicar
Partilhar
Comentar
0/400
RektButStillHere
· 12-05 04:51
Desta vez, a nvfp4 está mesmo a puxar pelos limites, o teto de otimização do kernel está à vista... Mas a verdade é que, nestes desafios de throughput deste tipo, normalmente ganha quem afinar melhor o compilador.
Ver originalResponder0
BlockchainWorker
· 12-05 04:51
nvfp4 desta vez vai diretamente para a mesa de operações, sem ter algum truque na manga, é mesmo impossível jogar
Ver originalResponder0
LiquidationTherapist
· 12-05 04:44
nvfp4 gemm? Eu não quero fazer este tipo de tarefa que maltrata o compilador.
Ver originalResponder0
BrokenDAO
· 12-05 04:31
Outra vez a competir pela optimização do kernel? No fundo, é sempre o mesmo esquema de incentivos. Quem pode garantir que no fim vão mesmo entregar os prémios prometidos?
A segunda ronda já começou — a fasquia está mais alta e os kernels têm de ser mais eficientes.
Juntámo-nos a uma equipa conhecida por levar o desempenho das GPUs ao limite para lançar um desafio que vai separar os verdadeiros mestres da optimização dos programadores de fim de semana. Desta vez? Multiplicação de matrizes em baixa precisão com NVFP4.
Se tens vontade de mostrar o teu talento em engenharia de kernels, este é o teu palco. Falamos de restrições de desempenho reais, exigências rigorosas de throughput e um problema capaz de fazer suar o teu compilador.
📌 Tarefa: optimização de GEMM com NVFP4
⏰ Submissões terminam: 19 de dezembro
Nada de ajudas. Nada de atalhos. Só tu, o teu código e o relógio.