第二轮刚刚开启——赌注更高,内核必须更精炼。



我们联手以极致GPU性能著称的团队,发起一场能区分优化高手与周末码农的挑战。这一次?使用NVFP4进行低精度矩阵乘法。

如果你一直渴望在内核工程领域证明自己的实力,这就是你的舞台。我们说的是现实世界的性能约束、极限吞吐需求,以及那种能让你的编译器“冒汗”的问题。

📌 任务:NVFP4 GEMM优化
⏰ 截止提交时间:12月19日

没有保姆式指导。没有捷径。只有你、你的代码,以及时间。
查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 4
  • 转发
  • 分享
评论
0/400
RektButStillHerevip
· 12-05 04:51
nvfp4这次真的卷起来了,kernel优化天花板见...不过说真的,这kind的throughput challenge往往就是看谁的编译器调得狠
回复0
区块链打工人vip
· 12-05 04:51
nvfp4这轮直接上手术台啊,没个两把刷子真没法儿玩
回复0
Liquidation Therapistvip
· 12-05 04:44
nvfp4 gemm?老子不玩这种虐待编译器的活儿
回复0
BrokenDAOvip
· 12-05 04:31
又来卷kernel优化?说白了还是那套激励机制,谁能保证最后真的按承诺发奖啊
回复0
交易,随时随地
qrCode
扫码下载 Gate App
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)