Bạn đã nhận thấy chiến lược khá thú vị của NVIDIA chưa? Họ đã mua lại doanh nghiệp chip suy luận của Groq với giá 200 tỷ đô la, và bây giờ bắt đầu rõ ràng hơn tại sao họ làm điều đó.



Điều đã thu hút sự chú ý của tôi là lời giải thích của Huang Renxun về logic đằng sau thương vụ này. Cơ bản, thị trường suy luận đang phân khúc. Trước đây, mọi người đều tập trung vào một điều duy nhất: tăng khả năng xử lý dữ liệu. Nhưng rồi giá trị thương mại của token đã thay đổi đáng kể, và các người dùng khác nhau sẵn sàng trả mức giá khác nhau tùy thuộc vào tốc độ phản hồi.

Nó giống như thế này: nếu tôi có thể cung cấp phản hồi nhanh hơn cho các kỹ sư, giúp họ làm việc hiệu quả hơn, họ sẽ sẵn sàng trả nhiều hơn cho điều đó. Và nhu cầu về độ trễ thấp này là khá mới trên thị trường.

Rồi đến Groq. Kiến trúc LPU của họ nổi tiếng chính nhờ độ trễ xác định thấp, điều này hoàn toàn bổ sung cho phương pháp xử lý qua lại cao của GPU NVIDIA. Khi ra mắt Groq 3 LPU trên công nghệ 4nm, họ đã chứng minh khả năng suy luận trên mỗi megawatt trong các mô hình có hàng nghìn tỷ tham số cao hơn 35 lần so với Blackwell NVL72. Điều này không nhỏ.

Nói cách khác, NVIDIA đã lấp đầy một khoảng trống quan trọng trong dòng sản phẩm của mình. Bây giờ họ bao phủ cả phân khúc xử lý cao và phân khúc độ trễ thấp, giá trị đơn vị cao. Mở rộng Pareto, như một số người gọi. Cùng một mô hình, giá khác nhau tùy theo thời gian phản hồi. Xử lý ít hơn, nhưng giá trị đơn vị bù đắp.

Đây là chiến lược: không phải cạnh tranh, mà là bổ sung. Và điều này rất hợp lý khi xem xét cách thị trường AI đang phát triển.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim