Z.AI của Trung Quốc đã phát hành một mô hình tạo hình ảnh mã nguồn mở lớn được huấn luyện hoàn toàn trên chip Huawei.
Nó sử dụng thiết kế lai tự hồi quy-khuyếch tán giúp nâng cao độ chính xác của văn bản và kiểm soát không gian.
Việc ra mắt này báo hiệu sự thúc đẩy của Trung Quốc hướng tới tự lực AI mà không phụ thuộc vào GPU của Mỹ.
Công ty trí tuệ nhân tạo Trung Quốc Z.AI hôm thứ Tư đã phát hành một mô hình tạo hình ảnh mã nguồn mở hoàn toàn huấn luyện trên các bộ xử lý Huawei, đánh dấu lần đầu tiên một mô hình AI lớn hoàn thành toàn bộ chu trình huấn luyện mà không dựa vào phần cứng của Mỹ.
Động thái này làm nổi bật một thách thức lâu dài đối với sự thống trị của Nvidia trong lĩnh vực chip AI, vì nó cho thấy một trong những công ty AI hàng đầu của Trung Quốc có thể huấn luyện các mô hình lớn mà không cần dựa vào GPU của Mỹ.
Mô hình đã có sẵn để tải xuống trên Hugging Face và tạo ra kết quả tốt—mặc dù chưa ấn tượng theo tiêu chuẩn ngày nay—về mặt thẩm mỹ và văn bản mạch lạc, đồng thời thể hiện khả năng nhận thức không gian xuất sắc dựa trên các thử nghiệm nhanh đầu tiên của chúng tôi.
Hình ảnh được tạo ra với mô hình mới của Z.AI.
Công ty có trụ sở tại Bắc Kinh, đã huy động được $558 triệu đô la trong đợt phát hành cổ phiếu lần đầu ra công chúng tại Hồng Kông tuần trước, đã huấn luyện mô hình gọi là GLM-Image trên các máy chủ Ascend Atlas 800T A2 của Huawei sử dụng framework MindSpore.
“Chúng tôi hy vọng điều này có thể cung cấp tài liệu tham khảo quý giá cho cộng đồng để khám phá tiềm năng của sức mạnh tính toán nội địa,” Z.AI cho biết trong một tuyên bố chia sẻ với South China Morning Post.
Giới thiệu GLM-Image: Một cột mốc mới trong tạo hình ảnh mã nguồn mở.
GLM-Image sử dụng kiến trúc lai tự hồi quy cộng khuyếch tán, kết hợp hiểu biết ngữ nghĩa toàn cục mạnh mẽ với chi tiết hình ảnh độ trung thực cao. Nó phù hợp với các mô hình khuyếch tán chính thống về chất lượng tổng thể… pic.twitter.com/cjtUYRkge5
— Z.ai (@Zai_org) 14 tháng 1, 2026
GLM-Image kết hợp các kỹ thuật tự hồi quy và khuyếch tán trong một kiến trúc lai với tổng cộng 16 tỷ tham số. Thành phần tự hồi quy, dựa trên mô hình ngôn ngữ GLM-4 của Z.AI, xử lý hiểu lệnh và phối hợp hình ảnh, trong khi bộ giải mã khuyếch tán tinh chỉnh các chi tiết nhỏ. Phương pháp này phản ánh các kỹ thuật được sử dụng bởi mô hình tạo hình ảnh mới nhất của OpenAI gpt-image-1.5, đã thể hiện khả năng hiển thị văn bản vượt trội và tuân thủ hướng dẫn tốt hơn so với các mô hình khuyếch tán thuần túy như Stable Diffusion.
Các mô hình khuyếch tán tạo ra hình ảnh bằng cách bắt đầu với nhiễu hình ảnh ngẫu nhiên và dần dần tinh chỉnh nó thành một bức tranh, trong khi các mô hình tự hồi quy xây dựng hình ảnh từng bước, dự đoán từng phần dựa trên phần đã có trước đó. Khuyếch tán rất giỏi về tính chân thực tổng thể nhưng có thể gặp khó khăn với các chi tiết chính xác như văn bản hoặc bố cục, trong khi các mô hình tự hồi quy xuất sắc về cấu trúc và tuân thủ hướng dẫn. Hiện tại, khuyếch tán là kỹ thuật hàng đầu trong các trình tạo hình ảnh AI mã nguồn mở.
Các hệ thống lai mới kết hợp cả hai phương pháp, sử dụng tạo hình tự hồi quy để lập kế hoạch hình ảnh và khuyếch tán để hoàn thiện kết quả cuối cùng.
Hình ảnh: Z.AI
Việc ra mắt này mang ý nghĩa quan trọng đối với Z.AI, công ty bị Washington đưa vào danh sách đen năm 2025 do cáo buộc có liên hệ với quân đội Trung Quốc. Được liệt vào danh sách đen, công ty bị cắt đứt khỏi các bộ xử lý H100 và A100 của Nvidia. Hiện tại, Z.AI đã chứng minh rằng các công ty bị liệt vào danh sách đen vẫn có thể sản xuất các hệ thống AI cạnh tranh bằng phần cứng nội địa, một bước phát triển mà Bắc Kinh đã lâu mong muốn thể hiện.
Ngay sau khi Z.AI công bố, Reuters đưa tin rằng cơ quan hải quan Trung Quốc đã chỉ đạo các đại lý chặn các chip Nvidia H200 nhập cảnh vào nước này. Các quan chức chính phủ triệu tập các công ty công nghệ đến các cuộc họp, nơi họ được yêu cầu không mua các chip này trừ khi cần thiết. Theo các nguồn tin, lời nói của họ đủ nghiêm trọng để coi như “gần như cấm nhập khẩu trong thời điểm này.”
Bắc Kinh dường như đang gửi tín hiệu rằng các phòng lab AI của Trung Quốc có thể xây dựng các mô hình đủ khả năng mà không cần silicon của Mỹ, giảm bớt sự cấp bách cho các công ty Trung Quốc tích trữ phần cứng Nvidia. Chip H200, với hiệu suất khoảng sáu lần so với chip H20 mà Bắc Kinh đã chặn vào tháng Tám năm ngoái, đã nhận được đơn hàng từ các công ty Trung Quốc hơn hai triệu đơn vị với giá 27.000 đô la mỗi chiếc.
Các nhà phân tích tại Trung tâm An ninh và Công nghệ Mới nổi của Georgetown đã lưu ý rằng chiến lược chip của Trung Quốc dựa trên việc bù đắp hiệu suất thấp hơn của từng chip bằng các cụm Huawei khổng lồ. Phương pháp này có hiệu quả, nhưng đòi hỏi nhiều phần cứng hơn, nhiều năng lượng hơn và nhiều công sức kỹ thuật hơn.
“Một trong những hạn chế chính của chiến lược này là khả năng sản xuất đủ chip trong nước của Trung Quốc để bù đắp và bắt kịp khoảng cách về khả năng,” nhà phân tích cao cấp Hanna Dohmen nói với CNBC vào tháng 11.
Theo lộ trình của Huawei, chip thế hệ tiếp theo của họ vào năm 2026 thực tế sẽ kém hơn so với flagship hiện tại về mặt sức mạnh thô. Tuy nhiên, các đánh giá như vậy có thể đánh giá thấp khả năng của các phòng lab Trung Quốc trong việc đạt được hiệu quả thuật toán, như DeepSeek đã thể hiện qua việc huấn luyện các mô hình cạnh tranh với ít chip hơn nhờ tối ưu GPU ở cấp độ lắp ráp.
Nguồn: Hội đồng Quan hệ Ngoại giao
GLM-Image của Z.AI đạt điểm chuẩn hàng đầu trong ngành về hiển thị văn bản và tạo ký tự Trung Quốc, theo báo cáo kỹ thuật của công ty. Những người không có phần cứng phù hợp cũng có thể thử trực tuyến với API có giá 0.014 đô la cho mỗi hình ảnh được tạo ra, hoặc qua một Space miễn phí trên Hugging Face do Z.AI duy trì.
Z.AI trở thành “hổ AI” đầu tiên của Trung Quốc, nhóm các startup xây dựng các mô hình ngôn ngữ lớn để cạnh tranh với OpenAI và Anthropic, ra công chúng. Cổ phiếu của họ đã tăng khoảng 80% kể từ khi niêm yết, theo sự hưng phấn của các nhà đầu tư đối với các công ty AI Trung Quốc như DeepSeek hoặc Alibaba trong bối cảnh tham vọng chip nội địa của Trung Quốc.
Trong khi đó, Huawei đang chuẩn bị tăng mạnh sản lượng các bộ xử lý Ascend trong năm nay. Sự hiện diện của công ty tại các hội nghị AI trên khắp Trung Quốc đã trở nên nổi bật hơn khi họ cố gắng định vị mình như là xương sống của hạ tầng AI quốc gia, không còn phụ thuộc vào Santa Clara.
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
Z.AI của Trung Quốc phát hành mô hình tạo hình ảnh AI lớn đầu tiên được huấn luyện mà không sử dụng chip Mỹ
Tóm tắt ngắn gọn
Công ty trí tuệ nhân tạo Trung Quốc Z.AI hôm thứ Tư đã phát hành một mô hình tạo hình ảnh mã nguồn mở hoàn toàn huấn luyện trên các bộ xử lý Huawei, đánh dấu lần đầu tiên một mô hình AI lớn hoàn thành toàn bộ chu trình huấn luyện mà không dựa vào phần cứng của Mỹ. Động thái này làm nổi bật một thách thức lâu dài đối với sự thống trị của Nvidia trong lĩnh vực chip AI, vì nó cho thấy một trong những công ty AI hàng đầu của Trung Quốc có thể huấn luyện các mô hình lớn mà không cần dựa vào GPU của Mỹ. Mô hình đã có sẵn để tải xuống trên Hugging Face và tạo ra kết quả tốt—mặc dù chưa ấn tượng theo tiêu chuẩn ngày nay—về mặt thẩm mỹ và văn bản mạch lạc, đồng thời thể hiện khả năng nhận thức không gian xuất sắc dựa trên các thử nghiệm nhanh đầu tiên của chúng tôi.
Hình ảnh được tạo ra với mô hình mới của Z.AI.
Công ty có trụ sở tại Bắc Kinh, đã huy động được $558 triệu đô la trong đợt phát hành cổ phiếu lần đầu ra công chúng tại Hồng Kông tuần trước, đã huấn luyện mô hình gọi là GLM-Image trên các máy chủ Ascend Atlas 800T A2 của Huawei sử dụng framework MindSpore. “Chúng tôi hy vọng điều này có thể cung cấp tài liệu tham khảo quý giá cho cộng đồng để khám phá tiềm năng của sức mạnh tính toán nội địa,” Z.AI cho biết trong một tuyên bố chia sẻ với South China Morning Post.
GLM-Image kết hợp các kỹ thuật tự hồi quy và khuyếch tán trong một kiến trúc lai với tổng cộng 16 tỷ tham số. Thành phần tự hồi quy, dựa trên mô hình ngôn ngữ GLM-4 của Z.AI, xử lý hiểu lệnh và phối hợp hình ảnh, trong khi bộ giải mã khuyếch tán tinh chỉnh các chi tiết nhỏ. Phương pháp này phản ánh các kỹ thuật được sử dụng bởi mô hình tạo hình ảnh mới nhất của OpenAI gpt-image-1.5, đã thể hiện khả năng hiển thị văn bản vượt trội và tuân thủ hướng dẫn tốt hơn so với các mô hình khuyếch tán thuần túy như Stable Diffusion. Các mô hình khuyếch tán tạo ra hình ảnh bằng cách bắt đầu với nhiễu hình ảnh ngẫu nhiên và dần dần tinh chỉnh nó thành một bức tranh, trong khi các mô hình tự hồi quy xây dựng hình ảnh từng bước, dự đoán từng phần dựa trên phần đã có trước đó. Khuyếch tán rất giỏi về tính chân thực tổng thể nhưng có thể gặp khó khăn với các chi tiết chính xác như văn bản hoặc bố cục, trong khi các mô hình tự hồi quy xuất sắc về cấu trúc và tuân thủ hướng dẫn. Hiện tại, khuyếch tán là kỹ thuật hàng đầu trong các trình tạo hình ảnh AI mã nguồn mở.
Các hệ thống lai mới kết hợp cả hai phương pháp, sử dụng tạo hình tự hồi quy để lập kế hoạch hình ảnh và khuyếch tán để hoàn thiện kết quả cuối cùng.
Hình ảnh: Z.AI
Việc ra mắt này mang ý nghĩa quan trọng đối với Z.AI, công ty bị Washington đưa vào danh sách đen năm 2025 do cáo buộc có liên hệ với quân đội Trung Quốc. Được liệt vào danh sách đen, công ty bị cắt đứt khỏi các bộ xử lý H100 và A100 của Nvidia. Hiện tại, Z.AI đã chứng minh rằng các công ty bị liệt vào danh sách đen vẫn có thể sản xuất các hệ thống AI cạnh tranh bằng phần cứng nội địa, một bước phát triển mà Bắc Kinh đã lâu mong muốn thể hiện. Ngay sau khi Z.AI công bố, Reuters đưa tin rằng cơ quan hải quan Trung Quốc đã chỉ đạo các đại lý chặn các chip Nvidia H200 nhập cảnh vào nước này. Các quan chức chính phủ triệu tập các công ty công nghệ đến các cuộc họp, nơi họ được yêu cầu không mua các chip này trừ khi cần thiết. Theo các nguồn tin, lời nói của họ đủ nghiêm trọng để coi như “gần như cấm nhập khẩu trong thời điểm này.” Bắc Kinh dường như đang gửi tín hiệu rằng các phòng lab AI của Trung Quốc có thể xây dựng các mô hình đủ khả năng mà không cần silicon của Mỹ, giảm bớt sự cấp bách cho các công ty Trung Quốc tích trữ phần cứng Nvidia. Chip H200, với hiệu suất khoảng sáu lần so với chip H20 mà Bắc Kinh đã chặn vào tháng Tám năm ngoái, đã nhận được đơn hàng từ các công ty Trung Quốc hơn hai triệu đơn vị với giá 27.000 đô la mỗi chiếc. Các nhà phân tích tại Trung tâm An ninh và Công nghệ Mới nổi của Georgetown đã lưu ý rằng chiến lược chip của Trung Quốc dựa trên việc bù đắp hiệu suất thấp hơn của từng chip bằng các cụm Huawei khổng lồ. Phương pháp này có hiệu quả, nhưng đòi hỏi nhiều phần cứng hơn, nhiều năng lượng hơn và nhiều công sức kỹ thuật hơn. “Một trong những hạn chế chính của chiến lược này là khả năng sản xuất đủ chip trong nước của Trung Quốc để bù đắp và bắt kịp khoảng cách về khả năng,” nhà phân tích cao cấp Hanna Dohmen nói với CNBC vào tháng 11. Theo lộ trình của Huawei, chip thế hệ tiếp theo của họ vào năm 2026 thực tế sẽ kém hơn so với flagship hiện tại về mặt sức mạnh thô. Tuy nhiên, các đánh giá như vậy có thể đánh giá thấp khả năng của các phòng lab Trung Quốc trong việc đạt được hiệu quả thuật toán, như DeepSeek đã thể hiện qua việc huấn luyện các mô hình cạnh tranh với ít chip hơn nhờ tối ưu GPU ở cấp độ lắp ráp.
Nguồn: Hội đồng Quan hệ Ngoại giao
GLM-Image của Z.AI đạt điểm chuẩn hàng đầu trong ngành về hiển thị văn bản và tạo ký tự Trung Quốc, theo báo cáo kỹ thuật của công ty. Những người không có phần cứng phù hợp cũng có thể thử trực tuyến với API có giá 0.014 đô la cho mỗi hình ảnh được tạo ra, hoặc qua một Space miễn phí trên Hugging Face do Z.AI duy trì. Z.AI trở thành “hổ AI” đầu tiên của Trung Quốc, nhóm các startup xây dựng các mô hình ngôn ngữ lớn để cạnh tranh với OpenAI và Anthropic, ra công chúng. Cổ phiếu của họ đã tăng khoảng 80% kể từ khi niêm yết, theo sự hưng phấn của các nhà đầu tư đối với các công ty AI Trung Quốc như DeepSeek hoặc Alibaba trong bối cảnh tham vọng chip nội địa của Trung Quốc. Trong khi đó, Huawei đang chuẩn bị tăng mạnh sản lượng các bộ xử lý Ascend trong năm nay. Sự hiện diện của công ty tại các hội nghị AI trên khắp Trung Quốc đã trở nên nổi bật hơn khi họ cố gắng định vị mình như là xương sống của hạ tầng AI quốc gia, không còn phụ thuộc vào Santa Clara.