DeepSeek menambahkan pengenalan gambar dan video ke chatbot utamanya

Perusahaan kecerdasan buatan asal Tiongkok telah menambahkan pengenalan gambar dan video ke chatbot utamanya.

Pada saat yang sama, pembuat chip lokal menunjukkan bahwa mereka kini dapat menyamai dukungan peluncuran cepat yang dulu menjadi kekuatan Amerika.

DeepSeek, sebuah perusahaan yang berbasis di Hangzhou, diam-diam menambahkan fitur baru yang disebut “mode pengenalan gambar” ke platform chat-nya. Mode baru ini bergabung dengan dua mode lain yang diluncurkan perusahaan awal bulan ini: “ahli” dan “kilat.”

Fitur baru ini memungkinkan chatbot memahami foto dan video, bukan hanya teks.

Ini menyelaraskan dengan chatbot AI besar lainnya yang telah menawarkan kemampuan serupa selama beberapa waktu.

Chen Xiaokang, yang memimpin tim multimodal DeepSeek, mengatakan alat ini pertama kali diuji dengan sekelompok kecil pengguna di situs web dan aplikasi seluler.

Chen Deli, seorang peneliti senior di perusahaan, merayakan peluncuran ini dengan sebuah posting singkat yang merujuk pada logo perusahaan: “Ikan paus kecil sekarang bisa melihat.”

Fitur gambar dan video ini keluar hanya beberapa hari setelah DeepSeek merilis pratinjau model flagship terbarunya, DeepSeek-V4, dan membuat bobot model tersedia untuk diunduh dan digunakan oleh siapa saja.

V4 bukan satu model, melainkan dua. Yang pertama, DeepSeek-V4-Pro, memiliki 1,6 triliun parameter dan dirancang untuk tugas-tugas sulit yang membutuhkan penalaran kompleks dan alur kerja otomatis multi-langkah.

Yang kedua, DeepSeek-V4-Flash, dibangun untuk menangani sejumlah besar permintaan dengan biaya yang lebih rendah. Kedua model mendukung jendela konteks sebesar satu juta token.

Mereka juga menggunakan desain perhatian hibrida yang dikatakan perusahaan dapat mengurangi daya komputasi dan memori yang dibutuhkan selama inferensi.

Pembuat chip Tiongkok mencapai tonggak baru

Yang menarik perhatian banyak pengamat industri bukan hanya model itu sendiri, tetapi apa yang terjadi pada hari peluncurannya.

Empat perusahaan chip Tiongkok, Huawei Ascend, Cambricon, Hygon Information, dan Moore Threads, semuanya mengonfirmasi bahwa perangkat keras mereka bekerja dengan sempurna dengan V4 sejak hari pertama dirilis.

Dukungan yang sama hari itu, di mana model baru berjalan lancar di chip non-NVIDIA saat peluncuran dan bukan berminggu-minggu atau berbulan-bulan kemudian, sebelumnya hampir tidak mungkin dilakukan di luar ekosistem Nvidia sendiri.

Chip Ascend Huawei, termasuk A2, A3, dan 950, mendukung baik V4-Pro maupun V4-Flash.

Perusahaan mengatakan bahwa chip Ascend 950 mereka menggunakan proses komputasi gabungan dan aliran pemrosesan paralel untuk mempercepat inferensi.

Cambricon menyelesaikan adaptasinya menggunakan kerangka inferensi vLLM sumber terbuka dan membagikan kode mereka di GitHub.

Hygon mengatakan mereka melakukan optimisasi model mendalam di platform DCU mereka untuk menciptakan jalur yang mulus dari rilis model hingga penggunaan nyata.

Moore Threads bekerja sama dengan Beijing Academy of Artificial Intelligence untuk menjalankan V4 di kartu MTT S5000 mereka menggunakan tumpukan perangkat lunak FlagOS.

Pengamat industri mengatakan peluncuran yang terkoordinasi ini mewakili perubahan nyata.

Selama bertahun-tahun, chip yang dibuat di luar ekosistem Nvidia membutuhkan waktu berbulan-bulan untuk mendukung model baru yang besar. Membuat delapan chipset domestik berbeda bekerja pada hari pertama adalah tonggak penting.

Gambaran besar: biaya dan kemandirian untuk Deepseek

Para pengamat percaya makna yang lebih besar dari peluncuran ini adalah bahwa DeepSeek telah menunjukkan bahwa mereka dapat menghadirkan AI tingkat tinggi tanpa bergantung pada perangkat keras Barat.

Dengan membuat modelnya bekerja secara native di beberapa chip Tiongkok sekaligus, mereka mengurangi risiko dari pembatasan ekspor yang telah memblokir akses perusahaan Tiongkok ke prosesor Amerika paling kuat.

Biaya juga penting. DeepSeek telah bekerja keras untuk menjaga agar biaya menjalankan modelnya tetap rendah. Ini memudahkan bisnis membangun sistem otomatis tanpa menghadapi biaya komputasi yang sangat tinggi.

Dengan cara ini, peningkatan dan peluncuran Deepseek bukan hanya tentang satu terobosan teknis. Mereka lebih tentang seluruh rantai pasok yang bersatu.

Dari rilis ini, pertanyaan tentang siapa yang memimpin dalam AI tampaknya beralih dari siapa yang membangun model paling pintar, menjadi siapa yang dapat menjaga seluruh sistem berjalan dengan murah dan mandiri dalam jangka panjang.

Jika Anda membaca ini, Anda sudah selangkah lebih maju. Tetap di sana dengan newsletter kami.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan