2026-04-02 12:01:57

A Alibaba lançou silenciosamente uma grande novidade.

CoPaw-Flash-9B — Modelo de Agente AI baseado no Qwen3.5. Com 9B de parâmetros, pode ser executado no seu próprio computador.
Por que é impressionante?
Alguns benchmarks estão ao nível do Qwen3.5-Plus (grande modelo fechado).
90 bilhões de parâmetros versus centenas de bilhões, pontuações semelhantes.
O que me entusiasma ainda mais é o framework CoPaw:
- Suporta memória persistente (lembra das conversas anteriores)
- Conexões multi-canal (pode conectar-se ao Feishu, Discord, etc.)
- Implantação local, sem custos de API
A arquitetura do Qwen3.5 também é muito potente — total de 397B de parâmetros, ativando apenas 17B por token. Máxima eficiência.
Você não precisa de um servidor H100. Um MacBook pode ser suficiente para rodar um assistente AI pessoal.
Estou pensando em mover algumas etapas intermediárias do meu pipeline de conteúdo (limpeza de dados, conversão de formato) para o modelo local, economizando mais da metade dos custos de API.
Na segunda metade de 2026, o agente AI pessoal pode se tornar padrão.
Mas as pontuações de benchmark e a experiência real são coisas diferentes. Só vou falar quando conseguir rodar tudo localmente.

Ver original

Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.