🔥Nvidia open-sources Lyra 2.0, supporting the generation of explorable 3D worlds from a single photo and import into robot simulators


A Nvidia lançou o Lyra 2.0, uma estrutura de código aberto que gera mundos 3D exploráveis a partir de uma única imagem. Após o usuário inserir uma foto, o Lyra 2.0 primeiro gera um vídeo de passeio controlado por trajetória de lente, depois reconstrói o vídeo em dispersões gaussianas 3D e modelos de malha, que podem ser importados diretamente para motores de jogo e simuladores para renderização em tempo real. Os pesos do modelo e o código estão disponíveis sob a licença Apache 2.0 no Hugging Face e no GitHub, permitindo uso comercial. A inovação central está na resolução de dois problemas de degradação durante passeios de longa distância: um é o esquecimento espacial, mantendo as informações geométricas 3D de cada quadro e recuperando relações com quadros históricos; o outro…
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Marcar