PANews a rapporté le 27 février que, selon Cointelegraph, le laboratoire d’IA open source Sentient a annoncé le lancement d’Arena, un environnement de test de qualité production pour évaluer les performances des agents IA dans les flux de travail au niveau des entreprises. Les divisions d’actifs numériques de Pantera Capital et Franklin Templeton ont rejoint la première cohorte de test d’Arena.
Sentient a indiqué qu’Arena n’est pas un test statique de modèle, mais teste plutôt l’agent IA sur une tâche standardisée en simulant les conditions d’entreprise avec de longs documents, des informations incomplètes et des sources contradictoires. La plateforme suit les catégories d’échecs telles que les hallucinations, les preuves manquantes, les erreurs de citation et les vulnérabilités de raisonnement afin d’aider les développeurs à diagnostiquer les problèmes. Arena prévoit de publier des indicateurs de performance comparatifs via des classements publics et de publier des rapports de test résumant les schémas de défaillance courants et les correctifs.
Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'
avertissement.
Articles similaires
Tether annonce la version 0.4.1 de QVAC Workbench, avec plusieurs améliorations axées sur la localisation AI
Le PDG de Tether, Paolo Ardoino, a annoncé sur la plateforme X la sortie de la plateforme de développement intelligent QVAC Workbench 0.4.1. La nouvelle version renforce l'expérience sans serveur, optimise l'inférence déléguée et les capacités RAG, prend en charge davantage de formats de documents, et a également été optimisée pour les appareils mobiles. Elle est actuellement en phase de test Alpha, la version complète sera bientôt disponible.
GateNewsIl y a 6m
Vitalik Buterin révèle que la Fondation Ethereum mise 72K ETH en utilisant DVT
Vitalik Buterin affirme que la Fondation Ethereum utilise une version « lite » de la Technologie de Validateur Distribué pour miser 72 000 ETH.
Il espère que cela éliminera l'idée que les institutions ont besoin d'une infrastructure complexe pour participer au staking.
Il y a deux semaines, la Fondation Ethereum a annoncé qu'
CryptoNewsFlashIl y a 7m
Multicoin affirme que les « marchés du travail sur Internet » pourraient entraîner la prochaine vague d'adoption de la cryptomonnaie
Multicoin Capital prévoit un changement dans l'utilisation des cryptomonnaies, passant de l'achat de tokens à leur gain via des tâches en ligne grâce au modèle des Marchés du Travail en Ligne, récompensant les contributions des utilisateurs par la technologie blockchain.
TheNewsCryptoIl y a 14m
Fondation Cardano vote OUI sur la limite de changement net de 300M ADA pour les époques 613–713
La Fondation Cardano a voté en faveur d'une proposition visant à plafonner le montant d'ADA pouvant sortir de la Trésorerie à 300 millions.
Elle indique que la nouvelle limite correspond aux revenus attendus de la Trésorerie et s'aligne sur un plan de dépenses plus conservateur.
La Fondation Cardano a voté pour soutenir une nouvelle
CryptoNewsFlashIl y a 17m
BNB Chain avertit alors que l'outil de jetons Beacon Chain approche de la fermeture
Les utilisateurs de BNB Chain doivent agir rapidement pour migrer leurs actifs en utilisant l'outil de récupération de jetons de la BNB Beacon Chain, qui sera arrêté d'ici le 30 avril 2026. La migration anticipée est essentielle pour garantir la récupération des actifs éligibles avant que le support ne passe à un processus plus lent.
CoinfomaniaIl y a 29m