币电讯
Ezra Reguerra
作者:Ezra Reguerra专职撰稿人
Bryan O'Shea
Bryan O'Shea审阅编辑

传统资管与加密风投联手!富兰克林邓普顿、Pantera 加入 Sentient Arena 测试 AI 代理

Sentient推出了Arena,这是一个用于测试AI代理企业任务的生产型平台,Pantera和富兰克林邓普顿加入了首批参与者。

传统资管与加密风投联手!富兰克林邓普顿、Pantera 加入 Sentient Arena 测试 AI 代理
最新资讯

Pantera Capital和富兰克林邓普顿数字资产部门已加入Arena首批参与阵容。Arena是开源AI实验室Sentient新推出的测试环境,旨在评估AI智能体在企业级工作流程中的表现。

据Sentient周五向Cointelegraph发布的公告,Arena被定位为生产环境级的基准测试平台,而非静态模型测试。它不仅根据固定数据集对智能体进行评分,还会让它们完成标准化的企业场景任务,包括长篇文档、不完整信息和冲突数据源。

Sentient Labs产品负责人Oleg Golev在接受Cointelegraph采访时表示:“在这个初始阶段,合作方将以支持Arena项目和开发者团队的方式参与。”

他表示,合作伙伴在共同探索什么才是面向生产、适用于文档密集型任务(如分析、合规和运营)的推理能力。各家公司此次并未宣布与该计划相关的资金承诺。

本次平台发布正值企业加速将AI智能体部署到研究和运营流程之际,但AI治理框架建设尚未跟上步伐。

据 Celonis于2月4日发布的《2026流程优化报告》指出,85%受访高管计划三年内实现“智能体企业”转型,目前仅有19%企业实际运用多智能体系统。

2026流程优化报告。来源:Celonis

面向生产环境的评估而非静态评分

Golev表示,Arena是一个共享平台,开发者可以将AI智能体提交至标准化任务下,在一致的测试条件下对比结果。

该平台记录失败类别,包括幻觉、证据缺失、引用错误和推理漏洞,帮助开发者诊断反复出现的问题。

Arena计划通过公开排行榜发布对比性能指标,并公布总结常见失效模式及修复方法的事故分析报告。

基础设施合作伙伴包括OpenRouter和Fireworks,为首批团队提供推理算力支持,其他合作方则提供工具和研讨会资源。

在AI自主性提升背景下的治理层

该项目推出之际,金融及加密企业正积极尝试赋予AI系统更大的经济自主权。

周三,MoonPay上线了基础设施,支持AI智能体自主创建钱包并执行稳定币交易。

周四,Stripe高管警告称,随着AI驱动的商业活动扩张,区块链或需实现重大扩容改进。

相关推荐:中东紧张局势推高黄金,投资者寻求避险资产

Cointelegraph 致力于独立、透明的新闻报道。本文依据 Cointelegraph 的编辑政策制作,旨在提供准确且及时的信息。建议读者自行核实相关信息。阅读我们的编辑政策 https://cn.cointelegraph.com/editorial-policy