5月28日,星期三
05-28 10:00
红杉中国推出AI基准测试工具

红杉中国推出智能体 基准测试「xbench」

最近,知名投资机构「红杉中国」推出 AI Agent(智能体)基准测试工具「xbench」,并公布了相关技术报告。

据介绍,xbench 的诞生旨在解决「模型能力和 AI 实际效用之间的关系」和「不同时间维度中能力的比较」这两个核心问题。因此红杉中国提出了「为现实世 ​……

[展开]
加载更多