IBM Granite登顶斯坦福大学2025年基础模型透明度指数报告

描述

IBM Granite 模型系列在斯坦福大学发布的 2025年“基础模型透明度指数”(Stanford Foundation Model Transparency Index)名列第一,并创下该指数的历史最高分。

基础模型如今无处不在,正在改变商业和日常生活的更多领域,比如,为聊天机器人、代码助手和地理空间模型等各类AI工具提供动力。值得一问的是:我们真的了解它们是如何构建的吗?

这正是斯坦福大学基础模型研究中心所探索的问题。日前,该中心发布了第三份年度基础模型透明度指数报告(Stanford Foundation Model Transparency Index,FMTI)。IBM 于 2024年开源了其 Granite 花岗岩模型,但对开发者和最终用户来说,开放性本身并不等同于透明度。FMTI 根据数据来源、风险评估、开放权重、外部可复现性、事件报告协议和数据使用政策等 100项指标,对主流基础模型的透明度进行评分。斯坦福团队根据评估框架对主要 AI 公司的模型进行评分,并在 FMTI 发布前给予公司回应评级的机会。

今年斯坦福评估了 13家公司的模型,综合所有领域得分后,IBM Granite 3.3 以 95% 的透明度得分高居榜首,领先第二名23个百分点,较 41% 的平均分高出 54个百分点。 

IBM

FMTI 从上游、模型和下游三大领域对模型进行评分,IBM Granite 在每个领域及总分上均处于领先地位。

在 15个主要透明度维度中,IBM Granite 有 10个维度获得满分 100分,包括数据获取、计算能力和下游缓解措施。

对 IBM 而言,将透明度融入模型核心不仅是道德决策,更是明智的商业选择。IBM 模型始终将透明度前置,并贯穿其生命周期。就像全球企业的供应链决策一样,企业需要确保其使用的产品值得信赖。FMTI 结果揭示了这一趋势,即企业级模型往往更具透明度。

此外,今年 FMTI 的整体平均分下降了 17分,这意味着其他头部 AI 公司的模型透明度有所降低。IBM 院士、IBM 研究院人工智能安全负责人 Kush Varshney 表示:"尽管许多 AI 公司对模型透明度的重视不足,IBM 始终甚至更加专注于透明度。"数据对比鲜明:在数据属性(Data Properties)维度,IBM 获得了满分 100分,而其他八家公司得分为零,该类别平均分仅为 14分。

除总分下降外,FMTI 报告还揭示另一趋势:2025年发布模型透明度报告的公司数量比 2024年减少了一半。斯坦福大学基础模型研究中心自行收集了其余数据。

IBM

在 FMTI 的 14个主要透明度维度中,IBM Granite 有 10个维度获得满分。在全部 14个维度上,其得分均超过所有评估模型平均值。

今年的 FMTI 结果新增了 AI 智能体的信息检索能力标准,并首次纳入中国公司的模型。指数编制团队指出,FMTI 还进行了模型的开放性评估,不仅包括模型的访问路径数量,还包括是否支持第三方的模型风险研究、跨智能体的互操作性协议等。

IBM 是与斯坦福大学合作提供模型信息的公司之一。在提交 Granite 3.3 的相关数据后,IBM 已发布新一代 Granite 4.0 系列模型。后者基于标准 Apache 2.0 许可证开源,是全球首个获得 ISO 42001 认证的开放模型,并进行了加密签名,确保其符合国际公认的安全、治理和透明度最佳实践。

斯坦福大学 Hazy Research 实验室的一项近期研究表明,开源的 Granite 4.0 微型和小型模型在消费级硬件上运行时,也能高效地处理多种 AI 任务。在他们看来,IBM Granite 4.0 系列模型指明了 AI 行业的发展方向。

IBM 院士、IBM 研究院人工智能安全负责人 Kush Varshney 表示:"正如我们不愿食用成分不明的食品或饮料,各行业企业都应该确保大语言模型的透明度。IBM Granite 所提供的正是‘从农场到餐桌‘的透明度体验。"

关于 IBM

IBM 是全球领先的混合云、人工智能及企业服务提供商,帮助超过 175个国家和地区的客户,从其拥有的数据中获取商业洞察,简化业务流程,降低成本,并获得行业竞争优势。金融服务、电信和医疗健康等关键基础设施领域的超过 4000家政府和企业实体依靠 IBM 混合云平台和红帽 OpenShift 快速、高效、安全地实现数字化转型。IBM 在人工智能、量子计算、行业云解决方案和企业服务方面的突破性创新为我们的客户提供了开放和灵活的选择。对企业诚信、透明治理、社会责任、包容文化和服务精神的长期承诺是 IBM 业务发展的基石。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分