大模型国际标准

发布时间:2025-04-15

  国际电信联盟电信标准分局(ITUT)于2025年3月正式发布ITU-T F.748.44基础模型的评估标准:基准测试/Assessment criteria for foundation models: Benchmark。该项国际标准由中国信通院牵头制定,规范了大模型基准测试的指标要求和测试方法。该标准旨在推动大模型基准测试体系架构形成国际共识,为大模型技术提供方和应用方提供高质量的能力评估依据,引导大模型技术及产业健康有序发展。
  本次发布的国际标准基于当前产学研界500余项基准测试系统性研究,一方面确立了大模型基准测试的4项核心要素,包括测试维度(测试场景、测试能力、测试任务和测试指标)、测试数据集、测试方法和测试工具。另一方面,针对通用场景的基础模型,提供了标准化的测试用例和范例流程,以支持企业规范开展大模型能力评估。
来源:中国工信新闻网 人民邮电报