国产人工智能大模型技术达标 首批通过官方评测

国产人工智能大模型技术达标 首批通过官方评测


【新闻发稿】中国电子技术标准化研究院近期完成了首个官方的人工智能“大模型标准符合性评测”,公布结果显示,包括阿里云、百度、360和腾讯在内的四大科技巨头旗下的大模型产品均成功通过了此次评测。此次评测的通过,标志着这些模型在通用性、智能性等关键技术指标上,已达到或超出国家制定的标准要求,彰显出国产人工智能大模型的发展成就。

据了解,参与通过评测的四款大模型分别是:阿里云的通义千问、百度的文心一言、360的智脑和腾讯的混元大模型。值得一提的是,通义千问不仅顺利通过评测,更以其开源模型的身份,展示了中国企业在促进人工智能开源生态中所作出的贡献。自去年12月份开源以来,通义千问72B模型凭借卓越的性能表现,已在HuggingFace排行榜以及上海人工智能实验室的Open Compass榜单中名列前茅。

“大模型标准符合性评测”由国内权威研究机构——中国电子技术标准化研究院主导,目的在于为我国大模型技术建立起一套标准化的评估体系,以促进人工智能行业的规范化、标准化发展。在开展此次评测前,机构广泛征集了来自学术界和产业界的意见与建议,并结合这些意见建立起覆盖38个细分评测维度的评估体系,这些维度密切围绕语言模型的通用性和智能性进行设计,旨在全面、细致地检验大模型的综合能力。

腾讯方面表示,其混元大模型是依照《人工智能大规模与训练模型 第2部分:测评指标与方法》国家标准进行设计和优化的,模型规模超过千亿参数,预训练的语料库也超过了惊人的2万亿tokens,体现了腾讯在大模型研究领域深厚的技术积累。

本次“大模型标准符合性评测”的成功举行和相关模型的通过,不仅对推动国内各大企业在人工智能领域的进一步开拓具有重大意义,也为整个人工智能产业树立了技术和质量的新标杆。未来,此类评测标准有望成为国内外相关企业的参考和目标,推动全球人工智能技术的健康、快速发展。对于广大用户而言,能期待在不久的将来,能够接触到更多高质量、高智能的人工智能产品和应用,这些产品和应用将在工作、学习和日常生活中发挥越来越重要的作用。

相关新闻