零一万物开源Yi-Coder系列模型,专为编程设计

2024-09-06 · 互联网 · 原创 · 望春风

日前,零一万物方面宣布开源Yi-Coder系列模型,并表示这是继5月13日开源Yi-1.5系列模型后,其在开源方向上的又一重要成果。

零一万物开源Yi-Coder系列模型,专为编码任务设计

据零一万物方面介绍,Yi-Coder系列模型是专为编码任务设计,提供了1.5B和9B两种参数。其中Yi-Coder-9B的性能表现优于其他规模在10B参数以下的模型,例如CodeQwen1.5 7B、CodeGeex4 9B,甚至能够与DeepSeek-Coder 33B相媲美。


具体而言,Yi-Coder系列模型具备强大的代码生成能力、支持52种主要编程语言,在代码生成和跨文件代码补全方面表现优异。同时能够处理长达128K tokens的上下文内容,并有效捕捉长期依赖关系,可适用于复杂项目级代码的理解和生成。此外尽管Yi-Coder系列模型的参数量相对较小,但其在代码理解、代码调试等领域的表现十分出色,10B以下的参数规模也让这一系列模型更加易于使用、方便端侧部署。

零一万物开源Yi-Coder系列模型,专为编码任务设计

在性能上,由于Yi-Coder系列模型的训练数据截止时间是2023年底,为确保没有数据污染,零一万物方面选取了LiveCodeBench动态基准测试库中2024年1月至9月的题目进行测试。结果显示,Yi-Coder-9B-Chat的通过率达23.4%,在10B以下参数量的模型中是唯一通过率超20%的模型。此外值得一提的是,该模型的通过率还超过了DeepSeek-Coder-33B-Instruct的22.3%、CodeGeex4-All-9B的17.8%,以及CodeLLama-34B-Instruct的13.3%等。


据零一万物方面公布的相关数据显示,在代码编辑和补全、长序列建模、数学推理等细分领域,Yi-Coder系列模型的表现也十分优秀。其中在代码编辑方面,Yi-Coder-9B-Chat在CodeEditorBench基准的Primary和Plus两个子集中的表现始终优于DeepSeek-Coder-33B-Instruct和CodeQwen1.5-7B-Chat。


此外,近日零一万物还正式宣布与企业协作与管理平台飞书达成合作。飞书方面在其多维表格原有业务巡检系统的基础上,接入零一万物视觉模型Yi-Vision,与Yi API合力打造了飞书智能巡检AI字段捷径。


据了解,这一功能可覆盖零售店铺管理、员工管理、车间环境巡检、开市工作检查、商品控损、门店防盗等多种识别场景,企业用户只需上传需要识别的图片,即可一键获取巡检结果。


【本文图片来自网络】