AI资讯
掌握人工智能AI动态,领略未来风采!
英伟达近日联合 Hugging Face 和 ServiceNow,发布了名为 StarCoder2 的 LLMs 系列模型,希望成为代码生成领域的新标准,具备性能、透明度和成本效益等诸多优势。
该系列模型包括一个由 ServiceNow 训练的 30 亿参数模型、一个由 Hugging Face 训练的 70 亿参数模型和一个由英伟达训练的 150 亿参数模型。
这是通过使用名为 Stack v2 的新代码数据集实现的,该数据集比 Stack v1 大七倍;新的训练技术也意味着该模型可以更好地理解 COBOL 等低资源编程语言、数学和程序源代码讨论。
StarCoder2 经过 619 门编程语言培训,可以执行源代码生成、工作流生成、文本摘要等专业任务。英伟达表示,开发人员可以利用它进行代码补全、高级代码总结、代码片段检索等,从而提高工作效率。
英伟达表示相比较初版 StarCoder LLMs,新的 30 亿参数模型进一步精简和筛选了优质参数,其性能相当于 150 亿参数模型的初版 StarCoder。
StarCoder2 采用 BigCode Open RAIL-M 许可证,允许免版税访问和使用。
感兴趣的用户可从 BigCode 项目的 GitHub 页面获取源代码,可从 Hugging Face 下载模型。
StarCoder2支持600多种编程语言,使其成为一个强大的代码翻译工具,能够将一种编程语言的代码翻译成另一种语言的代码。基于自然语言描述,该模型还可以生成相应的代码实现,为开发者提供了快速实现功能的途径。
作为编程学习工具,StarCoder2帮助初学者理解编程概念和代码结构,从而提升他们的编程技能。此外,通过分析代码的执行效率和资源消耗,模型提供代码优化建议,有助于提高程序运行效率。
StarCoder2的推出为开发者提供了一个全方位的代码支持工具,不仅能够提高开发效率,还在代码质量、学习与教育以及代码优化等方面发挥着积极作用。
项目入口:https://top.aibase.com/tool/starcoder2
博客:https://huggingface.co/blog/starcoder2
数据集:https://huggingface.co/collections/bigcode/starcoder2-65de6da6e87db3383572be1a