头条 科技 产经 家电 智能 手机 芯片 数码 电商 English
中国IT产经新闻网-移动互联网与智能搜索领域是未来IT产业发展的趋势!
中国IT产经新闻/软件安全/正文
「天工大模型4.0」o1版和4o版正式上线天工APP和网页,免费使用
来源:
2025-01-06
编辑:晓露

2025年1月6日,昆仑万维正式将「天工大模型4.0」o1版和4o版同步上线,并全量登陆天工网页和APP,人人免费可用。

  

作为国内第一款中文逻辑推理能力的o1模型(Skywork o1),不仅包含上线即开源的模型,还有两款性能更强的专用版本。经过全方位的技术栈升级和模型优化,由昆仑万维自研的Skywork o1系列能熟练处理各种推理挑战,包括数学、代码、逻辑、常识、伦理决策等问题。

  

「天工大模型4.0」4o版(Skywork 4o)是由昆仑万维自研的多模态模型,其赋能的实时语音对话助手Skyo,则是一个具备情感表达能力、快速响应能力、多语言流畅切换的智能语音对话工具。

  

当前,这两款模型已正式登陆昆仑万维旗下天工web与APP,全面向用户开放。

  

       

01.   

  

Skywork o1为用户带来更极致的推理能力,正式上线天工web

  

相较于之前的版本,正式上线的Skywork o1进行了重磅升级,体现在以下三个方面:PRM优化,基于Q*算法的推理系统优化,创新性提出Step-DAPO算法,力争解决训练效果不稳定、计算资源开销过大等问题。

  

全面升级且正式上线的Skywork o1 Lite / Skywork o1 Preview大幅提升了数学、代码和逻辑推理能力。我们对其进行标准数学基准测试(包括GSM8k、MATH、OlympiadBench、AIME-24以及AMC-23),以及在HumanEval、MBPP、LiveCodeBench及BigCodeBench这四项代码基准测试上评估了Skywork o1的代码能力。

  

       

表1丨Skywork o1在数学基准评测上的表现

  

  

       

表2丨Skywork o1在代码基准评测上的表现

  

*备注:对于BigCodeBench,我们采用它的instruct子集进行测试

  

可以看出,在数学、代码基准测试中,Skywork o1的能力表现逼近o1-mini,显著优于行业常规通用大模型。

  

02.

  

Skywork 4o赋能的Skyo,已全面登陆天工APP

  

       

图丨天工APP中Skyo入口与界面(来源:昆仑万维)

  

为了达成“像和真人一样说话聊天”的效果,Skyo 坚持采用更先进的创新路线,通过多模态 LLM 端到端建模,来解决这个难题。

  

       

图丨Skyo所采用的语音对话框架(来源:昆仑万维)

  

Skyo 的上线是昆仑万维在智能语音交互技术方向,从“操纵机器”迈向“和真人交流”的重要一步。

  

03.

  

坚定迈向AGI时代

  

过去两年,昆仑万维已完成“算力基础设施—大模型算法—AI应用”全产业链布局,并构建起由AI大模型、AI搜索、AI游戏、AI音乐、AI 社交、AI短剧组成的多元AI业务矩阵。我们坚信,所有在模型与产品上进化的每一小步,都是迈向实现通用人工智能的一大步。昆仑万维仍会坚持以技术为底座,以产品为先锋,给用户带来更好的使用体验,为推动人工智能技术的发展和应用做出贡献,立志成为一家小而大美的国际化人工智能企业。

产业点评更多
厂商动态更多
热门综合更多
CopyRight @ 2008-2024 IT产经新闻网 All Right Reserved 违者必究 湘ICP备2022017330号-2