欢迎光临江苏新闻热线!

当前位置: 首页 > 科技

零一万物新旗舰模型 Yi-Lightning超越 GPT-4o,李开复详解背后原因

【TechWeb】10月16日消息,在辟谣“不做大模型预训练”后,今天零一万物CEO李开复正式发布最新旗舰模型 Yi-Lightning。

在国际权威盲测榜单LMSYS 上,Yi-Lightning 超越硅谷知名大模型 OpenAI GPT-4o-2024-05-13、Anthropic Claude 3.5 Sonnet,排名世界第六,中国第一。

这也意味着零一万物紧随 OpenAI、Google 之后,与xAI 打平,进击全球前三大模型企业。

目前 Yi-Lightning 已上线 Yi 大模型开放平台(https://platform.lingyiwanwu.com/),每百万 token 仅需 0.99 元。

李开复再次强调:“零一万物绝不放弃大模型预训练,而且我们的预训练做得又快又好。”

和 Yi-Lightning大模型同时发布的,还有零一万物的To B行业解决方案——行业应用产品 AI 2.0 数字人,聚焦零售和电商等场景,将最新版旗舰模型实践到行业解决方案,在弹幕互动、商品信息提取、实时话术生成等环节,AI 2.0 数字人已接入 Yi-Lightning。

至此,零一万物大模型在To C和To B端均有推出产品进行布局。李开复对To C和To B的布局的不同侧重也进行了深入解读。

李开复观点:

1、绝不放弃大模型预训练,不要认为落后美国六个月是一个很羞耻的事情

在发布会上,李开复再次提到:“有自媒体声称国内六家大模型公司里有几家放弃了大模型预训练,网上也有很多观点认为,中国预训练赶不上美国。”

李开复再次正式辟谣:零一万物绝不放弃预训练,而且我们的预训练做得又快又好。

李开复称,在大模型预训练上,中国是落后美国,有人说落后十年、二十年。今天我们可以用非常精确的数字来算,因为GPT4o是在5月13日做出来的模型,零一万物在10月16日Yi-Lightning大模型已经把它打败了,所以就是五个月之后超过五个月前最强的模型。算中国赶超美国有多远的距离,至少零一万物只差五个月。

李开复强调,我们千万不要认为落后美国六个月是一个很羞耻的事情,因为我很多美国朋友都认为中国会远远落后,也有美国朋友包括一些中国朋友认为,按照这个打法,人家十万张GPU,我们要被甩掉三年、五年甚至十年都有可能。现在零一万物证明了不会落后这么多,而且这次LMSYS的榜单上也有两家其他中国公司表现也不错,也不是只有我们一家在做。

在李开复看来,做好预训练模型是一个技术活,需要有懂芯片的人,懂推理的人,懂基础架构的人,懂模型的人,有很好的算法同学,一起做出来。不是每家公司都可以做这件事情,做这件事情的成本也比较高,以后有可能会越来越少的大模型公司训练做预训练。

另外,李开复透露,这次 Yi-Lightning 的预训练只用了2000张GPU、训练了一个半月,花了300多万美金,做出来的预训练模型能力跟xAI的Grok打平,但是只花了它的1%或2%的成本。

2、不打价格战、不做亏本生意,API“白菜价”也有小利润

此次,零一万物最强大模型Yi-Lightning的API定价为每百万 token 仅需 0.99 元。

对于这个价格,李开复表示:“我们不会赔钱卖模型,但也不会赚很多钱,而是在成本线上加一点点小小的利润,就得到了今天0.99元/百万token的价格。欢迎大家使用,不用担心我们被你用垮了。”

同时,李开复也再次强调:“之前回应行业价格战时,我的回答就是零一万物不参与价格战。另外,我当时也提到,不能只看模型价格,还要看模型性能是否足够好。”

新旗舰模型 Yi-Lightning强在哪儿?

继上半年千亿参数模型 Yi-Large 之后,这次零一万物发布的最新旗舰模型 Yi-Lightning在国际权威盲测榜单 LMSYS 上超越 GPT-4o-2024-05-13、Claude 3.5 Sonnet,排名世界第六,中国第一。

除了在 LMSYS 这一全球大模型必争的公开擂台上,中国大模型首度实现“超越 OpenAI GPT-4o ”的最佳成绩。

在众多分榜上,Yi-Lightning 的成绩同样出众。

在中文分榜上,Yi-Lightning 超越了 xAI 发布的 Grok-2-08-13、智谱发布的 GLM-4-Plus 等国内外优质模型,与 o1-mini 等模型并列排名世界第二。

在多轮对话分榜上,Yi-Lightning 则是超越了 Google 所发布的 Gemini-1.5-Pro 、Anthropic 发布的 Claude 3.5 Sonnet 等知名旗舰模型,排名第三。

数学能力,代码能力方面,Yi-Lightning 同样处于全球第一梯队。在数学、代码分榜上,Yi-Lightning分别取得第三、第四名。

以专业性与高难度著称的艰难提问、长提问榜单上,Yi-Lightning 的表现依旧出众,均取得世界第四的优异成绩。

LMSYS Chatbot Arena 的用户体验评估不仅证明了 Yi-Lightning 的出色性能,也更为直观地验证了大模型解决真实世界问题的能力。这不仅证明了 Yi-Lightning 优异的模型性能,更重要的是,这也意味着 Yi-Lightning 能够丝滑地由实验室场景过渡到模拟真实用户场景,能够更快、更高质量地实现模型能力落地。

另外,与 Yi-Large 相比,Yi-Lightning 在模型性能更进一步的前提下,推理速度方面有着极大提升。

内部评测数据显示,在 8xH100 算力基础下,以同样的任务规模进行测试,Yi-Lightning 的首包时间(从接收到任务请求到系统开始输出响应结果之间的时间)仅为 Yi-Large 的一半,最高生成速度也提升了近四成。

大模型To B、To C应用两手抓

国内大模型赛道狂奔进入第二年,商业化造血能力已经成为多方关注的焦点。

今天,零一万物也首度公布了全新 To B战略下的首发行业应用产品 AI 2.0 数字人,聚焦零售和电商等场景,将最新版旗舰模型实践到行业解决方案,在弹幕互动、商品信息提取、实时话术生成等环节,AI 2.0 数字人已接入 Yi-Lightning。

据介绍,接入 Yi-Lightning 后,数字人的实时互动效果更好,话术更丝滑,回复也更准确;业务数据方面,在接入 Yi-Lightning 全新加持的数字人直播后,某酒旅企业的 GMV 较此前上升 170%。

李开复表示,一个大模型公司同时做To B和To C是很辛苦的,也需要多元化的管理方式,因为两个团队的基因不一样,做事的方法和衡量KPI的方法都不太一样。我自己在这两个领域有经验,也在试着做,但是也绝对不能什么都做。

To B选择做国内,李开复表示,我们找到了一些破局的空间,比如用数字人来做零售,做餐饮等等,这能做一个完整的解决方案,另外还有两三个领域开始在做,现在还不方便披露。To B工作只能在中国做,因为要触达美国的用户或国外的用户不太可能,所以To B的国外就放弃了。在国内做To B就做有利润的解决方案,而不只是卖模型,不只是做项目制,这是零一万物To B的做法。

To C零一万物主要布局海外。李开复认为,To C的产品在国内走流量有一个很大的问题,流量的成本越来越高,有些友商的用户从十几块人民币加到三十多块人民币,近来还有相当的流失。在这样一个挑战环境里我们会非常谨慎,先不推出中国本土新的To C的应用,已有的产品还会继续维护,但更多的精力会在国外的土壤用更低廉的钱买到非常高质量的用户,或者能直接把App卖出去,让用户来订阅收费,订阅的习惯在国外比较良好。国外做To C的产品,目前零一万物变现能力和消耗用户增长的成本算账可以算得过来,以后再关注国内有什么机会可以推出To C产品。

李开复强调,而无论是 ToC 还是 ToB,如何提前预判 TC-PMF 是绕不开的核心命题。模型性能与推理成本,两项关键因素直接影响着大模型落地的成败。作为兼具性能与性价比的新旗舰模型,Yi-Lightning 也将成为零一万物探索“模应一体”的重要基石。零一万物会坚持“模型+AI Infra+应用”三位一体的全栈式布局,积极在 ToB 企业级解决方案上探索 TC-PMF,以更从容的姿态迎接即将到来的 AI 普惠时代。(果青)

新浪众测 新浪众测 新浪科技公众号 新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

相关新闻
本文来源于网络,不代表江苏新闻热线立场,转载请注明出处
我要收藏
0个赞
转发到:
阿里云服务器
Copyright 2003-2024 by 江苏新闻热线 jsnews.xwxzx.cn All Right Reserved.   版权所有
关注我们: