零一万物新旗舰模型 Yi-Lightning超越 GPT-4o，李开复详解背后原因

时间： 2024-10-17 03:46 浏览量：512

【TechWeb】10月16日消息，在辟谣“不做大模型预训练”后，今天零一万物CEO李开复正式发布最新旗舰模型 Yi-Lightning。

在国际权威盲测榜单LMSYS 上，Yi-Lightning 超越硅谷知名大模型 OpenAI GPT-4o-2024-05-13、Anthropic Claude 3.5 Sonnet，排名世界第六，中国第一。

这也意味着零一万物紧随 OpenAI、Google 之后，与xAI 打平，进击全球前三大模型企业。

目前 Yi-Lightning 已上线 Yi 大模型开放平台（https://platform.lingyiwanwu.com/），每百万 token 仅需 0.99 元。

李开复再次强调：“零一万物绝不放弃大模型预训练，而且我们的预训练做得又快又好。”

和 Yi-Lightning大模型同时发布的，还有零一万物的To B行业解决方案——行业应用产品 AI 2.0 数字人，聚焦零售和电商等场景，将最新版旗舰模型实践到行业解决方案，在弹幕互动、商品信息提取、实时话术生成等环节，AI 2.0 数字人已接入 Yi-Lightning。

至此，零一万物大模型在To C和To B端均有推出产品进行布局。李开复对To C和To B的布局的不同侧重也进行了深入解读。

李开复观点：

1、绝不放弃大模型预训练，不要认为落后美国六个月是一个很羞耻的事情

在发布会上，李开复再次提到：“有自媒体声称国内六家大模型公司里有几家放弃了大模型预训练，网上也有很多观点认为，中国预训练赶不上美国。”

李开复再次正式辟谣：零一万物绝不放弃预训练，而且我们的预训练做得又快又好。

李开复称，在大模型预训练上，中国是落后美国，有人说落后十年、二十年。今天我们可以用非常精确的数字来算，因为GPT4o是在5月13日做出来的模型，零一万物在10月16日Yi-Lightning大模型已经把它打败了，所以就是五个月之后超过五个月前最强的模型。算中国赶超美国有多远的距离，至少零一万物只差五个月。

李开复强调，我们千万不要认为落后美国六个月是一个很羞耻的事情，因为我很多美国朋友都认为中国会远远落后，也有美国朋友包括一些中国朋友认为，按照这个打法，人家十万张GPU，我们要被甩掉三年、五年甚至十年都有可能。现在零一万物证明了不会落后这么多，而且这次LMSYS的榜单上也有两家其他中国公司表现也不错，也不是只有我们一家在做。

在李开复看来，做好预训练模型是一个技术活，需要有懂芯片的人，懂推理的人，懂基础架构的人，懂模型的人，有很好的算法同学，一起做出来。不是每家公司都可以做这件事情，做这件事情的成本也比较高，以后有可能会越来越少的大模型公司训练做预训练。

另外，李开复透露，这次 Yi-Lightning 的预训练只用了2000张GPU、训练了一个半月，花了300多万美金，做出来的预训练模型能力跟xAI的Grok打平，但是只花了它的1%或2%的成本。

2、不打价格战、不做亏本生意，API“白菜价”也有小利润

此次，零一万物最强大模型Yi-Lightning的API定价为每百万 token 仅需 0.99 元。

对于这个价格，李开复表示：“我们不会赔钱卖模型，但也不会赚很多钱，而是在成本线上加一点点小小的利润，就得到了今天0.99元/百万token的价格。欢迎大家使用，不用担心我们被你用垮了。”

同时，李开复也再次强调：“之前回应行业价格战时，我的回答就是零一万物不参与价格战。另外，我当时也提到，不能只看模型价格，还要看模型性能是否足够好。”

新旗舰模型 Yi-Lightning强在哪儿？

继上半年千亿参数模型 Yi-Large 之后，这次零一万物发布的最新旗舰模型 Yi-Lightning在国际权威盲测榜单 LMSYS 上超越 GPT-4o-2024-05-13、Claude 3.5 Sonnet，排名世界第六，中国第一。

除了在 LMSYS 这一全球大模型必争的公开擂台上，中国大模型首度实现“超越 OpenAI GPT-4o ”的最佳成绩。

在众多分榜上，Yi-Lightning 的成绩同样出众。

在中文分榜上，Yi-Lightning 超越了 xAI 发布的 Grok-2-08-13、智谱发布的 GLM-4-Plus 等国内外优质模型，与 o1-mini 等模型并列排名世界第二。

在多轮对话分榜上，Yi-Lightning 则是超越了 Google 所发布的 Gemini-1.5-Pro 、Anthropic 发布的 Claude 3.5 Sonnet 等知名旗舰模型，排名第三。

数学能力，代码能力方面，Yi-Lightning 同样处于全球第一梯队。在数学、代码分榜上，Yi-Lightning分别取得第三、第四名。

以专业性与高难度著称的艰难提问、长提问榜单上，Yi-Lightning 的表现依旧出众，均取得世界第四的优异成绩。

LMSYS Chatbot Arena 的用户体验评估不仅证明了 Yi-Lightning 的出色性能，也更为直观地验证了大模型解决真实世界问题的能力。这不仅证明了 Yi-Lightning 优异的模型性能，更重要的是，这也意味着 Yi-Lightning 能够丝滑地由实验室场景过渡到模拟真实用户场景，能够更快、更高质量地实现模型能力落地。

另外，与 Yi-Large 相比，Yi-Lightning 在模型性能更进一步的前提下，推理速度方面有着极大提升。

内部评测数据显示，在 8xH100 算力基础下，以同样的任务规模进行测试，Yi-Lightning 的首包时间（从接收到任务请求到系统开始输出响应结果之间的时间）仅为 Yi-Large 的一半，最高生成速度也提升了近四成。

大模型To B、To C应用两手抓

国内大模型赛道狂奔进入第二年，商业化造血能力已经成为多方关注的焦点。

今天，零一万物也首度公布了全新 To B战略下的首发行业应用产品 AI 2.0 数字人，聚焦零售和电商等场景，将最新版旗舰模型实践到行业解决方案，在弹幕互动、商品信息提取、实时话术生成等环节，AI 2.0 数字人已接入 Yi-Lightning。

据介绍，接入 Yi-Lightning 后，数字人的实时互动效果更好，话术更丝滑，回复也更准确；业务数据方面，在接入 Yi-Lightning 全新加持的数字人直播后，某酒旅企业的 GMV 较此前上升 170%。

李开复表示，一个大模型公司同时做To B和To C是很辛苦的，也需要多元化的管理方式，因为两个团队的基因不一样，做事的方法和衡量KPI的方法都不太一样。我自己在这两个领域有经验，也在试着做，但是也绝对不能什么都做。

To B选择做国内，李开复表示，我们找到了一些破局的空间，比如用数字人来做零售，做餐饮等等，这能做一个完整的解决方案，另外还有两三个领域开始在做，现在还不方便披露。To B工作只能在中国做，因为要触达美国的用户或国外的用户不太可能，所以To B的国外就放弃了。在国内做To B就做有利润的解决方案，而不只是卖模型，不只是做项目制，这是零一万物To B的做法。

To C零一万物主要布局海外。李开复认为，To C的产品在国内走流量有一个很大的问题，流量的成本越来越高，有些友商的用户从十几块人民币加到三十多块人民币，近来还有相当的流失。在这样一个挑战环境里我们会非常谨慎，先不推出中国本土新的To C的应用，已有的产品还会继续维护，但更多的精力会在国外的土壤用更低廉的钱买到非常高质量的用户，或者能直接把App卖出去，让用户来订阅收费，订阅的习惯在国外比较良好。国外做To C的产品，目前零一万物变现能力和消耗用户增长的成本算账可以算得过来，以后再关注国内有什么机会可以推出To C产品。

李开复强调，而无论是 ToC 还是 ToB，如何提前预判 TC-PMF 是绕不开的核心命题。模型性能与推理成本，两项关键因素直接影响着大模型落地的成败。作为兼具性能与性价比的新旗舰模型，Yi-Lightning 也将成为零一万物探索“模应一体”的重要基石。零一万物会坚持“模型＋AI Infra＋应用”三位一体的全栈式布局，积极在 ToB 企业级解决方案上探索 TC-PMF，以更从容的姿态迎接即将到来的 AI 普惠时代。（果青）

新浪科技公众号

“掌”握科技鲜闻（微信搜索techsina或扫描左侧二维码关注）

欢迎光临江苏新闻热线！

零一万物新旗舰模型 Yi-Lightning超越 GPT-4o，李开复详解背后原因