
创建或修改目录:/www/wwwroot/104.219.215.234/data 失败!
发布日期:2025-03-26 13:28 点击次数:115
偷偷撸
雷递网 乐天 10月16日
继上半年千亿参数模子 Yi-Large 之后,零一万物本日对外发布最新旗舰模子 Yi-Lightning。
零一万物称,在国外泰斗盲测榜单 LMSYS 上,Yi-Lightning高出 GPT-4o-2024-05-13、Claude 3.5 Sonnet,排名宇宙第六,中国第一。这是在 LMSYS 这一全球大模子必争的公开擂台上,中国大模子首度达成“高出 OpenAI GPT-4o ”的最好成绩。
零一万物CEO李开复博士示意,零一万物 (01.ai) 今天晋升为全球大型谈话模子(LLM)第三名的公司,位列 LMSys Chatbot Arena最新名次榜中,仅次于OpenAI 和Google 。
李开复还称,Yi-Lightning是一个小的各人混杂(MOE)模子,具有极高的速率且本钱便宜,每百万个token仅需0.14好意思元(东说念主民币0.99),比拟之下GPT-4o 的本钱为4.40好意思元。
零一万物毫不撤废预检修
这之前,网上听说国内大模子公司有几家撤废预检修,零一万物是其中一家。李开复在本日的媒体交流门径中示意,零一万物毫不撤废预检修,况且零一万物的预检修作念得又快又好。
李开复认为,面前国内头部的六家大模子公司只须有够好的东说念主才,想作念预检修的决心,融资额跟芯片王人不会是问题的。“这六家公司融资额度王人是够的,咱们作念预检修的production run,检修一次三四百万好意思金,这个钱亦然头部公司王人付得起。”
几天前,李开复就曾认识说,零一万物一直在作念预检修,前年和本年发布的Yi-34B,Yi-Large,Yi-Coder,Yi-VL, Yi-Vision王人是发布时全球第一梯队,国内率先的预检修模子。
无须惦念零一万物被用垮
经过一年多的千里淀,零一万物的“模应一体”计策在 ToB 边界内有了更直不雅的体现。目下,零一万物已推出AI 2.0 数字东说念主处理有策动、全行业处理有策动、AI Infra 等居品及劳动,面向 B/G 端客户构建起了从定制模子到专有诓骗搭建的一整套处理有策动。
在曩昔,模子性能与推理本钱之间的参加产出比一直是企业客户在采用大模子局势必要洽商的要素。本日,在 Yi 大模子灵通平台上,Yi-Lightning 已上线 每百万 token仅需 0.99 元,直逼行业最廉价。
谈及是否会濒临亏本时,李开复说,零一万物的确切的本钱比0.99元更低,照旧故意润空间,是以接待全球使用,无须惦念零一万物被用垮。
李开复认为,确切激活健康的生态系统,有相等多好的App,最关节的等于要有宇宙顶级的模子能作念到白菜价,今天零一万物发布的Yi-Lightning模子等于这样的模子。
中好意思顶尖模子时候差距6个月时候
天然中国大模子企业每每称我方的大模子逾越ChatGPT,但现实中,中好意思大模子边界仍存在不小差距,有东说念主以致认为是过时十年、二十年。
对此,李开复也认为,中国大模子边界过时好意思国,但莫得过时那么久。比如,GPT4o是在2024年5月13日作念出来的模子,Yi-Lightning在10月就也曾将其打败。如的确的算中国赶超好意思国有多远的距离,至少零一万物只差最好的OpenAI的模子五个月的时候。
“镌汰时候差相等穷苦,我不展望咱们可以镌汰这个时候差。因为毕竟东说念主家是用十万张GPU检修出来,咱们用的是两千张GPU检修出来,咱们时候差能达到仅仅因为咱们模子、AI infra等团队王人关注机灵,去使用和调治对方作念出来的东西,再加上咱们我方每家的研发有特色,比如数据处理、训推优化等等。”
李开复指出,通过一套嘱托,中好意思顶尖模子时候差距6个月时候,就也曾是很好的效果了。如果期待破局,可能需要一个前所未有的算法才有契机。
“咱们千万不要认为过时六个月是一个很玷污的事情,关于勤劳图强、繁重努力、机灵多元化的团队,在国内领有这样团队的公司,要用访佛零一万物的嘱托,去逼近好意思国最顶尖的公司,不过时逾越六个月,我合计是可能,况且不仅仅咱们一家可能,但难度是高的,但愿再往下减相等穷苦,除非真的有一个发明和科技上的冲破。”
以下是李开复演讲主要内容:
李开复:咱们王人瞩目到前一阵有自媒体宣称国内六家大模子公司里有几家撤废了预检修,网上也有好多不雅点认为,中国预检修赶不上好意思国,那么今天咱们所要作念的首要发布,等于零一万物的新旗舰大模子 Yi-Lightning 闪电模子,它是第一个在国外泰斗达到相等高排名、打败巨额的好意思国大模子,成为首度高出全球头部的 Open AI GPT-4o的中国大模子。
Yi-Lightning 闪电模子不但模子性能宇宙一流、推理相等快速,况且价钱相等低,无论是App调用、照旧企业诓骗场景调用,王人黑白常恰当的。
上一次中国模子取得的最高排名是在本年5月时,Yi-Large得到过第七名排名,那时过时于三家公司,当今咱们是过时两家公司,王人是好意思国最顶尖的公司,况且咱们打败了好多来自Google跟OpenAI的多款模子,包括GPT4o,在这个榜上是第七名,就比咱们差极少。
咱们也牢记GPT4o 在本年5月推出时是全球第一的模子,当今咱们也曾逾越5月的GPT4o,GPT出了最新的 ChatGPT-4o-latest 当今排在第别称,它也在9月作念了更新。
从这里可以看到讨论面前讲的大模子预检修中国弗成作念的听说不合,这个事情咱们就隆重辟谣。这个调治是荒诞的,零一万物毫不撤废预检修,况且咱们的预检修作念得又快又好,咱们的预检修当今的发达,好多东说念主问中国的预检修是否过时好意思国?
咱们也坦诚中国事过时好意思国,有东说念主说过时十年、二十年,今天咱们可以看到的可以用相等精准的数字来算,因为GPT4o在5月13日作念出来的模子,咱们在10月的今天也曾把它打败了,是以等于五个月之后逾越五个月前最强的模子,如的确的算中国赶超好意思国有多远的距离,至少零一万物只差五个月偷偷撸,最好的OpenAI的模子。
另外咱们打平了xAI的Grok,咱们知说念xAI在检修Grok时是几万张的GPU,当今囤了10万张GPU,也有东说念主说中国公司莫得这样多的GPU,莫得主见竞争,咱们这次预检修只用2000张GPU检修一个半月,只花了300多万好意思金,作念出来的预检修模子跟Grok打平,只花它的1%或2%的本钱。
是以在总榜上可看到,中国悉数模子在这个榜单上达到有史以来最高,况且不仅仅中国的,可以说是好意思国之外悉数模子,也可以说是硅谷之外悉数模子,是以咱们相等骄矜达到这样好的成绩,也感谢团队相等努力互助。
咱们再看一些其他的分榜单,咱们的汉文是比肩第二,咱们的多轮对话比肩第三,咱们数学比肩第三,咱们的代码比肩第四。
前阵子从GPT-o1可以看到,GPT-o1最强的坚决等于数学智商和代码智商,这里可以看到基本只过时他们GPTo1和o1 mini,另外还有一家,是以咱们这个分数一定是真的在最难的边界里反而发达最好,这个咱们也黑白常骄矜。天然可以看到在数学和coding和GPT-o1有特殊的距离,咱们当今在盘问调治用推理时候来作念到更机灵和更好的数学coding的行动。
再底下的两个亦然很难的题目,一个是粗重问题,一个是长发问,这两个亦然最难,咱们排名也黑白常高,比肩第四。
零一万物相等大的一个性格在于,咱们作念的模子和它底下的基础架构是共建的,计策名叫“模基共建”,咱们可以洽商到不但要把模子作念好,况且让它在推理时能相等便宜和便宜的价钱,相等快速地推理生成出来,因为这个影响用户体验,也影响诓骗它的本钱。
作念到这极少咱们会去定制一个相等好的GPU、CPU和多样内存的组合,把这样一个推理引擎优化在这样的硬件上,咱们会笔据这样的规格去让咱们模子团队检修一个塞满这些GPU又不会溢出的历程,又能得出很好的效果,咱们的模子、推理引擎、时候架构、硬件王人是量身定制打造,况且搭配到刚刚好,况且为了高效的推理作念出来的。
咱们时候方面也有好多很牛的地方。这次混杂瞩宗旨机制是咱们作念的一个相等要紧的点,混杂瞩宗旨是贪图里面比较大的比例,咱们不但把KV cache莽撞好多,将部分层的贪图复杂度从 L 平方降到了 L。
再底下是一个MoE,也等于混杂各人的模子,混杂各人里面有好多的各人,咱们各人特殊多,但有极少是咱们的新发明,各人好多,但不一定每次王人要用那么多。咱们检修时假定有80个各人,每次王人调用12个或15个,在推理的时候是否可以少调几个,这样可以免却好多的时候,这些王人可以用动态的行动。
平时点说,对绵薄的问题问两个各人,难的问题问十个各人,就跟东说念主们所遭遇的问题一样,当问题绵薄,想知说念天气是什么的时候,无须找一堆各人来花费他们的时候,但问题很复杂的时候,能够真的需要好多的各人,这样的均衡能不太影响咱们的发达,但能省俭好多时候。
终末极少相等要紧,因为能作念多阶段的检修,咱们可以把通盘检修切成两块,有一块是作念好以后就把它固定起来了,在这个固定的模子上头再作念后端的检修,是以咱们不必相通一个又一个的实验,咱们盘问员有五个行动,他们不必把全部的数据跑五遍才看哪个最好,咱们可以80%或90%王人是固定起来,终末再去作念高效的对比。
这个主要的对咱们的公道等于咱们可以用最低的本钱多检修一些不同的模子,从中学习到若何去用不同的算法,哪些算法发达最好,是以多阶段检修亦然特地的和前所未有的。
超碰在线更要紧的是价钱,这样好的宇宙排前六的模子,第三的公司,它要些许钱呢?咱们100万个token东说念主民币只收0.99元,况且还有多样登录注册的扩充奖金等等,是以但愿各开辟者和企业客户能使用。
因为今天咱们需要打造全民的诓骗,相等相等要紧的是要有相等好的模子,况且要相等快,相等便宜,否则咱们打磨的App再不去花太多时候和钞票,融资不易,咱们但愿悉数作念App的一又友,用中国完全最好的引擎,宇宙排名更高的引擎,况且它的收费基本是行业里相等低的了。
也有东说念主问前阵子价钱战,你们是否亏钱拉用户?咱们不是,咱们确切的本钱照旧比0.99元更低,咱们照旧故意润空间,是以接待全球使用,无须惦念咱们被你用垮了。
我合计大模子诓骗与其说卖模子或模子作客服等诓骗,最好的是能够有一个大模子公司看到完竣的用户需求,从端到端打造一个完竣的处理有策动,让购买大模子和数字东说念主的公司能坐窝看到每一使用就赢利,用得越多赚得越多,这样他对咱们的付费意愿也会增长。
在传统时期PC时期到Mobile时期,出动时期,悉数诓骗王人拔帜易帜了,PC时期用的四大派别网站,到Mobile时期等于用App,用小红书、抖音,PC时期看的优酷,在Mobile时期等于抖音了,东说念主们有相同的需求,关联词从PC到出动咱们使用的App会完全转变了。
咱们认为生成式AI今天这个时期会让每一个已有的诓骗再去转变,再被颠覆,作念成AI First和AI Native的诓骗,这个诓骗迟迟莫得出来,讲了好多,莫得看到有这样的诓骗,况且咱们今天看到确切最赢利的是英伟达芯片公司,App公司还没若何赢利,是以咱们认为绝顶中枢的极少,等于咱们要相等好的模子才气达到PMF,等于居品能够达到用户的需求。
如果相等好的模子很贵,这个App作念一作念就歇业了,确切激活健康的生态系统,有相等多好的App,最关节的等于要有宇宙顶级的模子能作念到白菜价,今天咱们发布的Yi-Lightning模子等于宇宙上最稳健我刚刚说的这句中的模子。
以下是对话中枢内容:
发问:此前有讯息称AI方面的六小虎,某几家撤废了预检修,开复憨厚也曾辟谣了,但站在行业的角度您评估和看一下对预检修模子缓缓撤废将是行业通盘趋势吗?
李开复:我合计作念好预检修模子是一个时候活,况且是要相等多有才华的东说念主在沿路责任,慢工出细活,需要有懂芯片的东说念主,懂推理的东说念主,懂基础架构的东说念主,懂模子的东说念主,有很好的算法同学,沿路作念出来。
如果一个公司能有幸领有这样多优秀的东说念主才,能够跨边界的互助,那我肯定中国事完全可以作念出宇宙排名前十的预检修的通用模子,但不是每家公司王人可以作念这件事情,作念这件事情的本钱也比较高,以后有可能会越来越少的大模子公司检修作念预检修。
不外据我所知,这六家公司融资额度王人是够的,咱们作念预检修的production run,检修一次三四百万好意思金,这个钱亦然头部公司王人付得起,我合计中国的六家大模子公司只须有够好的东说念主才,想作念预检修的决心,融资额跟芯片王人不会是问题的。
发问:OpenAI的o1发布后,从时候上悉数东说念主会认为带来新的Scaling的范式,您若何看,绝顶对初创公司来说会有哪些影响?
李开复:我刚从好意思国总结,跟OpenAI的东说念主员也有换取,OpenAI真的是很横暴的公司,他们跟我分析的是公司里面还有一些好东西,关联词他们不急拿出来,因为他们率先行业充足多,到了一定的业务节点才开释出来,这是他们能作念而别东说念主弗成作念。
OpenAI o1 天然荫藏了悉数中间的想考景况,关联词好多东说念主照旧在网上开动猜它若何作念,咱们认为有一些揣测照旧比较靠谱,是以当你发了一个新的时候,这个时候被好多机灵东说念主使用揣测,我合计五个月以后应该也有不少访佛o1 模子的智商出当今各个模子公司,包括零一万物。
o1 的想考模式是把之前只在预检修中 scaling 的趋势彭胀到了推理的时候,这件事情对行业是最大的剖析的转变。曩昔全球合计谁预检修作念好就够了,迟缓全球发现后检修SFT和强化检修王人黑白常要紧。
是以零一万物的团队刚开动作念的主如果专注预检修,之后又有好多很横暴的东说念主加入,帮咱们把Post train也作念出来,当今看来 inference 也很要紧,一年半以前全球合计大模子最横暴的地方等于预检修,一年以后发现Post train亦然相同要紧,这感谢OpenAI点醒咱们这极少,当今我肯定好多中好意思公司王人在往o1 场地决骤。
发问:您之前说不作念赔钱的to B,这次初度公布干系的矩阵,是否意味着也尝试往to B场地进一步深耕?第二个,往这个场地作念是否意味着处理AI 1.0行业SaaS行业低利润和亏欠的问题?
李开复:咱们绝顶有趣给每一个用户提供价值,是以咱们不会去说有模子,你要拿来作念什么,我卖给你,你先给钱,这样对用户是不会甘心的。
另外一种常见的作念法,等于到企业里,企业说我要作客服,模子卖给我,若何作客服我不会作念,你帮我作念,这就成为和AI1.0时期一样的可以称为系统集成型的AI,也等于说卖模子给你,先帮你把客服诓骗作念好,这样的情况下很难故意润,之前我说如果作念一单赔一单的to B,零一万物宁可不作念,这句话咱们并莫得转变。
刚才看到的AI 2.0数字东说念主处理有策动不是一个作念一单赔一单,因为它是专注到用户首要的痛点需乞降盈利点,也等于说一个店长或KOL平时作念一次直播花费最要紧的资源,等于他的时候,况且这个时候就动作念一小时的直播能赚到一千块钱,也等于一千块钱,但如果用数字东说念主直播就不是一小时了,可能可以作念一千个小时,哪怕每一个小时只可赚一半的钱,一千个小时照旧可以赚五百倍的钱,这样的账就很好算了。
如的确的能把数字东说念主作念到端到端,只须输入公司里面的东西,这次减价的,选一个形象、声息按一个钮就开动百录以致千录的直播,等于你是卖给这个企业一个印钞机,印钞阴私收租出费等于可行的了。除了直播之外,咱们的AI 2.0数字东说念主处理有策动也曾跑通了更多业务场景,比如AI伴侣、IP形象、办公会议等等。
咱们持续践诺模应一体计策,将Yi-Lightning模子智商与数字东说念主处理有策动麇集,阻抑迭代居品,后续会解锁更多业务场景。
回到国内的SaaS的问题,国内当今很难说到SaaS,通盘收费模式和贸易模式在好意思国走通了,但国内照旧一直有很大的问题。但也有一些行业可以走通SaaS,SaaS按使用收费,也可以订阅,按照每个月收费,也可以用分红,这些模式王人可以笼统称为比较好的贸易模式,因为它不是一次性卖掉,像一个格式制的公司帮你作念一个客服卖给你,你付钱就走了,以后莫得钱可以收了,而是可以捏续收费。
刚才讲的模式,非论分红、订阅的SaaS模式才是可捏续的贸易模式,今天咱们并莫得看到一个精深被收受的SaaS模式的存在。是以在国内,咱们大模子to B相干于AI 1.0时期有不同的嘱托,首要任务等于要寻找少数能够按使用情况收费的行动,而不是格式定制的行动,能得到比较高利润率的订单再去作念。
合座来看,零一万物 ToB 合座处理有策动会采纳“一横一纵”的嘱托。和Yi-Large比拟,Yi-lightning的模子性能又有大幅进步,作为国外 SOTA 的基座模子,他们自己就具备着出色的泛化性,再加上零一万物自身领有很宏大的SFT(监督学习)智商。
这些时候智商使得咱们的团队能够先将单个行业作念深作念透,进而以自身时候智商和行业积蓄为基础,凝练出圭臬化的ToB处理有策动,为九行八业的企业客户将本提效,将宇宙第一梯队的大模子用到实处,确切为企业带来业务增长和新竞争力。
发问:Yi-Large把咱们中好意思顶尖模子的时候差镌汰到六个月,这次咱们的发布这边打败了GPT4o,把这个时候差以致镌汰到了五个月,从零一万物到通盘中国大模子的初创公司来说,预检修模子要若何的我方的独门特色,能持续追逐镌汰这个时候差?
李开复:镌汰时候差相等穷苦,我不展望咱们可以镌汰这个时候差。因为毕竟东说念主家是用十万张GPU检修出来,咱们用的是两千张GPU检修出来,咱们时候差能达到仅仅因为咱们模子、AI infra等团队王人关注机灵,去使用和调治对方作念出来的东西,再加上咱们我方每家的研发有特色,比如数据处理、训推优化等等。
当今这一套行动论在零一万物也曾进修了,咱们有信心把我方的改进加上咱们的一些特长,在关注OpenAI和其他公司发布的新时候,尽快地去能够了解这些时候的中枢要紧性,然后把它的智商在咱们我方的居品里面阐扬出来,我合计这套行动保捏在六个月左右,就也曾是很好的效果了。如果期待破局,可能需要一个前所未有的算法才有契机。
咱们千万不要认为过时六个月是一个很玷污的事情,或者一定是要追逐的事情,因为我好多好意思国一又友王人认为中国会远远过时,也有好意思国一又友包括一些中国一又友按照这个嘱托,东说念主家十万张GPU等,咱们要被甩手三年、五年以致十年王人有可能,当今从零一万物讲明了不会过时这样多,况且这次LMSYS的榜单上也有两家其他中国公司发达也可以,也不是惟有咱们一家在作念。
是以关于勤劳图强、繁重努力、机灵多元化的团队,在国内领有这样团队的公司,要用访佛零一万物的嘱托,去逼近好意思国最顶尖的公司,不过时逾越六个月,我合计是可能,况且不仅仅咱们一家可能,但难度是高的,但愿再往下减相等穷苦,除非真的有一个发明和科技上的冲破。
发问:零一万物这样横暴的一个模子,竟然拿出白菜的价钱,价钱这样低会不会亏本?
李开复:零一万物在Yi-Lightning的订价上并莫得亏本。从配置的第一天起,零一万物就同期启动了模子检修、AI Infra、AI 诓骗三大团队。当三个团队王人进修了以后,再对接到沿路。
零一万物这一模式总结为模基共建、模应一体两大计策——AI Infra智商助力模子检修和推理,以更低的检修本钱检修出性能率先的模子,以更低的推理本钱撑捏诓骗层的探索。出色的模子性能与便宜的推理本钱不仅能撑捏零一万物开拓绝佳的ToB诓骗场景,还能让零一万物推出的大模子ToB处理有策动更具性价比,进而与企业互助伙伴沿路探寻大模子时期的TC-PMF。
之前回复行业价钱战时,我的回答等于零一万物不参与价钱战。另外,我那时也提到,弗成只看模子价钱,还要看模子性能是否充足好。那时有好多性能较差的模子价钱降到相等低,以致是免费,我肯定那时采用接入这类模子API的企业与个东说念主,成绩王人不达预期。要接入API,充足好的模子性能很要紧,否则居品无法达到PMF。
另外很要紧的极少等于把高性能模子的价钱降到白菜价,0.99元东说念主民币/百万 token 的价钱很便宜,但如果一个诓骗里每个用户每天调掉十几次,累积下来每年的本钱照旧覆盖暴虐的。零一万物也在作念App,咱们知说念作念App需要驱散本钱。
是以咱们不会赔钱卖模子,但也不会赚好多钱,而是在本钱线上加极少点小小的利润,就得到了今天0.99元/百万token的价钱。
挑选模子API最要紧的极少,等于模子性能一定要优秀,在这个前提之下才气去挑最便宜的,实践算一算用户掉用量会是些许,账算不算得过来。我肯定,笼统Yi-Lightning的模子质料和价钱来看,Yi-Lightning很可能是好多开辟者最认同、最高性价比的模子了。
发问:这次公布的 ToB 处理有策动矩阵是完竣的吗?近期是否还会公布其他 ToB 处理有策动?
李开复:除了咱们也曾发布的AI 2.0数字东说念主、API之外,零一万物目下还有 AI Infra 处理有策动、特地化定制模子等其他 ToB 业务,咱们会在近期隆重对外发布,敬请期待。
雷递由媒体东说念主雷建平创办偷偷撸,若转载请写明开头。