文心一言迭代数据曝光,QPS提升10倍,留给LLM玩家的时间不多了 热点
文心一言上线内测一个月后,首份迭代数据曝光:
一个月共迭代4次;模型推理效率提升10倍,最近一次带来的推理提升达到123%;推理性能提升50%,模型算力利用率提升1倍。简单归纳就是说,迭代很快、不仅成本降下来了,顺便还把性能提升了?!
要知道过去一个月内,全球网友们的热情被这场技术风暴所点燃,人们玩得不亦乐乎,ChatGPT也overload了好几次。
(相关资料图)
作为国内率先发布的文心一言,是如何保持住高效迭代的?
在这份成绩单中,找到了答案。
文心一言首月数据曝光
曝光的数据不多,但全都是关键技术指标——
大模型训练与推理方面的数据,直接影响后续产品体验效果的好坏。
首先,迭代方面。百度飞桨支撑的大模型推理服务在4月19日再次迭代,搭载了支持动态插入的分布式推理引擎。据消息称,这还是业内首创。
截止目前,已迭代至3.5版本,一个月共迭代4次。
具体到推理方面,QPS (每秒查询推理响应速度)提升10倍,模型推理性能提升50%,模型算力利用率提升1倍。
QPS (每秒查询推理响应速度)提升10倍,也就代表着是大模型推理效率的提升,推理成本降低为原来的10分之一。换言之,在同等成本情况下可以为更多用户提供服务。
模型推理性能提升50%。大模型需要在用户反馈中持续不断的学习,推理作为大模型应用的关键,其性能的提升直接影响到产品侧的效果。
而算力利用率提升1倍,同样也是降本增效的体现。
事实上,不管是迭代速度,还是从模型成本、性能以及效率等多方面的提升,而这背后文心一言之所以能够高效迭代,飞桨的重要性不容忽视。
更确切地来说,「飞桨+文心一言」联合优化。
大模型不仅需要单纯的「暴力美学」的支撑,同时还需要深度学习框架作为底层来支持高效、稳定的分布式训练。
此次数据就可以看到,飞桨即向上与模型「文心一言」,又向下与芯片算力都实现了协同优化,实现整体的效能提升。
而具体到推理过程,飞桨能为文心一言“定制”了一个精密生产流程,结合大模型算力、数据、参数量等特点来设计工艺,从而提升了推理效率和性能,帮助模型学习得越快越好。
大模型技术行业挑战
这些迭代数据的背后,带出了大模型技术的新行业挑战值得探讨。
随着更多产业玩家的推进,我们已经明显感知到大模型投入大成本高。如果没有足够的资金和计算资源,就连开发训练这一阶段都难以进行。
据最新消息,OpenAI每天需要支付70万美元来维持ChatGPT基础设施运行。在此之前微软也已经从中投入了数十亿美元。
诚如每每有行业大佬选择大模型创业,都有网友调侃:这点钱不够烧的。
其次,大模型优化难迭代要求高,需要自上而下的全局优化。
以往认知中,大模型核心技术突破来源于暴力资源累积,可以是超大规模计算资源的聚集、超大规模模型结构的设计、海量数据亦或是参数量的提升……
但事实上这牵涉到每个环节自上而下很强的经验积累。
诚如OpenAI有业内人士消息称,它将整个公司最优秀的算法研究员,拿去做数据规划和处理。
现在在百度文心一言,也得到再一次印证:
大模型的突破和迭代,并非靠简单三驾马车(算力算法数据)来驱动,而是一整套从底层芯片框架到模型训练推理等流程的系统工程化难题。
与此同时在这份数据中,也透露出了百度的经验解法:
全局技术栈,端到端优化。
早在文心一言启动邀测时,李彦宏就已经披露,百度将目前已有的AI技术栈自上而下分成了四个方面:应用层、模型层、框架层与芯片层。
四层架构之间端到端优化,进而来实现降本增效。此次飞桨与文心一言的联合优化,正好就是这套解法最直观的展现。
飞桨之于文心一言,一方面其开源分布式架构,可以支持模型大规模GPU并行训练,以提升模型的性能和效率。另一方面,连接了芯片层与模型层,将整套流程设计得更加精密和适配。
甚至业内人士这样形象化地形容:
更关键在于,如果这几层技术栈都是自主自研,那么协同合作就会更高效,效率提升也会更加明显。
这些又意味着什么?
最后,在这些行业挑战和百度经验解法之中,也透露出了大模型发展的几大趋势。
首先,大模型想要跑得快跑得稳,必须端到端优化。
OpenAI的成功一方面可以归结于自身的人才技术以及长期投入,另一方面微软从框架到算力的支持,也在其中做出了关键贡献,这才有了持续惊艳全球的ChatGPT。
只是当时这种端到端优化的范式没有被太多强调关注。而此次曝光的文心一言数据,则是更广泛地证明了端到端优化的优势。
以往大家所关注到的是大模型训练中算力、算法以及数据的必要性。但底层比如深度学习框架,对大模型训练推理的重要作用也应该被大家所广泛感知。
其次,端到端优化的趋势,也正在改变大模型赛道游戏规则。
ChatGPT风暴席卷而来,巨头们纷纷进场,大佬们前后脚创业,大模型人才被哄抢,每周都有上千个AI应用涌现……每个躬身入局的机构都在金钱、时间等方面进行抢夺与追赶。在大模型的创业浪潮中,有人把入场券门槛认为5000万美元,窗口期大概在半年到一年。
但现在这种端到端优化趋势,正在让创业窗口期越来越短。
原因无他,大模型雪球效应已经开始展现。
以百度为代表的大模型玩家,正在形成“架构-大模型-应用-数据”飞轮加速闭环。一方面,推理成本降低,加速大模型产业落地,甚至可能比上一波浪潮更快;另一方面,大模型迭代速度越来越快,产品应用具有长期持续性,商业壁垒更容易建立,对下游生态玩家而言,这自然是刚需和利好。
但与之相关,大模型创业甚至产品发布的窗口期也正在被压缩,留给大模型创业玩家的涌现的时间也不多了——
他们不光要准备金钱、时间等这些外在资源储备,还需要考虑自身产品能否还具有竞争力。另外创业的必要性也正在减弱:就动辄大几千万甚至上亿的入场券来说,既没有必要重复造轮子,也没有端到端核心积累优势。
大模型创业的机遇,会开始朝着生态和应用创新倾斜。
但也正因如此,反而更加彰显了大模型自主的重要性,因为太基础、太底层、太需要把生态放在放心安心的国产层面了。
大模型趋势再明晰不过,千行百业的落地价值也已经预见,入局是必然,但之前是否需要按照地缘区域或国界划分“造轮子”却没有共识——有些论点里,依然相信科学技术的进展会普惠到全世界。
然而随着地球另一边,OpenAI越来越Close,API输出的区别对待,中国需要自己的大模型底座,正在成为共识。
有意思的是,这在芯片、深度学习框架、底层架构平台的打造过程中,已经有过一轮讨论,有过一轮经验教训,并且还被类比为了汽车产业中的“发动机”,最后明确“发动机”必须要自主,这样产业才真正安全。
然而到了大模型竞速中,对于“变速箱”的认知,之前因为对大模型认知不完备,存在不同声音,但此役过后,应该无人再有异议了。
毕竟百度已经在打造、迭代的过程中,展现出了这种四层自研技术栈的端到端协同的必要性和重要性。
不过也正是这种必要性和重要性,进一步明示了大模型打造的残酷的游戏规则:
这背后既是端到端全栈带动的壁垒,更是数据、应用驱动飞轮之下越滚越大的雪球。
随着雪球向前,大模型产业落地的速度自然会加快,同时留给其他大模型玩家涌现的时间也越来越紧缺。
这种趋势已经开始,这种趋势还会持续。
标签:
文心一言迭代数据曝光,QPS提升10倍,留给LLM玩家的时间不多了 热点
2023-04-25
世界焦点!无障碍环境建设法草案二审稿提请审议支持既有住宅加装电梯
2023-04-25
微头条丨3D打印制成迄今最具弹性新合金
2023-04-25
富力过坎 环球微资讯
2023-04-25
市人社局市财政局关于进一步做好一次性创业补贴发放工作的通知
2023-04-25
【时快讯】任南坡出山_任南坡
2023-04-25
【世界时快讯】泰国球星赛:国乒今天迎战张本智和,面临10场外战考验(附赛程)
2023-04-25
天天观热点:2023年体育支教志愿服务将启动
2023-04-25
多家上市银行净息差跌破“警戒线” 中小银行密集下调存款利率稳息差-今日讯
2023-04-25
顺控发展(003039)2023年一季报简析:增收不增利_世界看热讯
2023-04-25
世界焦点!无障碍环境建设法草案二审稿提请审议支持既有住宅加装电梯
微头条丨3D打印制成迄今最具弹性新合金
富力过坎 环球微资讯
市人社局市财政局关于进一步做好一次性创业补贴发放工作的通知
【时快讯】任南坡出山_任南坡
【世界时快讯】泰国球星赛:国乒今天迎战张本智和,面临10场外战考验(附赛程)
天天观热点:2023年体育支教志愿服务将启动
多家上市银行净息差跌破“警戒线” 中小银行密集下调存款利率稳息差-今日讯
顺控发展(003039)2023年一季报简析:增收不增利_世界看热讯
从MBA向MTA演进是科技时代的必然趋势
缝组词_汉字缝怎么组词
广东核电集团黄凤球_广东核电集团
研发信息管理系统英文缩写_研发信息管理系统
【世界报资讯】赛尔号夜间版和普通版存档一样吗?_赛尔号夜间版
【环球新要闻】广信股份最新公告:2022年净利润增长56.53%至23.16亿元
滚动:双世宠妃2mv_双世宠妃2全集免费版云桃
全球今头条!江苏南通:“篷” 勃生机!帐篷经济折射消费新趋势
每日时讯!莎普爱思附属拟认购杭州苏银基金份额 其主要投向生物医药等领域
“神秘蜀韵 百部川扬”|《成都地名文化》系列微纪录片之《三瓦窑》_全球快报
解读一季度|④湖南工业迈向中高端_世界观点
643路区间更名为316路 全球报道
图解南都物业年报:第四季度单季净利润同比减90.27%-天天播报
雪滴花的花语和传说
部分游客呕吐腹泻!知名景区通报
全球动态:冰城古梨园“高龄”老树开花啦!137岁古梨梨花朵朵,179岁山杏“杏”味十足
解锁“自然生活”流量密码,尚品宅配随心选携手三大品牌跨界玩出圈|环球今热点
“带着我的梦想上天宫!”中国空间站期待你的来信
世界新动态:如何种植墨西哥极乐鸟_送给女朋友生日礼物贺卡怎么写好看
宝泰隆:业绩平稳彰显韧性 绿色转型抢筹未来
- 热门:富力地产(02777)收到通报批评决定书
- 阅读经典的好处议论文 阅读经典的好处|当前独家
- 《倒数说爱你》开启首站路演 魅力角色传递力量
- 葆拉·里西科_关于葆拉·里西科的简介
- 中资离岸债周报 | 上周一级新发以城投板块为主,建业地产交换要约发行完成|滚动
- 当前焦点!一周FOF研究 | 上周投资收益再现弱势,ETF成股票型FOF一季度重点配置工具
- 国家发展改革委赴山东省青岛市调研城乡融合发展
- 关于国家大事的新闻最近|世界滚动 环球速看
- 我的门派进阶攻略 我的门派进阶技巧一览 每日精选
- 闹乌龙,梅西突爆争议决定!巴萨空欢喜一场,姆巴佩发力成关键 当前焦点
- 高龄能不能转行做程序员?-环球简讯
- 国家级车联网先导区再扩容
- 新一批普通高校本科专业备案和审批结果公布_天天即时
- 世界最新:五一香港机票热度月环比上涨260% 同程旅行联合香港航空推出“一人价钱,两人飞”
- 工信部:适时出台稳定和扩大汽车消费政策
- 观焦点:2023年新能源行业政策及环境:政府出台多项新能源资金扶持政策
- 【环球速看料】天茂集团2022归母净利降42% 国华人寿归母净利降44%
- OnePlus及Oppo和小米确认采用骁龙8Gen2芯片组的新旗舰手机
- 南方能监局:为深化区域电力市场试运行奠定规则制度支撑
- 4月24日 14:55分 步 步 高(002251)股价快速拉升-热闻
- 中科星图投资新设航天科技公司,经营范围含集成电路设计
- 世界通讯!今年一季度全国地表水水质提升
- 当前关注:中国航天日 | 军事专家与飞航青年的一场思想碰撞[组图]
- 中国青爱工程和亚美尼亚驻华大使馆签订合作备忘录|环球观察
- 德国技术集团谈在华发展:持续看好中国市场,加大创新投入
- 全球热资讯!成立四年尚未盈利,“芯片茅”亲子携年内最大募资计划来了
- 声动中国|原来,大家都在读书!
- 特别好听的动物名字_好听的动物名字大全
- 观热点:@市民朋友,这份预防食物中毒小贴士请收藏
- 福彩公益金助力滨州福利事业高质量发展 环球关注
- 世界热点!中国星辰丨中国人的太空基建指南
- 果农户均年收入12万“绿色银行”是这样建成的
- 新资讯:五一民宿现涨价毁约潮 岂能只算经济账?
- in need of造句(in need of)|天天快消息
- 天天看点:港股异动 | 新华保险(01336)高开逾5% 预期一季度归母净利润同比增长110%至120%
- 列车软卧车厢按性别分配?公共议题不能顾此失彼|焦点短讯
- 选对了?中企在智能领域取得关键突破,微软CEO:中国是主要对手
- 全球讯息:平均降价84% !该类医疗耗材集采正式落地福建!
- 教师节祝福语简短10字微信短信中学_教师节祝福语简短10字 天天微头条
- 【环球报资讯】脚底长疣怎么治疗_脚底长疣的症状
- 【世界聚看点】湖州公安护航“夜经济”,他们是霓虹灯下平安“守夜人”!
- 每日快看:怎样注销支付宝账号注销_怎样注销支付宝账号
- 全球速看:仁化县气象台解除暴雨黄色预警【III级/较重】
- 对老师教师节的快乐的语句_适合祝老师节日快乐的句子
- 世界微资讯!实用小工具-规范名称
- 缺氧诱导因子是什么意思_缺氧诱导因子-全球滚动
- 大7纳智捷的油耗真的很惊人 纳智捷的大7真实油耗
- 杭州站和杭州东站有什么区别哪个离四季青近_杭州站和杭州东站有什么区别
- 执法记录仪突然天旋地转,记录下生死瞬间!|环球微动态
- 天天信息:100名地铁志愿者圆满完成“青马”服务保障