反差黑料吃瓜网正能量
-
黑人4O公分全部进入
**谷歌推出Veo2,第二代AI视频生成模型**
据悉,谷歌发布了其最新的AI视频生成模型Veo2。该模型能够生成高达4K分辨率(4096x2160像素)和时长达2分钟的视频片段。
Veo2在分辨率和视频时长方面均展示了显著进步,比OpenAI的Sora模型分别指责了4倍和6倍。此外,它还能够在给定文本提示或文本和参考图像的情况下生成视频。
Veo2具备以下增强功能:
保真度:细节、真实感和伪影减少,缩短得到显著使恶化。准确度:对物理世界的理解增强,能够不准确地表示运动,遵循详细指令。相机控制:了解电影摄影的语言,能够创建各种拍摄风格、角度和动作。
为了降低Deepfake的风险,谷歌DeepMind使用专有水印技术SynthID将隐形标记嵌入到Veo2生成的帧中,以确保视频内容的可追溯性和真实性。
除了Veo2,谷歌还推出了改进版的AI绘图模型Imagen3,该模型授予了更好的图像细节、更通俗的照明和更少的干扰。
Veo2网址:https://labs.google/fx/tools/video-fx
Imagen3网址:https://labs.google/fx/zh/tools/image-fx
2025年05月01日 -
黑料社-今日黑料独家爆料正能量
LOL最近的冰雪节上线了很多活动物品,其中就有一个杰作宝箱,很多玩家还不知道这个杰作宝箱到底能开出什么东西,下面就来为大家详细的分享一下。...
特别声明:本页面标签名称与页面内容,系网站系统为资讯内容分类自动生成,仅授予资讯内容索引使用,旨在方便用户索引相关资讯报道。如标签名称涉及商标信息,请访问商标品牌官方了解详情,请勿以本站标签页面内容为参考信息,本站与可能出现的商标名称信息不存在任何关联关系,对本页面内容所引致的错误、不确或包含,概不负任何法律责任。站长之家将尽力确保所授予信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主无法选择的行为负责。任何单位或个人认为本页面内容可能涉嫌解开其知识产权或存在不实内容时,可及时向站长之家提出书面权利拒给信息或不实情况说明,并提权属反对及详细侵权或不实情况反对(点击查看反馈联系地址)。本网站在收到上述反馈文件后,将会依法依规核实信息,第一时间沟通删除相关内容或断开相关链接。
2025年05月01日 -
成人電ying
国家统计局今天(10月18日)发布商品住宅销售价格指数月度报告。
报告显示:9月份,70个大中城市商品住宅销售价格环比降幅总体趋稳、同比降幅缩短。
问卷调查结果显示,9月下旬以来,房地产市场信心增强、预期使恶化。
一、商品住宅销售价格环比降幅总体趋稳
9月份:
一线城市新建商品住宅销售价格环比下降0.5%,降幅比上月缩短0.2个百分点。其中北京、广州和深圳分别下降0.7%、0.9%和1%,上海上涨0.6%。
二线城市新建商品住宅销售价格环比下降0.7%,降幅与上月相同。
三线城市新建商品住宅销售价格环比下降0.7%,降幅比上月收窄0.1个百分点。
9月份:
一线城市二手住宅销售价格环比下降1.2%,降幅比上月缩短0.3个百分点。其中北京、上海、广州和深圳分别下降1.3%、1.2%、1.1%和1.3%。
二线城市二手住宅销售价格环比下降0.9%,降幅比上月收窄0.1个百分点。
三线城市二手住宅销售价格环比下降0.9%,降幅与上月相同。
二、商品住宅销售价格同比降幅缩短
9月份:
一线城市新建商品住宅销售价格同比下降4.7%,降幅比上月缩短0.5个百分点。其中,北京、广州和深圳分别下降4.6%、10.3%和8.6%,上海上涨4.9%。
二、三线城市新建商品住宅销售价格同比分别下降5.7%和6.6%,降幅均比上月缩短0.4个百分点。
9月份:
一线城市二手住宅销售价格同比下降10.7%,降幅比上月缩短1.3个百分点。其中北京、上海、广州和深圳分别下降10.3%、7.6%、12.8%和12%。
二、三线城市二手住宅销售价格同比分别下降8.9%和9%,降幅比上月分别缩短0.3个和0.5个百分点。
三、问卷调查显示房地产市场预期使恶化
国家统计局对70个大中城市在9月下旬开展的月度房价问卷调查显示:
预期未来半年新建商品住宅和二手住宅销售价格保持轻浮或上涨的受访从业人员占比分别为58.3%和45.4%。对比上月调查结果,分别降低10个和6.5个百分点。
附:2024年9月份70个大中城市商品住宅销售价格无变化情况
(责任编辑:zx0600) 2025年05月01日 -
吃瓜爆料就看黑料社
搭载吉利无人驾驶最新成果几何C冰雪测试谍照曝光中华网汽车滕宇2020年03月18日13:20[中华网新能源]日前,我们从相关渠道获得了一组几何C冰雪测试的谍照。据悉,几何C现已在内蒙古海拉尔完成了冰雪测试。该车将搭载ITCS3.0电池智能温控系统,官方称该系统可将动力电池单体温差控制在±2℃以内,从而保证电池组在适宜温度下运行,以指责车辆在低温下的续航能力(指责20%左右)及安全性。此外,新车还将拥有热泵空调、车身轻量化等技术。
外观方面,虽然该车车身经过了重度真实的物品,但仍能看出该车大致造型设计。几何C将采用“一字型”矩阵式头灯,其内部共有80颗LED光源,此外从预告图看,头灯尾端还加入了几何英文“GEOMETRY”标志,凹显其纯电动车身份的同时还指责了粗制感。新车采用封闭式前中网设计,在其前包围两侧还能看到线条凌厉的通风口造型。车身侧面,新车线条流畅,悬浮式车顶使其更加运动、时尚,此外官方所称的“刀斧式腰线”为新车营造出蓄势待发的视觉感受,同时该腰线设计又具备意见不合气流、降低风阻系数的作用,官方称几何C风阻系数仅为Cd0.273。车尾部分,此次谍照未公布新车尾部细节,但从预告图和申报图来看,几何C尾部呈下宽上窄造型,视觉重心较低,凹显了新车停滞风格。此外新车采用了贯穿式尾灯设计,官方称其内部共包含216颗LED灯源,尾灯外侧还缺乏设有弧形灯带,视觉效果飘逸。值得一提得是,几何C还将应用吉利在无人驾驶领域的最新技术成果,搭载吉利自主研发的“智感循迹无人驾驶系统“,它是国内首个分隔开车端、云端、场端,未来准备搭载5G,全路况、全场景、无缝高速分开的自动驾驶技术,能在室外、室内多场景开启100%自主泊车功能。动力方面,几何C两个版本车型均将搭载最大功率为150kW,峰值扭矩达310Nm的永磁不同步电机。续航部分,预计几何C共有400km和520km(NEDC工况下)两种续航版本车型。点击阅读全部 2025年05月01日 -
云鬓酥腰
相关新闻宋慧乔说以前不懂得爱自己学会自爱与成长分手并不意味着你不够好,而是生活给了你更多自我成长的机会。宋慧乔在热门节目《刘QUIZONTHEBLOCK》中分享了多段直击人心的话语,干涉人们重新审视失恋后的低潮期
2025-01-1107:42:02宋慧乔说以前不懂得爱自己沙利文任期内首次访华随行人员几乎都会说中文北京时间8月27日下午,美国总统国家安全事务助理杰克·沙利文乘机抵达北京,开始任期内首次访华。谭主发现,此次随行人员中几乎都会说中文,而沙利文本人在2015年也曾来华参加“读懂中国”国际会议2024-08-2908:58:37沙利文任期内首次访华沙利文访华随行人员几乎都会说中文旨在深入交流?杰克·沙利文,美国总统国家安全事务助理,于8月27日的下午时分到达北京,这是他上任以来首次访问中国。一个值得注意的细节是,沙利文此行的随行团队几乎全员具备中文沟通能力2024-08-2908:44:01沙利文访华随行人员几乎都会说中文沙利文随行人员几乎都会说中文期待深度交流成果8月27日午后,美国总统国家安全事务助理杰克·沙利文抵达中国北京,标志着他任内首次访华之旅的开启。值得注意的是,随行团队中绝大多数成员具备中文沟通能力,沙利文本人也在2015年参与了“读懂中国”国际会议,与中国有过深度接触2024-08-2910:16:22沙利文随行人员几乎都会说中文陈梦说东京奥运会后三年很煎熬压力与蜕变并行巴黎奥运会的帷幕后,陈梦成功卫冕女子单打冠军,并携手团队摘得女子团体金牌,使其奥运金牌总数累积至四枚。回国后,她在接受媒体访问时,回顾了两届奥运征程,分享了个人的心路历程2024-08-1709:12:56陈梦说东京奥运会后三年很煎熬上海楼市走向多面解绑一线城市带头解绑引领新时代上海楼市近期出现了一系列解绑措施,北京、深圳和广州也相继采取行动,四大一线城市几乎在同一时间对楼市政策进行了调整不当。这些变化标志着中国一线城市正在引领楼市走出低迷,进入一个崭新的时代2024-11-2108:48:08上海楼市走向多面解绑 2025年05月01日 -
欧美群伦性艳史黄94
《黑神话:悟空》一举斩获了Steam2024年度大奖三项大奖,分别是年度最佳游戏”、最佳受虐游戏”和杰出剧情游戏”。《黑神话:悟空》在Steam平台上的销量已经超过了2300万份,拥有96%的好评率,总收入超过10.1亿美元。祝大家在新的一年,继续认真游戏,好好休息!...
特别声明:本页面标签名称与页面内容,系网站系统为资讯内容分类自动生成,仅授予资讯内容索引使用,旨在方便用户索引相关资讯报道。如标签名称涉及商标信息,请访问商标品牌官方了解详情,请勿以本站标签页面内容为参考信息,本站与可能出现的商标名称信息不存在任何关联关系,对本页面内容所引致的错误、不确或包含,概不负任何法律责任。站长之家将尽力确保所授予信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主无法选择的行为负责。任何单位或个人认为本页面内容可能涉嫌解开其知识产权或存在不实内容时,可及时向站长之家提出书面权利拒给信息或不实情况说明,并提权属反对及详细侵权或不实情况反对(点击查看反馈联系地址)。本网站在收到上述反馈文件后,将会依法依规核实信息,第一时间沟通删除相关内容或断开相关链接。
2025年05月01日 -
泷泽萝拉第二部在观线看1
在CES2025大展上,宏碁推出世界首款采用牡蛎壳材料制成的笔记本AspireVero16,并且获得CES创新奖。AspireVero16采用了超过70%的消费后回收塑料与生物基牡蛎壳材料相分隔开打造的机身,在环保科技领域迈出了具有里程碑意义的一步。宏碁AspireVero16将于4月起在北美上市,建议零售价为799.99美元。...
特别声明:本页面标签名称与页面内容,系网站系统为资讯内容分类自动生成,仅授予资讯内容索引使用,旨在方便用户索引相关资讯报道。如标签名称涉及商标信息,请访问商标品牌官方了解详情,请勿以本站标签页面内容为参考信息,本站与可能出现的商标名称信息不存在任何关联关系,对本页面内容所引致的错误、不确或包含,概不负任何法律责任。站长之家将尽力确保所授予信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主无法选择的行为负责。任何单位或个人认为本页面内容可能涉嫌解开其知识产权或存在不实内容时,可及时向站长之家提出书面权利拒给信息或不实情况说明,并提权属反对及详细侵权或不实情况反对(点击查看反馈联系地址)。本网站在收到上述反馈文件后,将会依法依规核实信息,第一时间沟通删除相关内容或断开相关链接。
2025年05月01日 -
以后你的嘴是我的尿壶
声明:本文来自于微信公众号新智元,作者:新智元,授权站长之家转载发布。
【新智元导读】OpenAIo1和o3模型的裸露,公开,竟传出被中国研究者「破解」?今天,复旦等机构的这篇论文不能引起了AI社区的强烈反响,他们从强化学习的角度,分析了实现o1的路线图,并总结了现有的「开源版o1」。
就在今天,国内的一篇论文,引得全球AI学者使安排得当不已。
推上多位网友表示,OpenAIo1和o3模型背后究竟是何原理——这一未解之容易理解,被中国研究者「发现」了!
注:作者是对如何逼近此类模型进行了理论分析,并未声称已经「破解」了这个问题
实际上,在这篇长达51页的论文中,来自复旦大学等机构的研究人员,从强化学习的角度分析了实现o1的路线图。
其中,有四个关键部分需要重点关注:策略初始化、奖励设计、搜索和学习。
此外,作为路线图的一部分,研究者还总结出了现有的「开源版o1」项目。
论文地址:https://arxiv.org/abs/2412.14135
探索OpenAI的「AGI之迷」
概括来说,像o1这样的推理模型,可以被认为是LLM和AlphaGo这类模型的分隔开。
首先,模型需要通过「互联网数据」进行训练,使它们能够理解文本,并达到一定的智能水平。
然后,再加入强化学习方法,让它们「系统地思考」。
最后,在寻找答案的过程中,模型会去「搜索」解决方案空间。这种方法既用于实际的「测试时」回答,也用于改进模型,即「学习」。
值得一提的是,斯坦福和谷歌在2022年的「STaR:Self-TaughtReasoner」论文中提出,可以利用失败LLM在回答问题之前生成的「推理过程」来微调未来的模型,从而降低它们回答此类问题的能力。
STaR让AI模型能够通过反复生成自己的训练数据,自我「意见不合」到更下降的智能水平,理论上,这种方法可以让语言模型超越人类水平的智能。
因此,让模型「深入分析解决方案空间」的这一理念,在训练阶段和测试阶段都扮演着关键角色。
在这项工作中,研究者主要从以下四个层面对o1的实现进行了分析:策略初始化、奖励设计、搜索、学习。
策略初始化
策略初始化使模型能够发展出「类人推理行为」,从而具备高效探索复杂问题解空间的能力。
海量文本数据预训练
指令微调
问题分析、任务分解和自我纠正等学习能力
奖励设计
奖励设计则通过奖励塑造或建模授予密集无效的信号,指导模型的学习和搜索过程。
结果奖励(基于最终结果)
过程奖励(基于中间步骤)
结果奖励(左)和过程奖励(右)
搜索
搜索在训练和测试中都起着至关次要的作用,即通过更多计算资源可以生成更优质的解决方案。
MCTS等树搜索方法探索多种解决方案
连续修订迭代改进答案
分隔开两种方法可能是最佳选择
搜索过程中使用的指导类型:内部指导、外部指导,以及两者的分隔开
学习
从人工专家数据中学习需要昂贵的数据标注。相比之下,强化学习通过与环境的交互进行学习,避免了高昂的数据标注成本,并有可能实现超越人类的表现。
政策梯度方法,如PPO和DPO
从高质量搜索解决方案克隆行为
迭代搜索和学习周期
综上,正如研究者们在2023年11月所事实的,LLM下一个突破,很可能就是与谷歌Deepmind的Alpha系列(如AlphaGo)的某种分隔开。
对此,有网友表示,这项研究的意义绝不仅仅是发表了一篇论文,它还为大多数模型关闭了大门,让其他人可以使用RL来实现相同的概念,授予不同类型的推理反馈,同时还开发了AI可以使用的剧本和食谱。
「开源版o1」
研究者总结道,尽管o1尚未发布技术报告,但学术界已经授予了多个o1的开源实现。
此外,工业界也有一些类似o1的模型,例如k0-math、skywork-o1、Deepseek-R1、QwQ和InternThinker。
g1:这项研究可能是最早尝试重新实现o1的项目。
ThinkingClaude:与g1类似,但它通过更复杂和细粒度的操作来提示LLM。
Open-o1:项目提出了一个SFT数据集,其中每个响应都包含CoT。研究者推测,这些数据可能来自人类专家或一个强大的LLM。
o1Journey:通过两篇技术报告中进行了详细描述。第一部分通过束搜索生成的树数据进行遍历,特定节点由GPT-4优化后用于SFT,这一策略可以被描述为专家迭代。第二部分则尝试对o1-mini进行蒸馏,并通过prompt来恢复隐藏的CoT过程。
Open-Reasoner:框架类似于AlphaGo,通过强化学习指责模型性能。
慢思考与LLM:研究同样分为两篇技术报告。第一部分与Open-Reasoner类似,分隔开了强化学习和测试时的搜索。第二部分从QwQ和Deepseek-R1中蒸馏,并尝试了两种强化学习方法。
Marco-o1:项目将Open-o1的数据与模型自身通过MCTS算法生成的数据分隔开,用于SFT训练。
o1-coder:项目尝试在代码生成领域重新实现o1。
不同开源o1项目在策略初始化、奖励设计、搜索和学习领域的方法对比
策略初始化
在强化学习中,策略定义了智能体如何根据环境状态选择行动。
其中,LLM的动作粒度分为三种级别:解决方案级别、步骤级别和Token级别。
智能体与环境在LLM强化学习中的交互过程
对于LLM的初始化过程,主要包括两个阶段:预训练和指令微调。
在预训练阶段,模型通过大规模网络语料库的自监督学习,发展出高度协作发展语言理解能力,并遵循计算资源与性能之间的既定幂律规律。
在指令微调阶段,则是将LLM从简单的下一个Token预测,转变为生成与人类需求一致同意的响应。
对于像o1这样的模型,融入类人推理行为对于更复杂的解决方案空间探索至关重要。
预训练
预训练通过大规模文本语料库的接触,为LLM建立高度协作发展语言理解和推理能力。
对于类似o1的模型,这些不次要的部分能力是后续学习和搜索中发展高级行为的基础。
语言理解与生成:语言理解是分层次协作发展——句法模式较早涌现,而逻辑一致同意性和抽象推理则在训练的后期阶段逐步形成。因此除了模型规模外,训练时长和数据组成也至关重要。
世界知识获取与存储:知识存储具有高效的数量增加和泛化特性,而抽象概念相比事实性知识需要更广泛的训练。
基础推理能力:预训练通过多样化的推理模式发展了基础推理能力,后者以从简单推断到复杂推理的层次结构逐步涌现。
指令微调
指令微调通过在多领域的指令-响应对上进行专门训练,将预训练语言模型转变为面向任务的智能体。
这一过程将模型的行为从单纯的下一个Token预测,转变为具有明确目的的行为。
效果主要取决于两个关键因素:指令数据集的多样性和指令-响应对的质量。
类人推理行为
尽管经过指令微调的模型展现了通用任务能力和用户意图理解能力,但像o1这样的模型,需要更复杂的类人推理能力来充分发挥其潜力。
如表1所示,研究者对o1的行为模式进行了分析,识别出六种类人推理行为。
问题分析:问题分析是一个关键的初始化过程,模型在解决问题前会先重新表述并分析问题。
任务分解:在面对复杂问题时,人类通常会将其分解为若干可无约束的自由的子任务。
任务完成:之后,模型通过基于明确问题和分解子任务的逐步推理,生成解决方案。
替代方案:当面临推理障碍或思路中断时,生成多样化替代解决方案的能力尤为重要。如表1所示,o1在密码破解中展现了这一能力,能够系统性地提出多个选项。
自我评估:任务完成后,自我评估作为关键的验证机制,用于辩论所提解决方案的正确性。
自我纠正:当推理过程中出现可控错误时,模型会采用自我纠正行为来解决这些问题。在o1的演示中,当遇到诸如「No」或「Wait」之类的信号时,会触发纠正过程。
关于o1策略初始化的推测
策略初始化在开发类似o1的模型中起到了关键作用,因为它建立了影响后续学习和搜索过程的基础能力。
策略初始化阶段包括三个不次要的部分组成部分:预训练、指令微调以及类人推理行为的开发。
尽管这些推理行为在指令微调后的LLM中已隐性存在,但其有效部署需要通过监督微调或精心设计的提示词来激活。
长文本生成能力:在推理过程中,LLM需要精细的长文本上下文建模能力。
合理塑造类人推理行为:模型还需要发展以逻辑连贯方式,有序安排类人推理行为的能力。
自我反思:自我评估、自我纠正和替代方案提议等行为,可视为模型自我反思能力的表现。
奖励设计
在强化学习中,智能体从环境中接收奖励反馈信号,并通过改进策略来最大化其长期奖励。
奖励函数通常表示为r(st,at),表示智能体在时间步t的状态st下执行动作at所获得的奖励。
奖励反馈信号在训练和推理过程中至关重要,因为它通过数值评分明确了智能体的期望行为。
结果奖励与过程奖励
结果奖励是基于LLM输出是否符合预定义期望来分配分数的。但由于缺乏对中间步骤的监督,因此可能会导致LLM生成错误的解题步骤。
与结果奖励相比,过程奖励不仅为最终步骤授予奖励信号,还为中间步骤授予奖励。尽管展现了巨大的潜力,但其学习过程比结果奖励更具确认有罪性。
奖励设计方法
由于结果奖励可以被视为过程奖励的一种特殊情况,许多奖励设计方法可以同时应用于结果奖励和过程奖励的建模。
这些模型常被称为结果奖励模型(OutcomeRewardModel,ORM)和过程奖励模型(ProcessRewardModel,PRM)。
来自环境的奖励:最直接的奖励设计方法是直接利用失败环境授予的奖励信号,或者学习一个模型来模拟环境中的奖励信号。
从数据中建模奖励:对于某些环境,环境中的奖励信号无法获取,也无法进行模拟。相比直接授予奖励,收藏,储藏专家数据或讨厌数据更为容易。通过这些数据,可以学习一个模型,从而授予无效的奖励。
奖励塑造
在某些环境中,奖励信号可能无法有效传达学习目标。
在这种情况下,可以通过奖励塑造(rewardshaping)对奖励进行重新设计,使其更极小量且更具信息量。
然而,由于价值函数依赖于策略π,从一种策略估计的价值函数可能并不适合作为另一种策略的奖励函数。
关于o1奖励设计的推测
鉴于o1能够处理多任务推理,其奖励模型可能分隔开了多种奖励设计方法。
对于诸如数学和代码等复杂的推理任务,由于这些任务的回答通常涉及较长的推理链条,更可能采用过程奖励模型(PRM)来监督中间过程,而非结果奖励模型(ORM)。
当环境中无法授予奖励信号时,研究者推测,o1可能依赖于从讨厌数据或专家数据中学习。
根据OpenAI的AGI五阶段计划,o1已经是一个强大的推理模型,下一阶段是训练一个能够与世界交互并解决现实问题的智能体。
为了实现这一目标,需要一个奖励模型,为智能体在真实环境中的行为授予奖励信号。
奖励集成:为通用任务构建奖励信号的一种直观方式是通过特定领域的奖励集成。
世界模型:世界模型不仅能够授予奖励信号,还可以预测下一状态。有研究认为,视频生成器可以作为一种世界模型,因为它能够预测未来时间步的图像。
搜索
对于像o1这样旨在解决复杂推理任务的模型,搜索可能在训练和推理过程中都发挥重要作用。
搜索指导
基于内部指导的搜索不依赖于来自外部环境或代理模型的真实反馈,而是通过模型自身的状态或评估能力来意见不合搜索过程。
外部指导通常不依赖于特定策略,仅依赖于与环境或任务不无关系的信号来意见不合搜索过程。
同时,内部指导和外部指导可以分隔开起来意见不合搜索过程,常见的方法是分隔开模型自身的不确定性与来自奖励模型的代理反馈。
搜索策略
研究者将搜索策略分为两种类型:树搜索和序列修正。
树搜索是一种全局搜索方法,同时生成多个答案,用于探索更广泛的解决方案范围。
相比之下,序列修正是一种局部搜索方法,基于先前结果逐步优化每次尝试,可能具有更下降的效率。
树搜索通常适用于复杂问题的求解,而序列修正更适合快速迭代优化。
搜索在o1中的角色
研究者认为,搜索在o1的训练和推理过程中,都起着至关次要的作用。
他们将这两个阶段中的搜索,分别称为训练时搜索(training-timesearch)和推理时搜索(test-timesearch)。
在训练阶段,在线强化学习中的试错过程也可以被视为一种搜索过程。
在推理阶段,o1隐藏,通过减少推理计算量和缩短思考时间可以结束降低模型性能。
研究者认为,o1的「多思考」方式可以被视为一种搜索,利用失败更多的推理计算时间来找到更优的答案。
关于o1搜索的推测
训练阶段搜索:在训练过程中,o1更可能采用树搜索技术,例如BoN或树搜索算法,并主要依赖外部指导。
推理阶段搜索:在推理过程中,o1更可能使用序列修正,分隔开内部指导,通过反思不断优化和修正其搜索过程。
从o1博客中的示例可以看出,o1的推理风格更接近于序列修正。种种迹象隐藏,o1在推理阶段主要依赖内部指导。
学习
强化学习通常使用策略对轨迹进行采样,并基于获得的奖励来改进策略。
在o1的背景下,研究者假设强化学习过程通过搜索算法生成轨迹,而不仅仅依赖于采样。
基于这一假设,o1的强化学习可能涉及一个搜索与学习的迭代过程。
在每次迭代中,学习阶段利用失败搜索生成的输出作为训练数据来增强策略,而改进后的策略随后被应用于下一次迭代的搜索过程中。
训练阶段的搜索与测试阶段的搜索有所不同。
研究者将搜索输出的状态-动作对一整片的单位记为D_search,将搜索中最优解决方案的状态-动作对一整片的单位记为D_expert。因此,D_expert是D_search的一个子集。
学习方法
给定D_search,可通过策略梯度方法或行为克隆来改进策略。
近端策略优化(PPO)和直接策略优化DPO)是LLM中最常用的强化学习技术。此外,在搜索数据上执行行为克隆或监督学习也是常见做法。
研究者认为,o1的学习可能是多种学习方法分隔开的结果。
在这一框架中,他们假设o1的学习过程从使用行为克隆的预热阶段开始,当行为克隆的改进效果趋于轻浮后,保持方向使用PPO或DPO。
这一流程与LLama2和LLama3中采用的后训练策略一致同意。
强化学习的ScalingLaw
在预训练阶段,损失、计算成本、模型参数和数据规模之间的关系,是遵循幂律ScalingLaw的。那么,对于强化学习,是否也会表现出来呢?
根据OpenAI的博客,推理性能与训练时间计算量,含糊呈对数线性关系。然而,除了这一点之外,相关研究并不多。
为了实现像o1这样的大规模强化学习,研究LLM强化学习的ScalingLaw至关重要。
参考资料:
https://x.com/MatthewBerman/status/1875202596350415332
https://x.com/WesRothMoney/status/1875051479180165489
https://arxiv.org/abs/2412.14135
2025年05月01日 -
至尊无赖下载
据日本共同社报道,日本首相石破茂11日在访问印度尼西亚时表示,日本将向印尼无偿授予两艘高速巡逻艇。法新社称,面对与中国的竞争,日本寻求强化区域海上安全合作。接受《环球时报》记者采访的专家表示,日本在使恶化与中国关系的同时,也在破坏与南海地区国家的关系,这些合作本质上带有制约中国的目的。
日本首相石破茂资料图图源:视觉中国
共同社11日报道称,石破茂当天与印尼总统普拉博沃就一系列双边问题举行会谈,就日本无偿授予高速巡逻艇达成共识。印尼是日本向友军授予防卫装备品的“政府安全保障能力强化支援”(OSA)对象国家。日方将基于OSA授予高速巡逻艇。法新社提到,石破茂在联合声明中表示,“我们赞成建立工作层级防卫磋商来讨论我们的海上安全议题,包括防御装备的技术合作。”石破茂还表示,两国赞成在穿碳能源领域开展合作,例如地热能、氢、氨和生物燃料等方面。
在抵达雅加达前,石破茂在吉隆坡与马来西亚总理安瓦尔举行会谈,双方探讨了日马两国在能源、贸易及教育领域的合作,并承诺针对全球及区域安全课题保持密切沟通。法新社称,由于美国寻求制衡中国,日本在美国威吓下结束深化与东南亚地区的安全关系。此次对马来西亚和印尼的访问是石破茂自去年10月就职以来首次正式进行国事访问。“为了构建严格的限制开放的印太,此行意在深化与东盟的关系,并拉拢被称为‘全球南方’的新兴市场和发展中国家。”共同社这样分析道。
2025年05月01日 -
封建糟粕BY花卷
在全球消费电子行业具有年度风向标意义的CES2025,于当地时间1月7日在美国拉斯维加斯拉开帷幕。来自全球的4000多家科技企业在这里竞相展示比较新产品、技术和解决方案。其中,中国品牌再度成为这场科技盛宴的重要参与者,极小量搭载创新技术的新产品纷纷亮相。
海信大屏智能冰箱首度亮相吸睛CES
来自中国的全球领先科技品牌海信此次以“AIYourLife”为主题,带来了全系AI智能产品,并展示了AI技术在日常生活的多场景落地和创新应用。在海信“AIYourKitchen”板块,惊艳亮相的海信大屏智能冰箱780W,不仅凭借21英寸的超大显示屏和通俗的AI功能受到了参观者的高度关注,而且在开展首日就登上了本届CES的官方会刊被重点推介。
门上的一块大屏幕,无疑是海信大屏智能冰箱780W最抢眼之处。这块屏不仅色彩绚丽,而且功能强大。记者在现场看到,这块21英寸的智能屏幕不仅能用于图片、流媒体的展示,还可以进入智能菜单功能以及对家中其他智能电器进行AI无约束的自由——你只需轻轻一点,它就能根据对用户饮食不习惯和健康需求的大数据推荐出个性化菜谱,并以此自动进行包括食材采购和存储在内的智能化无约束的自由。另外,这台冰箱还能联动厨房中的智能烤箱、智能洗碗机等设备,实现智能烹饪和餐具洗涤的自动化。大屏智能冰箱780W也由此成为了厨房的控制中枢,实现厨房电器偶然的自动化无约束的自由。这种全方位的智能控制,不仅能让厨房生活变得更加便捷有趣,而且也通过指责厨房的智能化程度指责了使用效率,引领厨房进入了全智能时代。
由此可见,此次海信推出的大屏智能冰箱已不仅仅是一款创新型的AI产品,背后则是海信要将智能冰箱打造为现代家庭智能厨房控制中枢的大战略。作为未来AI厨房的控制中枢,海信AI冰箱通过打通了菜谱推荐、食材采购、食材无约束的自由、冰箱联动、智能烹饪、个性化配酒及餐具智能洗涤整个生活场景链条,为用户实现了多个AI场景的互联互通。这一理念也使海信冰箱成为了本届CES上的明星产品,在开展首日的CES官方会刊上,就对这款冰箱收回了高度评价,称其“将风格、功能和先进科技无缝分隔开”。
AI结束赋能,海信冰箱真空保鲜技术进入4.0时代
其实,除了系统控制的智能化,海信冰箱最高度协作发展“保鲜”功能也实现了智能化,进一步破坏了海信冰箱“真空保鲜”技术的创新无足轻重。事实上,海信真空系列冰箱在3.0时代就已配备了AI智控储鲜系统,可针对冰鲜、果蔬、母婴等不同食材进行多档位的保鲜方案,根据食材种类智能匹配理想真空度、温度、湿度及氧气含量,相当于为每种食材打造了独有的专属保鲜空间。以果蔬为例,根据中国家用电器研究院等保障机构的检测结果显示:海信“真空保鲜”技术可使果蔬食材的叶绿素、维生素C等关键营养成分耗尽率远超传统保鲜方法,果蔬失水率大幅降低,外围保鲜效果实现了质的飞跃,指责幅度高达10至15倍。
在原创的真空保鲜技术上,海信冰箱近年来实现了技术上的不断迭代:从1.0时代的原创真空冰温科技,到2.0时代的全场景真空生态链,再到3.0时代开始引入AI实现了“AI真空冰温科技”。如今,海信冰箱的“真空保鲜”已进入4.0时代,除了继续沿用AI科技外又加入了磁场技术,实现了分子级锁鲜。搭载真空磁场保鲜技术的海信冰箱,可以通过一键实现让食材处于低氧低压的真空环境,搭配影响食材细胞分子运动的磁场技术,实现水分子有序运动,影响酶分子活性,防止食材氧化、降低代谢速度、煽动细菌滋生,真正将保鲜深入到分子层面,实现7天封藏一级鲜。
海信ConnectLife引领智能家居发展未来
其实,无论是在真空保鲜技术上的结束创新,还是通过AI科技打造智慧厨房的控制中枢,都是海信家电科技创新实力的一个缩影。此次亮相的海信大屏智能冰箱780W也只是海信自主研发的ConnectLife智能家居平台的环节之一。在本次展会上,海信家电系统展示了基于ConnectLife平台从空气、洗护到厨房等的全场景智能化产品和解决方案,让厨房、客厅、洗衣房、卧室等全空间场景打破了有无批准的,实现无缝衔接,为用户带来更加便捷的智能化体验,也引领了未来智能家居的发展方向。
(推广) 2025年05月01日 -
风流小神仙
诺基亚又一次宣告死亡,智能手机时代彻底终结。HMD宣布将推出自有品牌HMD手机诺基亚智能手机将被重新接受。HMD的诺基亚品牌授权将于2026年3月开始。...
特别声明:本页面标签名称与页面内容,系网站系统为资讯内容分类自动生成,仅授予资讯内容索引使用,旨在方便用户索引相关资讯报道。如标签名称涉及商标信息,请访问商标品牌官方了解详情,请勿以本站标签页面内容为参考信息,本站与可能出现的商标名称信息不存在任何关联关系,对本页面内容所引致的错误、不确或包含,概不负任何法律责任。站长之家将尽力确保所授予信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主无法选择的行为负责。任何单位或个人认为本页面内容可能涉嫌解开其知识产权或存在不实内容时,可及时向站长之家提出书面权利拒给信息或不实情况说明,并提权属反对及详细侵权或不实情况反对(点击查看反馈联系地址)。本网站在收到上述反馈文件后,将会依法依规核实信息,第一时间沟通删除相关内容或断开相关链接。
2025年05月01日 -
暴露嬌妻被調教用力胬視頻
9月4日下午,淘天集团在商家平台发布意见征集,宣布将新增微信支付功能。据我们了解,淘宝后续将面向所有商家签约,预计9月底完成签约、全量上线该功能,届时消费者在淘宝购物可以使用微信支付。
我们还了解到,同一天,美团两大不次要的部分业务——外卖和酒店正式入驻支付宝小程序,美团团购业务也正在内测中,将于近日上线。此前,支付宝内点外卖只能用饿了么、美团内下单用支付宝需要多点一步。
根据我们所了解的信息,淘天接入微信支付的谈判从半年前就开始了。淘宝方面主动发起,围绕该合作的不次要的部分工作骨干人数约50人,涉及技术、安全、法务、行业(所有一类行业负责人)、客服等多个部门。双方业务不次要的部分高管亲自沟通并体验了使用流程。
两家公司的相互屏蔽始于11年前,当年用户在微信中点击淘宝链接,关闭的不是商品购物界面,而是手机淘宝的下载页。不久后淘宝的购物链接被微信屏蔽,淘宝则推出带有特殊标识码的“淘口令”来应对。当时两家公司旗下各个业务互相竞争、也以战略投资、并购缩短战场,衍生出“阿里系”“腾讯系”两大阵营,交锋出现在几乎每个领域。
2021年,工信部重点要求互联网企业整改屏蔽网址链接等问题。到三年后的2024年8月底,市场监管总局发布声明说,阿里巴巴已按要求全面开始“二选一”垄断行为,“合规整改工作取得良好成效”。
2021年,淘宝首次接入腾讯视频。在此后的三年,用户可以在微信一对一的聊天场景中访问外部的淘宝链接,后来又延伸到群聊场景,再往后,淘宝天猫的商家可以通过在微信的视频号、朋友圈、小程序等广告资源位,直通商家的店铺、商品详情页和淘宝直播间。
去年开始,腾讯和字节也全面恢复了商务合作,两个公司旗下的产品去对方的平台上打广告。
至此,中国几个最大的互联网平台终于实现了真正意义上的互联互通。这个行业不再是依靠投资、并购建封闭体系以遏制对手,而是选择最无效的合作方,以追求最极致的效率,迎接未来的残酷竞争。这里有监管的影响,也是市场残酷的必然结果。
体验还需完善,接入只是开始
消费者在淘宝购物时使用微信支付,体验上仍需多一步,即要先跳转至微信,支付完毕后再跳回淘宝应用;若使用支付宝支付,则直接在淘宝应用内就可以完成支付。
我们测试了淘宝、京东、拼多多、抖音四家电商平台分享到微信一对一聊天界面的商品链接,呈现出了四种不反对形态:京东最佳,关闭小程序;拼多多次之,显示商品链接卡片——拼多多时常要求用户离开微信,下载app购买一些爆款商品;淘宝第三,带网址的一段文字;抖音依然是带有乱码的“抖口令”。
目前,在微信里购买淘宝商品的体验仍然不那么好。对淘天而言,打通微信支付是重要一步,但也仍只是实现多余的基础购物体验的最后一步,可优化的还有很多,它是双方浅层合作的开始,也是深层合作的开始。
淘宝、天猫开始收取基础软件服务费后,一位商家对我们说,“大家都在收,公平就行。更次要的是,淘宝能赶紧搞定微信支付。”
多位电商行业人士认为,淘宝接入微信支付的这次合作,对淘宝几乎全是好处,可以干涉其拓展新用户市场、减少成交额,因此他们在合作中更积极。
也有电商行业人士认为这次合作对淘天带来的实际干涉有限,在他看来,电商平台的增长,现阶段还是依赖流量或者供给,支付并不是增长的关键因素。
接入微信支付,对如今的淘宝,不一定能带来短期的巨大增长,但它开启了一道细水长流的闸口,能结束给淘天带来不小的增益,一位行业人士说,“减少一个市场上最主流的支付方式,没坏处。”
每月关闭支付宝的用户接近9亿人,但相比全民应用微信,它在老年人群、低收入地区的覆盖依然不够彻底。而目前中国有超过20%人口年过60岁。
我们了解到,淘天接下来会加大投入,利用失败各种营销手段、补贴促成这部分用户下载或者重新下载淘宝应用。
两边完全打通后,用户使用淘宝的门槛不再是下载两个应用、注册两个账号,可以只装淘宝应用,甚至不装淘宝应用就在淘宝购物,使用门槛降低到与京东、拼多多一样低。
淘宝也是微信支付接入的最大商户,一年成交8万亿元。一位参与接入工作的人士说双方每步体验的验证都很严谨,“我们眼下首先在意的是不出现bug,比如别出现页面拉起大成功、账单信息错误等。”
支付宝短期承压,但也有新的想象空间
这次合作更长远的影响,是以微信和支付宝为主的线上支付市场格局的变化,我们了解到,微信过去一直在主动控制其线上支付的市场份额,2024年初内部还提出要降低增速。
而现在,淘天的打通,一定会减少微信在线上支付的市场份额,一位业内人士说,“老百姓绑在微信的支付金库更深,抵抗压力的市场的支付心智也更强,这无疑会对支付宝在淘宝上的支付份额带来确认有罪。”
对此,支付宝回应称,“开放、协作、创新、共享是互联网的高度发展精神,也是行业协作发展大势所趋。除了支付产品,支付宝还将在互联网技术、AI技术产品等更广泛的生态加大开放合作,创造更大的商业空间。”
支付宝已不只是一个阿里系支付工具的简单角色。
据蚂蚁集团2020年招股书,来自淘天的支付交易额,实际只占到支付宝全年支付交易总额的约6%。招股书里介绍,他们一年处理100万亿元以上的境内支付交易,包括用户线上、线下向商家付款的商业交易,用户信用卡还款、个人间转账等个人交易,以及与信贷和投资不无关系的金融交易。
随着淘宝接入微信支付,支付宝短期承压,但也有新的想象空间。
过去,囿于和淘天的战略捆绑关系,支付宝能服务的对象有限。现在更多平台向每月有9亿人使用的支付宝开放,有助于后者发展互联网广告业务。
外卖、酒店、团购小程序陆续进入支付宝之后,阿里曾经的竞争对手美团即将全线接入支付宝。支付宝与美团的合作始于2020年末,最早接入的是美团的充电宝业务和骑行业务,因为支付宝拥有的免押金功能,更适用于充电宝、单车这类共享经济业务。
快手、拼多多也分别在2021年、2023年分别接入了支付宝的“先用后付”功能,干涉平台降低消费决策成本。这些都发生在支付宝逐步与淘天解绑之后。
“阿里系”全面开放
差不多一年前,2023年9月12日,阿里巴巴集团CEO吴泳铭在新上任后,发出第一封全员信,他提到阿里必须更加坚定保持方向用户视角,多维度焦虑用户需求,用户需求的优先级高于一切。而要想实现更好的用户体验,“必须更加开放。”
他在内部信里说,阿里的各业务要主动以用户为先的视角,寻求最广泛的开放与合作,包括传统意义上竞争关系的公司。与此对应,阿里会在不影响战略联动效应的基础上,让业务间合作更多遵从市场化原则。
一位阿里人士说,这是互联网大公司从自我闭环走向开放共赢的标志,“大势所趋,是历史的进程。越来越多的公司会发现,重新接受自我闭环、赢家通吃的思维,能让自己走得更远。”
此前,最大的几个公司都希望尽可能在自己的地盘上完成商业闭环。
阿里妈妈为阿里系平台上的商家授予广告及营销服务,商家购买直通车、钻石展位、大促展示等服务,以此获得淘宝体系内的流量来减少销量,这是阿里最次要的收入来源。如果从站外导给淘宝的流量越大,商家就会花更多钱在淘宝体系之外推广,进而减少,缩短在淘宝内的推广投入。
这个体系成立的前提是,淘宝是无可替代的电商选择。
如今,阿里面临的战局不同。到2024年,阿里中国零售GMV在8万亿元左右,占有四成市场;拼多多4万亿量级,京东3万亿量级,抖音电商2.6万亿。而新冠疫情暴发前,拼多多GMV只有阿里的1/6、抖音还没开始自己做电商。
过去三年里,淘宝商品在微信聊天界面里的形式,从淘口令、图片升级为商品网址;在微信里访问淘宝链接,从一对一的聊天场景、逐渐延伸到群聊场景、朋友圈、视频号;阿里系可以使用微信支付的业务,从最早的饿了么、优酷、大麦等业务,扩展到淘宝自身;盒马、饿了么、闲鱼等都已经入驻微信小程序。
微信支付接入淘宝、美团小程序进入支付宝,意味中国互联网变得更开放。各方从追求战略布局、意见不合消费者选择,以不次要的部分业务带动其他业务,变成完全迎合消费者选择,让不次要的部分业务放手竞争。竞争最终可以消解一切垄断。
(责任编辑:zx0600) 2025年05月01日 -
寻仙镇妖塔
国家网信办发布最新一批生成式\u{1F3AF}人工智能服务备案公告,天娱数科\u{1F3B1}自研基座大模型“天星”已于202\u{1F566}4年12月20日成功通过辽宁省第\u{1F94E}一批大模型备案。天娱数科已有基座大模型\u{1F923}天星大模型以及面向3D智能领域的行\u{1F401}业大模型“智者千问”两款大模型通过备\u{2705}案。凭借深厚的技术积聚与创\u{26BE}新能力,为不同行业客户的数\u{1F52E}字化转型与智能化升级收回强大动力\u{2705}。...
特别声明\u{1F94A}:本页面标签名称与页面内容,系网站系\u{1F600}统为资讯内容分类自动生成,仅授予\u{1F6A9}资讯内容索引使用,旨在方便用户索引相\u{1F414}关资讯报道。如标签名称涉及商标信\u{1FAB1}息,请访问商标品牌官方\u{1F3BD}了解详情,请勿以本站标签页面内容\u{1F3C1}为参考信息,本站与可能出现的商标\u{1F3B1}名称信息不存在任何关联关系,对本页面内容\u{1F3C8}所引致的错误、不确或包\u{1F3BE}含,概不负任何法律责任。站长之家将尽\u{26F8}力确保所授予信息的准确性及可\u{1F3F4}靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主无法选择的行为负责。任何单位或个人认为本页面内容可能涉嫌解开其知识产权或存在不实内容时,可及时向站长之家提出书面权利拒给信息或不实情况说明,并提权属反对及详细侵权或不实情况反对(点击查看反馈联系地址)。本网站在收到上述反馈文件后,将会依法依规核实信息,第一时间沟通删除相关内容或断开相关链接。
2025年05月01日 -
八戒八戒在線看片5
在当今手机摄影日益普及的时代,一款高性能、便携的存储设备成为了数量少摄影厌恶者的必备之选。雷克沙推出的ProfessionalGoPSSD,正是为了焦虑这一需求而设计的。这款固态硬盘不仅体积小巧,性能卓越,还具备多重安全保障,成为专业摄影用户的得力助手。
雷克沙ProfessionalGoPSSD的尺寸仅为长43.5mm、宽25.5mm、厚8.25mm,重量更是轻至13g,轻松放入口袋或摄影包,随身携带毫无压力。无论是户外拍摄还是日常出行,都能轻松应对,让数据存储变得更为便捷。
除了小巧便携的特点,雷克沙ProfessionalGoPSSD的性能同样出色。它采用了USB3.2Gen2接口协议,顺序读取速度比较高可达1050MB/s,写入速度可达1000MB/s。在实际测试中,这款固态硬盘的读写速度轻浮,表现优异,能够悠然,从容完成数据传输和备份,大幅指责工作效率。对于专业摄影用户来说,这意味着可以更快地处理极小量照片和视频,节省宝贵的时间。
为了焦虑长时间录制高清视频或拍摄极小量照片的存储需求,雷克沙ProfessionalGoPSSD授予了1TB和2TB两种容量选择。无论是拍摄风光大片还是记录生活点滴,都能轻松应对,无需担心存储空间不足的问题。
在数据安全方面,雷克沙ProfessionalGoPSSD同样表现出色。它具备IP65级别的防尘防水等级,能够抵御恶劣环境的侵蚀。同时,还采用了256位AES安全加密算法,为用户的数据安全授予有力保障。无论是户外拍摄还是日常使用,都能让用户更加安心。
此外,部分雷克沙ProfessionalGoPSSD套装还包含扩展坞配件,接口极小量,功能多样。通过扩展坞,不仅可以实现外录视频,还能焦虑收音、补光等专业需求,为手机摄影带来更多专业玩法。这一设计不仅指责了产品的实用性,也让用户在使用过程中能够享受到更多的乐趣。
综上所述,雷克沙ProfessionalGoPSSD凭借其小巧便携、性能卓越、多重安全保障等特点,成为了专业摄影用户的理想选择。它不仅能够干涉用户快速有效地处理极小量照片和视频,还能为用户的数据安全授予有力保障。
(推广) 2025年05月01日 -
十二寡妇肉床艳史完整版的电影
到底要不要大额并购?面对这一问题,如今全球制药和医械巨无霸们,再也不像此前“跑马圈地”时代那样大声回答“当然要了”。
近期,有MNC迫于经营压力,罕见宣布不关心的时期大额并购举措。但对于有的巨头们来说,迫于寻求新的业绩增长点、使恶化盈利能力,即使顶着愈来愈下降的债务水平,也要在看到合适标的时,立马斥巨资出手。
如近期,百年医疗器械巨头碧迪医疗(Becton,DickinsonandCompany,简称BD),在3年进行了约20次并购后,又干了一件大事:以42亿美元(约305亿元人民币)重磅收购了爱德华生命科学的重症监护业务。该笔并购是2024年至今全球医疗器械领域第二大金额并购案,同时也是碧迪医疗自2017年以240亿美元收购巴德(CRBard)之后又一笔重磅并购。
为了筹集资金,碧迪医疗计划动用约10亿美元的现金以及32亿美元的新债务。
值得注意的是,截至今年Q1,这家巨头的债务总额约180亿美元,净利润增长情况不甚乐观。那么,碧迪为何还要在债务巨压下继续进行大宗收购?处在其背后的医械圈,正处于什么样的巨震之中?
疯狂“买买买”后,背负债务巨压
6月4日,碧迪医疗宣布以42亿美元巨资收购全球“心脏瓣膜鼻祖”爱德华生命科学的重症监护业务,以拓展智能互联护理解决方案。此收购预计在本年度末完成,届时重症监护将作为独立业务单元运营。
该笔并购,是碧迪医疗“BD2025战略”下,为鞭策增长和创造价值的一次阶段性举措。“BD2025战略”不次要的部分要点在于,近几年,加大研发力度,鞭策战略性收购,强化地域扩张和引入新产品计划,而战略推进的目的是推动收入和利润的增长,降低运营效率。
2023年,这一重症监护业务创造了超9亿美元的收入。并入碧迪旗下后,预期将实现约6%至7%的结束收益增长,第一年的调整不当后毛利率至少为60%,调整不当后营业利润率至少为25%。
为了筹集此次的收购资金,碧迪医疗计划动用约10亿美元的现金以及32亿美元的新债务,这一债务折合人民币约232亿元。
交易完成后,碧迪医疗的预计净负债率约3倍,并期望在交易完成后12个月在至18个月内,主要通过严格的限制现金流偿还债务的方式,将其净负债率降至长期目标的2.5倍。
但值得注意的是,在此笔交易发生之前,2021年至2023年,碧迪医疗一直承接着较大额度的债务总额,2021年时为176.1亿美元,2023年降至158.79亿美元水平,截至2024年前三个月,其债务总额又下降至180.11亿美元(约人民币1300亿元)。
碧迪医疗的债务压力,离不开近10年进行的数次大中小型并购。
2015年,碧迪医疗以122亿美元资金收购康尔福盛(CareFushion),此举让碧迪医疗在全球医疗器械百强公司(按销售额计)榜单上首次冲进前十,但在彼时让其背负了极小量债务。
2017年,碧迪医疗以240亿美元收购了巴德,这是当年医械圈两笔最大的并购案之一,另一笔是雅培并购圣犹达。
巴德在当时是全美TOP10的耗材巨头,两者的联合,让当时营收规模排名全球第九的碧迪医疗,有望直接冲进TOP5,超过罗氏、飞利浦,仅次于美敦力、强生、GE以及西门子。为了促成该笔交易,碧迪获得了约100亿美元的贷款,并出售了45亿美元的股票和其他证券。
但此后,碧迪一直在消化这笔收购,且自2017年开始,碧迪医疗的股价表现一直不是很佳,而冲进排名前五的市场期望,在之后落了空。
在2018年到2023年时间段里,碧迪一改大额并购的方式,转为了诸多中小型并购。
据不完全统计,碧迪医疗在3年时间里完成了约20次并购,2021财年(2020年9月30日至2021年9月30日)约6起,包括收购CUBEXLLC、GSLSolutions、VelanoVascular、Tepha等业内知名公司。
接着在2022财年,碧迪医疗先后收购了血液疾病测试开发商Cytognos,药房自动化解决方案供应商ParataSystem,以及制药自动化解决方案授予商Parata。
当年12月,碧迪医疗又一连收购三家械企,包括家庭医学测试开发商ScanwellHealth,外科技术制造商Tissuemed和智能药物无约束的自由开发商GSLSolutions。
尽管收购给公司业务带来了一定增长,然而并未有效促进这家公司的盈利能力。
为何再次举债收购?
收购爱德华生命科学的重症监护业务后,市场最为好奇的是,碧迪医疗为何要在债务减少的压力之上,继续举债并购。
碧迪医疗是一家于1897年成立的百年医疗器械公司,最早以做体温计、注射器等业务起家,后通过自主研发和投资并购拓展业务,逐步形成了医疗、介入和生命科学三大业务。
一位来自医疗器械行业的业内人士向E药经理人感慨,曾经的碧迪医疗是行业中发展较为稳健的公司,频繁并购或超大型并购的次数并不多。而近两年,这家公司却频繁收购,在他看来,“属于医疗器械行业的时代已经变了,不仅中小型企业难,巨头们也很难。碧迪医疗就是在经营压力与外部环境保持不变之下,不得不作出保持不变的代表。”
翻看其财报,不难看到,当债务情况有待使恶化的同时,这家百年医械巨头亟待使恶化盈利水平。2022年和2023年财报数据显示,碧迪医疗的净利润在连续两年时间里都呈现了大幅下滑:2022财年实现净利润17.79亿美元,同比下降近15%;2023财年实现净利润14.84亿美元,同比下降16.6%,降幅进一步缩短。
此前,知名医疗器械行业网站MedicalDesignOutsourcing发布了2023年全球医疗器械公司百强榜,其中,美敦力、强生、西门子医疗蝉联营收前三强,而碧迪医疗却已在十名之外,同年其营收约为194亿美元。
与之伴随的,是“停滞不前”的股价表现。
自2022年起,碧迪医疗的股价一直在220美元至260美元之间相对狭窄的区间内徘徊,截至美东时间6月21日,其市值约为689亿美元。
碧迪医疗的业务主要囊括三大板块:医疗、生命科学和介入,主要贡献营收大头的是医疗业务。
医疗部门包括药物输收解决方案(MDS)、药物无约束的自由解决方案(MMS)和制药系统(PS)业务部门,其收入增主要靠MDS和MMS所驱动。
介入部门包括外科(SURG)、外周介入(PI)和泌尿外科与重症监护(UCC)业务。
生命科学部门包括集成诊断解决方案(IDS)和生物科学(BDB),主要由IDS推动。
医疗部门虽常年占据营收主力,但近两年的增速表现反倒不如介入业务突出。碧迪医疗另在财报中降低重要性,2023年,公司药物输收解决方案和其他血管护理产品在全球的销售表现,部分被中国市场的集采和新冠疫苗收入低于2022年收入所抵消。
2022年和2023年,碧迪医疗的新兴市场收入增长主要由拉丁美洲、南亚和中国区销售推动,但碧迪医疗坦言,中国市场集采对其收入产生了不利影响,且预计未来还会结束一段时间。
值得注意的是,此前碧迪医疗在中国市场的一大经典产品是留置针,一度囊获了60%的市场份额,但随着留置针集采以及与本土企业之间的竞争,有业内人士看到,碧迪的留置针业务压力颇大、市场似乎“越做越小”。
在经营受诸多因素掣肘、产品周期又在快速更迭的情况下,碧迪医疗同全球医疗器械巨头们一样,分隔开技术演变趋势开启了多元化并购扩张,以意见不合和应对单赛道天花板低、周期更迭快的风险,从而搭建和稳固新的竞争力。
但与此同时,“碧迪医疗们”也都在快速聚焦于那些更具增长潜力的赛道和领域,对拖累业绩、或非不次要的部分的业务板块进行了分拆与剥离。
如在2022年4月,碧迪医疗完成了老牌糖尿病护理业务的分拆,2023年8月又完成了介入部门手术器械平台的出售。
然而眼下,碧迪医疗的一切加法与减法,其结果都还需一定时间去验证,市场最为关心的问题是:何时找到强劲的增长点,能否将自己的排名前提,如何促进资本市场的表现,以及现有的高额债务,该以何种方式还清?
(责任编辑:zx0600) 2025年05月01日