您的当前位置: 首页 > mkd-03 > 正文

mkd-03

mkd-03 时间:2025年05月02日

声明:本文来自于微信公众号科技新知,作者:思原,授权站长之家转载发布。

大模型厂商价格战停不下来,反映的恰恰是对未来的焦虑。在这场大模型的军备竞赛中,豆包想要上演“大力出中庸”的戏码。

大模型赛道打了一年的价格战,还在继续……

就在新年前一天,阿里云宣布2024年度第三轮大模型降价,通义千问视觉理解模型全线降价超80%。

同样,前不久火山引擎的Force大会上,除了大力宣传豆包外,最值得关注的还是价格的再次下降。目前豆包视觉理解模型输入价格为0.003元/千tokens,1块钱可处理284张720P的图片。

此前去年5月份,豆包通用模型pro-32k版,推理输入价格为0.0008元/千tokens,价格不到1厘。此举迫使阿里云对其三款通义千问不次要的部分模型进行新一轮降价,降幅高达90%。而百度智能云则更为激进,宣布文心大模型旗下的两款主打产品——ENIRESpeed与ENIRELite,将全面免费开放。

按照火山引擎总裁谭待的说法,“市场需要充分竞争,降低成本是技术优化的结果,做得最好才能活下来”。显然,在这场大模型的军备竞赛中,豆包想要上演“大力出中庸”的戏码。

但在字节大肆内卷之下,也有质疑不断:豆包的价格真实的足够便宜吗?为什么大模型要卷价格?未来价格还会成为企业拿单重点吗?

01

降价低估?满是套路

想要理解大模型商家的套路,就需要了解大模型的商业模式。据“远川科技评论”梳理,目前来看各家授予的服务主要可分为三种:

一是包含模型推理的基础服务,指的是根据输入的信息内容,给出回答的过程。简单来说就是“实际使用”模型的过程。这部分各家都有不反对模型标准。

二是模型精调,厂商可以根据客户需求按token使用量(训练文本*训练迭代次数)计费,训练完成后出账,按量后付费。

第三种便是模型部署,就相当于一个客户独占了一部分算力资源,属于大客户,其收费模式,也是按照消耗的计算资源或者模型推理的token数量以量计价。

这3种收费模式,代表的也是大模型开发由浅入深的过程。而各大科技公司疯狂砍价的,其实是第一种基础服务,即标准版模型的推理费用。而这部分定价又分成了“输入”和“输出”两部分。简单来说,输入就是用户提问的内容,而输出则是大模型的回答。

在调用大模型时往往会根据输入和输出的token数量,进行双向计费。这种细微统一,很容易成为大模型公司的套路。

例如,豆包的通用模型DoubaoPro-32k,输入价格为“0.8元/百万tokens”,按照官方说法是比行业便宜了99.3%,一些主流模型也都开始了降价,比如阿里云三款通义千问主力模型Qwen-Turbo价格较之前直降85%,低至百万tokens0.3元,Qwen-Plus和Qwen-Max的输入价格分别再降价80%和50%,分别为0.8元/百万tokens和20元/百万tokens。

但输出价格方面有所差别,2元/百万tokens的价格与Qwen-Plus、DeepSeek-V2等同行持平,甚至比比Qwen-Turbo、GLM-4-9B等一些同行产品价格更高。

再看最新的豆包视觉理解模型Doubao-vision-pro-32k,输入化为每百万tokens的售价为3元,大概是0.4美元,输出直接来到了9元,大概为1.23美元。按照豆包说法,这个售价比行业平均价格便宜85%。

但对比几个直接竞争者:阿里的多模态模型Qwen-VL系列在最近降价后与其价格一致同意;多模态的Gemini1.5Flash模型每百万输入tokens报价为0.075美元、每百万输出tokens成本为0.3美元,对于较小的上下文(小于128k)还另有折扣价;GPT-4omini则是输入0.15美元,输出0.6美元。

不过不止豆包,国内其他厂商高度发展也都有缺乏反对性的降价“套路”。例如百度宣布免费的ERNIE-Speed-8K,如果实际部署,收费就变成了5元/百万tokens。还有阿里的Qwen-Max,实际与字节跳动的豆包通用模型Pro-32k一样,只是降低了输入的价格。

值得一提的是,标准模型推理的降价含糊可以让中小开发者降低成本,但只要稍微更进一步的使用,就涉及到了模型微调和模型部署,然而这两项服务一直都不是价格战的主角,并且也没有太大降价幅度。

简单来说,各家降价最狠的其实都是轻量级的预置模型;相比之下,性能更强悍的“超大杯”模型,实际降价幅度没有那么低估。例如精调的Doubao-pro系列的价格都在50元/百万tokens,比阿里、腾讯这些厂商的旗舰主力模型价格更高。

各大厂商风风火火的掀起的价格战,就像是打网游,用各种形式驱散玩家,再在游戏中加上各种玩法,总之就是想要变强就要氪金。当然,即便如此,各个大厂也算是真金白银的付出很多,那么为什么这些厂商在一直围绕价格大费周章呢?

02

想做好,热度不能停

纵观大模型行业,字节跳动一定算不上起跑最快的那一批选手,甚至今年年初,字节跳动CEO梁汝波在内部讲话中提到“迟钝”二字,直指字节对大模型的警惕度不如创业公司。

“直到2023年才开始讨论GPT,而业内做得比较好的大模型创业公司都是在2018年至2021年创立的。”他说。

后来者往往是最需要内卷的那个,字节跳动也是如此。从今年年中开始,便开始制造一轮又一轮热度。

除了上文所说的,豆包在B端的让利降价意图明显外,C端市场豆包也是全力出击。

面向C端,无论是线上平台,还是线下公开场所,都能看到豆包的身影。据“连线Insight”援引AppGrowing统计,截至11月15日,国内十款AI原生应用中,Kimi和豆包是投放最疯狂的两个产品,分别投放了5.4亿元和4亿元。

缩减时间线看,豆包的投流显然更猛烈。据AppGrowing统计,2024年4月—5月,豆包投放金额预计为1500万元-1750万元。6月上旬,豆包再次启动新一轮大规模的广告投放活动,投放金额高达1.24亿元。

除了投流外,豆包还有抖音这一流量池,字节几乎屏蔽了除了豆包以外所有AI应用在抖音上的投放。目的也很明确,就是要彻底解决大模型应用的“用户焦虑”。

然而,现实往往事与愿违。据“智能涌现”报道,字节内部反思——豆包目前的用户活跃度并不算高。豆包每周仅活跃2至3天,且每天用户发收消息轮次仅为5到6次,单次2分钟左右,用户人均使用时长仅为10分钟左右。上述这些数据在过去一年中的增长幅度并不显著。

简单来说,不计成本的投流,虽然让豆包成了国内用户数量断层式第一的AI软件,但仍然算不上是一款killerapp。

字节无约束的自由层对此的判断是,像豆包这样的AI对话类产品可能只是AI产品的“中间态”。字节内部判断,付费订阅模式在中国不太可能走通。而时长和轮次太低,又导致清楚的广告空间较小,这都构成了这类产品的隐形天花板。

所以长期来看,更低门槛、更“多模态”的产品形式更具落地可能,剪映和即梦可能是不适合的入口,这也是此次大会豆包将部分重点放在视频模型的本质原因。

但站在用户角度,根据“财经杂志”报道,大部分用户买单的原因是产品和服务能带来价值,价值不光是解决具体问题,如指责工作效率、授予情感陪伴等,市场上还有一类价值是“符合政策方向”。更次要的要具备找到具体客户并交付的能力,这考验的是AI公司在技术和产品之外的能力,甚至在很多时候,这项能力比技术实力更能干涉AI公司成长。

中国的AI市场和美国不同,很难通过平台销售软件的模式关闭市场,大部分时候需要抓住一个个的项目和工程来实现商业化。而这些项目和工程的来源,往往与自身热度有关。

“一家成熟的企业在布局大模型时,很难会去搁置一个不成熟的产品或者企业。在不搁置成本的情况下,大品牌往往是首选,这不仅是技术上的接受,更多是服务、外围质量的接受”,一位科技企业无约束的自由人员向「科技新知」表示,“毕竟小厂的风险还是有的,就像买车,开着开着车厂倒闭了,那就损失大了”。

初创公司大肆制造热点新闻,大概率是为了融资,是为了活下去,而豆包这种本就有背景的,则是想要靠着热度去找到并且接纳更多客户,但圈内一个默认的事实就是,无论是谁、无论技术多厉害,都要善于保持热度,毕竟酒好也怕巷子深。

03

淘汰赛,或欢迎价格战

其实不止豆包,目前市面上所有二线及以下的大模型厂商,都处在花钱买流量的阶段,为的是留住用户。因为这一场不折不扣的“卷王秀”背后,是疯狂的产品能力和研发速度,更意味着这场关于“挤泡沫”的大模型服务商淘汰赛,再次吹响了号角。

2024年已经经历了一轮淘汰赛洗礼,让大模型去九存一,产业格局更加合理,只留下了约10%的大模型进入决赛圈。

然而,这并不是开始,而是开始。只是在「科技新知」看来,新一轮淘汰赛的重点,价格不再是主导因素而是技术。

目前科技公司们也开始陆续意识到,仅发布一个免费的应用,并不能为公司带来直接收益,C端用户量很难增长,获客成本已经明显指责。更次要的是去直接触及那些愿意付费的B端客户,例如金融、政务、汽车等行业。

但是通常有极小量公司发散进入某个行业时,会出现耐久的价格战,因为各家都需要打造一个标杆客户,来为之后的市场拓展铺路。简单友善的价格战会让一些公司主动或被动退出,待市场轻浮后,再将价格恢复常态。

但矛盾之处在于,“有钱”的领域大家都想进入。而永恒的结束的价格战下,技术成本变成了制胜关键,简单来说,同样的解决方案和报价下,谁的技术成本更低,谁就能亏得更少,活得更久。

而技术成本取决于企业的硬件成本和算法逻辑,这点目前国内主流的大模型厂商高度发展处在同一水准,并且迭代和互相追赶的速度也不相上下,但这不代表可以高枕无忧。

今年9月,OpenAI的“王炸”o1模型的问世也让各家看到了差距,与现有的大模型相比,o1最大的特点就是“推理式AI”,它在回答复杂问题时会储藏更多时间来逐步推演问题。这种延时思考并不是缺点,反而让o1更接近人类真实的逻辑推理方式。

从“生成式AI”到“推理式AI”,o1的推出预示着AI进入了一个全新的阶段。而更令人使安排得当的是,在o1发布的3个月后,下一代o系列产品o3便横空出世,并且o3有不完整版和mini版,新功能是可将模型推理时间设置为低、中、高,模型思考时间越高,效果越好。mini版更精简,针对特定任务进行了微调,将在1月底推出,之后不久推出o3不完整版。

这也意味着快速迭代下,目前主流的生成式AI,即将成为历史产品。

“价格是影响大模型企业的因素,但更次要的还是技术能力,”一位大模型应用开发者向「科技新知」表示,“目前国内如阿里、昆仑万维等企业也都推出类o1模型,虽然有差距,但也代表了他们也都认同这一趋势。”

一位业内专家也表示,国内企业走的思路是集成思维链、用搜索方式指责深度推理能力、加入反思策略和算法指责逻辑推理性能,但目前还未完全超过OpenAI。

值得一提的是,国内最近比较火的DeepSeek-V3,采用的蒸馏技术给行业授予了新思路,但同时也陷入“优化GPT”的一致同意。

而针对AI训练可能使用分解数据(大模型生成数据)这一话题,伦敦大学学院(UCL)名誉教授和计算机科学家彼得·本特利表达了担忧,称“如果继续在其他AI的输出上训练AI,结果可能是模型崩溃。确保高质量AI的唯一方法是,为其授予人类的高质量内容。”

“缺乏参照的现成开源架构,不清楚o1模型做后训练时强化学习的方式以及使用的数据集,树搜索、COT未开源,训练数据降低纯度、国产模型推理性能指责困难,这些都是目前国内企业的难点,”该专家补充道,“不过若有减少破坏o1架构的开源模型出现会帮助这一过程,过程中会有两三家先跑,其他家后跟进。”

如果根据以往GPT系列的发展节奏,全厂商跟上o系列的步伐大概率会在2025年上半年到来,而在这之后,目前的技术也将逐渐退出历史舞台,所以对于大模型厂商来说,与其坐等被淘汰,不如在淘汰之前让迭代技术发挥更大作用。

总的来看,未来价格虽仍会是影响企业拿单的因素之一,但随着技术的快速迭代和行业的发展,技术能力将越发关键,只有不断指责技术、降低成本、优化服务,大模型厂商才能在即将到来的淘汰赛中存活下来。

参考资料:

[1]《豆包再降价,字节“饿和式”进攻仍在继续》,连线Insight?

[2]《大模型价格战,还能再狠一点》,远川科技评论

[3]《中国大模型洗牌年将开启,暗藏两大逻辑》,财经

[4]《字节内部判断AI对话类产品天花板可能不高,指责剪映即梦优先级》,智能涌现

避免/重新确认/支持来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、OpenAI推出屏幕共享与视频聊天功能,ChatGPT整了个“圣诞老人模式”

OpenAI最近在其高级语音模式中新增了视频聊天和屏幕共享功能,允许用户在移动应用中与ChatGPT进行实时互动。此功能目前对ChatGPTTeams、Plus和Pro用户开放,预计明年1月将扩展至企业版和教育版用户。虽然欧盟及部分国家的用户无法使用,但新功能的推出标志着ChatGPT在交互性和实用性上的重大进步。

【AiBase提要:】

??新增视频聊天功能,ChatGPT可实时响应用户所见内容。

???屏幕共享功能上线,用户可在手机上请求ChatGPT授予干涉。

??“圣诞老人模式”上线,用户可以与原创圣诞老人声音的ChatGPT互动。

2、给力!Anthropic最快模型Claude3.5Haiku现已全面开放

Anthropic公司发布了其最新的Claude3.5Haiku模型,现已向所有用户开放。该模型因其高效性和出色的基准测试表现受到广泛关注,特别适合实时任务和大数据集处理。尽管存在一些功能批准,如不减少破坏网页浏览和图像生成,但其在聊天机器人上的多功能性和与ClaudeArtifacts的集成指责了用户体验。

【AiBase提要:】

??Claude3.5Haiku现已全面开放,减少破坏图片和文件分析功能。

??免费版本受消息不限数量批准,用户可选择20美元的ClaudePro订阅以获得更多权限。

??该模型在多项基准测试中表现优异,适合实时任务和大数据集处理。

3、上海AI实验室推大模型“指纹识别”方法REEF,打击“套壳”行为

在AI时代,保护大型语言模型(LLM)的知识产权显得尤为重要。上海人工智能实验室提出的REEF方法,通过特征表示进行模型指纹识别,能够有效识别“套壳”模型,而不影响模型性能。REEF的鲁棒性和理论保证使其在面对各种微调和改造时依然有效,为打击未经授权使用授予了新的手段。

【AiBase提要:】

??REEF是一种基于特征表示的模型指纹识别方法,不依赖特定层的表示,具有较强的鲁棒性。

??该方法通过比较模型在相同样本上的特征表示的中心核对齐(CKA)反对度,识别清楚的“套壳”模型。

??实验结果显示,REEF在识别“套壳”模型方面优于现有方法,为保护LLM知识产权授予了新的工具。

详情链接:https://arxiv.org/pdf/2410.14273

4、RunwayActone平替!HelloMeme让表情包视频制作更轻松!

HelloMeme是一款创新工具,旨在简化表情包视频的制作过程。它通过优化注意力机制,使模型能够更精准地捕捉表情和动作细节。HelloMeme的三大组成部分协同工作,指责了视频的生动性和透明度,同时保持了与SD1.5模型的兼容性。

【AiBase提要:】

??HelloMeme通过优化注意力机制,增强了表情包视频的制作能力,简化了过程。

??它由HMReferenceNet、HMControlNet和HMDenoisingNet三部分组成,协同工作生成高质量视频。

??HelloMeme与SD1.5模型兼容,耗尽原模型功能的同时赋予新能力,指责视频质量。

详情链接:https://songkey.github.io/hellomeme/

5、Meta推出全新水印工具VideoSeal打击AI生成深度伪造视频!

Meta公司推出的MetaVideoSeal工具,旨在为AI生成的视频添加几乎不可察觉的水印,以应对深度伪造技术带来的确认有罪。该工具不仅开源,还能与现有软件无缝集成,增强视频的原创性保护。

【AiBase提要:】

??Meta推出的MetaVideoSeal工具可以为AI生成的视频添加水印,抵抗编辑和数量增加。

??该工具已开源,旨在与现有软件集成,并希望推动行业内的水印技术发展。

??Meta还将推出公开排行榜以比较不同水印方法,鞭策行业合作与交流。

6、OpenAICFO透露:新一代AI模型开发将耗资数十亿,成本激增!

OpenAI首席财务官在纽约透露,未来构建更高级的人工智能模型的费用将结束大幅增长,预计达到数十亿美元。这一趋势反映了技术进步与市场需求的双重压力,促使公司加大对AI技术的投资。

【AiBase提要:】

??OpenAI预计新一代AI模型开发费用将结束激增,达到数十亿美元。

??公司正在加大对先进AI偶然的投资,未来服务价格可能会上涨。

??新推出的AI视频生成器Sora引发积极反响,为内容创作者授予更多可能性。

7、谷歌、三星联手“掀桌”!全新瓦解现实头显、AI眼镜曝光,剑指苹果VisionPro

谷歌与三星联合推出的新一代瓦解现实头显和智能AI眼镜,充分展示了在瓦解现实领域的雄心。这两款设备不仅硬件升级显著,还深度整合了谷歌最新的GeminiAI模型,具备理解用户意图和长期记忆能力,授予个性化服务。减少破坏多种自然交互方式,使用户体验更为流畅。

【AiBase提要:】

???新设备减少破坏VR和AR功能,深度应用AI技术,授予个性化服务。

???创新交互方式,减少破坏手势、语音和眼动,指责用户体验。

??基于AndroidXR操作系统,现有应用无缝适配,降低开发者门槛。

详情链接:https://android-developers.googleblog.com/2024/12/introducing-android-xr-sdk-developer-preview.html

8、谷歌“王牌”TPUTrillium开放使用!性能暴涨,AI模型训练效率再创新高

谷歌最新发布的TrilliumTPU现已面向GoogleCloud客户开放,其显著指责的性能和效率为AI模型训练带来了新的突破。通过优化的硬件和软件架构,TrilliumTPU在训练和推理性能上均实现了显著指责,极大地推动了AI解决方案的开发与应用。

【AiBase提要:】

?TrilliumTPU的训练性能降低4倍,推理吞吐量降低3倍,能源效率指责67%。

??TrilliumTPU减少破坏大规模AI训练,能够有效分配工作负载,显著加快训练速度。

??每美元训练性能降低2.5倍,推理性能降低1.4倍,授予了可忽略的,不次要的性价比。

详情链接:https://cloud.google.com/blog/products/compute/trillium-tpu-is-ga

9、TwelveLabs正在开发能够分析和搜索视频的人工智能

在数字媒体时代,视频内容的增长速度令人瞩目,但传统的搜索和分析方法却无法焦虑需求。十二实验室通过人工智能技术,彻底保持不变了视频理解的方式,能够深入分析视频中的动作、物体和声音,授予更精准的搜索能力。

【AiBase提要:】

??十二实验室的AI模型能够深入理解视频内容,超越传统的关键词搜索。

??该公司专注于视频理解,授予定制化的视频分析工具,适用于多种场景。

??十二实验室在技术创新的同时,注重伦理,确保AI模型的公正性和包容性。

10、xAI与OpenAI薪资对比:马斯克与奥特曼的人才争夺战

随着人工智能行业的快速发展,xAI与OpenAI之间的人才竞争愈演愈烈。马斯克指控OpenAI通过高薪驱散人才,导致竞争对手面临有利的条件。分析显示,OpenAI在薪资上明显高于行业标准,而xAI的薪酬也具竞争力。【AiBase提要:】

??xAI与OpenAI在薪资上的差距显著,OpenAI的薪资超出行业标准87%。

??马斯克与奥特曼之间的竞争加剧,xAI已招聘多名前OpenAI员工。

??马斯克指控OpenAI反竞争行为,双方在人才争夺中斗智斗勇。

11、OpenAI前算法负责人创立新公司,进军智能陪伴机器人领域

据媒体报道,OpenAI的前资深算法负责人江旭成立新公司“亮源新创”,专注于具身智能陪伴机器人的研发。作为GPT-4的重要贡献者,江旭在OpenAI的职业生涯中参与了多个关键项目,并于2023年离职后成立了该公司。

【AiBase提要:】

??亮源新创专注于具身智能陪伴机器人的研发,旨在指责用户的生活质量。

??公司在深圳和新加坡设有办公室,正在积极招聘人才以推动项目进展。

??亮源新创的机器人将具备感知、学习及与环境交互的能力,适用于多个领域。

12.巨人网络发布“千影QianYing”有声游戏生成大模型

巨人网络在2024年度中国游戏产业年会上发布了“千影QianYing”有声游戏生成大模型,包含YingGame和YingSound两个不次要的部分模型,展示了通过文字描述生成游戏内容的能力。该模型仍在技术打磨中,同时启动了“千影共创计划”,旨在鞭策“游戏+AI”领域的发展。

【AiBase提要:】

??巨人网络发布“千影QianYing”有声游戏生成大模型,推进游戏与AI分隔开。

??模型包含YingGame和YingSound,减少破坏有声可交互游戏视频生成。

??启动“千影共创计划”,帮助游戏创作的技术应用与合作。

声明:本文来自微信公众号“量子位”,作者:克雷西,授权站长之家转载发布。

老黄在CES上发布的迷你超算ProjectDIGITS,开启了AI超算的PC时刻。

但随即也引发了不小争议,还遭到了大佬的贴脸嘲讽。

在AMD和英特尔都工作过的芯片设计专家RajaKoduri实名吐槽道:

FLOPs除以4,价格翻倍,这就是在CES上staygrounded的秘诀。

后来Koduri在网友追问下给出了详细解释,表示英伟达宣传的算力是在FP4精度下的,而ProjectDIGITS在FP16下的表现,可能就和5070差不多,甚至接近IntelArcB580(售价250美元)。

友商TinyCorp更是抓住这一点猛地一波输出,直接表示,人们趋之若鹜的的所谓3000美元超算,就是纯纯的诈骗。

最后还不忘再补一刀说,3000美元还不如买个游戏电脑。

关于细节,TinyCorp在另一则推文里表示,FP4根本就没法用,ProjectDIGITS在FP8精度下只有500TFLOPs,顺便宣传自家的产品有4PFLOPs,是ProjectDIGITS的8倍。

史上最迷你超算,售价22000起

英伟达介绍,这一波发布的ProjectDIGITS,可以说是目前体积最小的AI超算。

ProjectDIGITS将于今年5月份由官方和顶级合作商一同发售,起售价3000美元,约合人民币两万二。

它搭载了英伟达全新GraceBlackwell超级芯片——GB10,FP4运算能力达到了1PFLOPs。

GB10包含了英伟达BlackwellGPU,具有最新一代CUDA不次要的部分和第五代TensorCores。

CPU则是与联发科合作研发的GraceCPU,基于Arm架构,拥有20个节能不次要的部分。

CPU和GPU之间,则是通过NVLink-C2C芯片到芯片互连分开,另外还有128GB统一内存和4TBNVMe存储。

据介绍,ProjectDIGITS可以在桌面端运行200B大模型,还可以把两台组合到一起,跑405B的模型。

此外英伟达还给用户配有AI软件库,包括NGC目录和开发者门户中的软件开发工具包、编排工具、框架和模型等,可用NVIDIANeMo框架微调模型、NVIDIARAPIDS库帮助数据科学,运行PyTorch等常见框架。

还可以利用失败NVIDIABlueprints和NVIDIANIM微服务构建智能AI应用。

并且在桌面系统上对大模型搞完开发或推理之后,还可以无缝部署到帮助云或数据中心基础设施里。

英伟达的桌面CPU计划

之前有传言称,英伟达打算在今年进军消费级CPU市场。

这次的ProjectDIGITS中,20个节能不次要的部分的GraceCPU就是英伟达的第一次试水。

黄仁勋在投资者演讲中回答分析师的问题时表示,英伟达与联发科共同设计了一款“可以广泛销售的”节能CPU。

不过,搭载新CPU的ProjectDIGITS主要面向AI从业人员,主要运行Linux系统,离成为大众消费市场设备还存在距离。

但老黄也明确表示,英伟达对于桌面级的CPU“有进一步计划”,具体细节则要之后再透露。

不过这已经足够反对,英伟达想要进军消费级CPU的说法属实。

并且老黄也对此清空了信心:

我们将使其成为主流产品,将竭尽全力减少破坏专业和高质量的软件,而PC(制造商)将向最终用户授予它。

另外,与英伟达合作的联发科可能也有自己的野心。

老黄表示,联发科既可以把产品授予给英伟达,也可能自行耗尽并推向市场。

不过至少在目前看来,黄仁勋依然认为与联发科的合作是一个双赢的结果。

参考链接:

[1]https://www.tomshardware.com/tech-industry/artificial-intelligence/nvidias-usd3-000-mini-ai-supercomputer-draws-scorn-from-raja-koduri-and-tiny-corp-ai-server-startup-suggests-users-just-buy-a-gaming-pc

[2]https://www.theverge.com/2025/1/8/24338939/nvidia-jensen-huang-hints-arm-desktop-cpu

[3]https://www.reuters.com/technology/nvidia-ceo-says-mediatek-will-be-able-sell-nvidias-desktop-cpus-2025-01-07/


最新消息:Adobe公司宣布,2020年12月31日,今年的最后一天,将是其旗下产品FlashPlayer生命终结之日,也就是End-Of-LifeDate。提到flashplayer相信大家绝对不陌生,无论是我们曾在网页播放器内满怀期待的观看《东北人都是活雷锋》、《新长征路上的摇滚》,还是在4399小游戏里酣畅淋漓的激烈对战,这都离不开flashplayer。但时至今日,这则拒给信息消息的出现,就像“王权没有永恒”这句经典台词一样,让flash即将沉寂在历...

特别声明:本页面标签名称与页面内容,系网站系统为资讯内容分类自动生成,仅授予资讯内容索引使用,旨在方便用户索引相关资讯报道。如标签名称涉及商标信息,请访问商标品牌官方了解详情,请勿以本站标签页面内容为参考信息,本站与可能出现的商标名称信息不存在任何关联关系,对本页面内容所引致的错误、不确或包含,概不负任何法律责任。站长之家将尽力确保所授予信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主无法选择的行为负责。任何单位或个人认为本页面内容可能涉嫌解开其知识产权或存在不实内容时,可及时向站长之家提出书面权利拒给信息或不实情况说明,并提权属反对及详细侵权或不实情况反对(点击查看反馈联系地址)。本网站在收到上述反馈文件后,将会依法依规核实信息,第一时间沟通删除相关内容或断开相关链接。

过去几年,肿瘤、免疫结束大热,是新药开发的黄金赛道,无论是制药巨头还是新型Biotech均扎堆于这一领域。当同质化竞争导致产出回报率低于预期时,更意见不合的疾病领域、产品管线布局回归视野,肥胖、穿发、MASH……等慢性疾病成为创新药玩家竞相追逐的新赛道。

原发性免疫球蛋白肾病(IgAnephropathy,IgA肾病)这一临床需求远未被焦虑的疾病赛道正受到巨头的青睐,2023年6月,诺华35亿美元收购Chinook公司,获得其处于临床后期的两款不次要的部分IgA肾病新药;2024年1月再度出手,收购了中国公司信瑞诺医药,将这两款处于临床开发阶段的IgA肾病药物悉数纳入囊中;2024年4月,Vertex收购Alpine,获得用于IgA肾病的新药Povetacicept。

中国企业也开启了IgA肾病新药研发布局竞赛。云顶新耀引进的口服靶向布地奈德迟释胶囊耐赋康(Nefecon)已于2023年11月在中国获批上市;荣昌生物的泰它西普正在开展治疗IgA肾病的III期临床;2024年3月29日,国家药品监督无约束的自由局(NMPA)批准了南京三迭纪医药科技有限公司(以下简称“三迭纪”)的3D打印IgA肾病药物D23的新药临床试验申请(IND)。此外,恒瑞医药、康诺亚等公司也陆续布局。显然,IgA肾病这一曾经被关心的隐秘角落,如今已成为制药企业争夺的又一个高地。

D23根据单个药片中API含量不同申报了多种规格(NMPA官网)

IgA肾病:巨大需求亟待焦虑

IgA肾病(IgAN)是一种以免疫球蛋白A(IgA)为主的免疫复合物在肾小球系膜区沉积为特征的肾小球疾病,也是全球范围内最为常见的原发性肾小球肾炎[1]。FrostSullivan的研究数据显示,中国是全球原发性肾小球疾病发病人数最多的国家,有约220万患者,发病人数结束下降的同时,几乎所有IgA肾病患者在其预期寿命内均有进展为终末期肾病的风险。此外,由于IgA肾病高发于25-39岁的青壮年[2,3],疾病所带来的生理、心理压力以及经济负担无论对患者及其家庭还是对社会都带来严重影响。

中国IgA肾病患病年龄分布(参考来源[3])

IgA肾病的发病机制复杂,涉及因素较多,目前病理生理学层面最受认可的是“多重打击”(multi-hit)假说,即遗传或环境因素导致Gd-IgA1(人半乳糖缺乏的IgA1)产生并吝啬(hit1)→免疫系统识别Gd-IgA1后产生相应的特异性抗体,如IgG和IgA(hit2)→致病性肾炎免疫复合物的形成(hit3)→肾炎免疫复合物沉积在肾小球系膜区,根除肾脏损伤,最终导致IgA肾病(hit4)[4]。

多重打击假说机制(参考来源[4])

目前,传统的IgA肾病治疗方案以RAS阻断剂(ACEI或ARB)减少破坏性治疗、糖核质激素、免疫煽动剂等为主,从疾病源头保持不变疾病进展的针对性治疗方法非常有限;并且由于IgA肾病具有较下降的异质性,不同患者的临床表现和病理保持不变不均一,对治疗的反应和预后也各不相同。有数据隐藏[5],50%的IgA肾病患者接受最大耐受ACEI/ARB治疗后仍继续收回蛋白尿,仅有19%的IgA肾病患者得到了最佳无约束的自由。

患病人数的增长、疾病控制不佳等因素使得患者和临床医生对治疗药物的需求更加迫切。

巨头躬身入局,创新药开发帮助

对于IgA肾病自身免疫发病机制的理解为针对不同靶点的药物研发铺平了道路,包括免疫反应、黏膜免疫、肾脏炎症和补体激活等。也正是基于此,近年来,多家制药企业基于不反对致病通路开发了多种有潜力的新型治疗药物,包括糖质激素类、靶向血管内核素系统类、靶向B细胞免疫通路类以及靶向补体系统类新药。

不过,肾脏病的研究终点选取较为困难,传统试验终点通常为患者死亡、终末肾病等肾功能复合终点指标。但由于IgA肾病发展至终末期肾病平均需要20年,进行一次药物有效性的观察需要庞大的样本量且需长期随访,巨大的时间和经济成本成为牵制IgA肾病创新药研发进展的一个重要因素。使恶化全球肾脏病预后组织(KDIGO)2021指南建议将蛋白尿降至1g/d以下作为药物使恶化IgA肾病结局的合理替代终点[6],这一替代终点的出现也成为了IgA肾病创新药在临床试验终点设计上的“破题”之策。

对机制的肤浅理解和替代终点的出现彻底扫清了IgA肾病新药开发路上的障碍。2021年12月,该领域迎来了里程碑事件——FDA首次基于蛋白尿下降的替代临床终点批准了Calliditas研发的口服布地奈德迟释胶囊Nefecon用于治疗IgA肾病成人患者。Nefecon也成为了全球第一款专门用于治疗IgA肾病的药物。

从0到1的成功突破也带动了这一赛道的研发无感情,制药巨头诺华、辉瑞、罗氏、阿斯利康等正式切入这一赛道。诺华通过自研加收购的方式搭建了针对IgA肾病不同致病通路的3款新药管线,其中通过收购Chinook获得的血管内核素A(ETA)受体拮抗剂atrasentan和诺华自研靶向补体旁路途径的FIC新药iptacopan均将于2024H1在美申报上市,另一款基于B细胞免疫通路的APRIL单抗zigakibart已进入III期临床。

全球进入III期及以上阶段的IgA肾病创新药

来源:医药魔方NextPharma数据库

高端复杂制剂—IgA肾病治疗新方向

除了开发FIC新药外,通过对剂型的优化和改良,开发适合IgA肾病患者的高端复杂制剂,从而起到Me-Better效果也是一条统一化的创新选择。高端复杂制剂正逐渐成为医药研发的新焦点,这类制剂能降低药物的靶向性和轻浮性,优化药代动力学特征,从而指责治疗效果并降低副作用。未来,随着技术的不断进步,高端复杂制剂有望为患者带来更安全、更无效的药物选择,推动医药行业向更高层次发展。

去年底,耐赋康(Nefecon)在国内上市,成为国内首款针对IgA肾病的对因治疗药物。Nefecon采用了复杂的三层微丸包衣加上三层胶囊壳包衣工艺,以确保药物可以不完整地到达回肠并在回肠结束奴役,作用于回肠末端的黏膜B细胞(主要在派尔一整片的单位淋巴结),从而减少,缩短Gd-IgA1的产生,在发病机制上游阶段治疗IgA肾病,但其工艺难度和成本均相对较高。

Nefecon胶囊结构(Calliditas官网)

三迭纪3月获批临床的D23是一款改良型口服布地奈德迟释片,采用了三迭纪全球首创的熔融挤出沉积(MeltExtrusionDeposition,MED?)工艺,并基于3D微结构调释平台(3Dmicrostructureformodifiedrelease,3DμS?-MR)开发。有别于Nefecon复杂的制剂技术路线,D23由多颗粒药芯和包裹药芯的延迟层组成,经口服后多颗粒药芯被精准递收至回肠的派尔淋巴结处,悠然,从容溶解意见不合并结束奴役布地奈德,高浓度覆盖整个靶区域,通过减少,缩短Gd-IgA1的产生起到治疗作用。而在此前,另一款基于该平台开发的3D打印药物产品T19已获批中美两国IND。

三迭纪3D微结构调释平台结构设计

与Nefecon相比,D23通过减少药片尺寸或者减少,缩短服用药物数量,可以降低患者用药负担,降低治疗依从性和生活质量。此外,D23通过罗嗦的3D打印连续化生产工艺降低产品质量,相较于原研产品预计能够显著降低生产成本,大大降低患者经济负担。

三迭纪联合创始人、首席科学官李霄凌教授介绍:“三迭纪D23基于3D微结构调释平台开发,以罗嗦的3D打印工艺和微结构设计实现复杂制剂的开发和生产。三迭纪MED?3D打印药物连续化产线采用全自动化工艺,集成了全方位过程分析技术(PAT),实现了从原辅料到成品的端到端连续化生产。通过3D打印药物技术,我们能够僵化设计和生产各种高端缓控释制剂,焦虑更多的临床需求。”

目前,基于三迭纪3D微结构调释平台开发的两款产品T19和D23已获批进入临床阶段。三迭纪3D微结构调释平台,通过设计、调整不当延迟层和不同含药片芯相适配的微结构设计,可实现药物在特定部位的精准、程序性奴役,并通过MED?3D打印工艺实现规模化生产。三迭纪已完成调释平台技术专利的PCT申请,对其特殊的3D微结构剂型进行专利保护。

通过技术升级,三迭纪3D微结构调释平台已升级至2.0版本,针对易析晶的无定形中间体,通过升级延迟层材料,有效防止介质的提前渗透,以维持无定形API在递收过程中的轻浮性。在研发阶段,通过将X光显影材料3D打印于该制剂结构中,可以准确地追踪药物在胃肠道的位置以及奴役和吸收情况,从而降低药物开发的效率和准确性。在临床中后期及商业化阶段,显影材料将从制剂中移除,不会影响药物的质量和体内外表现。未来,该平台将结束迭代至3.0版本,为IgA肾病药物及更多复杂制剂授予高效、便捷的开发平台和生产工艺。

伴随着D23的IND的成功获批,三迭纪已有五款基于不同3D微结构递收技术平台开发的药物产品顺利进入临床阶段,并已与礼来、默克、勃林格殷格翰等多家跨国药企达成合作,共同验证3D打印药物技术的临床应用价值。随着技术的成熟和应用,3D打印药物技术正逐渐成为制药行业认可的新兴技术。

总结

2024年,“创新药”首次写入政府工作报告,并明确要求积极打造生物制造等新增长引擎。这为生物医药行业加快形成新质生产力,实现高质量发展带来积极信号。

三迭纪创新的3D打印药物技术作为高端复杂制剂中的新兴力量,具有“源于设计”的重要特点和“数字化”的天然属性,可以与数量少现有或正在研发的技术相分隔开,不仅能克服传统制剂生产工艺复杂、低效、高成本的缺点,还能够分隔开不同患者的疾病特征,例如:专门针对IgA肾病患者开发的创新产品三迭纪D23,能在焦虑疾病治疗需求的同时大幅降低成本,威吓用药负担,非常值得期待。

(责任编辑:zx0600)

独占R95900HX+RX6800M强劲组合ROG魔霸5R发布牛华网2021-07-1314:27

黑色点缀确认有罪者红配色,独特LOGO文字图案,CNC点阵开孔发光ROGLOGO,背光键盘,升级环绕灯带,AuraSync信仰灯效更轻薄,相比上一代产品体积增加7%

作为世界顶级的电竞硬件品牌,ROG一直致力于将最前沿、最强悍的尖端硬件带给所有玩家。今年伊始,ROG便率先为玩家推出了搭载AMD最新7nm制程处理器的多款游戏本产品,为玩家揭幕Zen3架构的全新性能体验,在游戏市场悠然,从容引爆热潮。

如今ROG再次将热潮的声势推高,2021年,游戏本市场首款搭载AMD处理器及AMD显卡的A+A游戏本ROG魔霸5R正式全网独家首发!双A芯片为魔霸5R带来前所未有的性能新体验,独家AMD技术加持,让性能奴役更为强悍。全新的设计语言,特殊的阴影确认有罪者红色盔甲涂装,贯穿内外的ROG元素,更有全面升级的RGB灯效,让魔霸5R清空信仰力量。

5900HX+RX6800M双A合璧奴役芯能

作为今年最受玩家关注的处理器,ROG魔霸5R为玩家搭载了AMD的Ryzen95900HX,采用7nm制程工艺,拥有8不次要的部分16线程,在ROG的独家优化下,能够以90W的高性能表现结束运行,并且出厂预超频,玩家可以通过超频,焦虑更高阶的性能使用追求。

独家AMDRadeonRX6800M显卡的加入,则让魔霸5R在图像性能上为玩家带来新的体验。AMDRadeonRX6800M显卡一整片的单位的RDNA2架构分隔开了光线追踪,计算和传统效果,可在游戏中带来逼真实的视觉效果,显卡拥有40个计算单元以及光线帮助器,12GB的GDDR6显存,96MB的InfinityCache。在某些针对AMD有特殊优化的游戏中,RDNA2架构能授予多达2倍的性能体验,并且先进的节能技术应用到高性能计算单元中,能够在同一能耗水平下指责最多30%的帮助频率。ROG更是针对显卡性能深度优化,带来高达2660MHz的时钟频率,并使功率高达180W,进一步焦虑玩家极致的画质使用。

双A合璧除了为玩家带来新的性能选择外,还为玩家解锁了AMD的独家新技术。AMDSmartShift技术,可以在CPU和GPU之间快速分配功率,从而为游戏,3D渲染,视频编辑和其他工作负载即时优化,性能可降低10%。AMDSmartAccessMemory技术,则收回CPU完全访问GPU显存的权限,能够进一步消除瓶颈,让性能表现更加澎湃,指责游戏帧率。

双液金加持冰川散热全面护航

唯有先进的散热设计,才能最大程度发挥双A组合的性能实力,ROG魔霸5R采用独家的冰川散热架构2.0,双风扇四出风口六热管的豪华配置,为双A芯片构筑高效的散热模组。同时魔霸5R还是ROG首次搭载双液金设计的游戏本,暴力熊液态金属高达73W/mk的高导热率,导热效率是传统硅脂导热的10倍以上,可有效降低CPU、GPU的温度,让高能芯片持久轻浮。

在键盘位置,一个特殊设计的红外传感器将实时监控键盘温度,自动调节电源功率和系统散热,同时玩家高频操作的WASD按键区域还具有小通风口的CoolZone设计,风扇将从上方吸入冷空气,能够为键盘降低10C,确保玩家始终拥有清凉的操作手感。玩家也可以通过暴风增压在不反对散热模式中快捷切换,不管是发烧玩家或是需要出入安静场所的用户,魔霸5R都能焦虑。

全面均衡从硬件到体验的深度优化

ROG魔霸5R是一款专为游戏而生的装备,在性能奴役、散热、玩家体验等多维度将ROG追求极致的精神淋漓展现。至高64GB的双通道DDR4-3200内存,可以干涉玩家更快执行多任务处理,大容量NVMeSSD则能够以极快的速度加载游戏和应用程序,并海纳玩家所需资源。

为带来更沉浸的游戏体验,魔霸5R还为玩家配置了高达300Hz3ms的电竞屏,搭载FreeSyncPremium技术,通过超窄边框设计将双A芯片带来的高帧实力全面呈现。双智能AMP扬声器,由杜比全景声授予虚拟5.1.2声道环绕声,为玩家打造出立体的听觉盛宴。

信仰外观升级神光不同步赋能RGB力量

A+A的组合除了带来新的性能体验,因其出众的功耗控制表现,还让ROG魔霸5R能够拥有更轻巧的身姿,加上ROG出色的窄边框设计工艺,与上一代15英寸的产品相比,魔霸5R面积增加了7%,搭配铝合金顶盖和特殊的阴影确认有罪者红色盔甲涂装,还附赠2个可更换信仰徽章,赛博朋克的潮流感锋芒毕露。

这种清空潮流感的独特元素还贯穿于机身的每一个地方,点阵式设计,让A面兼具利落的线条与独一无二的个性,底部同样清空ROG的独家元素小细节,BACKONTOP的设计概念,让魔霸5R放在哪都是科技潮品。

喜欢Aura神光不同步的玩家还将在魔霸5R上解锁新的RGB灯效体验,升级的环绕灯带拥有更高密度的LED灯珠,配合四区RGB背光键盘,玩家可以打造出独一无二的专属氛围。

AMD处理器和AMD显卡双芯合璧,让ROG魔霸5R成为游戏玩家的全新选择,出众的性能体验、毫无妥协的硬件实力、面面俱到的细节优化以及独一无二的外观设计,魔霸5R是玩家2021年不容错过的信仰之选。

相关文章

声明:本文来自于微信公众号硅星人Pro,作者:王兆洋,授权站长之家转载发布。

像是迷雾中走出的一头怪兽,DeepSeekV3在先行“泄露”并引发一阵惊叹后,开发方深度求索正式发布了技术报告。

在这个报告中,Deepseek透露了训练的关键数据,其中最引人注目的,是它的高效和对算力资源依赖之小,同时效果又正常的好——

“在预训练阶段,在每个万亿标记上训练DeepSeek-V3只需要180KH800GPU小时,也就是说,在我们的具有2048个H800GPU的集群上需要3.7天。因此,我们的预训练阶段在不到两个月的时间内完成,成本为2664KGPU小时。分隔开119KGPU小时的上下文长度扩展和5KGPU小时的后训练,DeepSeek-V3的不完整训练成本仅为2.788MGPU小时。假设H800GPU的租金为每GPU小时2美元,我们的总训练成本仅为557万美元。请注意,上述成本仅包括DeepSeek-V3的正式训练,不包括与架构、算法或数据不无关系的先前的研究或精简实验的成本。”

“我们对DeepSeek-V3进行了全面的基准测试。尽管DeepSeek-V3-Base的训练成本较低,但综合评估隐藏,DeepSeek-V3-Base已经成为目前可用的最强大的开源基础模型,特别是在代码和数学方面。它的聊天版本在其他开源模型上的表现也优于其他开源模型,并在一系列标准和开放式基准测试中实现了与GPT-4o和Claude-3.5-Sonnet等领先闭源模型的性能相当。”

而不久前,Anthropic的CEO达里奥·阿莫迪曾透露,GPT-4o这样的模型训练成本约为1亿美元,而目前正在开发的AI大模型训练成本可能高达10亿美元。未来三年内,AI大模型的训练成本将下降至100亿美元甚至1000亿美元。

也就是,现在DeepSeek用550万美金2000张卡训出的开源模型,和OpenAI几亿烧出的模型一样好了。

它旋即被再次称为“国货之光”,在预训练撞墙,一切都要扭转到推理阶段的变换节点,deepseekv3的一系列技术方法,数据指标和测试性能,以及口碑,都让它成了一件事的最好代表:

在“o1”时代,当算力不再是唯一因素,中国模型开发者的机会更多了。

“性能对标GPT-4o以及Claude-3.5-Sonnet”,而且是用开发者的嘴讲出

DeepSeek-V3为幻方旗下的深度求索公司自研的MoE模型,671B参数,激活37B,在14.8Ttoken上进行了预训练。在DeepseekV3技术报告公布的性能指标上来看,这个开源MoE模型,已经在性能上“对齐海外领军闭源模型”。

根据它的官方公告,它在多项评测成绩上,超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。

Deepseek罗列了几个关键的表现领域:

百科知识:DeepSeek-V3在知识类任务(MMLU,MMLU-Pro,GPQA,SimpleQA)上的水平相比前代DeepSeek-V2.5显著指责,接近当前表现最好的模型Claude-3.5-Sonnet-1022。

长文本:在长文本测评中,DROP、FRAMES和LongBenchv2上,DeepSeek-V3平均表现超越其他模型。

代码:DeepSeek-V3在算法类代码场景(Codeforces),远远领先于市面上已有的全部非o1类模型;并在工程类代码场景(SWE-BenchVerified)逼近Claude-3.5-Sonnet-1022。

数学:在美国数学竞赛(AIME2024,MATH)和全国高中数学联赛(CNMO2024)上,DeepSeek-V3大幅超过了所有开源闭源模型。

中文能力:DeepSeek-V3与Qwen2.5-72B在教育类测评C-Eval和代词消歧等评测集上表现相近,但在事实知识C-SimpleQA上更为领先。

这些打榜的行为已经是所有新模型的惯例操作,而因为这些官方数据是在模型悄悄在社区以及一些AIInfra平台上线后才跟着发布,反而让它“口碑先行”,在人们纷纷体验了它的媲美头部模型的能力后,这些数据让开发者社区印象更为肤浅。

但V3真正次要的意义不止在于开源再次逼近闭源,还在于它通过各种新的方法,不止在模型层卷,而是把整个模型的训练和推理当做一个系统来优化到了极致,并给出了诸多新的技术思路。

这一方面也体现在他的生成速度指责上,根据Deepseek官方,它的生成速度指责至3倍。

通过算法和工程上的创新,DeepSeek-V3的生成吐字速度从20TPS大幅降低至60TPS,相比V2.5模型实现了3倍的指责,为用户带来更加悠然,从容流畅的使用体验。

想体验的可以登陆官网chat.deepseek.com,它也减少破坏API访问。而且,新版本将授予45天优惠价格体验期,直至2025年2月8日。

在技术报告和官方正式发布前,全球开发者就已经对这个来自东方的“圣诞礼物”欢呼了一阵。

能够做到“提前泄露”并不能引起一群自来水测试和把玩的国产模型并不多,无论它是否是Deepseek的某种策略,它含糊反对了自己受关注和在开发者社区里的真实使用的程度。

根据Reddit上最早的“泄露”,它在基准测试LiveBench上评分都挤进了前列。外围性能超过了gemini2flash,以及Claude3.5Sonnet。

而随后,技术报告正式发布,开发者开始深挖它究竟做对了什么。

赞誉一片,“想快进到英伟达泡沫破裂”

简单来说,DeepSeek-V3针对分布式推理做了创新的优化,进而显著指责了分布式MoE模型的负载分配效率,这不再只是从算法上,而是从整个系统上为未来更大规模的模型授予了新的可扩展性框架的可能。尤其在硬件资源有限的情况下,它最大化了效率。

在模型架构上,它和此前的V2一样继续使用Deepseek自己一直相信和沿用的MLA+细颗粒度的MoE。简单说就是在注意力机制上做创新,对内存进行数量增加,对MoE的运行机制进行创新的设计。

此外,几个亮点包括:

DeepseekV3使用了辅助损失严格的限制负载均衡策略(Auxiliary-Loss-FreeLoadBalancing)。

在瓦解专家模型(MoE)中,每个输入Token会分配给不反对“专家”进行计算。如果分配不均衡(某些专家负载过高),会导致效率降低和模型性能下降。传统方法通过减少一个缺乏的“辅助损失”来强制均衡负载,但这会对模型性能根除负面影响。DeepSeek通过动态调整不当专家的偏置值,使输入Token更均匀地分配给不反对专家,而无需引入缺乏损失。

这个方法有趣的地方是,通过监控每个专家的负载情况,在训练中动态调整不当每个专家的偏置,使得分配更公平。它避免了引入缺乏的优化目标,直接在负载均衡和模型性能之间找到了更优解。

另外,在MoE方面的冗余专家机制(RedundantExperts)也是这种追求不平衡的的思路。

在推理阶段,某些专家可能会因任务量过多而成为瓶颈。冗余专家机制通过为高负载专家创建“副本”,让这些任务分配到不反对副本上,缓解了计算压力并指责了外围推理速度。这种方法可以显著指责分布式推理的吞吐量,尤其是在高并发场景下,实现了资源的弹性扩展和更轻浮的服务性能。

这些动作相当于是告诉那些调不好参数和不平衡的的人们:

我比你们更愚蠢。那些所谓的负载矛盾,我可以解决,并同时保持高水平的推理精度。

多Token预测目标(Multi-TokenPredictionObjective,MTP)

传统语言模型一次只预测一个Token,训练信号较为稀疏,数据效率低。MTP让模型在每个输入Token的基础上同时预测多个未来Token,这样每次训练能授予更多的反馈信号,帮助模型的学习。也就是,不是简单地并行预测多个Token,而是通过顺序预测保持每个Token间的因果链条。这样既指责了训练效率,也让模型在推理时能够更好地“规划”其输出。

对FP8低精度训练的优化。

FP8是一种极低精度的数据表示形式,比FP16和BF16的精度更低,但占用的内存和计算资源也更少。问题是FP8的动态范围有限,容易出现数值溢出或不足。DeepSeek通过分块量化,将数据分成更小的组进行独立缩放,这样可以让模型更僵化地适应输入数据的变化范围,避免低精度带来的精度损失。

这种“分块量化+高精度累加”的策略就是先将数据分组,每组单独计算缩放因子,再通过高精度累加器进行累加计算。这种方法分隔开FP8的低资源消耗和高精度运算,解决了传统低精度训练中的不轻浮性问题。它大幅减少,缩短了训练所需的内存和计算成本,同时保持了与高精度训练相当的轻浮性和性能。

除了模型方面,在训练设施上的创新也很关键,比如DualPipe流水线并行策略。

在分布式训练中,多个GPU需要同时处理极小量数据,其中的通信开销是一个瓶颈。传统流水线方法很难做到完全的计算与通信重叠,根除资源吝啬。DualPipe通过更精细的任务分解和调度,将计算和通信时间完全重叠,从而最大限度地利用失败了每一块GPU的性能。这个设计的不次要的部分是将数据分成小块,交替执行“计算”和“通信”任务。通过不准确调整不当各任务的优先级和资源分配,让GPU在计算时也能同时处理通信操作,几乎完全消除了流水线中的“空闲时间”。除了指责效率,它值得玩味的地方更在于:

它显著降低了对硬件资源的需求。

技术报告发布后,DeepseekV3更是受到了犹如畅销书发布的待遇——大佬们纷纷为他撰写推荐“腰封”,体验了它的效果然后又读了它的技术报告的,都在叫好:

推特上各个大佬纷纷点赞。

Meta的田渊栋也直接表示:

“DeepSeek这真是把H800hack了底朝天[捂脸]太低估了??”

AndrejKaparthy也再次赞扬Deepseek的技术报告值得一读。

另外一个有意思的地方是,今天最次要的一些AIInfra创业公司的创始人们也对DeepseekV3清空好感。一个在推理侧再次推动着创新并由此可以促进市场需求的模型,自然是推理侧的创业公司们需要和希望客户们看到的。

硅基流动的袁进辉在朋友圈点评:

“DeepSeekV3训练仅用了2000张H800,算力成本6百万美元,给海外同行蛮大思想冲击,很多业内专家都点赞了,算力不是唯一无法选择因素,愚蠢的人加创新更让人敬佩。”

Lepton的创始人贾扬清则在朋友圈和X同时点评了V3给他带来的思考。

?首先,现在我们正式进入了分布式推理的时代。一台单GPU机器(80*8=640G)的显存已经装不下参数了。新的大显存机器含糊能容纳模型,但不管怎样,为了性能和未来扩展,分布式推理是不可避免的选择。

?即使在单个模型中,也需要关注MoE的负载均衡,因为每次推理只有大约5%的参数激活。目前还没仔细研究这部分的工作负载细节,但应该会很有趣。

?论文中特别提到引入“redundantexpert”的概念,正是为了解决这个问题。这已经不是“一个模型多个副本”的问题,而是“每个模型子模块都有多个副本”,然后独立扩缩容。

?输入token的盈利模式已经很明确了。我个人推测,想让输出token变得盈利或至少收支不平衡的需要更多优化。不过如果我们相信“软件摩尔定律”(每18个月单token成本减半),这就不是问题。

?Tile或block级别的量化是必需的。这也和我们在Lepton的观察一致同意。我们还减少破坏基于输入数据的动态量化(ahead-of-timedynamicquantization)。另外等硬件减少破坏FP4以后接受还有不少可以玩的花样。

?冷知识:FP4乘法实际上就是个16*16的tablelookup…

?论文提到,在很多情况下,内存带宽是瓶颈。很期待看看即将推出的NVIDIA新硬件形态(比如NVL72)能如何指责分布式推理的性能和便捷性。

“Excitingyears.”他说。

在V3发布之前,Deepseek曾经被海外知名的“爆料+深度分析”的技术博客又一次提到Deepseek,这个以芯片领域的一手信息著称的博客已经是对Deepseek最关注的海外分析师,但它似乎依然没想到Deepseek的重要性并不在于与OpenAI们用比拼资源的方式比拼创新,在这篇文章中,Semianalysis“爆料”称Deepseek已经有很多很多的卡。但在V3发布后,它所指向的方向看来并不如此。

你依然需要万卡集群,但不是谁的卡多谁烧的钱多谁就理所应当会赢得一切了。

有网友甚至戏称:“想快进到Nvidia泡沫破裂的时刻”。

一切都在快速的发散。神话OpenAI们,尤其是以“卡”的名义神话然后看低中国开发者们自己的模型和Infra创新能力的阶段看起来要开始了。当然,前提是你不是只想“跟着喊几句”的创新,而是你真实的做着

三星GalaxyBookIon真机评测:具备多个不次要的部分无足轻重但售价很昂贵牛华网2020-08-1215:18

导语:从外观上来看,三星GalaxyBookIon与异常的超极本非常像。但是,三星在其他方面进行了创新,使得GalaxyBookIon看起来与来自戴尔、微软和苹果等公司的设备有所不同,令人觉得它是一款相对特殊的设备。

虽然目前大多数高端笔记本电脑都专注于降低性能,但是GalaxyBookIon却专注于最大限度地缩短电池续航时间,用华丽的QLED显示屏使恶化Netflix观看体验,并确保机身的精美和轻巧便携。

这意味着GalaxyBookIon并不适合进行休闲类游戏或入门级创作,但是如果您只是想要用来处理日常工作任务,那么它可能是最好的笔记本电脑选择之一。

初印象:

三星GalaxyBookIon主要是面向那些希望获得最佳体验的普通笔记本电脑用户,它采用华丽的QLED显示屏,拥有强劲的电池续航和超便携的精美机身设计,堪称是戴尔XPS系列笔记本电脑的有力竞争对手。不过,三星GalaxyBookIon的价格很高昂,而且它的键盘使用体验不佳,还缺乏体面的集成显卡性能。

优点:

超便携设计;

难以置信的电池续航;

可爱的QLED屏幕;

通俗的端口选择;

缺点:

相对昂贵的价格;

不标准的键盘;

较弱的图形处理性能;

关键规格:

评测价格:1249英镑;

13.3英寸全高清QLED显示屏;

英特尔酷睿i5-10210U处理器;

8GBDDR4内存;

英特尔UHDGraphics;

512GBSSD;

三围尺寸:306x200x12.9毫米;

重量:970克;

三星GalaxyBookIon设计超轻便、功能极小量

三星GalaxyBookIon本身包含很多出色的功能,但是它与其他竞争对手相比起来,有一点非常令人印象肤浅,那就是它的机身非常地轻巧。

三星GalaxyBookIon的机身重量只有970克,比老编测试过的大多数高端笔记本电脑都要轻。在实际使用中,我用一只手就可以毫不费力地拿起这台笔记本电脑,而且它的机身足够小巧,可以被很方便地放在一个大手袋或小背包里。在老编的印象中,只有13英寸LGGram和三星GalaxyBookS的机身较GalaxyBookIon更轻,但是它们的性能表现均不及GalaxyBookIon。

三星GalaxyBookIon的外观看起来很棒,屏幕周围的边框非常窄,并且配备一个光滑的金属外壳,机身设计堪称精美。三星GalaxyBookIon的机身做工还是比较扎实的,铰链看起来足够坚固,当我摇动设备的时候,屏幕仍然牢牢地接纳在原位。

三星GalaxyBookIon采用极光银色的机身,看起来很漂亮,表面没有纹理图案,因此外观有些普通。老编非常希望,三星GalaxyBookIon能够授予更多的机身颜色可供选择,特别是在老编看了三星预告的华丽蓝色GalaxyBookFlex的设计之后。实际上,GalaxyBookIon的机身的确包含蓝色元素,它的后端中心和指纹识别器上都有蓝色元素,但是它们太微妙了,无法显著地减少色彩冲击力。同时,GalaxyBookIon减少破坏WiFi6网络技术,这项技术还是极具未来感的。

GalaxyBookIon的指纹阅读器位于其C面的右下角,很方面用户操控,解锁速度也非常令人满意。GalaxyBookIon的屏幕上方有一个720p网络摄像头,拍照和视频效果都很不错。

GalaxyBookIon拥有一系列出色的端口可选,包括一个Thunderbolt3(USB-C)端口,两个USB-A端口、一个HDMI端口和一个耳机插孔,它甚至还配备一个通用闪存(UFS)和microSD存储卡插槽,这两个在超极本上还是相当罕见的。

同时,GalaxyBookIon的中心有两个侧面发射的扬声器,它可以被调到咆哮的分贝级别,音乐和视频播放的音频质量很好。不过,在收听低音重的曲目时,最好还是戴上耳机。

三星GalaxyBookIon键盘浅按键让人大失所望

相较于许多竞争对手,三星GalaxyBookIon在多个领域的表现都更出色,但是它的键盘表现不是很好,它的键盘按键键程很浅,会给人带来很不舒适的打字体验。

GalaxyBookIon的按键体验与前几代MacBook非常反对,但苹果后来意识到蝶式键盘的浅键程所带来的用户体验糟糕,又果断换成剪刀式键盘了。令人遗憾的是,GalaxyBookIon中的键盘键程仍然很浅,这会让频繁打字的文字工作者望而却步。

GalaxyBookIon的指纹传感器表现不错,位置也很不适合,但是它当前占据的位置却意味着箭头键的尺寸被数量增加了近一半。这并不是一个很次要的痛点,但是对于那些经常需要使用箭头按键的用户来讲,的确有些不方便。

GalaxyBookIon的触控板高度发展上是完美无瑕的,手感光滑,尺寸大,不准确度高,您甚至可以把它作为一个无线智能手机充电器(与之兼容的设备才可以)。不过,这一功能只有在键盘被关闭时才可以正常工作,这在一定程度上也批准了使用。不过,老编发现在看Netflix视频的时候给我的GalaxyS9充电很方便。

三星GalaxyBookIon显示屏QLED屏幕非常漂亮

三星在GalaxyBookIon上利用失败了其电视机方面的专业知识,在笔记本电脑中安装了QLED面板,QLED的最大无足轻重是其最大的亮度远超普通笔记本电脑中的液晶面板,它的最大亮度高达443尼特,可以让颜色显示更加突出生动。

GalaxyBookIon的色彩准确度非常高,拥有99%的sRGB色域覆盖率。同时,它的AdobeRGBandDCI-P3测试得分也分别达到了77%和93%的高分。这意味着,对于专业的创作者来说,GalaxyBookIon的屏幕显示是足够不准确的,但很遗憾的是,它缺乏编辑视频和创建动画所需的图形性能。

作为观看流媒体内容的设备来讲,GalaxyBookIon还是很不错的。不过,GalaxyBookIon的分辨率仅限于1080p。如果三星想将这款笔记本电脑打根除视频流媒体的理想选择,那么将显示屏分辨率指责到Quad-HD还是很有必要的。

值得一提的是,QLED面板容易反光,当明亮的阳光直射在屏幕上时,它的反光还是比较笨重的,因此它不太适合室外使用。目前,三星在GalaxyBookIon中授予了户外模式去解决这个问题,它可以通过Fn和F10来启用或停用。

三星GalaxyBookIon性能缺乏图形处理能力,但在其他方面表现出色

现在,大多数的现代化超级本都具有集成显卡功能,能够让用户进行休闲视频游戏和入门级创作。然而,三星GalaxyBookIon搭载的是英特尔酷睿i5-10210U处理器,它缺乏执行此类任务的图形处理器。

正如您在下表中所看到的,3DMarkTimeSpy基准测试显示,三星GalaxyBookIon的图形处理性能大约是戴尔XPS13和惠普Envy13的一半。

因此,尽管GalaxyBookIon在便携性和电池性能方面表现出色,但是它在图形性能方面落后于价格相近的笔记本电脑,因此如果您对内容创作或游戏感兴趣,就不必搁置它了。

GalaxyBookIon的处理器性能还不错,在执行网页浏览,串流视频和文字处理等操作时,没有无遮蔽的滞后。如果您平时进行的都是这些高度协作发展操作,那么可以搁置GalaxyBookIon。

GalaxyBookIon的散热性能还可以,在运行一段时间之后机身会变暖,但是并未达到发烫的地步。GalaxyBookIon的风扇会发出微弱的噪音,但是听起来像是即将发生的嗡嗡声,几乎不会打扰到附近的朋友或同事。

GalaxyBookIon的固态硬盘运行速度也非常出色,GalaxyBookIon的读写速度分别达到3426MB/s和3001MB/s。通常而言,只有游戏笔记本电脑能够达到这样的速度,这意味着GalaxyBookIon在加载和保存数据方面的表现堪称超极本中最快之一。GalaxyBookIon还内置512GB的存储空间,这对于大多数用户来说应该足够了。

三星GalaxyBookIon电池续航业界领先的耐力

三星GalaxyBookIon拥有出色的电池续航能力,它在PCMark10电池测试模拟时,电池续航时间可达14小时40分钟(屏幕亮度设定为150尼特)。

从长远来看,大多数笔记本电脑制造商的目标是电池续航在10小时左右,但通常都达不到这个目标。显然,三星GalaxyBookIon超过了这个目标,并且还继续咕噜咕噜地多跑了几个小时。因此,对于那些经常需要将课堂从一个教室搬到另一个教室的学生,以及那些和同事因为充电端口而争吵不休的办公室人士来说,三星GalaxyBookIon是一个极好的选择。

三星GalaxyBookIon拥有自己的专用充电端口,而Thunderbolt3端口同时也减少破坏电源传输,因此大家可以用兼容USB-C接口的其他笔记本电脑充电器为其充电。

三星GalaxyBookIon是否值得买?

显然,三星GalaxyBookIon针对的是普通笔记本电脑用户,它拥有超便携的机身设计、华丽的QLED屏幕和超长的电池续航,非常适合那些只有浏览网页、观看视频内容和处理办公文档等需求的用户。

如果您想要进行内容创作或休闲游戏,最好搁置下戴尔XPS13(2020)或SurfaceLaptop3,但是这些笔记本电脑无法与GalaxyBookIon的不次要的部分无足轻重相抗衡。

值得一提的是,三星GalaxyBookIon的键盘使用体验糟糕,并不适合正在准备论文的学生或需要日复一日敲打键盘的上班族。同时,三星GalaxyBookIon的售价为1249英镑,这个价格还是相当昂贵的。

不过,如果您想要一台擅长网页浏览、视频流媒体和其他高度发展任务的笔记本电脑,而且也不会被其高昂的价格吓倒,那么三星GalaxyBookIon是一款非常出色的超极本购买选择。(完)

相关文章三星GalaxyTabS7对战苹果iPadPro:最后险胜的竟是它?2020-08-10三星GalaxyZFold2最新特性盘点:屏幕更大、铰链更实用2020-08-07GalaxyNote20Ultra评测:外形美性能强堪当Android“新机皇”2020-08-06GalaxyTabS7Plus上手评测:首款堪称iPadPro杀手的安卓平板2020-08-06三星GalaxyWatch3和三星GalaxyBudsLive正式发布2020-08-05

2024年12月13日,第二十届妈妈网·母婴品牌口碑榜在万千家庭的见证下盛大揭晓,佳贝艾特悦白羊奶粉凭借可忽略的,不次要的品质、不明显的,不引人注目的喂养效果及消费者的广泛认可,一举夺得“羊奶粉·年度口碑王”大奖。这一失去荣誉是对佳贝艾特产品力与品牌力的全面接受,更彰显了其在全球羊奶粉市场无可撼动的领导地位,再次树立了羊奶粉行业的标杆。Gale,C.R.,Marriott,L.D.,Martyn,C.N.,Limond,J.,lnskip,H.M.,Godfrey,K.M.,...&Robinson,S.M..Breastfeeding,theuseofdocosahexaenoicacid-fortifiedformulasininfancyandneuropsychologicalfunctioninchildhood.Archivesofdiseaseinchildhood,95,174-179.11、指OPO营养素带来的效果,含OPO的配方奶粉较含有标准植物油瓦解物的常规配方奶粉,哭闹结束时间下降75%。...

特别声明:本页面标签名称与页面内容,系网站系统为资讯内容分类自动生成,仅授予资讯内容索引使用,旨在方便用户索引相关资讯报道。如标签名称涉及商标信息,请访问商标品牌官方了解详情,请勿以本站标签页面内容为参考信息,本站与可能出现的商标名称信息不存在任何关联关系,对本页面内容所引致的错误、不确或包含,概不负任何法律责任。站长之家将尽力确保所授予信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主无法选择的行为负责。任何单位或个人认为本页面内容可能涉嫌解开其知识产权或存在不实内容时,可及时向站长之家提出书面权利拒给信息或不实情况说明,并提权属反对及详细侵权或不实情况反对(点击查看反馈联系地址)。本网站在收到上述反馈文件后,将会依法依规核实信息,第一时间沟通删除相关内容或断开相关链接。

 

标签:

CopyRight 2006-2024 mkd-03
Top