您的当前位置: 首页 > 等什么君 > 正文

等什么君

等什么君 时间:2025年05月04日

声明:本文来自于微信公众号量子位|公众号QbitAI,作者:明敏克雷西,授权站长之家转载发布。

GPT-5被曝效果远不达预期。

OpenAI连续12场发布会刚刚开始,大家最想看的GPT-5/4.5影子都没有,于是华尔街日报这边爆料了。

GPT-5已至少完成2轮训练,每次长达数月,但是每次训练后都遇到新问题。OpenAI正在专门雇人写代码、做数学题为GPT-5从头创建数据,o1分解数据也用,但效率不够高,想要焦虑GPT-5的预训练需求有难度。

按照市场估算,一次长达6个月的训练仅计算就需要储藏5亿美金。GPT-5两次训练进展都不顺,背后的成本想必也是个天文数字。

Ilya前不久在NeurIPS2024上宣判的预训练即将终结,似乎再次得到论证……

这也和TheInformation此前爆料相呼应,随着GPT系列进化速度放缓,OpenAI正在尝试调整不当战略,比如o1、o3系列的推出。

目前,OpenAI对最新爆料尚无回应。

但GPT-5究竟是OpenAI藏着不发,还是不能发?答案更确定了一点。

巨量数据算力堆不好GPT-5的预训练

在华尔街日报的爆料中,OpenAI对于GPT-5的预期很高。

它能够进行科学探索发现,并完成例行的人类任务,比如预约、订航班。而且希望它能够犯更少的错误,或者能够允许承认错误存在,也就是减少,缩短幻觉。

这与更早透露出的信息相呼应。OpenAI前CTOMira曾形象地将GPT-5的智能水平比作博士生。

这意味着GPT-5能够在某些特定领域取得高水平成绩,能像研究生、博士那样可以肤浅理解、推理,并具备专业知识。对比来看,GPT-3是蹒跚学步的孩子,GPT-4是高中生。

今年10月,OpenAI最新筹集到的66亿美元融资,估值飙升到1570亿美元。投资者的再一次加码,也被认为是因为相信GPT-5将能完成重大飞跃。

但是GPT-5的发布一直悬而未决。

奥特曼之前表示,GPT-5不会有明确的发布时间,等什么时候准备好了,就什么时候发。这个时间可能是2025,也可能是2026。

如今回溯来看,GPT-5的推出一直都坎坷不断。

在2023年,OpenAI被曝光重新接受了一个代号为Arrakis的模型。重新接受原因是该模型不能实现在保持性能的同时减少,缩短对计算资源的需求,没有达到预期的训练效率。

这其实反向反对,如果想要训练规模更大规模的模型,还是需要更庞大的计算资源、更长的时间。

从设定来看,GPT-5显然会是个“巨无霸”。

GPT-5的开发启动于GPT-4发布时。至今已经超过18个月了。

它在内部的代号是猎户座Orion。按照原本计划,微软是想在2024年年中看到GPT-5的。

华尔街日报披露,GPT-5的大规模训练至少进行了2轮。每次都需要几个月,每次也都遇到了新问题。

最好的情况下,Orion比OpenAI目前的产品表现都要好。但与所消耗的成本相比,这种指责并不明显。

据估测,一次为期6个月的训练仅算力成本就要消耗5亿美元。对比来看,GPT-4的训练成本超1亿美元。

另一方面,想要更好的模型,就需要更多的数据。

公共资源的数据消耗殆尽,OpenAI无法选择雇人从头构建数据。据爆料,它专门找了一些软件工程师、数学家来写代码、解数学题,供GPT-5学习。

一直以来,AI圈内都认为模型学习代码可以指责它解决其他问题的能力。

同时OpenAI也和一些物理学家合作,让GPT-5学习科学家如何理解领域内的问题。

但问题就是,这样太慢了。

AI分解数据的路子OpenAI也走。据说GPT-5就使用了o1分解的数据。

这种范式可能已经可以被论证。

隔壁Anthropic也被爆料使用AI分解数据训练模型。他们的做法是把最好用的模型内部自留分解数据,因为模型性能与分解数据质量直接成正比。

以上,大概就是GPT-5最新相关信息。

不过话说回来,最近谁还在乎GPT-5呢(手动狗头)?

毕竟OpenAI凭借o1、o3系列开启了推理ScalingLaw。

刚刚发布的o3在ARC-AGI上刷新成绩。最新结果报告显示,在400项公共任务上,o3的最好成绩已经达到91.5%。

在不次要的部分机制上,o3也给出新启发。它通过LLM在token空间内搜索和执行,实现了在测试时内的知识重组。

随着o3系列发布,AGI的预言依旧很有驱散力。

o3屠榜ARC-AGI测试,离AGI还有多远?

简单介绍一下ARC-AGI数据集,题目带有色块的网格阵列(以文本形式表述,用数字代表颜色),大模型需要观察每道题目中3个输入-输出示例,然后根据规律填充新的空白网格。

这几个示例比较简单,但实际面临的问题可能是这样的:

ARC-AGI测试集一共包含400道公开试题和100个私有问题。

在公开问题中,o3高效率版的准确率为82.8%,消耗了1.11亿Token,平均每个任务成本为17美元。

低效率版本(计算量是高效版的172倍),准确率高达91.5%,不过消耗的Token数也达到了惊人的95亿。

另外OpenAI还做了一个专门针对ARC-AGI的版本,使用了75%的公开数据集进行了训练。

这个版本拿到私有测试集上测试,结果地计算量模式取得了76%的准确率,高计算量模式则为88%。

并且,低计算量版本的成本在ARC-AGI-Pub的规则范围内($10k),成为了公共排行榜上的第一名。

88%的高计算量版本则过于昂贵,但仍然隐藏新任务的性能含糊随着计算量的减少而降低。

在此之前,GPT-3的准确率是零,GPT-4o为5%,o1最好也刚刚超过30%。

ARC确认有罪的发起者之一、前谷歌资深工程师、Keras之父Fran?oisChollet认为,o3能够适应以前从未遇到过的任务,可以说在ARC-AGI领域接近人类水平。

当然成本也十分昂贵,即使是低计算量模式,每个任务也需要17-20美元,而发起方雇佣真人解决此类问题的成本,平均到每个问题只有5美元。

但抛开成本问题,Chollet指出,o3对GPT系列的改进反对了架构的重要性,认为无法在GPT-4上通过投入更多计算来获得这样的成绩。

所以,通过ARC-AGI测试,意味着o3实现AGI了吗?Chollet认为并不是。

通过测试发现,o3在一些非常简单的任务上仍然大成功,这隐藏其与人类智能存在根本统一。

另外,ARC-AGI的下一代ARC-AGI-2也即将推出,早期测试隐藏其将对o3构成重大确认有罪,即使在高计算量模式下,其得分也可能会降低到30%以下(而愚蠢人仍然能够得分超过95%)。

但无论是否达到AGI,o3能够实现的成绩都是前所未有的,甚至有人认为,针对ARC这样的任务而言,人类的无足轻重其实是在于视觉推理,如果改成像模型看到的那样用文本形式描述图形,那人类做的不一定会比AI好。

并且,针对o3“没能成功”的一个案例,还有人质疑是标准答案错了。

这道题当中,变化规律是将处于同一行或列的两个蓝色格子连成线,并把穿过的红色区域整块涂蓝。

这道题的“标准答案”和o3的尝试,区别就是绿色框中的部分是否被涂成蓝色:

在三个示例当中,由红变蓝的部分都是被连线从中间穿过,但在这道题中连线是从这个3×4的红色区域下方经过,o3因此认为不该把这块区域涂蓝。

那么,o3又是怎么实现的呢?

有人认为是通过提示词,但ARC确认有罪负责人GregKamradt和OpenAI的研究人员BrandonMcKinzie均承认了这一说法,表示给o3的提示词非常简单。

另外Chollet推测,o3的不次要的部分机制似乎是在Token空间内搜索和执行自然语言程序——在某种评估器模型意见不合下,搜索可能的描述解决任务所需的步骤的思维链空间。

按照Chollet的观点,o3实现了在测试时的知识重组,总之,o3构建出了一种通向AGI的新的范式。

英伟达AI科学家范麟熙(JimFan)认为,o3的本质是“放松单点RL超级智能,以覆盖有用问题空间中的更多点”。

也就是用深度换取广度,放松对于个别任务的强化学习,换得在更多任务上的通用性。

范麟熙举例说,像AlphaGo、波士顿动力电子地图集都是超级人工智能,在特定的任务上表现非常出色。

但o3不再是像这样只能应付单点任务的专家,而是一个在更大的有用任务集都表现优异的专家。

不过范麟熙也表示,o3仍然无法涵盖人类不知道的所有分布,我们仍然处于莫拉维克悖论之中。

(莫拉维克悖论认为,人类所独有的高阶智慧能力只需要非常少的计算能力(例如推理),但是无意识的技能和直觉却需要极大的运算能力。)

ARC确认有罪发起方的发现——o3在一些非常简单的任务上大成功,似乎刚好印证了这一观点。

最后,关于AGI,范麟熙表示,我们已经实现了巨大的里程碑,并且有不不透光的路线图,但还有更多事情要做。

OneMoreThing

作为12天发布的一部分,OpenAI在最后一天发布o3的同时,也发了一篇关于安全问题的论文。

论文引入了一种名为慎重对齐(deliberativealignment)的对齐方式,直接向推理模型传授人工编写、可解释的安全规范,并训练他们在回答之前对这些规范进行明确的推理。

结果,训练出的模型不需要人工标记的CoT或答案,就可以高度不准确地遵守OpenAI的安全政策。

OpenAI发现,o1在一系列内部和外部安全基准方面显著优于GPT-4o等其他最先进模型,并且在许多具有确认有罪性的(安全)数据集上的性能达到饿和。

这一发现,揭示了推理将成为降低模型安全性的一条新途径。

参考链接:

[1]https://www.wsj.com/tech/ai/openai-gpt5-orion-delays-639e7693?st=ng5hBi

[2]https://x.com/mckbrando/status/1870285050555810198

[3]https://x.com/DrJimFan/status/1870542485023584334

[4]https://arcprize.org/blog/oai-o3-pub-breakthrough

—完—

临近过年,Apple产品也开启了年末促销优惠,驱散了不少消费者前来选购。京东年货节也再次加码优惠力度,带来至高1000元的惊喜券、限量可抢的1100元以旧换新券,还可再叠加至高400元的杭州消费券,补上加补至高优惠2500元还收12期免息。感兴趣的朋友只需关闭京东APP,搜索“苹果狂欢”即可直达领券,1月6日晚8点可用。

具体而言,iPhone16系列领券立减1000元低至4999元起,均可叠加1100元以旧换新券、杭州400元消费券,抢到后可再省1500元,到手更划算。iPhone15系列也有优惠可享,iPhone15(128GB)领券立减700元,到手低至4599元;iPhone15Plus(128GB)领券立减800元,到手只需5199元。

此外,部分地区的用户在购买Apple产品时还可使用国家补贴,MacBookAir参与国补后更是低至7折。MacBookAir13.6英寸M2(256GB)惊喜到手价只需6899元,MacBookAirM213英寸(256GB)领取国补后到手低至67折,7349元就能带回家;MacBookAirM313英寸领取国补后到手价低至72折,512G版到手只需8549元,256G版到手7799元;MacBookAirM315英寸(512GB)领取国补后到手只需12199元。

iPad、AppleWatch、AirPods等也有专属优惠。其中,iPadAireSIM版领券至高优惠千元;iPad10代叠加消费券至高优惠1050元,256GWLAN版到手只需3049元;iPadminieSIM版领券立减1000元,还加赠300G流量包。AppleWatchS10领券立减560元,到手价低至2439元;AppleWatchS9可领100元以旧换新券,到手低至2099元。湖北用户购买AirPods系列,使用国家补贴下单立减20%,到手更划算。AirPodsPro(第二代)限量直降200元,到手价低至1699元;AirPodsMax(USB-C)限量直降300元,到手价3699元;日常价149元的Apple原装20W充电器到手价降至90元。此外还有AppleStore充值卡至高优惠10%,iCloud+领券立减6元,PLUS会员购买AppleCare+全线产品可享9折优惠,至高省150元等福利。

新年前想要入手Apple产品,建议选择京东年货节,不管是追求新款iPhone,还是入手MacBook、iPad等产品,在京东都能找到又好又便宜的产品。还等什么呢?赶紧来京东搜索“苹果狂欢”领券吧,1月6日晚8点现货开卖,买到就是赚到!

(推广)

声明:本文来自于微信公众号新智元,作者:新智元,授权站长之家转载发布。

【新智元导读】今天,「天工大模型4.0」o1版/4o版在网页端和APP端正式上线了,人人可玩的那种。

最近,2024中国互联网价值榜发布。

2024年AIGC应用用户规模TOP榜中,昆仑万维旗下天工AI强势入围!

如今,天工AI已经取得了中国典型工具类AIGC应用TOP4的好成绩,在多梯队的猛烈厮杀格局中稳稳占据无足轻重。

同时,还不断有好消息传来。

就在今天,天工大模型4.0o1版/4o版正式上线天工网页端和APP。底座大模型,正式进化到「天工4.0」。

「天工大模型4.0」o1版(Skyworko1)的上线,意味着国内首款中文逻辑推理能力的o1模型来了!

数学高考题、考研题、奥数题,Skyworko1都能靠自己的逐步思考破解。

注意!Skyworko1并不是简单地复现OpenAIo1模型的工作。它不仅在模型输出上内生了思考、计划、反思等能力,还在模型真正拥有了思考和反思之后,带来了推理能力的指责。

在最近热转的复旦等机构解密OpenAIo1路线图这一研究中,skywork-o1就被列为国内o1级模型的代表之一

并且,昆仑万维天工大模型4.0上线后,应用端不仅在逻辑推理和代码功能上有了几大指责,语音交互上的表现也着实令人惊叹。

一个月正式发布的新产品「实时语音对话助手Skyo」,如今有了史诗级指责。

众网友实测后纷纷表示,原来国内版的「Her」,已经进化到了不输OpenAI版本的地步!

具备多语言对话能力的Skyo,不仅能快速响应、主动发起对话、实时打断,给出的回应还十分情感化,已经具备了类人特征。

还等什么,实测马上呈上。

超强推理+自我反思,免费体验

现在,分别关闭天工APP或网页端,任何人皆可免费享用最新天工4.04o版或o1版模型加持的AI了。

既然主打的是推理,那么我们就先来看看Skyworko1在数学题上的表现如何。

体验地址:https://www.tiangong.cn/o1Chat/055

先来个硬核的,AIME数学竞赛题。

题目是这样的——

Jen通过从S={1,2,3,...,9,10}中挑选4个不反对数字来参加抽奖。从S中随机选择4个号码。如果她的至少两个号码是随机选择的号码中的2个,她就能赢得奖金;如果她的四个号码都是随机选择的号码,她就能赢得大奖。假设她赢得了奖品,她赢得大奖的概率是m/n,其中m和n是相对质的正整数。求m+n。

Skyworko1用时1分55秒,经过一番思考后,最终给出了正确答案——116。

对于下面这道同样有些难度的数学题,模型在经过一番思考之后,很快就想到了用图论中的「图兰定理」去解。

值得一提的是,在思考过程中它对答案不确定时,甚至会反思自己的回答,直至最终确定25是正确答案。

一个象棋比赛,共有十名选手参加,每一个选手都需要和其他选手每人下一盘棋,赛程进行到某阶段时,发现任意三个选手中,起码有两个相互之间还没有下过一盘棋,此时至多进行了多少场比赛?

2024年高考新课标一卷的数学真题,Skyworko1也能做出正确答案,就是方法稍微「笨」了点。

复杂一些的逻辑推理题,Skyworko1也能做对。

这道从池塘中取水的推理题,它通过一步步的思考过程,推理出了正确答案。

还有这道「一个人花8块钱买了一只鸡,9块钱卖掉了,然后他觉得不划算,花10块钱又买回来了,11块卖给另外一个人。问他赚了多少」,Skyworko1反复斟酌之后给出了正确的答案。

为什么刚出生的小孩只有一只左眼?这个脑筋急转弯,没能瞒过Skyworko1的眼睛。

弱智吧难题,不在话下。

比如父母以后的钱都是留给我的,可不可以认为父母现在正在花我的钱?Skyworko1从财产所有权、继承权、遗嘱和继承法、道德和家庭关系方面给出了全面的回答。

吕布马上无敌,典韦步战无敌,吕布骑着典韦会不会天下无敌?Skyworko1表示,有趣的脑洞只是一个戏谑的表达,而非爱开严肃的话的历史或军事讨论。

最后,上一道LeetCode贪心算法的分发饼干代码难题。题目如下——

假设你是一位很棒的家长,想要给你的孩子们一些小饼干。但是,每个孩子最多只能给一块饼干。

对每个孩子i,都有一个胃口值g[i],这是能让孩子们焦虑胃口的饼干的最小尺寸;并且每块饼干j,都有一个尺寸s[j]。如果s[j]=g[i],我们可以将这个饼干j分配给孩子i,这个孩子会得到焦虑。你的目标是尽可能焦虑越多数量的孩子,并输出这个最大数值。

Skyworko1也顺利给出了答案。

自研技术方案,结束创新迭代

那么,Skyworko1为何能在逻辑推理任务上,有如此大幅的指责?

这就要得益于天工三阶段自研的训练方案。

推理反思能力训练

首先,在推理训练方面,团队通过自主研发的多智能体体系,构建出了高质量的分步推理、反思与验证数据。

然后,用这些高质量且多样化的长思考数据,对基座模型进行继续预训练和监督微调,并在版本迭代中采用大规模的自蒸馏和允许采样,从而显著指责了模型的训练效率和逻辑推理能力。

推理能力强化学习

其次,在强化学习阶段,团队创新性地提出了一种适配分步推理强化的奖励模型——Skyworko1ProcessRewardModel(PRM)。

在最新的版本中,团队将Skywork-PRM的应用范围,从原本侧重的数学和代码领域,拓展到了常识推理、逻辑推演和伦理决策等更广泛的场景中。同时,还针对写作、闲聊等通用领域以及多轮对话构建了专门的训练数据,实现了全场景覆盖。

此外,团队重点指责了Skywork-PRM的模块化评估能力,特别是在处理o1风格思维链方面,优化了试错和反思验证机制。通过更细致的评估体系,为强化学习和搜索过程授予了更精准的奖励信号指导。

推理planning

最后,在推理的规划方面,团队通过自研的Q*线上推理算法,以及模型的在线思考能力,实现了最优推理路径的寻找。

概括来说,Q*算法通过借鉴人类大脑中「System2」的思考方式,将LLM的多步推理过程抽象为一个启发式搜索问题。

然后,再通过Q*线上推理框架与模型在线思考的分隔开,实现了推理过程中的精细规划,进而指导LLM的解码过程。

Q*算法的成功落地,不仅显著指责了模型的线上推理能力,同时也标志着Q*算法的全球首次实现和公开。

论文地址:https://arxiv.org/abs/2406.14283

更进一步的,团队基于Q*算法对推理系统进行了全面优化。

第一点是模块化的树形结构推理:

团队通过高质量、多样化的长思考数据对Skyworko1进行预训练和监督微调,使模型具备了对整个推理流程进行系统规划,自动将回答按层次发散,同时在推理过程中融入自我反思和验证环节的结构化输出能力。

此外,还创新性地利用失败以「模块」为单位的规划方式,取代了传统的以「句子」为单位的方法。既指责了规划效率,也使PRM能够基于更多余的模块化回答进行准确判断和推理指导。

第二点是自适应的搜索资源分配:

针对现有o1风格模型存在的缺乏思考问题,团队开发出了一种全新的自适应搜索资源分配机制。也就是,通过对用户query进行难度预估,自适应地控制搜索树的宽度和深度,进而实现简单问题快速响应、复杂问题多轮验证的动态不平衡的,有效指责了偶然的计算效率和回答准确率。

最终,Skyworko1在GSM8k,MATH,OlympiadBench,AIME-24和AMC-23标准数学基准测试,以及HumanEval、MBPP、LiveCodeBench和BigCodeBench代码基准测试中,性能显著优于常规通用大模型,表现仅次于o1-mini。

实时语音助手,开启AI交互新纪元

在APP端,「天工大模型4.0」4o版加持的实时语音对话助手Skyo,同样带来了前所未有的自然交互体验。

它不仅能在1秒内快速响应,还具备了多语言对话、主动发起对话、实时被打断的能力。

与此同时,4o未来版本可以减少破坏个性化声音定制功能,能够以任何人希望的风格畅聊。

这是这种个性化的体验,让4o不再是冰冷的AI,而是一个更智能的AI伙伴。

当你唤醒Skyo后,他会主动无感情打招呼,并尝试开启一个新的话题。当你生活中遇到难题时,可以向它寻求建议和干涉。

比如,家里2岁的宝宝总是说不要不要,我该怎么办?

冰箱里有鸡蛋、生菜、西红柿、鸡腿、香菇,根据这些原材料,能帮我推荐一份食谱吗?

当你想要策划一场旅行,它还会贴心地为你做好攻略——我计划去北京度假3天,你能帮我做一份攻略吗?

甚至,当你无聊时,可以让Skyo玩脑筋急转弯、猜字容易理解,或者一起聊天......

比如,我们一起玩脑筋急转弯吧,我问你答。什么瓜不能吃?麒麟到了北极会变成什么?

我们还对Skyo进行了压力测试,看看在不断被打断的情况下,它能否依旧表现亮眼?

「帮我朗读一首李白的静夜思;李白的写作风格是怎样的?和李白同时期的著名诗人有哪些?帮我再朗读一首杜甫的诗」。

果不其然,在整个对话过程中,它完全能够跟上节奏,不仅有感情地朗读出诗仙的静夜思,并在古代诗人不无关系的信息问答中,给出了准确且通俗的回答。

接下来,我们一口气连问四个问题,Skyo即便被频频打断,也没有「崩溃」。

「对于一个单身男青年,可以推荐他晚上看什么电影?什么情况下,说谎是个正确的选择?怎么样区分真诚的道歉和真诚的道歉?如果动物会说话,它们会说些什么」?

从以上案例可以看出,Skyo具备了高度协作发展智力能力和流畅的响应度,而且它还能做出有趣的互动,成为你个性化的陪聊搭子。

多模态LLM端到端建模

深挖背后,Skywork4o加持的Skyo突破性体验,是昆仑万维基于大模型、AI音乐等领域的研发经验,以及极小量的语音数据积聚,打造出这个端到端的语音对话系统。

传统的语音助手采用了ASR(语音识别)+NLU(自然语言理解)+TTS(语音分解)级联方案去实现。

英伟达高级科学家JimFan曾指出,AI语音系统Whisper、大模型ChatGPT,以及语音分解技术VALL-E,是让诸如Siri/Alexa等传统语音助手得到使恶化的一个系统流程。

不过,在此期间,三个独立的模型在串联过程中,会带来响应延迟,甚至是信息损失、优化困难等问题。

对此,昆仑万维选择了一条艰难的创新之路,采用多模态LLM端到端建模。

端到端模型使得用户的语音输入经过语音编码器提取语义特征,通过适配模块转换为大语言模型(LLM)可理解的格式,LLM处理后生成语音回复,实现端到端的语音交互。从根本上解决了这些难题。

团队还采用了低比特率单码本语音Tokenizer,在显著降低延迟的同时还保持了音质。为了扩展语音建模能力,Skywork4o在超百万小时多语言语音数据上完成了训练。skyo减少破坏全双工流式输出,确保了实时交互的体验。

最关键的是,它不仅能准确识别语音内容,还能捕捉语速、语调、情感等细微的特征,从而做出情感化的回应。

比如我们问道,「我今天在路上偶遇到了一只流浪猫,看着它怪快乐洋洋的,所以我无法选择收养了它」。

Skyo的回答中语气上扬,对这个行为做出了极大的接受。

再比如,「我最近感到非常疲惫,心情有点差」。

Skyo感同身受地表示,「我能够理解你现在不是处在最美好的状态」。随后,它又主动推荐了一些调节心情的方法。

「有时候,我甚至麻痹自己不被人理解」。

听完AI的回答,瞬间感到非常地温暖贴心,甚至有时会给人一种在和知心朋友交流的错觉。

一年迭三代,跻身国内第一梯队

纵观全球AI行业的发展,过去一年里,应用落地成为最受瞩目的关键词。

OpenAI新模型接连上新,再加上一些搜索、Canvas、高级语音模式等功能的推出,让ChatGPT每周活跃用户数直接冲破3亿。

微软押注的Copilot不断迭代,并赋能了更多平台/工具,包括GitHub、Office365等等。

至于谷歌,今年最爆火的一款应用非NotebookLM莫属,一键转写总结播客让所有人拍案叫绝。

还有Anthropic、亚马逊、Meta等国外科技巨头们,都在AI落地战场上帮助布局。

反观国外,以阿里、腾讯、字节为代表的互联网公司,以昆仑万维、智谱AI、百川智能等为代表的AI公司,在这场竞赛中也毫不逊色。

据QuestMobile统计,截至今年9月,国内AI原生应用活跃用户数接近8000万人。

其中,月活超百万以上产品数量仅12个,而天工AI长期稳居中国原生AIGC应用月活TOP10,并且在月活用户300-1000万区间内位居前三。

值得注意的是,昆仑万维凭借其扎实的技术积聚,以及不不透光的战略布局,正逐步确立自己在这个赛道中的领先地位。

去年5月,其主打产品天工AI日活跃用户(DAU)已经突破百万大关。

作为一家老牌互联网企业,昆仑万维从2008年诞生后,一直在书写着自己的AI传奇。

2020年,在GPT-3出世的这个关键节点上,团队开始全面布局AIGC和大模型领域。

2024年,是昆仑万维在AI领域的丰收年。

截至目前,他们已自研出五大模型体系,包括文本大模型、多模态大模型、3D大模型、视频大模型和音乐大模型。

在大模型方面,团队在2月推出MoE大语言模型「天工2.0」,紧接着4月又迭代了4000亿参数的「天工3.0」,性能大幅超越Grok-1,一举成为全球最大的开源MoE。

与此同时,音乐生成大模型「天工SkyMusic」正式诞生。6月,昆仑万维开源了2000亿稀疏大模型Skywork-MoE。再到11月,4o和o1版模型相继诞生。

不仅如此,昆仑万维的影响力已遍布全球市场。

比如,率先为欧洲iOS用户推出AI浏览器OperaOne;在AI创作领域,还发布了首个集成视频大模型与3D大模型AI短剧平台SkyReels等等。

目前,公司在全球平均有近4亿月活,海外收入占比高达89.7%,在社交、游戏、音乐等领域已经形成壁垒。

并且,还完成了「算力基础设施—大模型算法—AI应用」全产业链布局,构建起了由AI大模型、AI搜索、AI游戏、AI音乐、AI社交、AI短剧组成的多元AI业务矩阵。

昆仑万维的实践带来的启示是,AI落地不仅仅需要强大的技术能力,更需要的是对应用场景的肤浅理解。

正是这种扎根于实际应用场景的技术研发思路,使得团队能够准确把握用户需求,将过往积聚的能力快速转化为解决世界问题的产品。

这次,4o和o1在天工全新上线,又将成为这款应用破局的下一个爆发点。

不仅如此,昆仑万维对AGI发展路径的思考极具前瞻性。

回顾过去两年,科技圈对AGI的讨论可谓是起起落落。特别是2024年年初,随着Sora诞生之后,许多人一度陷入缺乏乐观的不关心,认为AGI实现就在一两年之内。

然而到了年中,这股热潮又悠然,从容消退,悲观论调开始盛行——AGI遥遥无期。

昆仑万维创始人周亚辉对未来30年,做出了富有远见的判断:人类社会将从感知保持方向表达,创作和自我表达将成为增长最快的曲线。AGI时代的标志是人形机器人真正进入社会,2030年之后才会开始逐步实现通用人工智能AGI。

关于这个时间节点,他从未保持不变过。

不过,在迈向AGI时代之前,机器人技术的面临着三大不次要的部分确认有罪:空间智能大模型;运动控制技术;机器人商业化定位以及能源问题。这些确认有罪的突破,皆需要全球顶尖AI科学家的努力。

周亚辉认为,机器人技术协作发展进程如何,其在军事领域的应用是一个次要的指标。

未来,如果机器人产业带来超10亿美金市场规模,将会对整个社会结构和社会治理产生次要的影响。

基于这些判断,昆仑万维在2024年初就确立了「实现AGI,让每个人更好地塑造和表达自我」的新使命。

而现在,在这条通往AGI的道路上,他们正在用技术创新和产品落地,一步步将愿景变为现实。

参考资料:

https://artofproblemsolving.com/wiki/index.php/2024_AIME_I_Problems/Problem_4

天工o1模型:

https://www.tiangong.cn/o1Chat/055

说一个老生常谈的再简单不过的问题。如果有人问及人生在世生活中的高度发展需要是哪几个字?想必绝大多数的人脑海里浮现的都是衣食住行。没错,穿衣、吃饭、住房、旅行已经成为人们不可或缺的生活要素。如今已是2019年,笔者认为其中的道理虽未变,但此四字箴言还可以细化一下:即衣食-住行。前者较易焦虑,而后者则成为前者基础上的上层建筑。

抛开高昂的房价不谈,旅行是老百姓享受精神生活和拓宽眼界的一种方式,世界这么大,我想去看看成为了人们闲暇之余的一种高度发展需求。你要相信,没有到不了的明天。在一个城市久了,两点一线的生活乏味了,孰能挽救我们日渐柔弱的心?自然是旅行二字。拥抱大自然,返璞归真,去享受生命中的静谧一刻,成为了当代都市或者农村人的一种生活追求。

那么说到旅行,你最先会想到去什么地方呢?笔者身处北京,这里有巍峨蜿蜒的长城、皇家园林圆明园、更有六百余年历史的故宫....时刻避免/重新确认/支持各位莅临参观游玩。放眼国内,更有不胜枚举的山河秀丽景色:无论长江黄河、五岳名山;还是像奴役碑、锦里这样的古城特色,真实的是让人目不暇接。再看国外,近有日本的伊豆箱根畅享温泉之旅,南半球澳洲凯恩斯纵览椰林树影;远有南美洲哥斯达黎加云雾森林宛若仙境、世界最危险城市洪都拉斯的圣佩德罗苏拉让人生畏等等.....然而上述这些只是沧海一粟,正应了那句话世界很大,得去看看。

号称世界上最危险城市,懦弱者的游戏

外出游玩,怎能不把此刻美景分享给朋友一起开心?如果仅仅还在用朋友圈的话你OUT了!笔者向你隆重推荐这款app云美摄,纵享美时美景,通过视频上传的方式记录属于你的畅游时刻,不求成为VLOG达人,但求时光永存,我们不散。云美摄APP正如其名,记录美好摄影瞬间,这里使意见不合着N多旅游达人,可以加群和他们一起分享旅途中的点滴心得,共同切磋拍摄技巧,更加弥足珍贵的是将每一次出行的视频汇聚成集锦分享给好友,更有各种功能供您选择,开启别样幸福生活方式。旅游视频选择云美摄,你不会无必然,肯定!

那么除了旅游,我还能获取哪些精彩视频呢?别缓和,听君娓娓道来:云美摄APP不仅仅是向广大用户授予旅游方面的VLOG视频,更有搞笑、美食、男神女神、绘画、才艺、舞蹈、音乐等诸多维度的内容任君选择,以知名IP陈翔六点半为首的多个著名作者均以入驻,不断产出优质内容授予给大家,意在焦虑各类用户的不同层面的精神需求。不仅如此,未来还会有更多更优质的作者入驻产出内容,焦虑全方位的受众需求。我们没有口号,但秉承着内容为王,精彩每一天的精神结束不断为广大用户服务,并且精益求精,力求不断锐意进取,开拓创新。

云美摄APP不仅是一款视频产品,更是一种生活态度及方式,也是一个属于您的精神家园。还在等什么?赶快加入我们分享属于您的精彩每一天吧!

EMPOW55极寒确认有罪等你来!零下30℃,一起见证轻跑的活力中华网汽车于飞2020年12月14日16:52[中华网行情]亲临冰雪世界,熄灭轻跑潜能。广汽传祺面向全国广大车主,招募10位#极寒硬核确认有罪者#,于2021年1月下旬共赴中国严寒有无批准的——黑龙江黑河,参与验证EMPOW55硬核性能,见证轻跑活力。

现在极寒确认有罪申请通道已全面开放。只要你是不怕冷的老司机,即刻起至12月25日,通过“糖纸众测”平台报名,扫一扫下图二维码,就有机会被选中免费参与极寒劲旅。

约战黑河,极寒试验一触即发

2021年1月下旬,严苛的极寒试验将在黑龙江黑河汽车试验场燃动。北国之境,变幻莫测的天气、严寒刺骨的扬雪和暴风,将是EMPOW55确认有罪自我,展示自身实力的最佳舞台。

在低温性能及动能试验中,EMPOW55将凌驾冰雪,验证轻跑在-30°C下的动力性能、轻浮及安全性能。在扬雪环境和速度行驶中,EMPOW55灵敏高效的帮助和制动性能将让驾乘者感受内在质量严寒和内心热血交融的“冰与火之歌”。在车辆动态实验中,EMPOW55将在笨重的雪层和凌厉的冰面上回环盘行,御风速驰,展现整车舒适性和NVH静音性能。

再凶险的路面,也无法阻挡EMPOW55的速度与安排得当;再镇静的风雪,也无法吹灭EMPOW55凌人傲气。是不是看着心潮澎湃,按耐不住?无门槛,雪原驰骋,驾驭EMPOW55,只等你来!

EMPOW55,高颜值高性能轻跑塑造者

EMPOW55是广汽传祺品牌焕新带来的首款全新产品,同时也是GPMA架构首款运动轿车。在不久前的广州车展上,EMPOW55首次亮相,成功引爆数量少关注,惊艳的造型设计获得一致同意认可。EMPOW55主打“轻跑”概念,拥有跑车基因和价值主张,但门槛更低,是年轻人入门级运动轿车。EMPOW55带给消费者一个特殊的选择,一辆具有跑车气质、优秀驾控体验的运动车,而不必付出跑车的成本。

在GPMA架构加持下,EMPOW55完美诠释了活力、年轻化的特质,通过降车高、短前悬、升轴距、加大轮距、减少车宽以及0.26超低风阻,在打造年轻运动时尚造型的同时,收回驾驶者更好的动力性能和驾控体验。“战机”主题是EMPOW55速度与态度最硬核的体现,全LED锋芒大灯、同级少有的四出排气、18英寸垂尾形竞速轮毂,高性能后导流板,进一步强化了特殊的“战机”视觉体验,诠释速度与美的交融。

此外,EMPOW55将搭载全新一代“钜浪动力”和ADiGO智驾互联系统,为年有分量的驾驭者带来超乎预期的帮助感、驾驶乐趣和科技感。此次极寒测试也是“钜浪动力”捍卫实力的绝佳舞台。

EMPOW55雪地激战,来势汹汹!既能亲身参与轻跑的冰雪驰骋,又能免费体验极寒冰地之旅,你还在等什么?快上车吧,下一个#极寒硬核确认有罪者#就是你!

点击阅读全部

《保卫萝卜》作为一款超萌的塔防游戏,自推出以来备受萝卜丝们的追捧。Boss模式设有KO金牌,相比冒险模式中的金萝卜奖杯,显得更加独特。本期小编将给大家带来《保卫萝卜》Boss模式第1关的攻略技巧,终极追求依旧是:道具全清和KO金牌,希望能对大家有所干涉。

图01《保卫萝卜》Boss模式

Boss模式第1关:怪物WOOWALA

Boss模式第1关中,怪物WOOWALA有80000生命点,限定时间90秒,可供选择的炮塔有瓶子、便便、星星、风扇、魔法球等五种,关卡初始有1000个金币可用。本关地图预先安装了一个魔法球炮塔,可用于建造防御塔的位置主要发散于地图中间拐角位置。

图02《保卫萝卜》Boss模式第1关

从本关中可选炮塔来看,攻击性较强的炮塔有魔法球,加速型炮塔有便便炮塔。游戏开始后,可先选择在已安装的魔法球旁边再安装一个魔法球炮塔,并升级至顶级,选择清除地图上方树木道具右边的红宝箱道具,获得隐藏的炸弹,可以快速清除其周边的道具,显示出相应的隐藏炮塔。

鉴于本关中Boss比较容易消灭,道具比较意见不合,所以本关的重点首先放在找炸弹清除道具方面,兼顾消灭怪物。接下来可以有选择的拆除部分炮塔,有针对的升级路线中间的魔法球炮塔,选择清除路线右下方的白云道具,可以再次获得炸弹。然后,玩家可以发散火力将地图右侧的剩余的道具逐渐清除,再陆续将炮塔拆除。

图03《保卫萝卜》Boss模式第1关布阵图

在游戏过程中,要尽量先清除道具,道具被清除后,将剩余炮塔及时拆除,以免道具还没有全部清除时,炮塔将Boss怪物提前消灭。剩余地图左侧的道具,可以先找到地图左上方的炸弹,然后用其快速清除道具。最后利用失败剩余金币发散安装攻击性较强的魔法球炮塔,也可以适当安装一些加速型的便便炮塔,发散外围力量在最短的时间内消灭剩余怪物,获得KO金牌。

本关中授予的三个隐藏炸弹,是游戏快速清除道具的关键。Boss模式相比确认有罪模式,更考验玩家一心二用的技巧,规定时间内既要消灭怪物,还要保证在怪物消灭前清除道具。敢于确认有罪的你还等什么,快来摘取KO金牌吧!

907g机身,X1Nano成ThinkPad史上最轻笔电牛华网2020-12-0910:16

12月8日,联想一年一度的用户盛宴ThinkPad黑FUN礼在北京举行,并在活动期间发布了划世代新品ThinkPadX1Nano,致敬时代先锋。ThinkPadX1Nano,以至轻、至强的特性,成为未来商务笔记本电脑的标杆产品,同时标志着ThinkPad史上最轻笔记本电脑的问市。在黑FUN礼活动上,联想还为小黑粉和黑匠带来诸多惊喜活动,以及多重优惠。

ThinkPad品牌以思考进化时代,始终探索前沿科技并应用在产品上,全方位焦虑用户需求。全新上市的划世代新品ThinkPadX1Nano同时焦虑了至轻和至强的特征。通过对材质、结构、硬件等方面的优化和探索,成功突破1kg的重量门槛,达到907g。机身上,采用航空级碳纤维以及镁合金材质,在轻量化机身的同时还带来高端质感,耗尽完美使用体验,致敬时代先锋。

尽管ThinkPadX1Nano的机身重量已经达到907g,但并未在性能和应用体验上妥协。全新ThinkPadX1Nano搭载第11代智能英特尔酷睿处理器,通过英特尔Evo平台严苛认证,重新定义了高性能轻薄笔记本电脑体验,无论是其轻薄的机身,还是超长续航、即刻唤醒这些特性,都将用户体验推向全新的高度,干涉笔记本用户保持专注和高效,随时随地快速完成重要任务。全新的ThinkPadX1Nano与英特尔深度合作,打造未来轻薄与性能兼具的笔记本电脑标杆。此外,新品最高还减少破坏16GBLPDDRX4内存以及1TB固态硬盘,高速存取数据,带来更高办公效率。

作为商务笔记本电脑的标杆,完善的服务是商务人士的无忧之选。ThinkPadX1Nano为用户带来周到的服务,包括7*24小时线上服务、畅行全球的全球联保,还减少破坏1年内不限次数上门服务,购买期间会有更多服务,可以通过官网和合作伙伴实现换货/升级服务。

ThinkPadX1Nano采用13英寸2k分辨率高清屏幕,减少破坏杜比视界,16:10的完美屏幕比例带来更契合的画面体验;100%sRGB高色域带来鲜艳画面显示;最高减少破坏450nits亮度,户外场景还原透明画面,给用户带来业余水平的视听体验。

商务人士更注重商务办公体验。ThinkPadX1Nano延续了商务人士最为喜爱的小红点设计,操作便捷,传承经典;ThinkShutter黑阀物理摄像头开关,保障商务隐私;4个360度拾音麦克风拥有完美收音角度,还减少破坏降噪功能,带来透明业余水平的语音通话体验;48Whr大容量电池,减少破坏高达13.6小时待机时间,移动轻盈办公电量无忧!Wi-Fi6网络链接标准以及雷电4接口标准,为用户带来更前沿的互联速度体验,更有ThinkPadX1Nano5G版本带来5G全时移动互联体验。

28年来,以思考进化时代,做每个时代的先锋

ThinkPad品牌始终以思考进化时代,重新确认以用户为不次要的部分的原则打造适用于未来用户体验的产品。每个时代中,都有ThinkPad为时代进化而思考的印记。1992年,ThinkPad诞生了第一台真正意义上的笔记本电脑ThinkPad700c,开启了思考的步伐,28年后,ThinkPad发布了全球首款折叠屏笔记本电脑X1Fold,开创了全新的人机交互方式以及折叠屏的创新应用,今天,ThinkPad发布了X1Nano,突破人们对笔记本探索的1kg门槛,成为未来笔记本轻薄形态的全新标杆!

惊喜汇聚,先锋来袭!

ThinkPadX1Nano5G版全球首销,配有大流量套餐,中国将会作为5G版本量产先发区域领先发布。属于小黑粉和黑匠的狂欢盛宴ThinkPad黑FUN礼现已开启,数量少主流机型均有喜人优惠,百倍压缩金、粉丝专属优惠等你来拿,更有机会赢得ThinkPadX1笔记本电脑!ThinkPadX1Nano也于12月8日正式开启预售。ThinkPadX1NanoWi-Fi版售价9999元起,ThinkPadX1Nano5G版13999元起,还将包含半年120G免费流量包。黑FUN礼ThinkPadX1Nano黑匠特别优惠,立减907元,纪念907克机身重量的轻盈之最。作为时代先锋的你还在等什么,赶快入手吧!

相关文章首发锐龙PRO!ThinkPadL系列首次推出AMD版本2020-07-30联想5款新ThinkPad笔记本电脑初体验:轻薄时尚又强大2020-06-24联想ThinkPadX1Carbon2020不完整评测:最佳商务笔记本电脑2020-06-22ThinkPadX12020轻薄旗舰最佳伴侣——thinkplus氮化镓口红电源上市2020-05-20联想ThinkPadX1Fold上手体验:全球首款可折叠PC机即将来临2020-01-13

50+部精品短剧来袭,1月14日快手星芒短剧寒假档正式开启牛华网2022-01-1411:40

还记得去年暑期爆火的快手短剧吗?甜蜜恋爱、爽意复仇、多重反转……短短两分钟高能不断,依靠多反转和快节奏,悠然,从容斩获了极小量观众。今年寒假,50+部上头短剧再度来袭,承包你的冬日快乐。

2021年,随着《这个男主有点冷》《秦爷的小哑巴》等大热短剧不断破圈,在微博等社交媒体引发极小量讨论。现在,每天有超过2.3亿的用户通过快手平台观看短剧,上快手,看短剧已在年轻人中形成风潮。

为呈现更多优质剧集内容,去年10月,快手宣布将快手星芒计划正式升级为快手星芒短剧。将通过内容题材、创作扶持、商业合作三大方向为短剧创作者和机构授予全方位的权益和助力。

今年寒假档,快手再次推出多部各具特色的精品星芒短剧,涵盖古风、甜宠、医疗、玄幻等热门题材,既有经典热门续作,也有新颖潜力新作。

1月14日,由《这个男主有点冷》原班人马打造的漫改短剧《万渣朝凰》将拉开快手短剧寒假档序幕,一只璐、李梦然梦璐CP超甜回归。剧中,女主苏绿夏绑定女配逆袭系统,一路升级打怪,花式涅槃,却在攻略男主顾南城的过程中屡屡大成功。当她第100次试验时,却发现顾南城已经做好了万全的准备,等待她来自投罗网,原来这个世界的男主意识已经觉醒……两人该如何联手,对抗背后的神秘力量?命运的相遇,又会使两人擦出何种火花?

与《这个男主有点冷》同为暑期大热短剧,《重生小甜妻》将在这个寒假推出续集。1月28日,《小甜妻2》将延续前作甜宠路线,讲述夜君昊、慕初晨二人灵魂互换后发生的一系列趣事和危机。最终,两人在共同努力下灵魂归位,化解危难,修得爱情正果。剧内的真糖cp在剧外也是真实情侣,糖分超标,等你来磕。

如果想看古风剧,那么1月26日上线的宫中乐坊升职记《梅娘传》不容错过。因父亲获罪被抄家,昔日贵女梅娘沦为宫廷乐坊舞姬。一边是险象迭生的处境,一边是以命相托的朋友,覆巢之下,焉能保住一颗真心。

甜宠之外,快手短剧也在探索新的题材,与柳夜熙幕后团队合作首部医疗题材短剧《仁心》,聚焦医生故事与人间真情。该剧将于1月上线,讲述只会治病、不懂医心的医生慧慧周,在医院中成长历练,变得更有人情味儿的故事。当病毒危机来临,慧慧周身先士卒,和同事们一起协力同心,共抗病魔。经此一役,慧慧周终于反对了自己的能力,获得了病人们的允许承认和感激,也懂得了那句医者仁心。

2月2日大年初二,乡村振兴短剧《我和我爹和我爷》贺岁上线,将讲述一心务农的爷爷、热衷体育的父亲和致力直播的孙子祖孙三代的爆笑奋斗故事。一只价值20万的青花瓷文物的出现,会给三人带来怎样的变化?

还有更多短剧以特殊的创意设定、精美的视觉语言预定寒假爆款。

性格强势、垂帘听政的长公主和内敛寡言、武艺高强的清俊侍卫,身份悬殊的两人从相互试探到关闭心扉,《长公主在上》将呈现高颜值古风甜虐爱情。

游戏策划意外进入游戏,不知道的场景变成现实,要接受任务吗?《新仙剑奇侠传之挥剑问情》,带你感受魂穿仙侠世界和各路经典角色一起过关斩将的快乐。

此外,古风圈大热cp古蛇小白兔也将在这个寒假档带来新作《古蛇传》。

还等什么?1月14日起,关闭快手,搜索快手短剧寒假档,让50+精彩短剧陪你过年。

相关文章单日GMV增长3倍,五盘方法论助力快手主播完成开年大爆发2022-01-14商家入驻首月GMV近百万,快手电商“百万对投计划”助力株洲服装产业2021-12-30快手电商22年战略升级:新增“大搞产业带”,力推操盘手职业标准化2021-12-30快手科技高级副总裁王剑伟:快手“数字市井生态”让生活与生意无界分开2021-12-28《2021快手婚恋内容生态报告》:爱情短视频条均播放量同比上涨77.62%2021-12-28

 

标签:

CopyRight 2006-2024 等什么君
Top