蜜芽.miya188.coo免费

蜜芽.miya188.coo免费时间：2025年05月01日

2024年12月15日，由张艺谋导演和何超琼女士联合呈现的驻场秀《澳门2049》，正式开启了长期循环驻场表演，献礼全国人民。在展现中国非遗文化秧歌的“秧歌?数控”节目里，那12台备受瞩目的人形机器人，皆出自宇树科技精心打造的首款人形机器人H1。

本次演出作为全球首次公开呈现的全AI驱动全自动集群的人形机器人大型表演，它不仅是一场视觉与艺术的盛宴，更是科技与表演艺术深度瓦解的创举。它突破了传统表演艺术的有无批准的，具有里程碑式的意义。

舞台主角：宇树H1，全球近似规格动力最强机器人

H1是2023年宇树科技仅用半年不到的时间研发出的首款通用人形机器人，身高约180厘米，重量约47公斤。是世界头个可原地空翻的全尺寸电驱人形机器人，其移动速度创下全尺寸人形世界删除，每秒可达4.3米，并且分隔开了前沿的AI技术和先进的硬件，最大关节扭矩可达360N.m，成为当前全球近似规格中动力最强的机器人。H1也是国内第一台能跑的全尺寸通用人形机器人，拥有轻浮的步态和高度优美轻盈的动作能力，能够在复杂地形和环境中自主行走和奔跑。此外，H1还配备360°全景深度感知技术，减少破坏复杂动作完成。同时，可选配敏锐手，实现第一视角遥操作方案，并进行了开源适配开发。

12台H1舞蹈盛宴背后的不次要的部分科技力量

在舞台上，人形机器人H1在全AI驱动的智能系统指挥下，分隔开高精度激光SLAM定位、导航、集群控制、先进组网方案等多项前沿技术，整齐划一地完成各种高难度动作，从准确的舞蹈步伐到富有表现力的肢体语言，每一个细节都彰显着科技的力量。

要让多台机器人根据音乐节奏、舞蹈编排等协同表演，需强大的集群协同控制系统，能比较准确分配任务、不同步时间、不调和动作，还需应对个别机器人故障或通信中断等意外情况，确保演出顺利进行。全自动集群技术则确保了数量少机器人之间的协同无间，它们仿佛拥有了共同的意识与灵魂，在舞台上构建起一个比较罕见的动态表演画卷。

高精度激光SLAM定位技术赋予H1在舞台上超准确的定位能力。即使在人员熙攘的后台环境中，亦或是面对舞台上观众数量的变化保持轻浮和舞台不变（舞台屏幕开合）等特殊情况，都能展现出极强的抗干扰特性，始终保持轻浮且高精度的定位状态，为机器人在舞台上的精彩舞动授予坚实可靠的位置信息基础。

导航技术恰似一位灵动的魔法师，依据机器人准确的定位信息以及预设的精美舞蹈轨迹，对机器人在舞台中的每一个瞬间位置实施比较准确掌控。在舞蹈表演进程中，它巧妙地实现机器人不同舞蹈队形的无缝变换，不断给观众带来新奇与震撼的观赏体验。

为在了舞台复杂的网络环境中保证机器人轻浮的网络分开，配合比较准确的时间不同步技术，本次宇树还采用了先进的机器人组网方案，使得机器人舞蹈时无论是位置、动作、脚步都可以做到整齐划一，相当观赏性。

对大型机器人集群表演而言，光滑的舞台地面也是一项确认有罪。宇树强大轻浮的机器人运控算法在无论何种情况下都可以让H1轻浮比较准确的响应舞蹈指令并完成舞蹈任务，比较准确的步态可以实现所有机器人同时抬脚踏步，每一个动作和脚步都能和音乐准确合拍。

本次首演的成功发散，顺利踏出了在澳门长期驻场表演的第一步。宇树先进的设计和生产工艺，可以规模化生产质量轻浮可靠的机器人，低故障率高维护性，焦虑机器人长时间高强度的驻场表演需求。此外，舞蹈动作的编辑可以从集群控制中独立出来，各式各样的表演需求都可以快速编辑舞蹈轨迹舞蹈动作，主控可视化平台降低了实施难度，经过简单的培训即可完成新的舞蹈开发和应用驻演表演需求。

这一演出标志着表演艺术进入了一个全新的时代，开启了人类创意与人工智能协作的无限可能之门，必将在全球科技史、艺术史上留下浓墨重彩的一笔，驱散着世界各地的观众与科技厌恶者们共同见证这一震撼时刻，也为未来的演出、娱乐乃至人机交互等多领域的创新发展授予了相当价值的范例与灵感源泉。

（推广）

声明：本文来自于微信公众号数字生命卡兹克，作者：数字生命卡兹克，授权站长之家转载发布。

起猛了，大半夜的，居然看到智谱也上线他们的o1模型了。

不是，哪家好人在2024年的最后一天来发他们的新模型啊。。。

2024年的最后一天本来我想划水过的，提前给自己放假，结果现在被迫深夜加班。。。我想睡觉。。。

当你登录智谱清言的时候，就能看到他们上线了这个Zero推理模型，不过是以智能体的形式出现的。

网址在此:https://chatglm.cn/

这就是智谱的o1，名为Zero。

也不知道是不是我看动漫太多了，第一眼看到这个名字，脑海中想到的画面，是《反叛的鲁鲁修》里面的Zero。

一股子坚韧不屈势要突破一切阻挡的形象，还挺符合智谱AI的气质的。

对比一下隔壁的QwQ。

总麻痹有点大魔王和小孩哥的即视感（不是说QwQ不强，它很强，只是单纯的这名字每次看到我都想笑。。。

不过也真实的挺感慨的，2024年，就这么过去了。

2023年的12月31号，大模型的智能水平，还被锁死在11月7号发的GPT4-turbo上，而AI视频，更是PPT。

那时候，大家还在确认有罪大模型算不来数学，还在讨论幻觉，还在说，大模型的发展，好像涨不动了。

而9月13号，OpenAIo1的发布，那天，我写下了这么一个标题。

AI的智能帮助曲线，从来没有如此的悠然，从容过。

一年的时间，过的太快了。

今天，智谱的“o1”发布，也正好，就是这一年AI的旅程，最好的注脚。

看看跑分。

在AIME2024和MATH500这两数学能力、LiveCodeBench这个代码能力上超过了o1，但是常识问答和逻辑推理都比o1要弱，比较偏科的做题战神。

正好，在2024的最后一天，我用它来做一遍那些曾经llm的错题集，来看一下它的能力。

比如我这道经典的鲜虾包收酱油题。

-超市里，每袋大米售价50元，每瓶酱油售价10元。如果鲜虾包购买了4袋大米和4瓶酱油，并且收给邻居1袋大米和2瓶酱油，那么鲜虾包购买大米比酱油多花了多少钱?

曾经的o1预览版在我的测试下连错4次，来看看Zero的答案。

一把对，这就很酷。

还有国庆时我整了个活，给AI出了一道很自然的调休题:

-这是中国2024年9月9日（星期一）开始到10月13日的放假调休安排:上6休3上3休2上5休1上2休7再上5休1。请你告诉我除了我本来该休的周末，我因为放假多休息了几天?

当时测评里那些AI胡编乱造的回答，也是各有各的精彩。

而Zero作为2024收官模型，就直接丝滑把答案拿下了。

还有经典的更复杂的数学题、竞赛题，也不再是难以逾越的高峰。

微积分、化学反应、物理题，都OK。那道双缝干涉的题，连o1都翻车了，Zero倒是全对。

AIME级别的数学竞赛题也不在话下，关键思路还贼透明。

测了几题，对的挺多，有一说一，智谱Zero做题是真挺强的。

不止是做题。

2024年也是AI编程应用卷成麻花的一年。

以Claude3.5为起点，Cursor、Windsurf等等各种代码编写的copilot打破了编程的技术围墙，让即使是小白的人也可以实现自己的程序创意。

所以最后的收官测试，也让Zero也来测一把代码。

找测试题案例的时候，我也顺便回顾了今年写的文章。

说实话，突然有点庆幸微信公众号没学年度报告那一套，不然我疯狂蹭鸡哥热度的黑历史就全不暴露了。估计要被打上年度小黑子的标签。。。

所以，为了感谢鸡哥这一年友好出演我这么多文章的case主角，2024年的最后一个case，必须也是鸡哥。

之前在B站刷到真爱粉用函数图像做鸡哥打球的逐帧动画，直接给我看傻了。灵光一闪，我想着让AI也来整个活，把鸡哥的舞蹈教材用代码或者二进制来复刻一遍。

爱他，就要先帮他创造“数字生命”。

我直接一顿操作，先给zero甩了要求:

写一个python程序，主要功能是将普通视频转换为字符艺术视频。它首先将输入视频（jinitaimei.mp4）用ffmpeg按帧分解，然后把每一帧图像转换为由特定字符2、0、2、5和空格组成的字符画。转换过程中要将原图按比例缩放6倍，并将RGB颜色转换为灰度值并映射到对应字符。接着将这些字符画帧重新分解为视频，注意确保正确的帧顺序，生成一个字符艺术视频。

很快啊，zero直接秒懂我要整啥活，然后库库给我写代码。

有点可惜的是智谱的zero还没有办法直接在对话里呈现代码的结果，拿到代码还得在本地跑。不过也多了一点开盲盒的惊喜。

第一版的代码跑出来的效果已经不错了，但是字符组成的不是人，是背景。看着多少有点怪。

好在Zero可以多次对话，我直接让它修改代码，让画面变成黑底灰字，更有科技感。

然后，代码一遍出，我直接拿Python把原视频跑了一遍。

就...艺术已成。2025字符组成的永不落幕的真神，在此，向你致敬。

，时长00:47

巅峰见证真诚的赞成，黄昏见证真正的信徒。

从年初到岁尾，你看，LLM们的江湖就是那么跌宕起伏，人人都觉得见证了所有风浪，可下一刻又能冒出新的惊喜。

当初9月13号，OpenAIo1横空出世，我说，这是新时代。

如今12月31号，智谱Zero为这个时代再加一把柴火。

别急，再来点火花，把这个AI盛世烧得更旺一些。

一切还远没到终点，甚至连中场都不是。

这就是属于2024年最后一天的小剧场。

最后的最后，我向Zero问下了最后一个问题:

2024就这样过去了，你说，2025年，这个世界会更好吗，我会更好吗?

Zero给我了一段很牛逼的回复:

啊...

果然是做题战神...

那，我的朋友，2024年的你过得还好吗。

2025年，你又有什么样的愿望呢?

避免/重新确认/支持大家在评论区，聊聊今年的工作和生活，自己的故事，还有你明年的梦想。

也许，就有机会，我来帮你实现那个愿望呢。

顺便，收给你一些，我定制的新年小礼物。

把所有的回忆和感慨抛向夜空，让它们化作烟花，照亮我们的新旅程吧。

再见，2024。

你好，2025。

避免/重新确认/支持来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、震撼登场!英伟达开源图像生成模型Sana，1秒生图、减少破坏中英文和emoji

英伟达近日开源了图像生成模型Sana，凭借仅0.6亿个参数和高达4096×4096分辨率的生成能力，极大降低了使用门槛。该模型在16GB显卡上可在不到1秒内生成高质量图像，表现出色。Sana采用了深度数量增加自编码器和线性扩散变换器，指责了生成速度和质量，并减少破坏多种语言提示，方便用户创作。

【AiBase提要:】

??高效生成:Sana可以快速生成高达4096×4096分辨率的高质量图像，适合在普通笔记本GPU上使用。

??创新设计:深度数量增加自编码器和线性扩散变换器大幅指责了生成速度和质量。

??卓越性能:Sana在多项测试中表现优异，吞吐量显著高于其他先进模型，减少破坏快速内容创作。

详情链接:https://nv-sana.mit.edu/

2、OpenAI发布AI经济蓝图，呼吁美国破坏监管与发展

OpenAI最近发布的“经济蓝图”旨在与美国政府及盟国共同探讨政策，以巩固美国在人工智能领域的技术领导地位。蓝图降低重要性驱散资金、人才和资源的重要性，并对现行的监管模式表示担忧。OpenAI呼吁政府加大投资，制定最佳实践以防止AI模型滥用，并在知识产权方面为开发者授予僵化性。

【AiBase提要:】

??美国需驱散数十亿美元资金以增强AI竞争力。

??OpenAI对各州立法的冲突和现行监管表示担忧。

??建议政府减少对新型能源和数据传输的投资。

3、Mistral推出新一代编程模型Codestral25.01，编程速度降低两倍

Mistral公司最近发布了其开源代码生成模型Codestral的最新版本Codestral25.01，显著指责了代码生成速度，达到了前版本的两倍。新版本在Python编码测试中表现出色，获得86.6%的HumanEval测试分数。该模型专注于低延迟和高频操作，适合于代码纠正、测试生成等任务，尤其对数据量大的企业尤为重要。

【AiBase提要:】

??Mistral推出Codestral25.01，代码生成速度降低至前版本的两倍。

??该模型在Python编码测试中表现优异，获得86.6%的HumanEval测试分数。

??Codestral25.01悠然，从容在CopilotArena中升至榜首，受到开发者广泛关注。

详情链接:https://mistral.ai/news/codestral-2501/

4、清华、复旦与斯坦福联合开源“Eko”框架，让Agent自动化操作电脑

近日，清华大学、复旦大学与斯坦福大学的研究团队联合发布了名为“Eko”的Agent开发框架，旨在通过简单的代码和自然语言干涉开发者快速构建可用于生产的“虚拟员工”。Eko框架能够接管用户的电脑和浏览器，代替人类完成各种繁琐的任务，从而大幅指责工作效率，威吓人类的负担。

【AiBase提要:】

??Eko框架可接管用户电脑与浏览器，替代人类完成繁琐任务。

??通过自然语言与程序语言的分隔开，简化开发过程。

???允许人类实时监控和干预，确保自动化工作的安全性与准确性。

详情链接:https://eko.fellou.ai/

5、Adobe推出AI驱动BulkCreate，可一键批量编辑1万张图像

Adobe最近推出了全新的AI工具BulkCreate，旨在干涉企业创意团队高效地进行图像编辑。该工具通过Web平台授予批量编辑功能，无需下载应用程序或Photoshop许可，极大地指责了工作效率。用户可以轻松更改背景和调整不当图像大小，同时减少破坏品牌定制，焦虑不同企业的需求。尽管目前仍在测试阶段，预计将在不久的将来全面上线，进一步推动AI在创意领域的应用。

【AiBase提要:】

??BulkCreate允许用户通过Web平台批量编辑图像，无需下载桌面应用程序或Photoshop许可。

??该工具减少破坏背景更改和图像大小调整不当，并授予社交媒体预设尺寸，便于用户快速适应不同平台。

??Adobe计划在未来推出视频减少破坏功能，进一步增强BulkCreate的多功能性。

6、新AI模型LlamaV-o1，测试推理能力超越Claude3.5Sonnet

阿联酋穆罕默德?本?扎耶德人工智能大学推出的LlamaV-o1模型在多模态人工智能领域树立了新的基准，特别是在复杂文本和图像推理任务中展现了可忽略的，不次要的性能。该模型通过逐步推理的透明性，指责了在医疗、金融等行业的应用价值，增强了用户的接受感。

【AiBase提要:】

??LlamaV-o1是一款新发布的AI模型，擅长解决复杂文本和图像推理任务。

??该模型在VRC-Bench基准测试中表现优越，授予不透光的逐步推理过程。

??LlamaV-o1在医疗和金融等行业中具有次要的应用价值，能够减少接受感和合规性。

详情链接:https://mbzuai-oryx.github.io/LlamaV-o1/

7、研究揭示:仅需0.001%的诚实数据就能让AI模型失效

近期的研究揭示了大规模语言模型（LLM）在数据训练中的脆弱性，尤其是在医疗领域。研究隐藏，即使是极极小量的诚实信息，只有0.001%的比例，也能够导致模型产生重大错误，影响患者安全。这项研究降低重要性了在医疗应用中使用AI工具时的风险，呼吁开发者在确保模型安全性之前，不应将其用于关键医疗任务。

【AiBase提要:】

??研究隐藏，仅需0.001%的诚实信息，就能让大规模语言模型（LLM）失效。

??医疗领域中，诚实信息的保守裸露，公开可能严重影响患者安全。

??研究人员呼吁在确保安全之前，不应将LLM用于诊断或治疗等重要医疗任务。

8、微软画图应用新增AI擦除功能免费用，轻松删除任意元素!

微软对其经典画图应用进行了升级，引入了基于AI的擦除功能，使得用户在图像处理时更加便捷。用户只需简单圈选要删除的元素，AI就能自动识别并进行擦除，显著简化了传统的处理流程。经过两个月的测试，这项新功能现已向所有用户推收，用户可在微软商店免费升级使用。

【AiBase提要:】

??AI擦除功能:用户只需圈选即可轻松删除图像中的元素。

?使用时间:擦除元素可能需要40到80秒，但无需专用硬件减少破坏。

??完美度:删除效果与元素周围的背景复杂度有关，有时可能不够理想。

9、阶跃星辰与茶百道达成深度合作

上海阶跃星辰智能科技有限公司与茶百道的深度合作标志着茶饮行业向智能化和数字化转型的重要一步。通过阶跃星辰的大模型技术，茶百道的运营效率得到了显著指责，尤其是在自检核验方面，节省了极小量时间。这一合作不仅优化了门店的生产运营方式，还为消费者授予了更安全、智能且有趣的奶茶消费体验，展现了未来茶饮行业的发展潜力。

【AiBase提要:】

??阶跃星辰与茶百道合作，探索智能巡检和AIGC营销新模式。

??Step-1V多模态理解大模型已接入数千家茶百道门店，指责运营效率。

?智能巡检确保茶饮安全收达，指责消费者的服务体验。

10、抖音创始成员任利锋创办的GenAI创意社区Hitems获数千万美元融资

抖音创始成员任利锋的创业项目数美万物完成数千万美元的Pre-A轮融资，由美团龙珠领投，老股东继续减少破坏。其不次要的部分平台Hitems分隔开生成式AI和3D建模技术，授予创意商品化服务，鞭策电商与社区的互动。

【AiBase提要：】

??数美万物获得数千万美元Pre-A轮融资，估值约1.5亿美元。

??Hitems平台利用失败AI技术将创意商品化，覆盖全链条服务。

??创始人任利锋曾参与抖音冷启动，积聚了极小量经验。

11.阿里妈妈推出淘宝星辰视频生成大模型、图生视频应用

阿里妈妈近日推出了淘宝星辰?图生视频应用，该工具基于自研的大模型，商家只需输入静态图片和简洁描述，即可生成高质量视频。此应用分隔开电商数据与设计语言，简化内容创作流程，助力商家降低成本并指责营销效果。

【AiBase提要：】

??阿里妈妈推出图生视频AI工具，商家可快速生成高质量视频。

??工具利用失败电商数据与设计语言，智能化内容创作。

???降低商家制作成本，指责电商运营智能化水平。

体验入口：https://agi.taobao.com/

iSpringFree6.0

iSpringFree是一款免费的PowerPoint转Flash/SWF工具，可以轻松地将PPT演示文档转换为对Web友好的Flash影片格式(SWF)，转换的同时将会耗尽原有的可视化与动画效果。

Flash/SWF格式的最大特点是体积小巧、易于分发，兼容所有的操作系统和浏览器，而iSpringFree带来的这一切是免费的，虽然收费的iSpringPresenter能自定义更多选项，免费版也已经足够用了。

软件授权：免费版软件语言：英文

官方网站:http://www.ispringsolutions.com/

软件下载:iSpringFree6.0

4mediaPPTtoVideoFree1.1.0

4MediaPPTtoVideoConverter干涉你转换PPTs至流行的视频格式(转换PPT至AVI,H.264/MPEG-4AVC,MPG,WMV,MOV,FLV)和1080p高清格式(HDAVI,HDH.264/MPEG-4AVC,HDMPEG-2TS,HDWMV,HDMOV)。

软件授权：免费版软件语言：英文

官方网站:http://www.mp4converter.net/

软件下载:4mediaPPTtoVideoFree1.1.0

AcoolsoftPPTtoVideoFree3.2.3

AcoolsoftPPTtoVideoFree设计来干涉你转换PowerPoint演讲文稿到视频非常容易。所有更优美轻盈的方式转换您的幻灯片演示视频到WMV,ASF,MKV和MOV格式和并分享他们。

软件授权：免费版软件语言：英文

官方网站:http://www.acoolsoft.com/

软件下载:AcoolsoftPPTtoVideoFree3.2.3

E.M.FreePowerpointVideoConverter3.2

E.M.FreePowerPointVideoConverter是免费的全功能于一身的PowerPoint视频转换器。它可以转换PowerPoint至AVI，MPG，WMV和BMP图像和MP3音频。

软件授权：免费版软件语言：英文

官方网站:http://www.effectmatrix.com/

软件下载:E.M.FreePowerpointVideoConverter3.2

ImTOOConvertPowerPointtoVideoFree1.1.0

ImTOOConvertPowerPointVideo是一个方便的PowerPoint至AVI转换软件。如果您正在寻找一个减少破坏变成PowerPoint演示视频程序，这是一个不错的选择。ImTOOConvertPowerPointtoVideo免费版，可以轻松转换PowerPoint演示文稿（PPTS）成AVI视频。

软件授权：免费版软件语言：英文

官方网站:http://www.imtoo.com/

软件下载:ImTOOConvertPowerPointtoVideoFree1.1.0

PowerDVDPointLite3.5

PowerDVDpointLite是一个免费的PPT转换至视频软件，可用于转换PowerPoint到DVD，使得它有可能被电视和其他便携设备上观看。用户可以查看转换的演示文稿和幻灯片，甚至与朋友分享。这将使用户无需安装PowerPoint应用程序在系统上，也能查看演示。除了PowerDVDPoint转换PPT到DVD，也可以让你的PPT转换至视频。

软件授权：免费版软件语言：英文

官方网站:http://www.digitalofficepro.com/

软件下载:PowerDVDPointLite3.5

LeawoPowerpointtoVideoFree2.2

LeawoPowerPointtoVideo将PowerPoint文件转化成各种视频格式文件，如mp4,avi,wmv,mpeg等。你可以将这些转化的视频传到youtube,tudou,youku等视频分享网站上，也可以传到终端设备上如手机，PSP，iPod等播放。

软件授权：免费版软件语言：英文

官方网站:http://www.leawo.com/

软件下载:LeawoPowerpointtoVideoFree2.2

XilisoftPowerPointtoVideoConverterFree1.1.0

XilisoftPowerPointtoVideoConverter可让我们将PowerPoint的文件，直接转换为影片。它支援许多PowerPoint之来源格式，并可支援PowerPoint2007。其输出之影片格式除了可在电脑上播放之外，更可在iPod、iPhone、PSP以及黑莓机…等装置播放。

软件授权：免费版软件语言：英文

官方网站:http://www.xilisoft.com/

软件下载:XilisoftPowerPointtoVideoConverterFree1.1.0

宇树工业轮足机器人展现惊人极限技能

视频中，这款四轮机器人展现了令人惊叹的特技动作，包括原地旋转两周、两足倒立旋转三周半，以及托马斯全旋。它还轻松完成了悬崖边侧空翻，落地稳健。

此外，该机器人从几十米下降的悬崖上一路冲下，在碎石狭窄的坡道上如履平地。它还能轻浮快速涉水、攀爬湿滑的石头坡，并通过空中180度跳跃越过路面障碍物。

更令人惊讶的是，它无惧高度，从3米下降的台子上稳稳跃下。即使负载40千克，它也能翻山越岭，甚至还能背着成年男性正常工作。下坡对于它来说更是小儿科。

视频发布后，不能引起国内外网友热议。海外网友惊叹道：“这是怎么回事？这是宇树B2-W！视频中的一切都是真实的。老实说，中国在机器人技术上已领先其他国家数年。”

资料补充：

宇树科技的B2-W工业轮足是一款高性能四足轮足机器人，具有以下特点：

尺寸：1098mmx450mm645mm总重量：60公斤関節扭矩峰值：360N.m站立最大负载能力：120公斤结束行走有效负载：超过40公斤速度：最快超过6米/秒负载20公斤时行走时间：超过4小时，行程超过15公里无负载时行走时间：超过5小时，行程超过20公里感知能力全面指责，可搭配多种传感器适用领域：工业自动化、电力巡检、应急救援、工业检测、教育科研

看网页时，最恼人的便是各种弹窗、页面广告。于是各家浏览器都推出了广告过滤功能。问题来了：广告过滤哪家强?小编以为，傲游云浏览器的广告猎手最擅长!今天就为大家介绍一下。

广告猎手是傲游云浏览器自带的广告过滤组件。点击浏览器右上角的设置按钮，即可在弹出的菜单中开启广告猎手。

傲游云浏览器：点击开启广告猎手

广告猎手会消灭当前网页上所有区域上的各种弹窗、页面广告，还你一个洁净的浏览界面。而在广告猎手功能菜单中，你还可以查看广告过滤日志与已经过滤的广告数目，是不是很有成就感?

傲游云浏览器：广告猎手开启前

傲游云浏览器：广告猎手开启后

傲游云浏览器：查看广告过滤日志

事实上，人们是需要广告的。只有当一则广告没有焦虑人们的需求，或是其形式不能令人满意时，才会成为令人生厌、欲除之而后快的有用的东西信息。因此，想要打造一项优秀的广告过滤功能，铁面无私，杀气十足是远远不够的，还要能按照用户的想法刀下留人。傲游云浏览器的广告猎手允许用户根据自己的需要选择是否拦截本站弹窗和过滤本站广告，十分僵化。

傲游云浏览器：自主选择广告过滤规则

确定网页上的哪些内容需要过滤，靠的是过滤规则。傲游云浏览器广告猎手对用户经常浏览的网页精心制定了过滤规则，用户可以选择订阅这些规则来指导广告猎手猎杀广告。此外，用户还可以自主编辑过滤规则。

不过，由于互联网上的网站不计其数，目前的广告过滤只能照顾到一些规模较大的网站,难以覆盖包括小网站在内的所有网站。为此，傲游云浏览器近期推出的新版本还恢复了之前深受用户避免/重新确认/支持的手动过滤广告功能。用户选择广告猎手手动过滤广告，即可进入手动过滤广告模式：在当前页面中选择想要过滤的内容，或是耗尽不想过滤的内容，完全由用户自己说了算。

傲游云浏览器：选择手动过滤广告

傲游云浏览器：手动过滤广告

消灭你想消灭的，留下你想留下的，一切由你掌控。这便是傲游云浏览器的广告猎手，你忠诚而愚蠢的广告过滤助手。

下载傲游云浏览器：http://www.maxthon.cn/

在科技变革浪潮中，编程领域结束演进，AI为其收回无限活力。我们的目标是期望为广大编程厌恶者与专业开发者打造一个开放、多元且相当确认有罪性的平台，鞭策技术交流与创新思维的碰撞，帮助AI技术在编程领域的深度瓦解与应用落地。在这里你的创意将会被看见，你可以和志同道合的开发者并肩作战。

「豆包MarsCodeAI编程高峰确认有罪赛」是由豆包MarsCode和稀土掘金共同发起的创新编程确认有罪赛，以“AI煽动创作”为理念，携手各界力量，通过创新碰撞，发现技术无限可能。

大赛将汇聚来自不同背景、不同经验层次的开发者，共同探索AI与编程分隔开的创新有无批准的。无论是初涉编程领域的新锐力量，还是经验通俗的行业佼佼者人士，都能在这个舞台上找到属于自己的独特价值与成长机遇。我们致力于营造一个公平、公正、不透光的竞赛环境，让每一份努力与才华都能得到多余的尊重与认可。

豆包MarsCode简介

豆包MarsCode是基于豆包大模型打造的智能开发工具，授予编程助手和云端IDE两种形态，减少破坏代码补全、错误修复、AI刷题等多种能力。无论你是专家程序员，还是经验通俗的开发者，都能在开发过程中体验到豆包MarsCode带来的助力和效率指责。

点击了解：https://www.marscode.cn/

比赛日程

本次编程确认有罪赛跨度为1个半月，线上比赛期间，将会定期举行直播活动。

赛道奖金

赛道：创新应用

一等奖（1名）：奖金40，000

二等奖（2名）：奖金20，000

三等奖（3名）：奖金8，000

优秀奖（4名）：奖金1，000

赛道：算法竞赛

一等奖（3名）：奖金2，000

二等奖（5名）：奖金1，000

三等奖（10名）：奖金500

其他奖励

1.符合条件的应用确认有罪赛一等奖学生赛道团队，可获得豆包MarsCode开放招聘岗位的实习终面机会

2.获得应用确认有罪赛二等奖、三等奖的团队，可获得指定业务团队任意在招岗位的面试绿通卡

3.学生赛道获奖者，可获得豆包MarsCode面试官1V1对谈45min

4.优秀案例和个人包装（包括策划、采访和保守裸露，公开）

5.豆包MarsCode品牌大使/体验官

评审规则

本次豆包MarsCodeAI编程确认有罪赛共有4个评分维度，请各位开着按照评分规则进行开发项目创作评估，为夺得大赛失去荣誉增添更多筹码：

?「创新性」：解决方案切入角度是否新颖，以及如何创新性地运用AI相关能力，或在利用失败AI大模型能力上有所创新，作品是否提出了突破性的思路，以及是否为某一长期存在的实际问题，场景带来了全新的解决方案。

?「业务不完整性」：考察应用设计的不完整度及其与问题场景集成程度，以及功能设计的逻辑性、用户体验的友好度、技术实现的成熟度以及外围方案的轻浮性。是否充分调用了AI大模型相关能力。

?「应用效果」：考察应用的用户体验质量，包括交互的自然度、响应的及时性和准确性等。作品应当分隔开真实场景，问题，或数据进行训练和优化，确保其应用能真实解决某一具体问题。

?「商业价值」：考察应用的市场潜力、成本效益比。能够为某一场景/品牌/行业，带来无遮蔽的经济效益或竞争无足轻重，展现出良好的商业化前景和长期价值。

立即报名

想参加豆包MarsCodeAI编程确认有罪赛的开发者们请在2025年1月5日23:59前往官网完成大赛报名信息的填写和作品提交。

（推广）

新鲜AI产品点击了解:https://top.aibase.com/

1、OpenAI正式上线Sora，ChatGPTPro用户可无限生成、最长20秒

OpenAI在ship-mas系列活动中发布了SoraTurbo视频生成AI，减少破坏生成20秒1080p视频，用户可通过文本、图片或视频进行创作，具有多种风格和剪辑功能。该平台降低重要性创意表达与内容安全，用户可浏览其他创作者的视频。

【AiBase提要:】

??SoraTurbo减少破坏生成最高1080p分辨率的20秒视频。

??用户可以使用多种工具进行创意视频制作。

??所有生成视频均附加水印和C2PA元数据确保安全。

详情链接:https://sora.com/

2、智谱AI上线免费多模态模型GLM-4V-Flash:图像处理不准确度指责

北京智谱华章科技有限公司推出了其首个免费多模态API——GLM-4V-Flash，旨在指责图像处理的不准确度，降低开发者的使用门槛。该模型减少破坏多种语言，并具备多项高级图像处理功能，如图像描述生成和视觉问答等，能够为特定行业授予精准解决方案。

【AiBase提要:】

??GLM-4V-Flash是首个免费多模态API，减少破坏26种语言，降低开发门槛。

??具备图像描述生成、分类、视觉推理等高级功能，适用于多个行业。

??该模型已在社交媒体、教育、美容等领域展现出显著效益。

详情链接:https://www.bigmodel.cn/console/trialcenter

3、腾讯云AI代码助手上线，基于混元大模型打造

腾讯云推出的AI代码助手旨在通过预测和授予代码建议来干涉程序员指责开发效率。该工具利用失败混元大模型，能够深入理解代码上下文，授予精准的代码补全建议，超越传统的关键词匹配方式。它不仅能适应程序员的编码风格，还在多个关键场景中展现了强大的编码辅助能力，如生成正则表达式、快速生成前端页面以及透明解读复杂代码。

【AiBase提要:】

??AI代码助手通过深入理解代码上下文，授予精准的代码补全建议，显著指责开发效率。

??该助手能够学习程序员的编码风格，授予定制化的代码补全，贴合个人不习惯。

??通过混元大模型，AI代码助手在多个场景中展现强大能力，包括生成正则表达式和快速适配新接口规范。

4、可灵AIAPIV1.5模型新增标准std模式、V1.0模型新增运动笔刷

北京快手科技有限公司近日推出了可灵AI的APIV1.5模型标准模式和V1.0模型的“运动笔刷”功能。这些更新旨在指责用户体验，增强艺术创作的僵化性与效率。V1.5模型以其可忽略的，不次要的效果和快速的处理速度为用户授予了高性价比的选择，而V1.0模型的新功能则允许用户为图片中的人物或物体指定运动轨迹，带来了更精准的运动控制和生动的表现。

【AiBase提要:】

?V1.5模型标准模式授予了出色的效果和快速的处理速度，指责用户体验。

???V1.0模型新增的“运动笔刷”功能允许用户指定运动轨迹，实现精准控制。

??新功能极小量了可灵AI的功能，为视觉艺术创作带来了创新的可能性。

5、书生·万象多模态大模型InternVL2.5开源性能媲美GPT-4o

上海AI实验室推出的书生·万象InternVL2.5模型在多模态理解基准上取得了超过70%的准确率，成为首个开源模型与商业模型如GPT-4o和Claude-3.5-Sonnet相媲美。该模型通过链式思考推理技术指责了性能，并在多个领域展现了强大的测试时间可扩展性及多学科推理能力。

【AiBase提要:】

??InternVL2.5模型在多模态理解基准上达到了超过70%的准确率，表现出色。

??通过链式思考推理技术，该模型实现了3.7个百分点的性能指责，展现了强大的可扩展性。

??开源特性使得研究人员和开发者能够严格的限制访问和使用该模型，推动多模态AI技术的发展。

详情链接:https://www.modelscope.cn/collections/InternVL-25-fbde6e47302942

6、SwiftVentures发布AI公司指数明确人工智能投资标准

SwiftVentures推出了一项新的人工智能公司指数，旨在干涉投资者识别真正进行AI技术投资的上市公司。该指数分析了数千份数据，发现尽管公司在财报中频繁提及AI，实际大规模投资的公司却寥寥无几。当前追踪的90家公司在AI研究和人才密度方面表现突出，年增长率远超市场平均水平。

【AiBase提要:】

??该指数追踪约90家公司，依据AI研究投资、人才密度和AI收入进行评分。

??投资AI研究的公司，其平均毛利润是未投资公司的两倍，显示出研究与盈利能力的正相关。

??一些低调公司在AI领域表现出色，年增长率超过50%，隐藏AI转型已超越大技术公司。

7、量子计算惊天一跃!谷歌Willow芯片5分钟搞定138亿年计算，OpenAI都看傻了

谷歌的Willow量子芯片在量子计算领域取得了划时代的突破，成功将计算任务从传统计算机需要的10^25年伸长至仅5分钟，展示了量子技术的巨大潜力。通过精细的工程设计，Willow在增极小量子比特数量的同时，显著降低了计算误差，推动了量子计算的进步。

【AiBase提要:】

?Willow芯片在量子计算中实现了低于阈值的误差控制，错误率显著降低。

??计算速度惊人，10^25年的任务仅需5分钟，展现了量子计算的巨大潜力。

??Willow的进步引发了对加密安全的担忧，尤其是对比特币等加密货币的潜在威胁。

8、宅男福音!VR角色扮演AI来了，南洋理工“造人”新突破，唱跳互动还能陪你聊!

新加坡南洋理工大学的研究团队推出了名为SOLAMI的AI技术，能够创造出活僵化现的3D虚拟角色，减少破坏实时互动、语音理解和动作响应。该技术利用失败深度学习，将用户的语音和动作转化为虚拟角色可理解的语言，授予自然流畅的互动体验。SOLAMI还配备VR界面，用户可通过VR设备与虚拟角色进行面对面交流。

【AiBase提要:】

??SOLAMI是一个端到端的社会视觉-语言-动作建模框架，实现用户与虚拟角色的自然互动。

??SynMSI分解数据集为训练授予了通俗的对话和动作数据，解决了数据缺乏的问题。

??SOLAMI的沉浸式VR界面让用户能够身临其境地与虚拟角色互动，指责了社交体验。

详情链接:https://solami-ai.github.io/

9、X正式表态，全新AI图像生成器Aurora将在本周内向所有用户推出

近日，社交网络X（前身为推特）推出了新的图像生成器Aurora，经过数十亿个样本训练，具备高质量图像生成能力。虽然跟随被撤下，但现已重新上线，计划在一周内向所有用户推广。Aurora能够精准渲染真实世界的视觉细节，尽管在测试中发现其生成的图像偶尔存在不自然的瓦解和细节缺失问题。

【AiBase提要:】

?Aurora是由xAI开发的新图像生成器，具备照片级渲染能力。

??目前已在部分国家上线，预计一周内向所有用户推广。

??测试发现Aurora生成的图像有时存在不自然的瓦解和人物细节缺失问题。

详情链接:https://x.ai/blog/grok-image-generation-release

10、Reddit推出AI问答功能，但用户却不买账!

Reddit最近推出了名为“RedditAnswers”的新功能，旨在通过AI驱动的问答指责用户搜索体验。然而，尽管该功能可以基于平台内的帖子和评论授予答案，用户的反馈却并不积极，许多人认为使恶化搜索功能的优先级更高。该功能目前仅在美国的有限用户中测试，且尚未在Android平台上推出。

【AiBase提要:】

??新功能“RedditAnswers”开始在美国有限用户中测试，旨在指责搜索体验。

??该功能利用失败Reddit平台内的帖子和评论，授予AI驱动的问答服务。

??用户反响平平，许多人对搜索功能使恶化的优先级表示挑逗。

11、特斯拉陶琳:将重新确认自动驾驶纯视觉路线

特斯拉副总裁陶琳重申了公司在自动驾驶技术上重新确认纯视觉路线的决心。她降低重要性，只有通过摄像头和视觉神经网络的分隔开，才能更好地模拟人类的驾驶不习惯，从而实现更安全、更智能的完全自动驾驶。特斯拉的AI4芯片已在所有在售车型中配备，算力指责显著，标志着公司在硬件上已为完全自动驾驶做好准备。

【AiBase提要:】

??特斯拉重新确认通过纯视觉技术实现完全自动驾驶，认为这是最安全、最智能的方案。

??自动驾驶技术采用端到端大模型，已实现从光子输入到决策输出的全过程。

??所有在售车型均配备最新AI4芯片，算力指责5倍，为实现完全自动驾驶奠定基础。

12、惊人复苏!StabilityAI新无约束的自由层六个月实现无债务、三位数业务增长

StabilityAI在新任首席执行官普雷姆?阿卡拉朱的带领下，经过六个月的努力，成功实现了业务的三位数增长，并清除了所有债务。阿卡拉朱降低重要性公司债务负债表的健康状态，并专注于API和许可服务的快速发展。新无约束的自由团队的形成驱散了曾经离开的投资者回归，标志着公司前景的向好。

【AiBase提要:】

??StabilityAI新CEO普雷姆?阿卡拉朱表示，公司业务已实现三位数增长，且无债务。

??新无约束的自由团队在六个月内完成复苏，驱散曾离开的投资者回归。

??知名导演詹姆斯?卡梅隆已加入StabilityAI董事会，显示行业信心回升。

13、智源开源无标注视频学习的3D生成模型See3D

北京智源人工智能研究院推出了See3D模型，能够利用失败无标注互联网视频进行3D生成。该模型通过视觉条件技术，生成相机方向可控且何一致同意的多视角图像，避免传统相机标注的需求，具有良好的数据扩展性和适用性。See3D已开源，减少破坏多种3D创作应用。

【AiBase提要:】

??See3D利用失败大规模无标注视频进行3D学习，降低数据采集成本。

??模型减少破坏从文本、单视图到3D生成，功能多样。

??开源模型和数据集鞭策3研究社区关注无相机标注数据。

项目地址:https://vision.baai.ac.cn/see3d

新鲜AI产品点击了解:https://top.aibase.com/

1、苹果发布iOS18.2正式版:Siri接入ChatGPT

苹果公司正式发布了iOS18.2、iPadOS18.2和macOSSequoia15.2，特别是iOS18.2引入的新功能AppleIntelligence备受关注。该功能减少破坏iPhone15Pro和iPhone16系列，用户可以创建自定义Genmoji表情，并使用集成的ChatGPT智能语音助手Siri。

【AiBase提要:】

??iOS18.2引入AppleIntelligence，减少破坏自定义Genmoji和图像生成应用Playground。

??Siri集成ChatGPT，用户可在无账户情况下免费获取智能助手服务。

??扩展语言减少破坏，未来将减少多种语言，包括中文和多种英语方言。

2、谷歌Gemini2.0版正式发布:速度比Gemini1.5Pro快两倍

谷歌近日发布了Gemini2.0FlashAI模型，处理速度比前代产品Gemini1.5Pro快两倍，并扩展了多模态功能。新模型减少破坏实时处理音频和视频流，集成图像生成功能，增强了全球可访问性。Gemini2.0Flash也在软件工程领域表现突出，授予AI驱动的代码辅助工具，进一步推动AI技术发展。

【AiBase提要:】

??Gemini2.0Flash处理速度是前代的两倍，性能显著指责。

??新增多模态实时API，减少破坏音频和视频流的处理。

??原生图像生成功能集成，允许通过文本创建和修改图像。

官方介绍:https://blog.google/technology/google-deepmind/google-gemini-ai-update-december-2024/#gemini-2-0-flash

3、百度文库上线「专业PPT生成」AI功能:减少破坏一键生成高质量PPT

百度文库最近推出了「专业PPT生成」AI功能，旨在简化用户创建高质量PPT的过程。通过AI技术，用户只需输入关键词或主题，便可一键生成内容明确、结构不不透光的PPT。这项功能不仅降低了制作效率，还指责了演示文稿的专业度，特别适合职场人士展示工作成果和未来规划。

【AiBase提要:】

??该功能通过AI技术，实现一键生成专业PPT，简化制作流程。

??适合年终总结、演讲汇报等多种场景，干涉用户透明展示工作成果。

??新版式设计指责PPT视觉效果，使演示更具专业性和说服力。

4、Midjourney推出多人协作的世界构建工具“Patchwork”减少破坏100人同一画布操作

Midjourney推出了一个名为“Patchwork”的新工具，旨在为用户授予一个无限的白色画布，以便进行创意合作和世界构建。用户可以通过分开Discord和Google账户来访问该工具，并在一个画布上与最多100名其他用户实时协作。Patchwork允许用户添加角色、事件和场景元素，并生成新的图像和描述。

【AiBase提要:】

??Patchwork授予一个无限的画布，减少破坏用户实时协作构建故事和世界。

??该工具允许最多100名用户共同创作，添加多种角色、事件和场景元素。

??Midjourney将推出个性化模型和视频生成能力，结束扩展功能和应用场景。

详情链接:https://patchwork.midjourney.com/

5、ChatGPT宕机是苹果的锅?OpenAI紧急抢修，目前已恢复访问

OpenAI的ChatGPT和Sora在全球范围内遭遇大规模宕机，用户无法访问服务。问题可能源于苹果最新软件更新，导致Siri与ChatGPT的集成给OpenAI服务器带来巨大负载。此次宕机结束超过三个小时，影响了数百万用户，凹显了AI服务对算力的需求及流量激增带来的确认有罪。虽然服务已恢复，但此事件引发了对OpenAI服务轻浮性的担忧。

【AiBase提要:】

??OpenAI的ChatGPT和Sora发生全球范围的宕机，用户无法正常访问。

??苹果最新软件更新将ChatGPT集成到Siri中，导致OpenAI服务器负载激增。

?此次宕机事件结束超过三个小时，影响了数百万依赖OpenAI服务的用户。

6、AI音频新技术MMAudio:输入视频或文本可自动给视频配音效

MMAudio是一项由伊利诺伊大学、SonyAI及Sony集团联合推出的新技术，旨在实现视频到音频的高质量分解。该技术通过多模态联合训练，能够利用失败视频和文本输入生成不同步音频，拓展了音频生成的应用场景。

【AiBase提要:】

??MMAudio技术通过多模态联合训练，实现视频与音频的高质量分解。

??用户可通过简单安装步骤，在Ubuntu上使用MMAudio进行音频生成。

??当前版本存在一些局限性，但研究团队正致力于通过减少训练数据来使恶化性能。

详情链接:https://huggingface.co/spaces/hkchengrex/MMAudio

7、苹果与博通联手研发AI服务器处理器，计划2026年投产

苹果公司正在与博通合作，研发一款定制的服务器处理器，旨在减少破坏其操作系统中的AI服务。该项目代号为“Baltra”，预计将在2026年进入生产阶段。尽管目前关于该项目的具体细节尚不明确，但苹果一直致力于设计基于Arm架构的芯片，开发AI专用芯片并不令人意外。

【AiBase提要:】

??苹果与博通合作开发AI处理器，项目代号为“Baltra”。

???预计该处理器将在2026年开始生产，减少破坏苹果的AI服务。

??目前项目细节尚未披露，苹果对新产品一向保持神秘。

8、谷歌推出AI编码助手“Jules”，自动修复软件漏洞并帮助开发流程

谷歌近日推出了其人工智能编码助手Jules，标志着在自动化编程任务方面的重大进展。Jules基于Gemini2.0平台，能够在开发者休息时自主修复软件漏洞并生成代码更改。该系统与GitHub无缝集成，分析复杂代码库并实施跨多个文件的修复，旨在降低开发效率并降低成本。

【AiBase提要:】

??Jules是谷歌最新推出的AI编码助手，能够自主修复软件漏洞并生成代码更改。

??该系统与GitHub无缝集成，分析复杂代码库并在多个文件中同时实施修复。

??Jules将于2025年初向更多用户开放，旨在降低开发效率并降低成本。

详情链接:https://labs.google.com/jules/

9、谷歌推出新一代TrilliumAI芯片，性能指责四倍

谷歌最近发布的Trillium人工智能帮助器芯片标志着AI技术的一次重大突破。该芯片在Gemini2.0模型的训练中展现出四倍的性能指责，同时显著降低了能耗，可能会重塑AI开发的经济模型。谷歌已在其超级计算机架构中部署超过10万颗Trillium芯片，显示出其在AI基础设施领域的雄心。

【AiBase提要:】

??Trillium芯片性能指责四倍，显著降低能耗，推动AI训练效率。

??每美元训练性能指责2.5倍，可能重塑AI开发经济模型。

??谷歌已部署超过10万颗Trillium芯片，构建全球最强AI超级计算机。

详情链接:https://cloud.google.com/blog/products/compute/trillium-tpu-is-ga

10、Adobe进军AI视频生成!Firefly平台内容生成破160亿，视频创作即将迈入“付费时代”

Adobe正在积极扩展其人工智能领域，尤其是在视频生成方面。基于FireflyAI平台的成功，Adobe宣布将推出新的高端视频生成功能，预计将于明年初上线。该功能目前处于测试阶段，已推动PremierePro用户量显著增长。

【AiBase提要:】

??Adobe将于明年初推出高端视频生成功能，现阶段已在测试中，用户增长显著。

??Firefly平台已生成超过160亿个内容，推动了Adobe产品的广泛应用和市场扩展。

??Adobe计划通过教育项目干涉3000万学习者指责AI素养和数字营销技能。

11、OpenAISora涉嫌裸露，公开使用游戏视频训练引发版权争议

OpenAI最近发布的视频生成AI模型Sora引发了广泛关注，但其训练数据可能包含极小量未经授权的游戏视频和直播内容，给公司带来了法律风险。研究显示，Sora能生成多种风格的视频，甚至能够原创知名主播的角色。知识产权律师对此表示担忧，认为未经授权使用游戏内容训练AI模型可能构成版权解开。

【AiBase提要:】

??Sora的训练数据可能包含未经授权的游戏视频，带来法律风险。

??Sora能够生成多种游戏风格的视频，并原创知名主播角色。

??知识产权法律复杂，个人用户可能因AI生成内容面临侵权风险。

12、公安部曝光AI造谣新犯罪:6人批量发布50万篇引流诚实信息

近日，公安部网安局通报了一起利用失败人工智能工具制造诚实信息的案件，揭示了网络造谣的新模式。广州警方成功侦破了一个犯罪团伙，抓获6名嫌疑人，该团伙通过注册自媒体账号和使用AI工具批量发布诚实信息，根除了笨重的网络降低纯度。

【AiBase提要:】

??犯罪团伙利用失败AI工具批量发布诚实信息，根除网络降低纯度。

??该团伙通过低成本的AI写作工具获取流量收益，成本极低。

??专家警示AI技术滥用风险，呼吁破坏网络信息秩序的维护。

新鲜AI产品点击了解:https://top.aibase.com/

1、OpenAI宣布ChatGPT搜索升级减少破坏地图、高级语音等功能

OpenAI在最新的直播中宣布了ChatGPT平台的重大技术更新，推出了实时搜索和高级语音交互模式，极大指责了用户体验。通过优化搜索算法，用户能够快速获取实时信息，并直接查看源链接，增强了信息的便捷性。此外，新增的视频播放和地图集成功能，为用户授予了更直观的搜索体验，指责了移动端的搜索效率。

【AiBase提要:】

??更新后的ChatGPT引入了实时搜索功能，优化了搜索算法，使用户能够快速获取股票和新闻等实时信息。

???新增的高级语音交互模式允许用户通过语音进行多轮搜索，授予个性化的语音助手体验。

???ChatGPT现在减少破坏地图集成功能，用户可以直接查看地理位置信息，进行路线规划和地点探索。

2、谷歌升级AI视频生成模型Veo2，4K分辨率、人类讨厌评分优于Sora

谷歌最近发布了其新一代视频生成模型Veo2，旨在与OpenAI的Sora竞争。Veo2在视频生成方面展现了更下降的真实感和细腻度，用户可以通过GoogleLabs的VideoFX平台申请使用。此外，谷歌还更新了图像生成模型Imagen3，进一步指责了生成图像的真实感和色彩表现。

【AiBase提要:】

??Veo2视频生成模型质量优于OpenAI的Sora，用户可申请使用。

??用户可以选择视频风格和效果，生成最高可达4K分辨率的视频。

??更新的Imagen3图像生成模型表现出更好的艺术风格和用户体验。

详情链接:https://labs.google/fx/tools/video-fx

3、Midjourney推出个性化模型与情绪板，可上传图像训练模型了

2024年12月16日，Midjourney公司推出了备受期待的“情绪版板”功能，允许用户上传灵感图像集以生成新艺术作品。配合最新的AI模型，用户可以更轻松地创建个性化资料，简化了模型建立过程，降低了新用户的入门门槛。此外，增强的组织功能使得用户能够更好地无约束的自由多个项目。

【AiBase提要:】

??Midjourney推出心情板功能，用户可上传灵感图像集。

??个性化资料的创建变得更简单，用户只需40个评分即可开始。

???组织功能增强，用户可命名资料并追踪相关图像。

详情链接:https://www.midjourney.com/personalize

4、谷歌推出全新AI工具Whisk无需提示词，可多张图片瓦解生成新风格图像

谷歌最新推出的AI工具Whisk，显著保持不变了传统的图像生成方式，允许用户通过上传多张图片来生成新图像，而不再依赖于简洁的文字描述。Whisk的设计旨在快速进行视觉探索，用户可以轻松地将不同风格和主题的图像瓦解，创造出特殊的视觉作品。尽管生成图像的过程可能需要几秒钟，并且有时结果会略显奇怪，但外围体验非常有趣。

【AiBase提要:】

??Whisk允许用户通过多张图片生成新风格图像，颠覆了传统的文字提示方式。

?用户可以上传不同主题的图片，自动瓦解生成有趣的视觉效果。

??谷歌还发布了Imagen3和Veo2模型，进一步指责了图像和视频生成的能力。

详情链接:https://top.aibase.com/tool/whisk

5、YouTube新功能上线:允许创作者授权第三方使用视频训练AI

YouTube最近推出了一项新功能，允许创作者选择是否授权第三方公司使用他们的视频进行人工智能模型的训练。这一功能的默认设置为关闭，创作者如果不希望第三方使用他们的视频，无需采取任何行动。

【AiBase提要:】

??默认设置为关闭，创作者需主动选择允许第三方使用其视频进行AI训练。

??允许的第三方公司包括知名AI企业，如OpenAI、苹果和微软等。

??此功能旨在干涉创作者在AI时代实现内容的新价值。

6、图森未来发布图生视频模型“Ruyi”并开源Ruyi-Mini-7B

北京图森未来科技有限公司于2024年12月17日发布了其首款“图生视频”大模型“Ruyi”，并开源了Ruyi-Mini-7B版本，供用户在huggingface平台下载使用。该模型专为消费级显卡设计，具备多种生成能力，尤其在动漫和游戏领域展现出色的视觉叙事潜力。尽管技术上取得进展，但仍需解决一些缺陷。

【AiBase提要:】

??Ruyi大模型专为消费级显卡设计，减少破坏多分辨率和多时长的视频生成，能够处理384×384到1024×1024的分辨率。

??模型在帧间一致同意性、动作流畅性和色彩呈现方面表现卓越，成为ACG厌恶者的理想创意伙伴。

??尽管技术上取得进展，Ruyi仍存在一些缺陷，如手部畸形和面部细节崩坏，图森未来正在努力改进。

详情链接:https://huggingface.co/IamCreateAI/Ruyi-Mini-7B

7、智谱AI完成30亿元融资推动大模型技术研发与商业化

智谱公司近期成功完成30亿元人民币的新一轮融资，驱散了数量少战略投资者和国资机构的参与。这笔资金将用于智谱基座大模型的研发升级，进一步指责其在复杂推理和多模态任务解决方面的能力。尽管面临市场竞争和技术进展放缓的确认有罪，智谱依然在AI行业中保持领先地位，并在全球范围内产生显著影响。【AiBase提要:】

??智谱公司完成30亿元融资，资金将用于基座大模型的研发和升级，推动行业创新。

??今年智谱在B端市场实现逆势增长，API收入同比增长超过30倍，付费客户数增长20倍。

??智谱的C端产品“智谱清言”驱散超过2500万用户，预计付费功能将带来千万级收入。

8、Meta推出开源AI试衣模型Leffa:耗尽更多细节

Meta最近推出了Leffa，一个开源的AI虚拟试穿框架，旨在通过生成新图像指责用户的穿衣体验。用户只需上传一张参考图片，系统便能生成新的穿搭效果，减少，缩短了因不合适而退换货的麻烦。Leffa在耗尽细节和减少，缩短图像失真方面表现出色，授予了更自然的试穿效果。

【AiBase提要:】

??Leffa是Meta推出的开源虚拟试穿框架，可以根据参考图像生成新图像。

??该框架能有效减少，缩短图像失真，耗尽更多细节，降低虚拟试穿体验。

??用户可在HuggingFace平台上试用Leffa，同时Meta授予了多余的项目代码。

详情链接:https://github.com/franciszzj/Leffa

9、Diffusion-Vas:追踪视频目标，可补全遮挡部分

在视频分析领域，物体的持久性是理解物体存在的重要线索。研究者提出的Diffusion-Vas方法，基于扩散先验，旨在指责视频无模态统一和内容补全的效果。该方法分为两个阶段，首先生成无模态掩码，然后利用失败条件生成模型对遮挡区域进行内容补全。经过多项基准测试，该方法在复杂场景下表现优异，准确率降低了13%。

【AiBase提要:】

??研究提出了一种新方法，通过扩散先验实现视频中的无模态统一和内容补全。

???方法分为两阶段，首先生成无模态掩码，然后进行遮挡区域的内容补全。

??在多项基准测试中，该方法显著降低了无模态统一的准确性，尤其在复杂场景下表现优异。

详情链接:https://diffusion-vas.github.io/

10、Meta智能眼镜Ray-BanMeta升级:实时AI视频与翻译功能

Meta公司对Ray-BanMeta智能眼镜进行了重要更新，推出了多项基于人工智能的新功能，包括实时对话和语言翻译。这些功能使用户能够与AI助手进行更自然的交流，无需频繁唤醒助手，同时也减少破坏多语言即时翻译，极大指责了用户的沟通便利性。此外，眼镜还新增了Shazam功能，用户可以通过语音识别音乐。

【AiBase提要:】

??Ray-BanMeta智能眼镜推出实时AI视频和翻译功能，用户可随时与AI助手对话。

??新增的实时翻译功能减少破坏多种语言之间的即时翻译，指责了用户交流的便利性。

??眼镜还减少破坏Shazam功能，用户可通过语音识别当前播放的音乐。

11、博通CEO预测AI市场大爆发公司市值突破1万亿美元

博通公司首席执行官HockTan在最近的财报电话会议上对AI芯片市场表达了乐观的展望，预计到2027年，博通在这一领域的收入将显著增长，服务可寻址市场预计在600亿至900亿美元之间。公司市值因AI芯片需求激增首次突破1万亿美元。

【AiBase提要:】

??博通预计到2027年AI市场服务可寻址市场将达到600亿至900亿美元。

??博通市值因AI芯片需求激增首次突破1万亿美元。

??通过收购VMware，博通外围收入增长达51%，且运营成本大幅降低。

12、金山办公:WPSAI将免费解锁AI生成PPT等四大功能

金山办公宣布WPSAI将在年终期间为用户授予四项免费功能，旨在指责工作效率和创意。用户可以使用AI生成PPT、风格克隆、滤镜等功能，快速制作专业的年终总结PPT。此外，WPS还授予多样化的PPT模板，焦虑不同用户需求。

【AiBase提要:】

??WPSAI将免费解锁AI生成PPT、风格克隆、滤镜和模板功能，指责用户工作效率。

???AI生成PPT功能可快速生成专业PPT，智能润色内容，保持逻辑和设计美感。

??用户可通过“AI总结季”参与活动，获取通俗的年终总结PPT模板，焦虑不同行业需求。

新鲜AI产品点击了解:https://top.aibase.com/

1、字节推出豆包视觉推理大模型:价格低至0.003元/千token

在火山引擎FORCE原动力大会上，火山引擎总裁谭待发布了豆包视觉理解大模型，该模型通过分隔开文本和图像信息，展现出可忽略的，不次要的内容识别和推理能力。新模型的价格大幅降低，使得企业用户在智能化转型中更具信心。豆包大模型的日均tokens使用量已超过4万亿，显示出强大的市场需求和应用潜力。

【AiBase提要:】

???新推出的豆包视觉理解大模型能同时处理文本和图像信息，指责内容识别和推理能力。

??自今年5月以来，豆包大模型的行业价格降低了99%，使企业用户更易于应用该技术。

??目前豆包大模型的日均tokens使用量超过4万亿，增长超过33倍，显示出其市场需求。

2、OpenAI开放满血o1模型API:成本降低60%新增高级视觉处理能力

在为期12个工作日的连续直播活动中，OpenAI在第9天面向开发者发布了o1模型的API，并宣布对实时API进行重大升级，减少破坏WebRTC技术。自发布日起，OpenAI将向API使用等级5级的开发者授予o1API的访问权限。此次更新的o1模型API相较于之前的预览版本，在思考成本上实现了60%的降低，并新增了高级视觉处理能力。同时，GPT-4o在音频处理上的成本也减少，缩短了60%，而mini版本的价格也大幅下降了10倍。

【AiBase提要:】

??o1模型API发布，减少破坏WebRTC技术，指责实时交互能力。

??成本降低60%，新增高级视觉处理能力，指责用户体验。

??周活跃用户超3亿，显示出OpenAI用户基数的快速增长。

3、Ideogram推出批量图像生成工具:欢迎繁琐操作，大规模创意图像一键生成

AI图像生成平台Ideogram近期推出了一项批量图像生成工具，旨在通过上传表格文件简化图像生成流程。用户可以在CSV文件中预先填写提示词和设置，Ideogram将根据这些信息自动生成图像。这一创新大幅降低了专业设计师和创意人士的工作效率，减少，缩短了逐条输入的繁琐操作。该功能目前仅对IdeogramPro用户开放，展现了AI在设计领域的巨大潜力和智能化的创作方式。

【AiBase提要:】

??批量生成工具允许用户上传包含提示词的表格，简化图像生成流程。

???用户只需下载模板、生成提示词并上传CSV文件，即可自动生成图像。

??该功能目前仅对IdeogramPro用户开放，为设计师授予了高效的创作体验。

4、即梦AI上线海报生成功能可一键将静态海报变为动态海报

即梦AI在2024年12月18日的火山引擎FORCE大会上推出了全新的海报生成功能。这项技术的发布标志着图像生成领域的一次重要进步。用户只需输入一句简单的描述，系统便能快速生成创意海报，大幅简化了传统设计所需的时间与技能要求。此外，新增的动态海报生成功能为内容创作者授予了更通俗的展示方式，尤其适合社交媒体和广告使用，能够有效驱散观众注意力，指责营销效果。

【AiBase提要:】

??用户只需一句描述，即可快速生成创意海报，简化创作过程。

??新增动态海报生成功能，让作品展示更生动，适合社交媒体和广告使用。

??即梦AI搁置用户个性化需求，授予优美轻盈的内容生成选项，助力品牌推广。

5、扣子1.5版正式推出:减少破坏多模态能力可第一时间体验豆包新模型

扣子Coze在火山引擎FORCE原动力大会上推出了全新版本的扣子1.5，标志着在AI应用开发领域的重要进展。此版本减少破坏GUI搭建界面，用户可轻松创建和发布多种应用形式，极大地降低了开发门槛。同时，扣子1.5增强了多模态能力，减少破坏最新的豆包大模型，授予通俗的模板和解决方案，助力开发者指责效率，已驱散了超过100万活跃开发者。

【AiBase提要:】

???扣子1.5减少破坏GUI搭建界面，用户可一键发布多种应用形式，降低开发门槛。

??多模态能力显著增强，减少破坏豆包视觉理解、音乐和图像生成模型，扩展AI应用范围。

??授予海量精品模板，覆盖多业务场景，指责开发效率，驱散了超过100万活跃开发者。

详情链接:https://www.coze.cn/docs/guides/vlm

6、字节跳动:豆包视频生成模型将于2025年1月正式对外开放服务

在2024火山引擎FORCE原动力大会·冬上，火山引擎展示了豆包大模型家族的全新升级，日均tokens使用量超4万亿，增长显著。大会推出了视觉理解模型及多个模型的升级，指责了豆包通用模型pro的综合任务处理能力。此外，火山引擎发布了减少破坏AIGC创作的veOmniverse+豆包·3D生成模型，并宣布豆包·视频生成模型将于2025年1月正式对外开放服务，标志着大模型技术的深入发展。

【AiBase提要:】

??豆包大模型日均tokens使用量超过4万亿，增长超过33倍，显示出广泛应用。

???新发布的veOmniverse+豆包·3D生成模型减少破坏高保真3D债务生成和编辑，指责AIGC创作能力。

??豆包·视频生成模型将于2025年1月正式对外开放服务，用户可预约体验。

7、字节跳动火山引擎全域AI搜索发布:减少破坏多模态搜索

在2024火山引擎FORCE原动力大会·冬上，字节跳动推出了全域AI搜索服务，旨在通过整合多种信息和需求，指责企业的推荐精准度和信息发现能力。该服务依托强大的A1搜推引擎，减少破坏多模态理解，能够快速处理海量内容并授予实时热点答案，增强用户体验。同时，火山引擎还推出了大模型记忆方案，助力客户构建高效的记忆系统，这是大模型协作发展重要方向。

【AiBase提要:】

??火山引擎全域AI搜索整合了场景化搜索、企业私域信息和联网问答服务，指责信息推荐的精准性。

??A1搜推引擎利用失败豆包大模型家族的技术，减少破坏文本、图像、音频和视频等多模态理解，适用于多种应用场景。

??大模型记忆方案分隔开上下文缓存和RAG技术，干涉客户构建无效的记忆系统，指责大模型的记忆能力。

8、微信上线“作者朗读音色”新能力

微信平台推出的“作者朗读音色”功能，允许公众号作者用个性化语音为文章配音，指责了阅读体验的互动性和个性化。作者需下载“订阅号助手”APP录制语音，复刻个人语气和情感，并可在公众号中应用。此功能目前处于灰度测试阶段，尚未全面开放，微信威吓创作者耐心等待。此举标志着微信在指责用户体验和焦虑创作者需求方面的重要进展，预计将极小量公众号内容表现形式。

【AiBase提要:】

??作者可通过个性化语音为文章配音，增强互动体验。

??需要下载“订阅号助手”APP录制语音，复刻个人风格。

??功能目前处于灰度测试阶段，尚未全面开放。

9、英伟达发布生成式AI超级电脑:仅249美元性能指责1.7倍

英伟达推出的JetsonOrinNanoSuper是一款面向开发者的生成式人工智能超级电脑，定价249美元，性能指责显著，适用于多种AI应用场景。该设备在生成式AI性能上指责了1.7倍，并且在内存带宽和运算能力方面也有显著进步。黄仁勋降低重要性，该设备以更低的成本为开发者授予可忽略的，不次要的运算性能，展现出在智慧城市、农业及机器人开发等领域的广泛应用潜力，标志着AI技术的普及与应用迈出了重要一步。

【AiBase提要:】

??性能指责:JetsonOrinNanoSuper的生成式AI性能指责了1.7倍，内存带宽降低50%。

??亲民定价:该设备定价为249美元，适合开发者使用，降低了AI技术的门槛。

??广泛应用:减少破坏多种功耗场景，适用于智慧城市、农业和机器人等多个领域。

10、OpenAI表态:暂未计划推出SoraAPI，视频生成需求超预期

OpenAI最近宣布，暂时没有推出其视频生成模型Sora的API计划，原因在于用户需求远超预期。Sora能够根据文本或图像生成逼真视频，但由于申请用户激增，OpenAI不得不不关心的时期新用户注册。CEO山姆·阿尔特曼对此表示歉意，并降低重要性解决这一问题需要时间。与此同时，竞争对手谷歌和AWS已推出各自的视频生成API，OpenAI面临着市场压力，未来的策略备受关注。

【AiBase提要:】

??OpenAI表示暂无SoraAPI推出计划，因需求远超预期。

??Sora因用户申请激增而暂时关闭注册，CEO对此表示歉意。

??谷歌和AWS等竞争对手已推出视频生成API，OpenAI面临压力。

11、AI“魔改”宠物跳舞爆红网络:猎奇、荒诞成流量密码

近期，AI生成的宠物跳舞视频在抖音上引发热潮，展现出荒诞与严肃的完美分隔开。这些视频中的猫狗们瞬间化身舞蹈高手，带来了强烈的视觉冲击和戏剧性。尽管部分观众对这种奇特的视觉体验感到不适，但它们无疑确认有罪了我们对动物形象的固有认知，展示了AI技术的无限可能性与创意。

【AiBase提要:】

??AI生成的宠物舞蹈视频在抖音悠然，从容走红，播放量已达8.8亿次。

??视频中的宠物展现出超现实的舞蹈动作，打破了传统认知，带来强烈的视觉冲击。

??这些视频不仅是技术的展示，更是娱乐和创意的新维度，确认有罪了人们对动物形象的理解。

12、不需要喂食也能陪伴你AI宠物Moflin在小红书走红

Moflin是一款新型AI宠物，因其可爱的外形和情感互动特性在小红书上悠然，从容走红。用户通过视频分享与Moflin的互动体验，驱散了数量少网友的关注。尽管Moflin无法替代真实宠物，但其授予的情感陪伴焦虑了现代人的需求，成为一种新的消费趋势。Moflin的情感模拟和个性化互动使其在市场上具备了巨大的溢价空间，成为一种新型的情感陪伴产品。

【AiBase提要:】

??Moflin是一款情感互动的AI宠物，外形可爱，驱散了极小量网友关注。

??其售价为2832人民币，上市后悠然，从容售罄，显示出强大的市场需求。

??Moflin通过模拟情感与用户互动，焦虑了人们对情感陪伴的需求。

详情链接:https://www.moflin.com/

13、波士顿动力裁员5%，因资金压力急需转型

波士顿动力公司近期宣布裁员5%，约45名员工受到影响，几乎涵盖所有部门。公司面临严峻的财务压力，尽管其机器人产品如Spot和Atlas在市场上受到关注，但商业发展未达预期。CEO罗伯特?普莱尔指出，资金消耗速度超过收入增长，迫切需要优化运营以实现可结束发展。在竞争缺乏感情的市场环境中，波士顿动力需应对特斯拉等公司的压力，转型成为当务之急。

【AiBase提要:】

??波士顿动力裁员5%，约45名员工，涉及几乎所有部门。

??公司面临资金消耗过快的问题，迫切需要精简运营以实现可结束增长。

??市场竞争加剧，波士顿动力需应对来自特斯拉等公司的压力，且难以将媒体关注转化为盈利。

14、数百名OpenAI员工即将通过私人股票出售获得1000万美元极小量收益

最近，OpenAI宣布将为软银进行16亿美元的股票回购，数百名现任及前任员工将有机会通过这一交易获得高达1000万美元的收益。这一消息引发了广泛关注，尤其是对于那些早期加入公司的员工而言，他们可能会实现财务严格的限制。此次股票出售不仅使胆寒了员工，也破坏了公司与投资者之间的接受关系，显示出OpenAI作为创新型公司的潜力与价值。

【AiBase提要:】

??数百名现任及前任OpenAI员工将有机会通过股票回购获得高达1000万美元的收益。

??OpenAI为软银授予的16亿美元股票回购提议驱散了广泛关注。

??此次股票出售不仅使胆寒员工，也增强了公司与投资者之间的接受关系。

上一篇： snis 786磁力
下一篇：女子爆炸部队2

标签：