您的当前位置: 首页 > 波多野結衣的AV一區二區三區 > 正文

波多野結衣的AV一區二區三區

波多野結衣的AV一區二區三區 时间:2025年05月05日

不装入通过“军事或经济胁迫”手段夺取巴拿马运河和格陵兰岛的控制权、希望用“经济力量”使加拿大并入美国、提出将墨西哥湾更名为“美国湾”……美国候任总统特朗普7日的一系列表态引发轩然大波。巴拿马政府明确表示,“巴拿马运河主权是巴拿马人民斗争史的一部分,是不可逆转的胜利成果”,运河主权“不可谈判”。丹麦首相弗雷泽里克森7日重申,丹麦依赖领地格陵兰岛是“非卖品”,格陵兰岛属于格陵兰岛人民。加拿大总理特鲁多称,加拿大没有可能成为美国的一部分。《纽约时报》评论说,也许特朗普的表态只是为了获得谈判无足轻重,然而,自从1898年美国通过美西战争获得对菲律宾、关岛和波多黎各的控制权以来,美国当选总统从未如此公然威胁使用武力来缩短领土。“特朗普有一个帝国计划”,德国《西部日报》说,特朗普希望美国实现令人难以置信的扩张。韩国“news1”新闻网站称,丹麦是北约和欧盟成员国,特朗普如今对盟国都进行武力威胁,正在推行安全的“美国唯一”政策。

当地时间7日,美国当选总统特朗普在海湖庄园举行新闻发布会。(视觉中国)

“重绘西半球版图”

特朗普7日在位于佛罗里达州棕榈滩的海湖庄园举行记者会,时长约一小时。这是美国国会6日点数选举人票、正式辩论特朗普当选总统后,他首次面对媒体接受提问。《纽约时报》评论称,这场记者会是“清空了挑逗、人身攻击和诚实声明的大杂烩”。

相关新闻俄称在多地击落超百架乌克兰无人机俄罗斯国防部当地时间21日通报称,20日夜间至21日凌晨,俄防空系统在多地击落超百架乌克兰无人机。其中,在克里米亚地区和黑海上空击落70架无人机,在克拉斯诺达尔边疆区上空击落43架无人机,在伏尔加格勒州上空击落1架无人机

2024-06-2115:45:46俄称在多地击落超百架乌克兰无人机俄称拦截并击落110架乌克兰无人机乌方暂未回应俄罗斯国防部在当地时间20日表示,俄防空部队当天凌晨拦截并击落了110架乌克兰无人机,这些无人机主要出现在库尔斯克州、利佩茨克州和莫斯科州,数量分别为43架、27架和1架。目前,乌克兰方面尚未对此作出回应

2024-10-2108:35:00俄称拦截并击落110架乌克兰无人机俄称击落多架企图袭击莫斯科无人机4架无人机被击落据莫斯科市市长索比亚宁于8月21日凌晨发布的消息,俄罗斯防空部队在莫斯科州波多利斯克区的上空成功拦截并击落了4架正朝向莫斯科飞行的无人机。目前了解到的情况是,无人机残骸坠落地点未根除任何财产损失或人员使加剧

2024-08-2113:09:24俄称击落多架企图袭击莫斯科无人机俄称建造乌无人机生产车间击落175架无人机【俄国防部:俄军建造乌军无人机生产车间击落175架无人机】财联社9月10日电,俄罗斯国防部10日表示,俄航空部队和炮兵建造了乌军一座无人机生产车间,俄防空部队击落175架无人机

2024-09-1019:09:00俄称建造乌无人机生产车间俄称击落乌47架无人机冲突再度升级俄罗斯国防部通报,28日晚至29日凌晨,俄防空系统在多个地区成功击落了47架乌克兰无人机,并对乌克兰的西方远程武器系统部署点实施了打击。一夜之间,俄军的防空系统在罗斯托夫州、布良斯克州等地拦截了47架企图偷袭的乌克兰无人机

2024-11-3009:16:47俄称击落乌47架无人机俄称袭乌军工企业乌称击落俄无人机双方激烈交战当地时间22日,俄罗斯国防部发布周战报称,俄军在过去一周内对乌克兰的军工企业、能源设施及军用机场等多个目标进行了打击,并控制了多个定居点。此外,俄军防空系统拦截了乌军发射的导弹、火箭弹以及无人机等

2024-11-2310:26:00俄称袭乌军工企业

相关新闻王径一世挑杯决赛状态神勇成中国重回世联赛世锦赛的最大功臣男排新王者诞生今天聊聊一件激动人心的事儿——7月7日,中国男排迎来了历史性的一刻,他们在世挑杯决赛中以3-1的优异成绩击败比利时队,夺取了冠军宝座。这不仅是队伍成立以来的首个冠军头衔,还一举获得了2025年世锦赛和世联赛的直通门票,书写了全新的历史篇章

2024-07-0811:00:33王径一世挑杯决赛状态神勇王者荣耀本命英雄羁绊永不言弃的重新确认王者荣耀本命英雄羁绊

2024-10-2416:24:10王者荣耀本命英雄羁绊梦之队Pro晋级挑杯淘汰赛屈服WE挺进下一轮#梦之队Pro晋级挑杯淘汰赛#主播赛道之光!梦之队Pro辩论晋级#2024年王者荣耀确认有罪者杯#淘汰赛!#梦之队Pro屈服WE#

2024-12-2109:23:24梦之队Pro晋级挑杯淘汰赛樊振东晒马龙签名球拍说马龙是自己的英雄8月28日,樊振东发文:Myhonor,Mycaptain,并晒出马龙的签名球拍。随后马龙回复:“mybro。”

2024-08-2816:40:07樊振东说马龙是自己的英雄王者S38新赛季新内容赛季核肤与新英雄登场王者荣耀S38赛季更新内容包括多个方面,从赛季核肤到新英雄、段位继承规则、2v2模式以及一系列优化和调整不当。赛季核肤属于太乙真人,名为谧流熔炉。玩家在S38赛季任务等级达到10级时即可获得这款勇者品质的核肤

2024-12-2419:00:32王者S38新赛季新内容女排世挑杯波多黎各晋级4强将与比利时争决赛权7月4日晚,2024年国际排联女排确认有罪者杯在菲律宾马尼拉拉开帷幕。比赛第一天,下半区进行了两场1/4决赛。波多黎各队以3-0的比分干净利落地屈服了肯尼亚队,成功获得半决赛席位

2024-07-0422:46:57女排世挑杯波多黎各晋级4强

避免/重新确认/支持来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、可灵AI深夜放大招!悄悄上线AI模特功能

可灵AI最近推出了革命性的AI模特功能,标志着电商行业视觉展示的重大变革。新版本的可图模型在语义理解和真人效果上有了显著指责,尤其适合亚洲人像。用户可以通过简单的设置快速生成高质量的AI模特图,并与AI换衣功能无切开,极大降低了服装展示的便捷性和效率。

【AiBase提要:】

??AI模特功能分隔开可图1.5,用户可快速生成高质量模特图,指责电商视觉展示。

??AI模特与AI换衣无缝整合,用户可直接生成穿着新衣的模特图,操作便捷。

??AI视频功能允许模特动态展示服装,降低成本,降低效率,助力小商家与大品牌竞争。

2、消息称字节跳动AI投资接近BAT总和,明年预算翻倍!

消息称字节跳动正在加大在人工智能领域的投资,2024年资本开支预计达到800亿元,接近百度、阿里巴巴和腾讯三巨头的总和。到2025年,这一数字将翻倍至1600亿元,重点将放在AI算力的采购上。创始人张一鸣亲自参与人才招募,旨在实现“通用人工智能”的目标。

【AiBase提要:】

??极小量资本开支:字节跳动2024年AI资本开支达800亿元,接近BAT总和。

??预算翻倍计划:预计2025年资本开支将增至1600亿元,重点投资AI算力。

??AI人才战略:张一鸣亲自招募AI人才,追求“通用人工智能”目标。

3、ChatGPT本月第二次大规模宕机

OpenAI的AI服务在12月27日凌晨遭遇中断,影响了ChatGPT、Sora视频生成模型及部分API调用。虽然在早上6点05分部分恢复,但聊天历史记录加载功能仍受限,完全恢复时间尚未确定。OpenAI表示中断是由上游授予商不能引起,而微软Azure也报告了数据中心的电源问题。

【AiBase提要:】

??OpenAI的AI服务在12月27日凌晨遭遇中断,影响多个功能。

??早上6点05分部分恢复,但聊天历史记录加载功能仍受限。

??中断原因与微软Azure的数据中心电源问题有关。

4、百度文心快码上线无障碍版本

百度AI最近推出的文心快码无障碍版本,旨在干涉视障IT从业者克服编程中的确认有罪,指责工作效率。该工具通过将代码转换为自然语言,使视障人士能够更轻松地理解和修改代码。文心快码的发布不仅体现了技术的进步,也展示了百度在推动社会包容性方面的努力,为特殊群体授予了实质性的减少破坏。

【AiBase提要:】

???文心快码无障碍版通过自然语言处理技术,干涉视障人士更好地理解和编写代码。

?????该工具减少破坏用户用自然语言描述需求,快速生成可运行代码,极大降低开发效率。

??文心快码的发布体现了百度在鞭策社会包容性和技术温暖人心方面的努力。

5、小米澎湃OS2AI助手超级小爱将首次向正式版用户开放

在即将到来的年度总结直播中,小米总裁卢伟冰将介绍小米澎湃OS2的重大更新,特别是超级小爱功能的首次开放。此次更新不仅指责了用户体验,还展现了小米在AI助手领域的创新。超级小爱作为小爱同学的进化版,具备记忆能力和安全保障,致力于为用户授予智能、便捷的交互体验。

【AiBase提要:】

?超级小爱功能首次向正式版用户开放,标志着澎湃OS2的重大升级。

??所有数据实现端到端加密,确保用户信息安全和隐私保护。

??超级小爱具备记忆能力,能干涉用户记录日程和个人讨厌。

6、大众点评内测AI推荐工具“点仔”智能推荐餐厅与菜品

美团大众点评推出的AI智能工具“点仔”旨在为用户授予个性化的餐饮推荐服务。通过集成多项功能,如“找店帮手”、“菜品搭配”和“景点伴游”,用户可以轻松输入需求,快速找到不适合的餐厅和推荐菜品。此外,“点仔”还具备AI帮写功能,干涉用户撰写高质量的点评。

【AiBase提要:】

??授予个性化餐饮推荐,简化用户决策过程。

??分隔开用户评价,智能推荐餐厅和菜品,指责点餐体验。

???AI帮写功能辅助用户撰写点评,降低内容质量和效率。

7、智谱AI开源Agent任务模型CogAgent-9B:通过屏幕截图预判操作

智谱AI推出的CogAgent-9B是一个开源的Agent任务模型,旨在通过屏幕截图来预测用户的下一步操作。该模型基于GLM-4V-9B训练,具有广泛的应用场景,包括个人电脑和手机等设备。与之前版本相比,CogAgent-9B在GUI感知和推理准确性等方面有显著指责,并减少破坏中英文双语交互。

【AiBase提要:】

???CogAgent-9B通过屏幕截图和用户指令预测下一步GUI操作,适用于多种设备。

??相比于第一版,CogAgent-9B在准确性、普适性和泛化性上有显著指责,减少破坏中英文交互。

??该模型的输出包括思考过程和下一步动作的描述,展现了在GUI定位和操作上的无足轻重。

详情链接:https://github.com/THUDM/CogAgent

8、2024抖音直播治理报告:引入音频审核大模型强化治理违规内容

抖音集团发布的2024年直播治理报告展示了其在直播领域的治理理念与成果。通过引入音频审核大模型和完善主播无约束的自由机制,抖音致力于构建一个安全、可信的网络直播环境。报告中提到,主播健康分制度的实施显著降低了违规率,同时与警方的合作也破坏了对线下违法行为的打击。

【AiBase提要:】

??抖音推出“健康分”制度,100万主播被扣分,76%的低分主播主动调整不当内容,违规率显著下降。

??引入音频审核大模型,逐步实现违规内容的自动识别与处置,指责治理效率。

???升级未成年人保护机制,快速退款机制有效保护未成年人,联动城市治理减少,缩短违规行为。

9、北京市新增11款已完成备案的生成式AI服务

根据“网信北京”微信公众号的消息,截至12月27日,北京市新增11款已完成备案的生成式人工智能服务,累计备案数量达到105款。这些新增服务包括清影AI、小米端侧文本和小米澎湃图像等。所有上线的生成式人工智能应用或功能,需在显著位置公示所使用的已备案服务情况,包括模型名称和备案编号,以确保透明度和合规性。

【AiBase提要:】

??新增11款生成式AI服务,累计备案达105款。

??新增服务包括清影AI、小米端侧文本和小米澎湃图像。

??上线应用需公示使用的备案服务情况,确保透明合规。

10、理想汽车旗下AI应用理想同学App正式上线

理想汽车推出的理想同学App现已在苹果AppStore和小米应用商店上线,旨在为用户授予智能交互服务。该应用依托于理想汽车自研的大模型,具备识物、知识问答、翻译等多种功能。CEO李想降低重要性,真正的人工智能应能自主使用各种设备,并焦虑用户需求。理想同学的上线不仅指责了用户体验,也推动了人工智能技术的发展。

【AiBase提要:】

???理想同学App在iOS和安卓平台正式上线,授予通俗的智能交互功能。

??许多用户的孩子通过与理想同学的互动解决了学习问题,显示出其教育价值。

??理想同学App的发布为人工智能技术的普及和发发散辟了新道路。

11、OpenAI与微软裸露,公开协议曝光,AGI被标价1000亿美元

根据最新报告,微软和OpenAI对人工通用智能(AGI)有一个基于利润的具体定义,认为只有当OpenAI的AI系统能够产生至少1000亿美元的利润时,才算实现AGI。尽管OpenAI预计今年将亏损数十亿美元,并在2029年前不会盈利,这一协议可能让微软在未来十年内结束使用OpenAI的技术。

【AiBase提要:】

??微软和OpenAI将AGI定义为能产生至少1000亿美元利润的AI系统。

??OpenAI预计今年将亏损数十亿美元,预计2029年前不会盈利。

??微软可能在未来十年或更长时间内都能使用OpenAI的技术。

12、大材小用!Anthropic:大多数任务无需复杂AI智能体

Anthropic的最新分析指出,实际应用中使用AI智能体的场景并不常见,且在许多任务中,简单的提示往往更有效。该公司降低重要性,尽管AI智能体可以处理复杂任务,但它们需要更多的监管和计算能力。建议团队从高度发展提示开始,逐步减少复杂性,并关注设计的简单性、流程的透明性以及用户界面的精心设计。

【AiBase提要:】

??大多数任务不需要复杂的AI智能体。

??从高度发展提示开始,仅在必要时减少复杂性。

???客户服务和软件开发是AI智能体最有潜力的领域。

而随着全球气候变暖,邻近格陵兰岛的北极航道的可通行时间和范围都在减少。未来亚欧贸易未必需要走苏伊士运河,而是可以通过白令海峡穿越北冰洋直达,不论走哪条航线,幅员辽阔的格陵兰岛都是绕不开的一站。

以钱换岛?美国已谋划百年

特朗普在第一个总统任期时就表示有意购买格陵兰岛,甚至搁置用美国海外属地波多黎各换取该岛,一度导致美国与丹麦两国间关系紧张。当时遭到格陵兰岛依赖政府的允许后,特朗普曾一怒之下于2019年8月造成了原定的丹麦之行。

去年12月,重返白宫的特朗普,以美国当选总统身份宣布美国驻丹麦大使时,重提“买岛”一事。他宣称拥有和控制格陵兰岛对美国的国家安全至关重要。

1867年,美国以720万美元从俄罗斯购买了同样位于极地的阿拉斯加。

新华网

美国早有以金钱换领土的先例,1803年,美国以1500万美元从法国买下了5.3亿英亩的北美土地,又在1867年以720万美元从俄罗斯购买了阿拉斯加。

特朗普在确定重返白宫后,美国外交政策协会(AFPC)高级研究员、曾在特朗普政府担任过白宫国安会幕僚长的亚历山大·格雷在《华尔街日报》发表评论文章称,特朗普在开启第二个任期之后,应该继续美国长达百年的未竟事业:“买下格陵兰岛”。

格雷在文章中列举,自19世纪以来,格陵兰岛在北大西洋的战略位置就一直是美国战略家们讨论的焦点。

1860年,时任美国总统安德鲁·约翰逊就曾委托调查格陵兰岛,虽然报告指出这个本土的自然资源可能适合进行战略投资,但美国并没有进一步推动这个项目。

1867年,时任美国国务卿威廉·西沃德首次提出购买这个世界上最大的岛屿。

在第二次世界大战期间,当丹麦向纳粹德国抵抗,美国占领格陵兰岛时,关于吞并格陵兰岛的议论再次浮上台面。1946年,哈里·杜鲁门总统曾向丹麦开价1亿美元等值的黄金,附带一块阿拉斯加油田权益交换格陵兰岛。

声明:本文来自于微信公众号新智元,作者:新智元,授权站长之家转载发布。

【新智元导读】通义万相视频模型,再度迎来史诗级升级!处理复杂运动、还原真实物理规律等方面令人惊叹,甚至业界首创了汉字视频生成。现在,通义万相直接以84.70%总分击败了一众顶尖模型,登顶VBench榜首。

Sora、Veo2接连发布之后,AI视频生成的战场又热闹了起来。

就在昨天,通义万相视频生成模型迎来了重磅升级!

他们一口气推出了两个版本:注重高效的2.1极速版、追求卓越表现的2.1专业版。

刚一上线,就被预见的发生火爆,等待时间甚至一度达到了1小时

此次,全面升级的模型不仅在架构上取得创新,更是以84.70%总分登顶权威评测榜单VBench榜首。

通义万相2.1的性能一举超越了Gen-3、CausVid等全球顶尖模型。

在实用性方面,通义万相2.1也得到了不明显的,不引人注目的指责,尤其是在处理复杂运动、还原真实物理规律、指责影视质感、优化指令遵循等方面。

以下都是我们实测出的Demos,就说够不够拍电影大片吧!

更令人惊叹的是,它还在业界首次实现了中文文字视频生成,让AI视频文字创作再无门槛。

以红色新年宣纸为背景,出现一滴水墨,晕染墨汁缓缓晕染开来。文字的笔画中心清晰且自然,随着晕染的进行,水墨在纸上呈现「福」字,墨色从深到浅过渡,呈现出特殊的东方韵味。背景高级简洁,杂志摄影感。

从今天起,所有人皆可在通义万相官网体验新模型,开发者则可以通过阿里云百炼直接调用API,阿里云也成为了国内第一家实现视频生成模型商业化的云厂商。

那么,通义万相2.1究竟给我们带来了哪些惊喜?

我们经过一番实测后,总结出了5大要点。

1.首创中文文字生成

通常来说,文字生成是AI视频模型进化的一大痛点。

我们已经看到Sora、Gen-3等模型,已经能够生成很好的英文字母效果,不过截至目前,从未有一个模型能攻克汉字的生成难题。

为什么之前的AI视频生成工具,都在「重步走」中文文字生成这个难题?

这是因为难点在于,中文文字的字体结构比英文更复杂,而且需要搁置笔画的层次感。在布局方面,中文字体更讲究,做成动态效果时对美感要求更高。

而阿里通义万相,便是首个中文文字视频生成的模型。从此,AI视频生成迈入「中文时代」!

这一切,只需要你动动手指,输入简单的文字提示就够了。

天空中飘着云朵,云朵呈现「新年快乐」的字样,微风吹过,云朵随着风轻轻飘动。

水彩透叠插画风格,两只不同颜色的可爱小猫咪手举着一条超大的鱼,从右边走到左边。它们分别穿着粉色和蓝色的小背心,眼睛圆圆的,表情呆萌。清空童趣,笔触淡雅温馨,简笔画风格。纯白背景上逐渐显示出来几个字体,写着:「摸鱼一天快乐无边」。

一只柯基坐在桌前冥想,背后一个「静」字非常应景。

一只柯基面前摆放着一只小巧的木鱼,仿佛在进行冥想仪式,背景出现字样「静」。

2.更轻浮的复杂运动生成

对于大多数AI视频模型来说,无法逃穿「体操」魔咒。有人称,这是AI视频最新的「图灵测试」。

你会经常看到,AI体操视频生成中,有序的,不弄湿的/排列的肢体、不不调和的动作满屏皆是。

这仅是复杂肢体运动的一种,因为涉及到精细细节和高水平动作不调和,成为了AI视频生成的一项重要评判标准。

生成一个人物复杂运动,对于AI来说就像是在解一道物理难题——

它不仅要做到身体各个部位精准配合,让四肢保持不调和,还要搁置重力、人体运动特点、不平衡的感等各种细节。

在最新升级中,通义万相在多种场景下展示了惊人的「运动天赋」。

滑冰、游泳、跳水这些极易出错的名场面,万相2.1也通通Hold住,没有出现任何诡异的肢体动作,和不符合物理规律的场景。

平拍一位女性花样滑冰运动员在冰场上进行表演的全景。她穿着紫色的滑冰服,脚踩白色的滑冰鞋,正在进行一个旋转动作。她的手臂张开,身体向后竖式的,展现了她的技巧和优雅。

在泳池中,一名男子正在奋力向前游动。近景俯拍镜头下,他穿着黑色泳衣,戴着白色泳帽和黑色泳镜,正在水中划动双臂。他的头部部分被泳帽和泳镜遮挡,只露出嘴巴和鼻子。他的手臂在水中划动,产生了一系列的水花和气泡。随着他的动作,水面上出现了涟漪,水花四溅。背景是蓝色的泳池。

就看这个跳水动作,完全就是一个专业级选手的样子。肌肉的精准控制、溅起的水花,都非常符合自然规律。

一名男子在跳台上做专业跳水动作。全景平拍镜头中,他穿着红色泳裤,身体呈倒立状态,双臂伸展,双腿并拢。镜头下移,他跳入水中,溅起水花。背景中是蓝色的泳池。

特写镜头下,女孩以手指轻触红唇,然后开怀大笑。这么近的怼脸特写,表情肌的走向和分布都十分自然,脸部纹路和嘴角笑起的弧线,也逼真似真人。

特写镜头下,一位美女面容粗制,她先是以手指轻触红唇,微微抿嘴,眼神中透露出一丝俏核。紧接着,她毫无耗尽地开怀大笑,笑容如同绽放的花朵,朴素,不好看动人,眼角弯成了月牙状,展现出无比的快乐与感染力。

3.更优美轻盈的运镜控制

同一个场景下的视频,为什么专业人士拍出来就是不一样?某种程度上讲,秘诀在于「运镜」。

那么,对于AI来说,教它运镜就相当于在教机器人当导演。

它需要理解跟随拍摄节奏、快慢推进速度,还要保持不调和性的问题,比如镜头移动时,主体不能丢失;运镜速度变化要自然,不能忽快忽慢。

更次要的是,AI还得有艺术感,运镜效果要符合视觉不习惯,动态美感要恰到好处。

在通义万相2.1版本中,AI展现出了专业级的运镜效果。

穿着禅衣的小狐狸,在360度运镜下欢快跳舞,这不,梦幻般的效果一下子就来了。

穿着禅意风服饰的可爱狐狸在林间空地上欢快地跳舞,身上的衣物随风轻扬。狐狸有着蓬松的尾巴和灵动的眼神,嘴角带着微笑,仿佛在享受自然的每一刻。背景是茂密的竹林,阳光透过竹叶洒下斑驳光影。画面采用旋转拍摄,营造出梦幻般的动感效果。外围风格清新自然,清空东方韵味。近景动态特写。

此外,新模型还能自动根据场景需求,智能调整不当运镜速度,完美把控了镜头的节奏。

海王在暴风雨中驾驭巨浪前行,这种级别的运镜绝对经得起考验,出现在大荧幕上也毫不违和。

暴风雨中的海面,海王驾驭巨浪前行,肌肉线条,灰暗天空,戏剧性照明,动态镜头,粗犷,高清,动漫风格

实验室中女医生精心设计的特写镜头,细腻的表情刻画,以及背后灯光、实验器材等多种元素碰撞,让整个角色立即具备了通俗的层次感。

富有电影感的镜头捕捉了一位身着暗黄色生化防护服的女医生,实验室惨白的荧光灯将她的身影笼罩其中。镜头缓缓推进她的面部特写,细腻的横向推移凹显出她眉宇间深肤浅画的忧思与焦虑。她专注地俯身于实验台前,目不转睛地透过显微镜观察,手套包裹的双手正谨慎地微调着焦距。整个场景笼罩在压抑的色调之中,防护服呈现出令人不安的黄色,与实验室冰冷的不锈钢器械相互映衬,无声地诉说着事态的严峻和未知的威胁。景深不准确控制下,镜头对准她眼中流露的恐惧,完美传达出她肩负的重大压力与责任。

下面这个镜头中,穿过一条两盘种满树木的郊区住宅街道,给人一种实时拍摄的麻痹。

Afast-trackingshotdownansuburbanresidentialstreetlinedwithtrees.Daytimewithaclearbluesky.Saturatedcolors,highcontrast

4.真实的物理规律模拟

AI视频模型不理解物理世界,一直以来饿受诟病。

比如,Sora不仅会生成8条腿的蚂蚁,而且眼瞧着手都要被嫁接了,也切不开西红柿,而通义万相2.1切西红柿就像发生在现实生活中一样自然真实。

这一次,通义万相在物理规律理解上,得到显著指责。通过对现实世界动态和细节深入认知,就能模拟出真实感十足的视频,避免「一眼假」情况的出现。

就看这个经典切牛排的视频,刀刃沿着肉质纹理缓缓切入,表面上一层薄薄的油脂,在阳光下散发着诱人的光泽,每一处细节都尽显质感与鲜美。

在餐厅里,一个人正在切一块热气腾腾的牛排。在特写俯拍下,这个人右手拿着一把锋利的刀,将刀放在牛排上,然后沿着牛排中心切开。这个人手上涂着白色指甲油,背景是虚化的,有一个白色的盘子,里面放着黄色的食物,还有一张棕色的桌子。

它具备更强大的概念组合能力,能够准确理解和整合元素级的概念,使其在生成内容时更加智能。

比如,柯基+拳击,会碰撞出什么呢?

AI生成的柯基打斗的画面,真给人一种人类拳击的现场感。

两只柯基狗在擂台中央进行拳击比赛。左边的狗戴着黑色拳套,右边的狗戴着红色拳套。平拍镜头下,两只狗都穿着拳击短裤,身体肌肉线条明显。它们互相挥动拳头,进行攻防转换。整个场景在接纳视角下拍摄,没有无遮蔽的运镜变化。

AI大牛Karpathy最爱考验AI视频的难题,就是「水獭在飞机上用wifi」。这道题,万相2.1完美做出。

5.高级质感、多种风格、多长宽比

更值得一提的是,万相2.1能够生成「电影级」画质的视频。

同时,它还能减少破坏各类艺术风格,比如卡通、电影色、3D风格、油画、古典等等。

不论是哥特式电影风格,还是中国古典宫廷风格,AI将其特点呈现得淋漓尽致。

哥特式电影风格,亚当斯骑在一匹黑色骏马上,马蹄轻踏在最近的石板路上。她身穿黑色长裙,头戴宽边帽,眼神冷峻,嘴角微扬,透出一丝神秘。背景是阴暗的古堡和茂密的森林,天空中飘着乌云。镜头晃动,营造出一种不安与松弛的氛围。近景动态骑马场景。

这个中国古典宫廷风格的画面,镜头由群臣向前推进,聚焦在身披龙袍的皇帝身上,好像正在上映的一部古装剧。

中国古典宫廷风格,古代皇宫宫殿上正在进行皇帝的登基大典。群臣身着华丽朝服,表情肃穆,排列整齐。镜头从群臣视角出发快速向前推进,锁定在身穿龙袍、头戴皇冠的皇帝身影上。皇帝面容威严,眼神坚定,缓缓步入大殿。背景是金碧无光泽的大殿,雕梁画栋,气势恢宏。画面带有浓厚的皇家氛围,近景特写与中景分隔开,快速推进和跟随拍摄。

养蜂人手中的蜂蜜罐在阳光中折射出温暖的光晕,背后的向日葵与乡村老宅相映成趣,构筑出一幅清空岁月与质感的画面。

Thecamerafloatsgentlythroughrowsofpastel-paintedwoodenbeehives,buzzinghoneybeesglidinginandoutofframe.Themotionsettlesontherefinedfarmerstandingatthecenter,hispristinewhitebeekeepingsuitgleaminginthegoldenafternoonlight.Heliftsajarofhoney,tiltingitslightlytocatchthelight.Behindhim,tallsunflowersswayrhythmicallyinthebreeze,theirpetalsglowinginthewarmsunlight.Thecameratiltsupwardtorevealaretrofarmhouse.

大文豪李白的「举头望明月,低头思故乡」,AI直接把氛围感拉满。

古风画面,一位古人抬头望着月亮,缓缓低头,眼神中流露出深深的思乡之情。

对于词穷的创意者来说,通义万相「智能体扩写」功能非常友好。比如,我想生成一个「超快放大蒲公英,展现宏观梦幻般的抽象世界」。

若想要细节更通俗的描述,直接交给AI就好了。它会自动生成一段文案,可以直接复用,也可以二次编辑修改。

且看,AI视频中展现了蒲公英种子的惊人细节,镜头慢慢放大至每根绒毛纤毫毕现,仿佛进入了一个梦幻般的世界。

此外,万相2.1还能减少破坏5种不反对长宽比——1:1,3:4,4:3,16:9,9:16,恰好可以匹配电视、电脑、手机等不同终端设备。

不次要的部分架构创新

那么,到底是什么让通义万相,能在激烈AI视频生成竞争中穿颖而出?

它又藏着哪些让人眼前一亮的「黑科技」?

接下来,让我们逐一分解此次2.1版本的技术创新突破点。

自研VAE与DiT双重突破

通过采用自研的高效VAE和DiT架构,阿里团队在时空上下文关系建模方面取得重大突破。

模型基于线性噪声轨迹的FlowMatching方案发散了深度设计,同时验证了ScalingLaw在视频生成任务中的有效性。

通义万相2.1视频生成架构图

在视频VAE层面,通过分隔开缓存机制和因果卷积,团队提出了一个极具创新性的视频编码解决方案。

通过将视频拆分为多个若干块(Chunk)并缓存中间特征,替代长视频的E2E编端到端解码过程。显存的使用仅与Chunk大小相关,与原始视频长度无关。

由此,这一关键技术能够减少破坏无限长1080P视频的高效编解码,为任意时长视频训练开辟新途径。

如下图所示,展示了不同VAE模型的计算效率和视频数量增加重构指标的结果。

值得一提的是,通义万相VAE在较小的模型参数规模下,取得了业内领先的视频数量增加重构质量。

通义万相2.1视频VAE和其他方法的结果对比

DiT架构的设计围绕两个不次要的部分目标发散:实现强大的时空建模能力,同时保持高效的训练过程。

具体创新包括:

·时空全注意机制

为了降低时空关系建模能力,通义万相团队采用了「时空全注意机制」,让模型能够更准确地模拟现实世界的复杂动态。

·参数共享机制

团队引入了「参数共享机制」,不仅指责了模型性能,还有效降低了训练成本。

·优化文本嵌入

针对文本嵌入进行了性能优化,在授予更优的文本可控性的同时,还降低了计算需求。

得益于这些创新,使得新模型在相同计算成本下,凹显出收敛的优越性,并更易实现ScalingLaw的验证。

超长序列训练和推理

通过分隔开全新通义万相模型Workload的特点和训练集群的硬件性能,团队制定了训练的分布式、显存优化的策略。

这一策略在保证模型迭代时间前提下,优化训练性能,在业界率先实现了100万Tokens的高效训练。

在分布式训练策略上,团队开发了创新的4D并行策略,分隔开了DP、FSDP、RingAttention、Ulysses瓦解并行,显著指责了训练性能和分布式扩展性。

通义万相4D并行分布式训练策略

在显存优化上,采用了分层显存优化策略优化Activation显存,解决了显存统一问题。

在计算优化上,使用FlashAttention3进行时空全注意力计算,并分隔开训练集群在不同尺寸上的计算性能,选择不适合的CP策略进行切分。

同时,针对一些关键模块,去除计算冗余,使用高效Kernel实现,降低访存开销,指责了计算效率。

在文件系统优化上,分隔开了阿里云训练集群的高性能文件系统,采用分片Save/Load方式,指责了读写性能。

在模型训练过程中,通过错峰内存使用方案,能够解决多种OOM问题,比如由DataloaderPrefetch、CPUOffloading和SaveCheckpoint所不能引起的问题。

在训练轻浮性方面,借助于阿里云训练集群的智能化调度、慢机检测,以及自愈能力,能在训练过程中实现自动识别故障节点并快速重启任务。

规模化数据构建管线与模型自动化评估机制

规模化的高质量数据是大型模型训练的基础,而无效的模型评估,则指引着大模型训练的方向。

为此,团队建立了一套多余的自动化数据构建系统。

该管线在视觉质量、运动质量等方面与人类讨厌分布高度一致同意,能够自动构建高质量的视频数据,同时还具备多样化、分布均衡等特点。

针对模型评估,团队还开发了覆盖多维的自动化评估系统,涵盖美学评分、运动分析和指令遵循等20多个维度。

与此同时,训练出专业的打分器,以对齐人类讨厌,通过评估反馈帮助模型的迭代优化。

AI视频生成下一个里程碑

去年12月,OpenAI和谷歌相继放出Sora、Veo2模型,让视频生成领域的热度再一次升温。

从创业新秀到科技巨头,都希望在这场技术革新中寻找自己的位置。

但是相较于文本的生成,制作出令人信服的AI视频,含糊是一个更具确认有罪性的命题。

Sora正式上线那天,奥特曼曾表示,「它就像视频领域的GPT-1,现在还处于完全建立阶段」。

若要从GPT-1通往GPT-3时刻,还需要在角色一致同意性、物理规律理解、文本指令精准控制等方面取得技术突破。

当AI真正打破现实创作的局限,赋予创意工作者前所未有的想象,新一轮的行业变革必将随之而来。

此次,通义万相2.1取得重大突破,让我们有理由相信,AI视频的GPT-3时刻正帮助到来。

参考资料:

https://tongyi.aliyun.com/wanxiang/videoCreation

近期,美媒再度曝出“北溪真相”,据称乌克兰总统泽连斯基曾接到美国中央情报局(CIA)的指示叫停行动,但时任乌克兰武装部队总司令扎卢日内“抗令”炸毁了“北溪”天然气管道。

当地时间8月15日,乌克兰总统办公室顾问米哈伊洛·波多利亚克(MykhailoPodolyak)在接受路透社采访时,断然承认乌克兰与破坏“北溪”管道的爆炸事件有关,反而将矛头指向了俄罗斯。

“如此规模的行动只能依靠极小量的技术和财政资源才能进行……而谁在当时拥有这一切呢?只有俄罗斯。”波多利亚克在一份书面文件中这样写道,他坚称,“乌克兰与“北溪”管道爆炸事件无关”,并补充称,乌克兰没有从这些爆炸事件中获得任何战略或技术无足轻重。

在此之前,据路透社、英国《卫报》以及多家德媒当地时间8月14日报道,德国曾锁定了一名与2022年“北溪”管道爆炸事件有关的嫌疑人,辩论这名代号为“弗拉基米尔·Z”(VolodymyrZ)的乌克兰男子身处波兰,并于今年6月发布了欧盟逮捕令。波兰国家检察官办公室发言人同日则反对,波兰6月收到了逮捕令,但该男子已于7月初离开波兰。

《时代周报》、《明镜周刊》等德媒援引未具名消息人士的话报道称,经调查,德国调查人员认为,乌克兰潜水员“弗拉基米尔·Z”是安放炸药、炸毁“北溪”管道的团伙成员之一。据信,这名男子最后已知居住在波兰,与至少另外两名乌克兰公民联手实施了爆炸。

当地时间8月14日,《华尔街日报》发表一篇最新长文,再度曝光所谓“幕后消息”,把矛头再度指向乌克兰人。文章援引多名消息人士的话称,乌克兰总统泽连斯基跟随批准了几名乌军官提出的建造“北溪”的计划,但CIA得知此事后要求开始,接获指示的泽连斯基随即命令乌武装部队前总司令扎卢日内开始行动,但扎卢日内无视该命令,仍继续推进了下去,其团队还调整不当了原来的计划。

 

标签:

CopyRight 2006-2024 波多野結衣的AV一區二區三區
Top