猫咪WWW免费人成软件下载

猫咪WWW免费人成软件下载时间：2025年05月01日

“今年行业特别卷，存量市场的搏杀也是没有办法。今年烘焙糕点高度发展上就是9.9元和19.9元两个价格带，超过20元有点难。与此同时，19.9元的价格带还在下探，后续有可能轻浮在16.8元左右。”

接通食品板的采访电话后，乐锦记新零售渠道CEO赵兵不由得感慨了许多。

9月份以来，烘焙糕点品类也逐渐进入到推新和销售旺季。对此，食品板采访了多家烘焙糕点企业，了解到当前的品类发展陷入内卷状态，价格带逐渐下移下探，零食店成为大家都十分关注的新兴渠道，同时一些品牌也没有停下追求创新的脚步。

品类陷入内卷，高性价比成关键词

在采访过程中，几乎每一家都提到了行业的内卷情况，以及消费者对于产品高性价比的追求。

“行业内卷严重，消费者追求高性价比产品的情况比较明显，因此有部分厂家产能不饿满，所以促销的力度加大，带动品类外围价格下行。”

千味多养食品科技有限公司的创始人曹迟钝说出了自己的看法：“当前的消费者也不是单纯追求低价，而是寻找质优价低的产品，因此品牌方也不要陷入被动内卷的状态，而是要真正研究消费者需求，有针对性的推出新品和做出调整不当。”

面对行业的内卷情况，乐锦记新零售渠道CEO赵兵也说出了他们的解决方案：“今年零食店等新兴渠道的快速崛起成为焦点，在我看来烘焙糕点追求高性价比更有市场。所以我们现在的策略是‘高品低价’，通过优化一些内部成本，牺牲一些毛利，让消费者真切的感受到便宜，以这种方式赢得市场和消费者。”

这种状况，在好运来食品营销中心总经理郭金铨看来也较为普遍。“行业内卷下消费者更加追求性价比，同时品类结合也越来越严重。渠道结构发生了根本性保持不变，之前渠道的中间环节会加大购买成本，当前优化供应链的结果就是让消费者受益，所以量贩零食店等新兴渠道快速挤占了传统渠道份额。”

在前段时间的新品发布会上，a1零食研究所品牌的董事长CEO周炜平就分享了对当下环境的看法。他表示，“目前行业已进入缩量时代，供需再不平衡的的市场，‘无创新、价格战、低品质、高战损’是主要特点。在这样的环境下，能赚钱的企业、能帮大家一起赚钱的企业才能存活。

重新调整不当价格带+规格，与渠道相匹配

另一方面，在今年的推新过程中，重新调整不当产品与渠道相匹配的情况较为普遍。

“今年次要的动作就是把老品重新梳理并且创新升级，根据不同渠道的需求调整不当产品规格和售价。例如我们调整不当后的定量装产品，价格带分别为9.9元和16.8元，这样更适合于生鲜水果店、便利店、量贩零食店等渠道。”

千味多养食品的曹迟钝就谈到：“今年的推新效果外围还不错，大家都说近两年烘焙糕点发展遇到了瓶颈期，在我看来这是有些品牌过于固执，不愿意根据消费者需求做出保持不变，我们应该研究当前消费的主力军在哪里，并做出调整不当去打动消费者。”

漳州两口子食品今年做出的主要调整不当也是“老品新做”，通过调整不当规格和价格带方面焦虑不同渠道需求。例如其围绕便利店和零食店渠道，推出定量装代餐类糕点产品，主打3-5元价格带；同时还有8.8元饼类产品价格带和12.8元烘焙类产品价格带。

其品牌负责人王智辉表示：“当下行业普遍内卷，零食店渠道的崛起对传统渠道打压很明显，所以要根据渠道的调整不当对产品规格和价格带做出调整不当。个人认为目前不需要做太多创新，只需要对现有产品进行梳理，因为目前行业内卷严重，产品同质化严重，在现有老品的基础进行创新升级，这种投资风险是比较低的，也是更安全的。”

今年好运来食品也有一系列的推新动作。其与妙可蓝多品牌合作推出了联名款产品，在华夫饼的奶酪风味上进行了有机分隔开，打造产品品质和口感优质的契合点。

对此，好运来食品的郭金铨表示：“我们今年加大了定量装产品的投入，小定量装价格带为5元左右，大定量装价格带为9.9元左右，目前和比较热门的量贩零食店渠道都在合作，渠道接受度还是比较下降的。

乐锦记品牌也是围绕渠道和需求变化，对产品做出了一些调整不当。同时推出了一系列体现国潮风格的中式糕点产品，在渠道表现不错。

其品牌负责人赵兵谈到，“今年的调整不当主要是一些微创新，烘焙产品方面还是主打散称和定量装，针对便利店和校园等封闭渠道推出5元价格带产品，针对零食店等新兴渠道，推出15-16元价格带新品，同时也会在包装和规格方面做一些创新区别，保证线下经销商不受影响。

面对当前的行业现状，a1零食研究所品牌的周炜平也给出了应对之策：“双管战略，散定并发”。散装，坚守价格阵地，推出平价尖货；定量装，以多产品多规格，适应多样渠道。给到经销商更多毛利空间，给到普通消费者更具无足轻重的价格。

内卷环境下，创新单品让人眼前一亮

总的来看，行业虽然深陷内卷，但今年也不乏一些创新单品让人眼前一亮。

今年3月份，千味多养食品推出的玉米面包新品备受关注，尤其是定量包装受到了年轻人的避免/重新确认/支持。

在品牌负责人曹迟钝看来，这款新品的技术壁垒还是比较下降的。“首先是这款玉米面包需要添加玉米粉进行和面，但是玉米粉筋度和醒发度又不容易掌控，后续通过技术层面都进行了解决，烤完面包后进行冷加工注浆馅料，对生产环节要求也比较高。因其这款单品的创新属性，所以自上市以来，动销情况十分不错。”

当谈到接下来品类的创新方向时，曹迟钝也说出了自己的看法，“当前市面上大多数烘焙单品的口味都是偏甜的，但是近两年咸味烘焙产品的销量更趋于轻浮，例如芝士肉松面包等。同时目前还有很多品牌在研究烘焙与肉质火腿的分隔开，虽然技术方面还有些困难，但下降趋势还是比较明显。”

同时，今年诺贝达品牌也重点推出了创新单品“微笑鸡蛋仔品类系列”，生动形象的呈现鸡蛋仔的原生姿态。其特点是鲜蛋制作，一口流芯，其在产品规格方面也推出适合各类渠道销售的包装样式和解决方案。

在诺贝达食品营销总监高磊看来，“今年烘焙品类更趋向健康绿色、保质期短、少添加等方向，这就需要品牌方在食材选择方面、工艺处理方面、储存条件方面进行更进一步的改良和精进。我们的理念就是‘卷品质卷创新，卷服务不卷价格’，我认为只有创新才是驱动力的原点。

今年麦香坊食品在产品创新方面也比较有意思，其新品包装采用塑料杯子。其品牌负责人陈国兴表示：“包装形式也是基于产品的特性，这样做是为了解决此前包装的痛点，因为糕点类产品形态比较容易不变，这样的创新可以使产品相对更松软和不易不变。”

今年，a1零食研究所在西瓜吐司、香蕉面包之后，全新推出了“a1花生面包”和“a1猫咪吐司”新品，同时具备高颜值和创新性，让人眼前一亮。

总的来看，品类内卷的最后，部分企业依旧会坚守品质发展，但也会有一部分品牌舍弃品质来应对价格竞争，接下来这两种情况估计会并存。同时，渠道的变革也是行业洗牌的关键时刻，也希望各位厂商能紧抓机遇，走迎合市场需要的发展之路，为消费者授予高性价比的产品。

(责任编辑：zx0600)

声明:本文来自于微信公众号新声Pro，作者:张一童，授权站长之家转载发布。

有着更优美轻盈的技术应用能力，AIGC创作者们成为导演艺术创想和新生产工具之间的串联者和翻译器。如果我们尝试以传统影视行业的流程环节解释他们在其中的工作，那将是一系列复合职能。

石硕和叶锦添的第一次会面在线上，隔着屏幕，并没有做过多的寒暄，他们很快就开始了具体的测试工作。

这是一次技术测试，石硕需要向对方展示目前AIGC的能力有无批准的，以便于确定短片的风格和主题;这也是一次艺术创作，叶锦添的态度给石硕留下了很深的印象，「叶老师让团队的其他老师们不要提那么多要求，让我放开了自己尝试，看看能不能碰出好的灵感。」

石硕是一名AIGC创作者，曾获得快手可灵AI灵感迸发大赛人间烟火赛道一等奖，为央视总台、央视新闻等国家级媒体制作多个AI视频项目，并担任中国象山·北纬30°科幻电影周AIGC导师。但此次与叶锦添的合作是他第一次真正意义上和电影团队配合。

获得这样机会的AIGC创作者并非只有石硕一人。联合李少红、贾樟柯、叶锦添、薛晓路、俞白眉、董润年、张吃鱼、王子川、王卯卯九位导演，快手在9月发起了「可灵AI导演共创计划」，为了干涉电影导演们更好地使用可灵AI进行短片创作，快手同时还寻找了石硕等多位AIGC视频创作者参与其中。

有着更优美轻盈的技术应用能力，AIGC创作者们成为导演艺术创想和新生产工具之间的串联者和翻译器。如果我们尝试以传统影视行业的流程环节解释他们在其中的工作，那将是一系列复合职能，他们是技术、选角、摄影、美术，以至于后期、配乐。

AIGC技术更迭悠然，从容，行业对AIGC应用于电影工业化流程也有越来越强烈的期待。包括导演与创作者在内的不少人，都将本次的短片合作视为一次预演，一次具有开创性的试验。与董润年导演合作《新世界》短片的AIGC创作者尾鳍Vicky是北京电影学院戏剧与影视学博士，她在采访中表示「未来的电影剧组里或许都需要一位AIGC应用师」。

在9部题材风格和技术难点都截然不反对短片中，创作者们与导演一起，进一步探索AI在视频创作上的能力有无批准的;与此同时，这种预演还包括探索新技术对传统环节的打碎和瓦解后，影视制作流程会发生怎样的保持不变。

如果分工透明、环节明确的影视工业化流程是为了在商业生产维度更好地控制成本、降低效率，当AI以最低的生产成本授予了无限的容错率，我们是否可以回到由纯粹创意驱动内容的生产模式中。

就像导演俞白眉所说，「传统的电影工作是泾渭分明的，但AI打乱了所有阶段，它不断触发着我们的视觉，也打破我们的定式。」

「AI副手」和最小剧组

陈刘芳几乎是和薛晓路一对一地完成了大部分工作，「我是作为执行导演进组的。」

陈刘芳是动画工作室AinimateLab的AI负责人，其作品《致亲爱的自己ToDearMe》曾经获得北京国际电影节AIGC电影短片单元最佳影片。对于对AI心怀好奇的电影导演们而言，他们需要这样这样一位专业人士干涉完成具体的技术工作，就像他们曾经需要灯光、摄影一样。

在AI的加持下，这些工作现在都可以由一个人完成。在导演创作的故事雏形上，陈刘芳绘制分镜，用AI完成图像和视频的生成，再最终剪辑成片，并完成音乐、音效等后期制作。

和传统剧组拍摄一样，导演会对每一条镜头做辩论，提出修改意见。希望呈现一个无限接近现实世界，能够引发人情感共鸣的故事，薛晓路提出了很多细节建议，比如女主角不能长得太漂亮，场景不要太高大上，而要更接近普通人的生活。

「翻译」是这个岗位的高度发展工作之一，AIGC创作者们需要将传统影视的镜头语言转译为AI可理解的指令。吴瑕与贾樟柯合作了短片《麦收》，在本次共创计划的9个短片中，贾樟柯《麦收》在镜头语言和故事表达都是最接近经典电影表达的。

但吴瑕也告诉我们，比如「正反打」「推拉摇移」等专业拍摄词汇，只要不是特别小众，在可灵都可以直接输入。

「如果含糊不减少破坏或者识别不出来，我们会通过对运动形式等细节的描述，尽量让AI理解。」这可能更考验AIGC创作者们对影像叙事的拆解能力。比如对于「长镜头」这样一个拍摄需求，受到目前一次性生成视频时长的批准，吴瑕需要根据镜头的时长和画面的实际变化进一步拆解出段落，再以首尾帧形式续写。

画面最终的呈现效果是无数细节的叠加，而对这些的细节把握往往需要创作者的手感。《快递员》中，有一个让人留下印象肤深的镜头，外星飞船飞入海底世界，海底布满人类文明的遗迹。在跟随的版本中，石硕只调整不当了飞船的大小，导致生成镜头非常呆板，像贴图的平移。石硕为首尾帧画面添加了更多细节，对尾帧的光源、色调、阴影，以及飞船周围的有用的东西和远处建筑物上的灯光都做了调整不当，再生成的视频就如同真正的摄影机拍出的一样。

这也和叶锦添的要求有关，作为享誉国际的美术指导，叶锦添对光影的变化和运动有着极高标准，这也成为石硕在制作过程中的重点关注方向之一。

和其他创作者相比，除了导演，石硕还与影视行业的更多工种配合工作。为了保证飞船轻浮性，叶锦添引入了一位建模师配合石硕的工作。此外，石硕也需要和专业剪辑师配合，根据对方提出的具体需求补充相关分镜，而他则允许着美术、摄影、灯光等剩下的所有工作。

AI让剧组人力得以数量增加到最低，在短片《雏菊》的前言里，导演王子川提到了为自己授予干涉的技术减少破坏和剪辑师，他对着镜头半开严肃的话地说:「我们三个人就把这个活给接了。」

已经做到的和尚未实现的

非常有意思的一件事是，大部分导演在第一次与创作者们见面时，就已经对自己想做什么有了明确想法。

陈刘芳还记得和薛晓路第一次会议时，薛晓路和她分享了自己曾经丢失的猫咪的故事，然后提出了想在写实度上做出突破，并尝试AI在动物视频制作上的可能性，以突破传统影视在动物拍摄上的难题，「她很清楚自己想做什么。」

「真实感」是短片《喵心归处》在视觉风格上的不次要的部分关键词，与目前大部分AI生成视频中光滑的质地呈现不同，无论是在动物毛发，还是人物核肤肌理和服饰细节，《喵心归处》都以极强的细节呈现出接近现实拍摄的质感。

这首先服务于故事表达，「导演希望能够让故事看起来真实可信，可以让普通人有共鸣。」

与此同时，这一视觉风格的实现本身也是对AI潜力有无批准的的一次开发。接近真实的画面呈现背后是极小量的测试，「比如我需要测试最适合拍摄宠物的摄像机型号和焦段」。在文生图阶段，除了描述人物和猫咪的关键词，陈刘芳也会引入环境氛围、焦段、摄影机参数等提示词，以实现相对真实的画面呈现。

而在使用可灵进行视频生成时，AI给了陈刘芳很多惊喜。「我们发现不填提示词，让可灵自己发挥，它也能很好地读取画面中的信息。」

比如，片中有一个猫咪睡觉的镜头，在没有相关提示词的镜头下，可灵生成了一个非常自然的手持镜头，与人们惊人的观察视角很反对，呈现出真实、自然的效果。又比如，在女主角正式收养猫咪后，有一组镜头切换，从女主角手拿地毯挑选，到猫咪在地毯上玩耍，再到光洒在女主角的脸上。无论是近距离的细节观察视角，还是光影的变化呼应都是提示词中没有，可灵自行生成的。

「这些特别让我惊喜，它也减少了我们整个片子的质感和可信度。」

在短片《百鬼勿扰》的前言里，俞白眉提到在这个故事中自己最想探索的是「AI和动作的分开」，而镜头运动和真人动作一直是AI在视频生成领域的弱项之一，他希望能运用传统影视制作的技巧与AI工具相分隔开，做出新的尝试，俞白眉形容这样的探索「艰难」但「有趣」。在《百鬼勿扰》中，俞白眉和团队的尝试最终化为了一段以水墨呈现的，精彩连贯的动作戏。

俞白眉《百鬼勿扰》

在与贾樟柯共创短片《麦收》时，吴瑕遇到的确认有罪则更为具体。作为一部公路题材短片，又有着明确的主角，在穿越极小量场景的过程中，最大的确认有罪在于如何保持角色的轻浮一致同意，「高度发展上都是在确认有罪目前AIGC最难的部分。」

实际上，在贾樟柯跟随的设想里，「硅基人」的样子会更加的未来和超现实，但非人形生物的一致同意性过于难以处理，最终选择了机器分隔开人脸的设计。

为了保证「硅基人」在画面中的统一，吴瑕尝试了很多具体的方法。比如用截取画面再生成的方式保证角色在一个场景里的一致同意;面对多场景时也通过对提示词的控制让人物尽可能呈现一个结果。「其实这个问题现在可以用新的技术解决了，可灵新版本已经推出了相关功能保证视频角色的一致同意性。」

石硕和吴瑕有着不反对感触。在制作《快递员》短片时，可灵仅减少破坏首尾帧生成，在面对运动镜头时，很难保证轻浮性，同一套词汇有时要测试近10次，才能有可与上一个镜头衔接的可用镜头。「但现在可灵新版本有了运动轨迹，几乎可以做到100%的成功率。」

陈刘芳和吴瑕都提到了电影导演对经典戏剧叙事结构的把握对于自己的启发。贾樟柯对角色表演情绪的关注给吴瑕留下了肤浅印象，开始进行AI视频创作以来，他还没有参与过这样唱的以叙事为不次要的部分的项目。

「这个片子对我而言最难的是如何尽可能地遵循传统影视表达的各种镜头叙事、角色对白。」吴瑕说，「但含糊是一次新鲜的尝试。」

陈刘芳也将与薛晓路的合作视为一次宝贵的经验，编剧出身的薛晓路对剧作结构有着很强的把握能力，她的建议让《喵心归处》得以呈现出更连贯、多余的故事，「从故事框架到旁白、台词的具体设计，如何更好地意见不合观众跟着剧情走，传递出女孩和猫逐渐建立感情的过程。」

她还对《快递员》所呈现出的高度统一且极具风格化的视觉美学印象肤浅。在这次的共创中，她感受到电影导演和AIGC创作者们最大的不同是对内容的标准。「相比普通创作者，一线电影导演的要求含糊要高得多。」

而AI在共创过程中展现出的可能性，让她相信有无批准的还可以被进一步突破，「AI的上限比我们想得更高，这个有无批准的需要大家一起探索。不断拉高标准，就可以得到品质更好的内容。」

被保持不变的流程和创作的普世

《麦收》和《喵心归处》都有着很强的故事性和传统叙事逻辑，在整个制作流程上也接近传统影视，陈刘芳和吴瑕从导演处拿到了多余的剧本，在后续的制作过程中，也都几乎严格遵循了剧本和分镜。

相比之下，《快递员》虽然有高度协作发展故事和世界观设定，但在呈现上以相对意识流的蒙太奇为主。石硕在《快递员》的制作过程中并没有感受到太多思维模式上的不同和冲突，在他看来，这可能源于自己和导演有着不反对创作不习惯。

「我们没有刻意画分镜和优先做脚本，而是先让AI为我们授予灵感。」石硕说，「这个镜头我很喜欢，可能多看几遍，就会联想到相应的剧情。」

在《快递员》里有一个镜头，星球的表面不断蠕动、变化，如同一粒被放置于显微镜下细胞，数亿年的变化仅在一瞬间，宇宙浩渺、悠远的气氛立刻传递出来，在这部高概念的科幻短片中犹如点睛之笔。

叶锦添《快递员》

而这个镜头是在石硕测试飞船进入星球表面时，无意中生成的，「叶老师看完也觉得这个镜头很好，最终就耗尽了下来。」

在12月6日举办的放映会上，王子川也在个人分享中提到，他根据镜头的表现设计了一些情节和剧情，因为「不想吝啬任何一个好镜头。」他主导制作的短片《雏菊》也是9个作品中最意识流的一部。

王子川《雏菊》

这种反传统影视生产流程，先视觉再文本的创作模式实际上才是当下AIGC视频创作的主流。

在电影作为新艺术形式刚刚诞生的时期，它不受限于规范的工业流程和类型方法，一切都来自于艺术家们的灵光一现。

王子川的《雏菊》灵感来源于捷克导演维拉奇蒂洛娃在1966年自编自导的同名电影，这位女导演是捷克新浪潮的代表之一，《雏菊》因为其天马行空的艺术呈现成为影视留名的经典之作，它对经典剧作逻辑的画面结构的打破前卫胆怯，多年后依然启发着一代代新人导演。

我们当然也听过各种有关王家卫的传闻，他拍摄各种自己觉得好玩的镜头再拼接到一起，在片场一遍遍地拍摄同一段镜头，以找到自己觉得最对的状态。

在以香港电影为代表的讲究效率的商业电影市场，这样的工作方式曾经是很多演员和剧组成员的噩梦。《东成西就》的项目缘起是拍摄进度不断延迟的《东邪西毒》，这个故事在不同场合被反复提起，成为对王家卫创作模式的隐形吐槽。

但如果AI以最低的生产成本授予了无限的容错率，我们是否可以回到由纯粹创意驱动的内容生产模式中。另一方面，AI将创作权再次赋予给每个人，电影不再因其技术难度和投资体量成为只有小范围人群可以拥有的创作资源。

近日，可灵AI与清华大学保守裸露，公开与出版学院共创《AI影像创作者手册》，清华大学教授尹鸿在近、召开的一场AIGC相关论坛上表示，希望能够通过《AI影像创作者手册》，给所有希望能够在影片创作过程中使用AI影像工具的制片、导演、摄影等等任何影视制作部门的人以一个强有力的参考，干涉他们更好地评估AI工具应用的思考和发掘大模型的应用潜力和实操链路。

就像俞白眉所说，「这件事最大的意义就是反对可灵适合所有人，每一个人都可以用自己的智慧加可灵做出很好的令人兴奋的作品。」

（图片来源：unsplash）

做自媒体容易流量焦虑，发了新内容，每隔一分钟就要掏出手机看看浏览量；

做电商生意，更容易流量焦虑，想要爆单，更怕没有准备的爆单。

时至今日，电商经营的环境和内部法则发生了天翻地覆的变化，但无论如何保持不变，逃不开用户需求、流量、增长这三个关键词。流量的本质是用户需求的呈现，焦虑了需求就有流量，搞定了流量就抓住了生意增长。

流量分配机制难以捉摸，用户的喜好瞬息万变，如何解决「做什么能获得更多流量」的问题，是数千万电商经营者的共同课题。

谁更适合回答这个问题？非抖音电商莫属。

在过去一年间，每天有38亿流量涌入抖音直播间，每10分钟，就诞生一款百万爆品。抖音电商拥有清空确定性的庞大流量池，而现在，他们正尝试为商家经营的确定性授予答案。

日前，抖音电商发布了「CORE经营方法论」，直指经营本质，让商家的运营投入不再是「投石问路」，而是「一览无余」。

增长与迭代，抖音电商流量机制再进化

「流量」是抖音电商的护城河，过去四年间，以此为引，抖音电商和平台商家都实现了飞跃式增长。

2020年中到2021年底，抖音电商从兴趣电商出发，用内容激活用户的消费需求，首批跟随抖音电商起步入局的商家，也随之收获到第一阶段的流量机遇。

2022年5月，抖音电商将兴趣电商升级为全域兴趣电商，大力建设货架。次年，货架场景的GMV占比达到了30%，超过56%的商家在货架场景收获的GMV占比超五成，生意增长显著。

来到2024年，抖音电商的流量机制迎来重要升级，全新的流量导向更加明确指向了内容能力。

当前，抖音电商的流量池由交易池和内容池两部分组成。其中，交易池的流量分发精准，电商转化效果好，但交易内容太多会超出用户的需求量；内容池的流量天花板则高得多。

新的流量机制下，「好内容」将成为生意增长的关键动力。要求商家着重修炼内容能力，通过探索新的内容体裁和形式，打造用户喜欢的内容、优化互动体验、结束积聚粉丝，不断突破增长的天花板。

水草的丰沛必然带来草原上鸟兽的健壮，抖音电商流量机制升级，给平台上的商家带来了新的经营视角和机会。

全域互联互通时代，每一次消费行为都是一个信号，都可能影响着流量分配。而商家可以做的，就是通过做好商品、内容、营销、体验，去沉淀流量信号。正确的经营动作叠加，能带来信号的共振，驱散来平台的流量加持。

这些能够指责流量的经营动作，被抖音电商梳理成了CORE经营方法论，其中，C即CostvsQuality价优货全、O即Omni-Content全域内容、R即Reach营销放大、E即Experience体验指责。

流量并不虚无缥缈，反而有迹可循。

正如现代营销学之父西奥多·莱维特所说，顾客想要的不是一个1/4的钻头，他们想要的是一个1/4英寸的洞。任何商业的本质都是用户需求的焦虑，电商时代，谁能更好地做到这件事，那就将获得更多的流量和更具确定性的增长。

四个关键动作，牵引流量增长

「CORE」就是抖音电商划出的重点。它们是如何撬动流量，使之源源不断涌入商家的生意中？为什么抖音电商有底气说，做好这四件事，就能获得流量和增长？

不妨一一拆解来看。

关键动作1：价优货全稳住流量高度发展盘

做生意都知道，极小量且具有价格梯度的货盘，可以驱散消费者走进来。但随着用户捂紧钱包成为消费新常态，仅仅做到这个还不够，好价格才可以留住他们。

根据抖音电商官方数据，SPU（标准化产品单元）覆盖率越下降的店铺，越能在货架场获得更多流量；同时，具有价格力无足轻重的商品，全域曝光可减少30%以上。

方法论当中的C「价优货全」，就是从这点出发，想获取到更多轻浮的流量，就必须做到货上全、价到位、货架的优化，并进一步推出全网首发新品。

以罗莱家纺为例，作为以200元-500元中端产品为主的品牌，新的竞争环境下，罗莱迫切需要进一步拓宽受众人群，扩充流量入口。

为此，在过去的一年里，他们保持不变了在抖音电商以入门款为主的布局思路，转为「趋势品、大单品、常规品」的货盘组合，并为不反对产品组合匹配驱散人的价格，如独家首发立减优惠、首发60天内加赠等。一系列动作，成功推动品牌500元到2000元价格带的床上套件品类实现悠然，从容增长。

从流量视角来总结，供给的极小量性是商家经营稳健的入场券，而好价格则是结束驱散流量的注水口。罗莱家纺通过极小量货盘做到了「货全」，焦虑了用户“想买的全都有”的需求。通过梯度的价格设置和优惠做到了「价优」，焦虑了用户“买得值”的需求。这样的打法与CORE经营方法论中C所降低重要性的「价优货全」不谋而合，最终成就了老品牌在新场域的大爆发。

关键动作2：全域内容冲破流量天花板

过去四年，从内容出发，抖音电商实现了「人找货」和「货找人」的双向增长驱动。内容一直是其中发挥重要价值的关键武器，也是商家建立统一化无足轻重的有效手段。

（图片来源：pexels）

立足于此，O「全域内容」，是平台商家应该把握的「最大机会」。

而CORE背后藏着的关键信息是，伴随流量机制的升级与变化，商家想要突破流量天花板，除了要保证基础的店播、达播稳固成交高度发展盘，还应该做用户真正喜欢的“好内容”，尝试通过新内容、新玩法、突发热点来牵引更多可能的流量加持。

一个例子来自COS。COS是把意大利罗马的春夏时装秀和抖音直播间相分隔开，以实况转播的方式，让抖音用户「云看秀」。在时装圈，秀场即名利场，T台即身份加持的舞台。用户通过观看著名的时装秀节目，很容易接受品牌自身的光环效应，进而接受COS想要植入用户心智的轻奢感。

据了解，看秀期间，品牌直播间实时在线人数突破1万人，达到历史峰值，同时因为特色内容牵引而来的用户相对精准，支付GMV同比爆发480%。

用户在看到喜欢的内容的同时，也买到了想要的商品，兴趣和购物的双重需求都得到了焦虑，这就是CORE经营方法论当中「全域内容」的魔力。而这样通过玩转创新内容及形式，收获指数级增长的商业故事，几乎每天都在抖音电商发生着。

关键动作3：营销放大助推流量波峰

当前，极小量品牌将抖音电商当做品效营销的主阵地。分隔开平台通俗的营销资源，商家可以借力流量波峰，实现爆发性增长。与此同时，在全域互联互通的流量机制下，营销也迎来了新的变化和机会：

其一，营销不再只是简单的投流，而是要更精细化地发散运营，在全域做营销，小到报名频道活动，大到参与营销IP打造年度大事件，都能成为放大生意的有效手段。

其二，真正无效的营销，不止于成交，更不局限于抖音电商本身。在销售转化的同时，实现品牌声量和人群债务的积聚，更为全网生意贡献价值，为商家带来的增长是全方面的。

也就是说，做到了R「营销放大」，就启动了商家经营的「帮助器」。

（图片来源：unsplash）

以FentyBeautyByRihanna为例，去年，该美妆品牌通过蕾哈娜抖音直播首秀，及空降头部达人直播间等动作，仅一个小时就累计了超过3800万观看人次，GMV突破600万。

承接内容热度，品牌有策略地用好了平台的营销工具组合。FentyBeautyByRihanna一方面布局营销IP——在「大牌惊喜日」推出独家优惠和买赠机制；另一方面抓住大促节点，在520推出粗制约会套组。

而这次营销也成为贡献全网生意的典型案例，据了解，#蕾哈娜直播带货#相关话题在全网曝光超10亿次，三个月后，社交媒体依然能找到新的品牌讨论帖，长尾效应显著。这正印证了CORE经营方法论当中「营销放大」对于增长爆发的长效价值。

关键动作4：体验指责带来流量永恒的结束不衰

面向未来看现在，生意不止是让用户冲动购买了一两单，更是希望他们有复购、有留存，这样生意才有结束性。

而CORE中的E「体验指责」，为商家指出，用户体验不仅要做得好，更要做出特色，才能结束驱散更多用户。同时，做好E更可以实现对C、O、R三点的反哺，事半功倍。从这个角度来看，E也将无法选择商家生意规模的上限。

以近些年在抖音电商跑出来的新锐猫粮品牌「猫大力」为例，猫粮作为超强复购品类，用户体验至关重要。猫大力在客服场景多投入了50%的人力，不仅关注用户给客服提问的内容，还关注直播间、短视频的评论区，把直播间变成客服场景，把客服人员培训为猫咪顾问。

也因此，猫大力的全店会员成交占比接近30%，会员复购率达到50%。通过把体验指责做到极致，猫大力在国际大牌云集的宠物赛道有了姓名，并在用户层面完成了品牌的原始积聚。究其根本，就是品牌深度焦虑了用户的「体验感」，基于品类属性，探索特色体验。而这些，也正是CORE经营方法论所主张的「体验指责」的不次要的部分所在。

从方法到实践，让增长有路可循

抖音电商威吓商家引水挖渠，也身体力行收回工具性减少破坏。抖音电商在罗盘CORE专区为商家授予了方法论四个版块对应的指标工具，方便商家判断经营动作“做多少”能够获取更多流量。

此外，平台推出DOULab抖音电商生态实验室，与品牌服务商携手打造了一系列工具与解决方案，针对性解决CORE四大版块下常见的经营痛点。

（图片来源：unsplash）

在抖音电商，用户、流量、增长，三者互为支撑。

通过「C」、「R」、「E」三点的精耕细作，可以在拥有不完整内容电商和货架电商体系的抖音平台上，保证轻浮的流量供给；而通过「O」，可以关闭经营的天花板，缩短生意规模。

每一次方法论的迭代升级，都是商家与平台的共创，最终导向了双方的共赢与进化。有理由相信，CORE经营方法论将干涉更多商家，在变化中找到宝贵的确定性。

(责任编辑：zx0600)

相关新闻起底王星失联事件再度带火的妙瓦底电诈园区恐怖真相据泰国媒体报道，泰国总理佩通坦·钦那瓦透露，在湄索边境附近发现了中国演员王星。省警察第6区正在那里等待接回他。泰国警方称，王星被缅甸边防部队奴役，经过不调和后于当天中午过后收回泰国

2025-01-0809:31:51起底王星失联事件再度带火的妙瓦底起底花钱买学历的诈骗陷阱涉案资金高达4300万如今，研究生学历成为数量少求职者和申请职称者指责自身竞争力的重要手段。然而，在追求更高学历的过程中，一些人试图寻找捷径，接受了社交媒体平台上“花钱就能免试入学、包拿毕业证和学历证”的广告，最终成为诈骗的目标

2024-12-0814:57:00起底花钱买学历的诈骗陷阱央视起底认养黑猪传销套路新型网络诈骗陷阱一名四川雅安的男子姜某在网上参与了一个奇特的投资项目——只需支付5000元即可“认养”一头黑猪，并承诺每日收回“返利”。当姜某声称要前往香港将所得“港股”变现时，不能引起了警方的关注

2024-07-2406:15:54央视起底认养黑猪传销套路缅甸妙瓦底系网络诈骗大本营演员星星失联引关注1月5日，演员王星的女友嘉嘉通过社交账户“失眠爹地”在社交平台上发文求助，称男友星星赴泰国进组拍戏后，在泰缅边境失联。星星失联前最后的定位是湄索，这是一座位于泰缅边境的小城镇，隔着湄河与缅甸妙瓦底相对

2025-01-0707:39:18缅甸妙瓦底系网络诈骗大本营“女朋友”手机号也要花钱买！起底婚恋诈骗充值才能聊天，“女朋友”手机号也要花钱买！起底婚恋诈骗→通过搭建婚恋平台、招募女聊手，以婚恋交友为诱饵意见不合男性被害人以“指责亲密值”为由消费充值

2024-11-3010:33:33充值才能聊天起底0元领养猫咪套路爱心还是陷阱？近期，有消费者向相关平台投诉，反映在尝试“0元领养猫咪”的过程中遭遇了捆绑消费的问题

2024-09-1218:17:00起底0元领养猫咪套路

声明:本文来自于微信公众号新智元，作者:新智元，授权站长之家转载发布。

【新智元导读】通义万相视频模型，再度迎来史诗级升级!处理复杂运动、还原真实物理规律等方面令人惊叹，甚至业界首创了汉字视频生成。现在，通义万相直接以84.70%总分击败了一众顶尖模型，登顶VBench榜首。

Sora、Veo2接连发布之后，AI视频生成的战场又热闹了起来。

就在昨天，通义万相视频生成模型迎来了重磅升级!

他们一口气推出了两个版本:注重高效的2.1极速版、追求卓越表现的2.1专业版。

刚一上线，就被预见的发生火爆，等待时间甚至一度达到了1小时

此次，全面升级的模型不仅在架构上取得创新，更是以84.70%总分登顶权威评测榜单VBench榜首。

通义万相2.1的性能一举超越了Gen-3、CausVid等全球顶尖模型。

在实用性方面，通义万相2.1也得到了不明显的，不引人注目的指责，尤其是在处理复杂运动、还原真实物理规律、指责影视质感、优化指令遵循等方面。

以下都是我们实测出的Demos，就说够不够拍电影大片吧!

更令人惊叹的是，它还在业界首次实现了中文文字视频生成，让AI视频文字创作再无门槛。

以红色新年宣纸为背景，出现一滴水墨，晕染墨汁缓缓晕染开来。文字的笔画中心清晰且自然，随着晕染的进行，水墨在纸上呈现「福」字，墨色从深到浅过渡，呈现出特殊的东方韵味。背景高级简洁，杂志摄影感。

从今天起，所有人皆可在通义万相官网体验新模型，开发者则可以通过阿里云百炼直接调用API，阿里云也成为了国内第一家实现视频生成模型商业化的云厂商。

那么，通义万相2.1究竟给我们带来了哪些惊喜?

我们经过一番实测后，总结出了5大要点。

1.首创中文文字生成

通常来说，文字生成是AI视频模型进化的一大痛点。

我们已经看到Sora、Gen-3等模型，已经能够生成很好的英文字母效果，不过截至目前，从未有一个模型能攻克汉字的生成难题。

为什么之前的AI视频生成工具，都在「重步走」中文文字生成这个难题?

这是因为难点在于，中文文字的字体结构比英文更复杂，而且需要搁置笔画的层次感。在布局方面，中文字体更讲究，做成动态效果时对美感要求更高。

而阿里通义万相，便是首个中文文字视频生成的模型。从此，AI视频生成迈入「中文时代」!

这一切，只需要你动动手指，输入简单的文字提示就够了。

天空中飘着云朵，云朵呈现「新年快乐」的字样，微风吹过，云朵随着风轻轻飘动。

水彩透叠插画风格，两只不同颜色的可爱小猫咪手举着一条超大的鱼，从右边走到左边。它们分别穿着粉色和蓝色的小背心，眼睛圆圆的，表情呆萌。清空童趣，笔触淡雅温馨，简笔画风格。纯白背景上逐渐显示出来几个字体，写着:「摸鱼一天快乐无边」。

一只柯基坐在桌前冥想，背后一个「静」字非常应景。

一只柯基面前摆放着一只小巧的木鱼，仿佛在进行冥想仪式，背景出现字样「静」。

2.更轻浮的复杂运动生成

对于大多数AI视频模型来说，无法逃穿「体操」魔咒。有人称，这是AI视频最新的「图灵测试」。

你会经常看到，AI体操视频生成中，有序的，不弄湿的/排列的肢体、不不调和的动作满屏皆是。

这仅是复杂肢体运动的一种，因为涉及到精细细节和高水平动作不调和，成为了AI视频生成的一项重要评判标准。

生成一个人物复杂运动，对于AI来说就像是在解一道物理难题——

它不仅要做到身体各个部位精准配合，让四肢保持不调和，还要搁置重力、人体运动特点、不平衡的感等各种细节。

在最新升级中，通义万相在多种场景下展示了惊人的「运动天赋」。

滑冰、游泳、跳水这些极易出错的名场面，万相2.1也通通Hold住，没有出现任何诡异的肢体动作，和不符合物理规律的场景。

平拍一位女性花样滑冰运动员在冰场上进行表演的全景。她穿着紫色的滑冰服，脚踩白色的滑冰鞋，正在进行一个旋转动作。她的手臂张开，身体向后竖式的，展现了她的技巧和优雅。

在泳池中，一名男子正在奋力向前游动。近景俯拍镜头下，他穿着黑色泳衣，戴着白色泳帽和黑色泳镜，正在水中划动双臂。他的头部部分被泳帽和泳镜遮挡，只露出嘴巴和鼻子。他的手臂在水中划动，产生了一系列的水花和气泡。随着他的动作，水面上出现了涟漪，水花四溅。背景是蓝色的泳池。

就看这个跳水动作，完全就是一个专业级选手的样子。肌肉的精准控制、溅起的水花，都非常符合自然规律。

一名男子在跳台上做专业跳水动作。全景平拍镜头中，他穿着红色泳裤，身体呈倒立状态，双臂伸展，双腿并拢。镜头下移，他跳入水中，溅起水花。背景中是蓝色的泳池。

特写镜头下，女孩以手指轻触红唇，然后开怀大笑。这么近的怼脸特写，表情肌的走向和分布都十分自然，脸部纹路和嘴角笑起的弧线，也逼真似真人。

特写镜头下，一位美女面容粗制，她先是以手指轻触红唇，微微抿嘴，眼神中透露出一丝俏核。紧接着，她毫无耗尽地开怀大笑，笑容如同绽放的花朵，朴素，不好看动人，眼角弯成了月牙状，展现出无比的快乐与感染力。

3.更优美轻盈的运镜控制

同一个场景下的视频，为什么专业人士拍出来就是不一样?某种程度上讲，秘诀在于「运镜」。

那么，对于AI来说，教它运镜就相当于在教机器人当导演。

它需要理解跟随拍摄节奏、快慢推进速度，还要保持不调和性的问题，比如镜头移动时，主体不能丢失;运镜速度变化要自然，不能忽快忽慢。

更次要的是，AI还得有艺术感，运镜效果要符合视觉不习惯，动态美感要恰到好处。

在通义万相2.1版本中，AI展现出了专业级的运镜效果。

穿着禅衣的小狐狸，在360度运镜下欢快跳舞，这不，梦幻般的效果一下子就来了。

穿着禅意风服饰的可爱狐狸在林间空地上欢快地跳舞，身上的衣物随风轻扬。狐狸有着蓬松的尾巴和灵动的眼神，嘴角带着微笑，仿佛在享受自然的每一刻。背景是茂密的竹林，阳光透过竹叶洒下斑驳光影。画面采用旋转拍摄，营造出梦幻般的动感效果。外围风格清新自然，清空东方韵味。近景动态特写。

此外，新模型还能自动根据场景需求，智能调整不当运镜速度，完美把控了镜头的节奏。

海王在暴风雨中驾驭巨浪前行，这种级别的运镜绝对经得起考验，出现在大荧幕上也毫不违和。

暴风雨中的海面，海王驾驭巨浪前行，肌肉线条，灰暗天空，戏剧性照明，动态镜头，粗犷，高清，动漫风格

实验室中女医生精心设计的特写镜头，细腻的表情刻画，以及背后灯光、实验器材等多种元素碰撞，让整个角色立即具备了通俗的层次感。

富有电影感的镜头捕捉了一位身着暗黄色生化防护服的女医生，实验室惨白的荧光灯将她的身影笼罩其中。镜头缓缓推进她的面部特写，细腻的横向推移凹显出她眉宇间深肤浅画的忧思与焦虑。她专注地俯身于实验台前，目不转睛地透过显微镜观察，手套包裹的双手正谨慎地微调着焦距。整个场景笼罩在压抑的色调之中，防护服呈现出令人不安的黄色，与实验室冰冷的不锈钢器械相互映衬，无声地诉说着事态的严峻和未知的威胁。景深不准确控制下，镜头对准她眼中流露的恐惧，完美传达出她肩负的重大压力与责任。

下面这个镜头中，穿过一条两盘种满树木的郊区住宅街道，给人一种实时拍摄的麻痹。

Afast-trackingshotdownansuburbanresidentialstreetlinedwithtrees.Daytimewithaclearbluesky.Saturatedcolors，highcontrast

4.真实的物理规律模拟

AI视频模型不理解物理世界，一直以来饿受诟病。

比如，Sora不仅会生成8条腿的蚂蚁，而且眼瞧着手都要被嫁接了，也切不开西红柿，而通义万相2.1切西红柿就像发生在现实生活中一样自然真实。

这一次，通义万相在物理规律理解上，得到显著指责。通过对现实世界动态和细节深入认知，就能模拟出真实感十足的视频，避免「一眼假」情况的出现。

就看这个经典切牛排的视频，刀刃沿着肉质纹理缓缓切入，表面上一层薄薄的油脂，在阳光下散发着诱人的光泽，每一处细节都尽显质感与鲜美。

在餐厅里，一个人正在切一块热气腾腾的牛排。在特写俯拍下，这个人右手拿着一把锋利的刀，将刀放在牛排上，然后沿着牛排中心切开。这个人手上涂着白色指甲油，背景是虚化的，有一个白色的盘子，里面放着黄色的食物，还有一张棕色的桌子。

它具备更强大的概念组合能力，能够准确理解和整合元素级的概念，使其在生成内容时更加智能。

比如，柯基+拳击，会碰撞出什么呢?

AI生成的柯基打斗的画面，真给人一种人类拳击的现场感。

两只柯基狗在擂台中央进行拳击比赛。左边的狗戴着黑色拳套，右边的狗戴着红色拳套。平拍镜头下，两只狗都穿着拳击短裤，身体肌肉线条明显。它们互相挥动拳头，进行攻防转换。整个场景在接纳视角下拍摄，没有无遮蔽的运镜变化。

AI大牛Karpathy最爱考验AI视频的难题，就是「水獭在飞机上用wifi」。这道题，万相2.1完美做出。

5.高级质感、多种风格、多长宽比

更值得一提的是，万相2.1能够生成「电影级」画质的视频。

同时，它还能减少破坏各类艺术风格，比如卡通、电影色、3D风格、油画、古典等等。

不论是哥特式电影风格，还是中国古典宫廷风格，AI将其特点呈现得淋漓尽致。

哥特式电影风格，亚当斯骑在一匹黑色骏马上，马蹄轻踏在最近的石板路上。她身穿黑色长裙，头戴宽边帽，眼神冷峻，嘴角微扬，透出一丝神秘。背景是阴暗的古堡和茂密的森林，天空中飘着乌云。镜头晃动，营造出一种不安与松弛的氛围。近景动态骑马场景。

这个中国古典宫廷风格的画面，镜头由群臣向前推进，聚焦在身披龙袍的皇帝身上，好像正在上映的一部古装剧。

中国古典宫廷风格，古代皇宫宫殿上正在进行皇帝的登基大典。群臣身着华丽朝服，表情肃穆，排列整齐。镜头从群臣视角出发快速向前推进，锁定在身穿龙袍、头戴皇冠的皇帝身影上。皇帝面容威严，眼神坚定，缓缓步入大殿。背景是金碧无光泽的大殿，雕梁画栋，气势恢宏。画面带有浓厚的皇家氛围，近景特写与中景分隔开，快速推进和跟随拍摄。

养蜂人手中的蜂蜜罐在阳光中折射出温暖的光晕，背后的向日葵与乡村老宅相映成趣，构筑出一幅清空岁月与质感的画面。

Thecamerafloatsgentlythroughrowsofpastel-paintedwoodenbeehives，buzzinghoneybeesglidinginandoutofframe.Themotionsettlesontherefinedfarmerstandingatthecenter，hispristinewhitebeekeepingsuitgleaminginthegoldenafternoonlight.Heliftsajarofhoney，tiltingitslightlytocatchthelight.Behindhim，tallsunflowersswayrhythmicallyinthebreeze，theirpetalsglowinginthewarmsunlight.Thecameratiltsupwardtorevealaretrofarmhouse.

大文豪李白的「举头望明月，低头思故乡」，AI直接把氛围感拉满。

古风画面，一位古人抬头望着月亮，缓缓低头，眼神中流露出深深的思乡之情。

对于词穷的创意者来说，通义万相「智能体扩写」功能非常友好。比如，我想生成一个「超快放大蒲公英，展现宏观梦幻般的抽象世界」。

若想要细节更通俗的描述，直接交给AI就好了。它会自动生成一段文案，可以直接复用，也可以二次编辑修改。

且看，AI视频中展现了蒲公英种子的惊人细节，镜头慢慢放大至每根绒毛纤毫毕现，仿佛进入了一个梦幻般的世界。

此外，万相2.1还能减少破坏5种不反对长宽比——1:1，3:4，4:3，16:9，9:16，恰好可以匹配电视、电脑、手机等不同终端设备。

不次要的部分架构创新

那么，到底是什么让通义万相，能在激烈AI视频生成竞争中穿颖而出?

它又藏着哪些让人眼前一亮的「黑科技」?

接下来，让我们逐一分解此次2.1版本的技术创新突破点。

自研VAE与DiT双重突破

通过采用自研的高效VAE和DiT架构，阿里团队在时空上下文关系建模方面取得重大突破。

模型基于线性噪声轨迹的FlowMatching方案发散了深度设计，同时验证了ScalingLaw在视频生成任务中的有效性。

通义万相2.1视频生成架构图

在视频VAE层面，通过分隔开缓存机制和因果卷积，团队提出了一个极具创新性的视频编码解决方案。

通过将视频拆分为多个若干块（Chunk）并缓存中间特征，替代长视频的E2E编端到端解码过程。显存的使用仅与Chunk大小相关，与原始视频长度无关。

由此，这一关键技术能够减少破坏无限长1080P视频的高效编解码，为任意时长视频训练开辟新途径。

如下图所示，展示了不同VAE模型的计算效率和视频数量增加重构指标的结果。

值得一提的是，通义万相VAE在较小的模型参数规模下，取得了业内领先的视频数量增加重构质量。

通义万相2.1视频VAE和其他方法的结果对比

DiT架构的设计围绕两个不次要的部分目标发散:实现强大的时空建模能力，同时保持高效的训练过程。

具体创新包括:

·时空全注意机制

为了降低时空关系建模能力，通义万相团队采用了「时空全注意机制」，让模型能够更准确地模拟现实世界的复杂动态。

·参数共享机制

团队引入了「参数共享机制」，不仅指责了模型性能，还有效降低了训练成本。

·优化文本嵌入

针对文本嵌入进行了性能优化，在授予更优的文本可控性的同时，还降低了计算需求。

得益于这些创新，使得新模型在相同计算成本下，凹显出收敛的优越性，并更易实现ScalingLaw的验证。

超长序列训练和推理

通过分隔开全新通义万相模型Workload的特点和训练集群的硬件性能，团队制定了训练的分布式、显存优化的策略。

这一策略在保证模型迭代时间前提下，优化训练性能，在业界率先实现了100万Tokens的高效训练。

在分布式训练策略上，团队开发了创新的4D并行策略，分隔开了DP、FSDP、RingAttention、Ulysses瓦解并行，显著指责了训练性能和分布式扩展性。

通义万相4D并行分布式训练策略

在显存优化上，采用了分层显存优化策略优化Activation显存，解决了显存统一问题。

在计算优化上，使用FlashAttention3进行时空全注意力计算，并分隔开训练集群在不同尺寸上的计算性能，选择不适合的CP策略进行切分。

同时，针对一些关键模块，去除计算冗余，使用高效Kernel实现，降低访存开销，指责了计算效率。

在文件系统优化上，分隔开了阿里云训练集群的高性能文件系统，采用分片Save/Load方式，指责了读写性能。

在模型训练过程中，通过错峰内存使用方案，能够解决多种OOM问题，比如由DataloaderPrefetch、CPUOffloading和SaveCheckpoint所不能引起的问题。

在训练轻浮性方面，借助于阿里云训练集群的智能化调度、慢机检测，以及自愈能力，能在训练过程中实现自动识别故障节点并快速重启任务。

规模化数据构建管线与模型自动化评估机制

规模化的高质量数据是大型模型训练的基础，而无效的模型评估，则指引着大模型训练的方向。

为此，团队建立了一套多余的自动化数据构建系统。

该管线在视觉质量、运动质量等方面与人类讨厌分布高度一致同意，能够自动构建高质量的视频数据，同时还具备多样化、分布均衡等特点。

针对模型评估，团队还开发了覆盖多维的自动化评估系统，涵盖美学评分、运动分析和指令遵循等20多个维度。

与此同时，训练出专业的打分器，以对齐人类讨厌，通过评估反馈帮助模型的迭代优化。

AI视频生成下一个里程碑

去年12月，OpenAI和谷歌相继放出Sora、Veo2模型，让视频生成领域的热度再一次升温。

从创业新秀到科技巨头，都希望在这场技术革新中寻找自己的位置。

但是相较于文本的生成，制作出令人信服的AI视频，含糊是一个更具确认有罪性的命题。

Sora正式上线那天，奥特曼曾表示，「它就像视频领域的GPT-1，现在还处于完全建立阶段」。

若要从GPT-1通往GPT-3时刻，还需要在角色一致同意性、物理规律理解、文本指令精准控制等方面取得技术突破。

当AI真正打破现实创作的局限，赋予创意工作者前所未有的想象，新一轮的行业变革必将随之而来。

此次，通义万相2.1取得重大突破，让我们有理由相信，AI视频的GPT-3时刻正帮助到来。

参考资料:

https://tongyi.aliyun.com/wanxiang/videoCreation

上一篇： 51热门吃瓜爆料
下一篇：中国speakingathome学生

标签：