您的当前位置: 首页 > 我吃西红柿新书 > 正文

我吃西红柿新书

我吃西红柿新书 时间:2025年05月01日

十几年来,李愷不仅给亲戚朋友、邻居提供健康知识(把资料复印、分发),自己也身体力行编辑整理养生知识。十年前,他前列腺略有增生。看到了北京解放军总医院赵林教授讲座中提到“鸡蛋炒西红柿可以治疗前列腺增生,鸡蛋过油后盛出来,把西红柿炒成稀烂状,然后一起吃。”

找来lululemon的高管后,迪卡侬的售价越来越贵,一件短袖T恤直接翻倍卖39.9元、一个背包涨了40元、一双登山鞋贵了100元……有网友感慨:“迪卡侬涨价幅度是真猛,同款复购都买不起了。”事实上,不光迪卡侬,就整个户外赛道而言,涨价是一个大趋势。

“不是lululemon买不起,而是迪卡侬更有性价比。”曾经,迪卡侬靠平价收获了一批拥趸,但最近它却因忠诚打工人冲上了热搜。

事情的起因是,人们发现迪卡侬售价越来越贵。尤其是那些忠实粉丝们,把之前的订单截图和现在的价格一对比,立即坐不住了,一件短袖T恤直接翻倍卖39.9元、一个背包涨了40元、一双登山鞋贵了100元……

「市界」走访中发现,迪卡侬门店里象征着低价的蓝色商品消失了,只留了些许尾货区域。这意味着迪卡侬已经悄悄保持不变自身的经营策略,不再像以往那样追求薄利多销去驱散消费者了。

这与迪卡侬的业绩增长乏力不无关系。2023年迪卡侬营收为156亿欧元(约1200亿元),同比仅增长1.15%;净利润为9.31亿欧元,同比微增0.9%。在赚钱能力上,它比耐克和阿迪达斯低了一个台阶,净利润率只有个位数。为了谋变,迪卡侬找来了lululemon的高管。

再也不是“直男天堂”了

今年1月,lululemon前中国区品牌负责人张晓岩被曝跳槽到迪卡侬任中国区CMO(首席营销官)。听到这一消息后,不少人的第一反应就是迪卡侬不会要涨价了吧。

这种担忧不无道理。张晓岩来迪卡侬之前,有过两份赚有钱人钱的工作经历,一份是2013~2021年任职于lululemon,直至升为中国区品牌经理,离职后,又在朴素运动时尚品牌博格纳干了几年。这说明她在富人营销方面已经积聚了充分的经验。

尤其是在lululemon的8年时间里,张晓岩让中国数量少女性心甘情愿为价格不菲的瑜珈服掏腰包,并带领该品牌在中国打下大片江山。

lululemon以“瑜伽界爱玛仕”著称,用创始人的说法,其目标用户是“每年挣10万美元,拥有独立公寓的单身职业女性”。2016年lululemon在上海开出第一家门店,2023年达到127家,比加拿大本土的门店数量还多。2023年,光是lululemon中国区就卖了9.64亿美元,营收占比达到10%。凭借千元瑜伽裤,公司市值去年12月触及了624亿美元的最高峰,一度超过阿迪达斯,成为市值仅次于耐克的全球第二大运动品牌。

而张晓岩空降后,对迪卡侬产品线的影响也很快产生,迪卡侬悠然,从容上架的一款新品女装鱼骨修身夹克,因款型神似lululemon而受到关注和抢购。只不过,单价399元的价格,与69.9元的经典抓绒外套相比,生生翻了近6倍,让粉丝在惊讶之余,突然有点不认识迪卡侬了,这还是“直男天堂”吗?

虽然迪卡侬没公开表述过涨价事宜,但最近在社交媒体上吐槽迪卡侬涨价的声音不绝于耳。

据网友总结,迪卡侬基础款T恤从最早的19.9元涨到24.9元后,又涨到39.9元;背包从49.9元涨到89.9元;运动鞋垫从49.9元涨到59.9元;被各大博主带火的网红裙裤从79.9元涨到129.9元……有网友感慨:“迪卡侬涨价幅度是真猛,同款复购都买不起了。”

来自数见消费的数据显示,2022年至2024年,迪卡侬商品销售均价从128.81元上涨到196.32元,上涨幅度达到52%。

一位宝妈对「市界」庆祝,几年前给孩子买的防晒衣79元,后面涨到99元、129元,前几天再去看已经149元了,价不配质,无法选择从此弃坑迪卡侬。抱有这种想法的不止她一人。在一则声讨迪卡侬涨价的帖子下面,有人写道“质量越来越堪忧,给对象买了两件无袖背心,对象说洗了两次就不变了。”

针对涨价疑问,迪卡侬客服只笼统地回复称:“活动时间不同,价格不同。”

不过,「市界」在走访中发现,单品涨价只是一方面,在店内陈设中,高客单价商品的占比正在变高。

在迪卡侬北京西红门荟聚商场店,顾客一进门,就被映入眼帘的春季出游海报所驱散。一路往里走,徒步登山、户外骑行、露营、越野、轮滑、游泳等各大运动分区一一呈现在眼前。一款男士防水防风冲锋衣售价699元,一双抓地登山鞋售价599元,一辆竞速公路自行车更是卖到24999元。

而一些较为平价的基础款服饰,则被放在了店内后排次展示区的位置,尾货区也只有少得快乐洋洋的几款。

对于迪卡侬内部来说,这种转变其实不算突然。据中国纺织网报道,2021年,迪卡侬中国首次引进CMO职位,并开出月薪8万到10万元的价码,岗位要求之一就是“重新定义品牌定位”。

高薪请来张晓岩两个月后,2024年3月,迪卡侬宣布启动“北极星”战略。公司高管称,此前,80个品牌过于意见不合,产品之间也存在极小量重复。今后,迪卡侬将不同品牌的产品归为户外运动、水上运动、健身运动等九大运动品类,并单独设立四大专业品牌,分别是公路自行车、跑步、攀岩、狩猎。

为此,迪卡侬全球1700多家商店将在未来几个月内进行翻新,包括门店标识、店内布置等。

伴随着新战略的发布,迪卡侬的logo也在3月换新了,大有一副要改头换面的架势。

平价策略赚的是辛苦钱

或许一些人还不知道,以低价闻名的迪卡侬诞生于奢侈品大牌云集的法国。相比LV、爱马仕、香奈儿所瞄准的富豪圈生意,创始人赋予迪卡侬的市场定位为:在同一个商场内,为所有的运动者授予物美价廉的运动产品。

2003年,迪卡侬来到中国,在上海开出第一家标准概念店。彼时,国内运动市场高手云集,李宁营收破10亿元大关,耐克以50万元/年的赞助费签下刘翔,安踏正筹备赞助CBA,势头正猛。

纷繁的品牌种类中,迪卡侬的横空出世,还是给了中国消费者耳目一新的麻痹。

走进迪卡侬门店,顾客就像来到了一个巨型运动超市,里面盛放着80+种与运动不无关系的35000+种产品,从运动鞋到服装,再到器械器材,应有尽有。据悉,迪卡侬在中国卖出的第一件产品竟然是一副马鞍,这足以隐藏迪卡侬在小众运动方面强大的覆盖力。

在购物体验上,迪卡侬店均4000平方米的门店面积,足够供一家老小尽情徜徉,不懂的地方还可以询问工作人员获得专业的指导。“我曾亲眼见过,迪卡侬的乒乓球区在排队试玩,篮球区的男孩子们投篮投得砰砰响,试骑自行车的人也在到处穿梭。”一位迪卡侬用户称,“即使不购物,光玩也够玩一下午的。”

▲(市民在迪卡侬里边逛边选购)

当然,迪卡侬最驱散人的特色还是便宜,50元以下的东西一抓一大把,在高档运动品牌门店买一件T恤的钱,在迪卡侬甚至可以拿下全套。

为了降低成本,迪卡侬“无所不用其极”。公司不请大牌流量明星,不买赛事广告位,严格控制宣传费用,占营业额1%左右。且所有产品包装简陋,鞋子清一色没有鞋盒。国泰君安曾对迪卡侬的价格作出分析,结果显示,迪卡侬产品价格低于同市场同类产品约20%。

据迪卡侬2023年12月的数据显示,其75%的营业额是由长期消费的会员所带来,其中老客复购占到60%以上。迪卡侬寄希望于老顾客能在其周边形成带动效应。不负迪卡侬的期望,50%以上的新顾客都是通过口口相传而来。

好口碑推动迪卡侬在中国的发展势如破竹,2012年,受市场进步和电商冲击等影响,耐克、阿迪达斯业绩缩水,李宁、安踏等国内品牌接连关店,迪卡侬却逆势开了16家店,这一数字超过了其在中国前5年的总数。

2014年,迪卡侬中国门店破百家;2017年,中国市场营收破百亿,成为迪卡侬在全球发展最快的国家。

在此过程中,迪卡侬不但继续为直男授予性价比服务,也不断拓展女性圈层。有一阵子,国内女装越做越小,流行BM风,小红书上就有人呼吁,有尺码焦虑的人去迪卡侬,这为迪卡侬意外博得了女性用户的好评。包括运动裙裤在内,速干浴巾、防晒手套、运动内衣都曾占据迪卡侬女士产品销售榜。

▲(小红书截图)

如果不是中国电商的崛起和来自同行的竞争加剧,迪卡侬或许可以一直高枕无忧下去。2022年,迪卡侬的销售额仍维持在154亿欧元高位,仅次于耐克和阿迪达斯,但营收增速从上一年的21.3%下滑至12%。同期利润率低于行业平均水平,仅为5.9%,相比之下,耐克、阿迪达斯、李宁、安踏分别为11.6%、10%,15.7%和15.37%。

“迪卡侬的平价无足轻重被国内线上电商的快速迭代、快速反应,以及本土品牌卷掉了。”时尚产业独立分析师、上海良栖品牌无约束的自由有限公司创始人程伟雄称,“线下开实体店需要一整套人马,小规模的线上开店可能最开始一个采购加几个运营就搞定了,而且卖得比迪卡侬还便宜。”

他表示,消费者在选择面上变广了,不一定要去迪卡侬,这退回后者在战略上做调整不当。

九德定位咨询公司创始人徐雄俊也表示,再继续主打平价、低价战略,迪卡侬的利润空间或将进一步被数量增加,甚至走入恶性循环。

要补专业深度的课

仔细梳理不难看出,迪卡侬从未间断对中国运动市场的开发和挖掘,且从未错过任何一个运动热点。

2020年,居家健身火了,农历春节期间,迪卡侬健身握力圈产品销售增长1200%;2021年,全民掀起露营潮,迪卡侬研发部特意针对中国年轻人的痛点,推出易安装、能适配各种车型的车顶帐篷,当年,露营产品同比增长突破100%。

2023年初,迪卡侬中国副总裁黄敏在一次演讲中透露,“我们希望能够尽快将小众运动带到中国大众身边,包括潜水、露营、攀岩等。”就连北京亮马河可以划桨板这一巨大的变化,也被迪卡侬视为是开发水上运动的好机会。

黄敏还提到,过去几年飞盘、陆冲、骑行等项目在年轻人之间开始流行,迪卡侬自行车销售获得两位数增长。钓鱼不再是中年男人的专利,而是成为了95后排名第一且愿意尝试的运动。

“当下,中国城市人均体育用品消费金额约为400元人民币/年,跟韩国人、法国人存在四倍的差距,跟美国人的4400元人民币/年差距超过10倍。”黄敏有理由认为,中国体育市场的增长潜力巨大。

但面向未来,迪卡侬想要继续赚运动的钱则需要往专业上深挖,补专业深度的课。

作为一名迪卡侬会员,程伟雄表示,迪卡侬的产品比较适合入门专家,真正的进阶用户往往会选择专业品牌。换句话说,迪卡侬产品的专业深度不够。

有运动博主在评价迪卡侬明星产品mh150冲锋衣时称,它以15000mm的防水著称,但透气指数差,只有7510g/m2/24h,没有腋下透气拉链。疯狂内卷的国产品牌在同样300多元价位,可以做到同样等级的防水,外加10000+的透气。“mh150可以说完全被吹爆了。”

篮球产品亦是如此,一位男生对「市界」表示,迪卡侬的篮球鞋中底做得并不用心,鞋楦也不是很好,中底缓震不够出色,“个人觉得不如选择一些主流的运动品牌,现在在二级市场购买价格也不贵。”

马拉松厌恶者家骉允许承认,在运动领域,迪卡侬绝对是??全的品牌。但他话锋一转:“一旦你和?端品牌对?,那迪卡侬可能在部分产品上就表现一般。”他拿耐克的跑步背?Dri-FITADV,与迪卡侬较为高端的KIPRUN男?轻盈跑步背?举例,两者售价分别为499元和129.9元,但很多跑友哪怕贵也要买耐克,主要就是为了性能买单。

“迪卡侬没有拔尖的东西。”程伟雄称,户外运动是个泛概念,迪卡侬要想往高端专业上走,要先找准几个细分赛道去冲。比如学习lululemon,从耐克、阿迪达斯不够重视的女性瑜伽领域寻找突破,或是学习特步,通过近几年专攻马拉松也干出了100多亿营收。

当下,摆在迪卡侬面前最首要的麻烦,是如何在悄悄涨价、冲击高端的同时,稳住原有粉丝的心。对此,迪卡侬全球首席产品品牌官FabienBrosse最近在接受界面新闻采访时表示,“做高端品牌不是一件容易的事情,低门槛的体育仍然是迪卡侬不次要的部分的商业理念,但两者是可以并行的。”

事实上,不光迪卡侬,就整个户外赛道而言,涨价是一个大趋势。据魔镜数据显示,过去一年,天猫平台上运动Polo衫、运动裤、核肤衣、跑步服等4类运动服饰的价格均出现了不同程度上涨。其中,靠性价比在户外圈走红的KAILAS,如今价格已经逼近北面,一件冲锋衣要上千元。

就连优衣库都被质疑在悄悄涨价,被网友吐槽称,“之前49.9元的款式,现在高度发展都得79.9元或者99.9元才能买到了。”

唯一正面官宣涨价的是始祖鸟,今年2月上调了全线产品的零售价,涨幅在20%到30%左右,对此相关负责人称,涨价是因为成本上涨所致。

(责任编辑:zx0600)

小扇贝的营养价值

小扇贝的营养价值非常高。据《中国海洋与渔业》杂志报道,每100克小扇贝含有蛋白质12克,脂肪1.4克,碳水化合物2.4克,钙104毫克,磷415毫克,铁15.2毫克等营养成分。这些营养成分对于增强免疫力、促进生长发育、维持身体健康都有着重要的作用。

小扇贝的食用方法

那么,如何才能品尝到最美味的小扇贝呢?以下是一些小技巧:

1. 选择新鲜的小扇贝。新鲜的小扇贝壳是紧闭的,用手轻轻敲击,会有清脆的声音。

2. 清洗小扇贝。将小扇贝放入淡盐水中浸泡,让它们吐出泥沙。

3. 烹饪小扇贝。根据个人口味选择烹饪方法,如清蒸、烧烤等。

4. 享用小扇贝。搭配一些蘸料,如蒜蓉、酱油等,更能提升口感。

小扇贝的美食分享

回到那个“宝让我吃你的小扇贝”的美食分享,原来是一位美食博主在直播中展示了自己制作的小扇贝美食。她先将小扇贝清洗干净,然后用蒜蓉、辣椒等调料腌制,最后放入烤箱烤制。烤好的小扇贝色泽金黄,香气扑鼻,让人垂涎欲滴。

这位美食博主还分享了一些烹饪小扇贝的小技巧,比如如何去除小扇贝的腥味,如何让小扇贝更加鲜嫩等。她的分享让很多网友都跃跃欲试,纷纷在评论区留言表示要尝试一下。

小扇贝的美食之旅

声明:本文来自于微信公众号新智元,作者:新智元,授权站长之家转载发布。

【新智元导读】今天,「天工大模型4.0」o1版/4o版在网页端和APP端正式上线了,人人可玩的那种。

最近,2024中国互联网价值榜发布。

2024年AIGC应用用户规模TOP榜中,昆仑万维旗下天工AI强势入围!

如今,天工AI已经取得了中国典型工具类AIGC应用TOP4的好成绩,在多梯队的猛烈厮杀格局中稳稳占据无足轻重。

同时,还不断有好消息传来。

就在今天,天工大模型4.0o1版/4o版正式上线天工网页端和APP。底座大模型,正式进化到「天工4.0」。

「天工大模型4.0」o1版(Skyworko1)的上线,意味着国内首款中文逻辑推理能力的o1模型来了!

数学高考题、考研题、奥数题,Skyworko1都能靠自己的逐步思考破解。

注意!Skyworko1并不是简单地复现OpenAIo1模型的工作。它不仅在模型输出上内生了思考、计划、反思等能力,还在模型真正拥有了思考和反思之后,带来了推理能力的指责。

在最近热转的复旦等机构解密OpenAIo1路线图这一研究中,skywork-o1就被列为国内o1级模型的代表之一

并且,昆仑万维天工大模型4.0上线后,应用端不仅在逻辑推理和代码功能上有了几大指责,语音交互上的表现也着实令人惊叹。

一个月正式发布的新产品「实时语音对话助手Skyo」,如今有了史诗级指责。

众网友实测后纷纷表示,原来国内版的「Her」,已经进化到了不输OpenAI版本的地步!

具备多语言对话能力的Skyo,不仅能快速响应、主动发起对话、实时打断,给出的回应还十分情感化,已经具备了类人特征。

还等什么,实测马上呈上。

超强推理+自我反思,免费体验

现在,分别关闭天工APP或网页端,任何人皆可免费享用最新天工4.04o版或o1版模型加持的AI了。

既然主打的是推理,那么我们就先来看看Skyworko1在数学题上的表现如何。

体验地址:https://www.tiangong.cn/o1Chat/055

先来个硬核的,AIME数学竞赛题。

题目是这样的——

Jen通过从S={1,2,3,...,9,10}中挑选4个不反对数字来参加抽奖。从S中随机选择4个号码。如果她的至少两个号码是随机选择的号码中的2个,她就能赢得奖金;如果她的四个号码都是随机选择的号码,她就能赢得大奖。假设她赢得了奖品,她赢得大奖的概率是m/n,其中m和n是相对质的正整数。求m+n。

Skyworko1用时1分55秒,经过一番思考后,最终给出了正确答案——116。

对于下面这道同样有些难度的数学题,模型在经过一番思考之后,很快就想到了用图论中的「图兰定理」去解。

值得一提的是,在思考过程中它对答案不确定时,甚至会反思自己的回答,直至最终确定25是正确答案。

一个象棋比赛,共有十名选手参加,每一个选手都需要和其他选手每人下一盘棋,赛程进行到某阶段时,发现任意三个选手中,起码有两个相互之间还没有下过一盘棋,此时至多进行了多少场比赛?

2024年高考新课标一卷的数学真题,Skyworko1也能做出正确答案,就是方法稍微「笨」了点。

复杂一些的逻辑推理题,Skyworko1也能做对。

这道从池塘中取水的推理题,它通过一步步的思考过程,推理出了正确答案。

还有这道「一个人花8块钱买了一只鸡,9块钱卖掉了,然后他觉得不划算,花10块钱又买回来了,11块卖给另外一个人。问他赚了多少」,Skyworko1反复斟酌之后给出了正确的答案。

为什么刚出生的小孩只有一只左眼?这个脑筋急转弯,没能瞒过Skyworko1的眼睛。

弱智吧难题,不在话下。

比如父母以后的钱都是留给我的,可不可以认为父母现在正在花我的钱?Skyworko1从财产所有权、继承权、遗嘱和继承法、道德和家庭关系方面给出了全面的回答。

吕布马上无敌,典韦步战无敌,吕布骑着典韦会不会天下无敌?Skyworko1表示,有趣的脑洞只是一个戏谑的表达,而非爱开严肃的话的历史或军事讨论。

最后,上一道LeetCode贪心算法的分发饼干代码难题。题目如下——

假设你是一位很棒的家长,想要给你的孩子们一些小饼干。但是,每个孩子最多只能给一块饼干。

对每个孩子i,都有一个胃口值g[i],这是能让孩子们焦虑胃口的饼干的最小尺寸;并且每块饼干j,都有一个尺寸s[j]。如果s[j]=g[i],我们可以将这个饼干j分配给孩子i,这个孩子会得到焦虑。你的目标是尽可能焦虑越多数量的孩子,并输出这个最大数值。

Skyworko1也顺利给出了答案。

自研技术方案,结束创新迭代

那么,Skyworko1为何能在逻辑推理任务上,有如此大幅的指责?

这就要得益于天工三阶段自研的训练方案。

推理反思能力训练

首先,在推理训练方面,团队通过自主研发的多智能体体系,构建出了高质量的分步推理、反思与验证数据。

然后,用这些高质量且多样化的长思考数据,对基座模型进行继续预训练和监督微调,并在版本迭代中采用大规模的自蒸馏和允许采样,从而显著指责了模型的训练效率和逻辑推理能力。

推理能力强化学习

其次,在强化学习阶段,团队创新性地提出了一种适配分步推理强化的奖励模型——Skyworko1ProcessRewardModel(PRM)。

在最新的版本中,团队将Skywork-PRM的应用范围,从原本侧重的数学和代码领域,拓展到了常识推理、逻辑推演和伦理决策等更广泛的场景中。同时,还针对写作、闲聊等通用领域以及多轮对话构建了专门的训练数据,实现了全场景覆盖。

此外,团队重点指责了Skywork-PRM的模块化评估能力,特别是在处理o1风格思维链方面,优化了试错和反思验证机制。通过更细致的评估体系,为强化学习和搜索过程授予了更精准的奖励信号指导。

推理planning

最后,在推理的规划方面,团队通过自研的Q*线上推理算法,以及模型的在线思考能力,实现了最优推理路径的寻找。

概括来说,Q*算法通过借鉴人类大脑中「System2」的思考方式,将LLM的多步推理过程抽象为一个启发式搜索问题。

然后,再通过Q*线上推理框架与模型在线思考的分隔开,实现了推理过程中的精细规划,进而指导LLM的解码过程。

Q*算法的成功落地,不仅显著指责了模型的线上推理能力,同时也标志着Q*算法的全球首次实现和公开。

论文地址:https://arxiv.org/abs/2406.14283

更进一步的,团队基于Q*算法对推理系统进行了全面优化。

第一点是模块化的树形结构推理:

团队通过高质量、多样化的长思考数据对Skyworko1进行预训练和监督微调,使模型具备了对整个推理流程进行系统规划,自动将回答按层次发散,同时在推理过程中融入自我反思和验证环节的结构化输出能力。

此外,还创新性地利用失败以「模块」为单位的规划方式,取代了传统的以「句子」为单位的方法。既指责了规划效率,也使PRM能够基于更多余的模块化回答进行准确判断和推理指导。

第二点是自适应的搜索资源分配:

针对现有o1风格模型存在的缺乏思考问题,团队开发出了一种全新的自适应搜索资源分配机制。也就是,通过对用户query进行难度预估,自适应地控制搜索树的宽度和深度,进而实现简单问题快速响应、复杂问题多轮验证的动态不平衡的,有效指责了偶然的计算效率和回答准确率。

最终,Skyworko1在GSM8k,MATH,OlympiadBench,AIME-24和AMC-23标准数学基准测试,以及HumanEval、MBPP、LiveCodeBench和BigCodeBench代码基准测试中,性能显著优于常规通用大模型,表现仅次于o1-mini。

实时语音助手,开启AI交互新纪元

在APP端,「天工大模型4.0」4o版加持的实时语音对话助手Skyo,同样带来了前所未有的自然交互体验。

它不仅能在1秒内快速响应,还具备了多语言对话、主动发起对话、实时被打断的能力。

与此同时,4o未来版本可以减少破坏个性化声音定制功能,能够以任何人希望的风格畅聊。

这是这种个性化的体验,让4o不再是冰冷的AI,而是一个更智能的AI伙伴。

当你唤醒Skyo后,他会主动无感情打招呼,并尝试开启一个新的话题。当你生活中遇到难题时,可以向它寻求建议和干涉。

比如,家里2岁的宝宝总是说不要不要,我该怎么办?

冰箱里有鸡蛋、生菜、西红柿、鸡腿、香菇,根据这些原材料,能帮我推荐一份食谱吗?

当你想要策划一场旅行,它还会贴心地为你做好攻略——我计划去北京度假3天,你能帮我做一份攻略吗?

甚至,当你无聊时,可以让Skyo玩脑筋急转弯、猜字容易理解,或者一起聊天......

比如,我们一起玩脑筋急转弯吧,我问你答。什么瓜不能吃?麒麟到了北极会变成什么?

我们还对Skyo进行了压力测试,看看在不断被打断的情况下,它能否依旧表现亮眼?

「帮我朗读一首李白的静夜思;李白的写作风格是怎样的?和李白同时期的著名诗人有哪些?帮我再朗读一首杜甫的诗」。

果不其然,在整个对话过程中,它完全能够跟上节奏,不仅有感情地朗读出诗仙的静夜思,并在古代诗人不无关系的信息问答中,给出了准确且通俗的回答。

接下来,我们一口气连问四个问题,Skyo即便被频频打断,也没有「崩溃」。

「对于一个单身男青年,可以推荐他晚上看什么电影?什么情况下,说谎是个正确的选择?怎么样区分真诚的道歉和真诚的道歉?如果动物会说话,它们会说些什么」?

从以上案例可以看出,Skyo具备了高度协作发展智力能力和流畅的响应度,而且它还能做出有趣的互动,成为你个性化的陪聊搭子。

多模态LLM端到端建模

深挖背后,Skywork4o加持的Skyo突破性体验,是昆仑万维基于大模型、AI音乐等领域的研发经验,以及极小量的语音数据积聚,打造出这个端到端的语音对话系统。

传统的语音助手采用了ASR(语音识别)+NLU(自然语言理解)+TTS(语音分解)级联方案去实现。

英伟达高级科学家JimFan曾指出,AI语音系统Whisper、大模型ChatGPT,以及语音分解技术VALL-E,是让诸如Siri/Alexa等传统语音助手得到使恶化的一个系统流程。

不过,在此期间,三个独立的模型在串联过程中,会带来响应延迟,甚至是信息损失、优化困难等问题。

对此,昆仑万维选择了一条艰难的创新之路,采用多模态LLM端到端建模。

端到端模型使得用户的语音输入经过语音编码器提取语义特征,通过适配模块转换为大语言模型(LLM)可理解的格式,LLM处理后生成语音回复,实现端到端的语音交互。从根本上解决了这些难题。

团队还采用了低比特率单码本语音Tokenizer,在显著降低延迟的同时还保持了音质。为了扩展语音建模能力,Skywork4o在超百万小时多语言语音数据上完成了训练。skyo减少破坏全双工流式输出,确保了实时交互的体验。

最关键的是,它不仅能准确识别语音内容,还能捕捉语速、语调、情感等细微的特征,从而做出情感化的回应。

比如我们问道,「我今天在路上偶遇到了一只流浪猫,看着它怪快乐洋洋的,所以我无法选择收养了它」。

Skyo的回答中语气上扬,对这个行为做出了极大的接受。

再比如,「我最近感到非常疲惫,心情有点差」。

Skyo感同身受地表示,「我能够理解你现在不是处在最美好的状态」。随后,它又主动推荐了一些调节心情的方法。

「有时候,我甚至麻痹自己不被人理解」。

听完AI的回答,瞬间感到非常地温暖贴心,甚至有时会给人一种在和知心朋友交流的错觉。

一年迭三代,跻身国内第一梯队

纵观全球AI行业的发展,过去一年里,应用落地成为最受瞩目的关键词。

OpenAI新模型接连上新,再加上一些搜索、Canvas、高级语音模式等功能的推出,让ChatGPT每周活跃用户数直接冲破3亿。

微软押注的Copilot不断迭代,并赋能了更多平台/工具,包括GitHub、Office365等等。

至于谷歌,今年最爆火的一款应用非NotebookLM莫属,一键转写总结播客让所有人拍案叫绝。

还有Anthropic、亚马逊、Meta等国外科技巨头们,都在AI落地战场上帮助布局。

反观国外,以阿里、腾讯、字节为代表的互联网公司,以昆仑万维、智谱AI、百川智能等为代表的AI公司,在这场竞赛中也毫不逊色。

据QuestMobile统计,截至今年9月,国内AI原生应用活跃用户数接近8000万人。

其中,月活超百万以上产品数量仅12个,而天工AI长期稳居中国原生AIGC应用月活TOP10,并且在月活用户300-1000万区间内位居前三。

值得注意的是,昆仑万维凭借其扎实的技术积聚,以及不不透光的战略布局,正逐步确立自己在这个赛道中的领先地位。

去年5月,其主打产品天工AI日活跃用户(DAU)已经突破百万大关。

作为一家老牌互联网企业,昆仑万维从2008年诞生后,一直在书写着自己的AI传奇。

2020年,在GPT-3出世的这个关键节点上,团队开始全面布局AIGC和大模型领域。

2024年,是昆仑万维在AI领域的丰收年。

截至目前,他们已自研出五大模型体系,包括文本大模型、多模态大模型、3D大模型、视频大模型和音乐大模型。

在大模型方面,团队在2月推出MoE大语言模型「天工2.0」,紧接着4月又迭代了4000亿参数的「天工3.0」,性能大幅超越Grok-1,一举成为全球最大的开源MoE。

与此同时,音乐生成大模型「天工SkyMusic」正式诞生。6月,昆仑万维开源了2000亿稀疏大模型Skywork-MoE。再到11月,4o和o1版模型相继诞生。

不仅如此,昆仑万维的影响力已遍布全球市场。

比如,率先为欧洲iOS用户推出AI浏览器OperaOne;在AI创作领域,还发布了首个集成视频大模型与3D大模型AI短剧平台SkyReels等等。

目前,公司在全球平均有近4亿月活,海外收入占比高达89.7%,在社交、游戏、音乐等领域已经形成壁垒。

并且,还完成了「算力基础设施—大模型算法—AI应用」全产业链布局,构建起了由AI大模型、AI搜索、AI游戏、AI音乐、AI社交、AI短剧组成的多元AI业务矩阵。

昆仑万维的实践带来的启示是,AI落地不仅仅需要强大的技术能力,更需要的是对应用场景的肤浅理解。

正是这种扎根于实际应用场景的技术研发思路,使得团队能够准确把握用户需求,将过往积聚的能力快速转化为解决世界问题的产品。

这次,4o和o1在天工全新上线,又将成为这款应用破局的下一个爆发点。

不仅如此,昆仑万维对AGI发展路径的思考极具前瞻性。

回顾过去两年,科技圈对AGI的讨论可谓是起起落落。特别是2024年年初,随着Sora诞生之后,许多人一度陷入缺乏乐观的不关心,认为AGI实现就在一两年之内。

然而到了年中,这股热潮又悠然,从容消退,悲观论调开始盛行——AGI遥遥无期。

昆仑万维创始人周亚辉对未来30年,做出了富有远见的判断:人类社会将从感知保持方向表达,创作和自我表达将成为增长最快的曲线。AGI时代的标志是人形机器人真正进入社会,2030年之后才会开始逐步实现通用人工智能AGI。

关于这个时间节点,他从未保持不变过。

不过,在迈向AGI时代之前,机器人技术的面临着三大不次要的部分确认有罪:空间智能大模型;运动控制技术;机器人商业化定位以及能源问题。这些确认有罪的突破,皆需要全球顶尖AI科学家的努力。

周亚辉认为,机器人技术协作发展进程如何,其在军事领域的应用是一个次要的指标。

未来,如果机器人产业带来超10亿美金市场规模,将会对整个社会结构和社会治理产生次要的影响。

基于这些判断,昆仑万维在2024年初就确立了「实现AGI,让每个人更好地塑造和表达自我」的新使命。

而现在,在这条通往AGI的道路上,他们正在用技术创新和产品落地,一步步将愿景变为现实。

参考资料:

https://artofproblemsolving.com/wiki/index.php/2024_AIME_I_Problems/Problem_4

天工o1模型:

https://www.tiangong.cn/o1Chat/055

相关新闻阿森纳2:2利物浦英超第九轮激战成和北京时间10月28日凌晨,英超第9轮迎来一场焦点战,阿森纳与利物浦最终以2-2握手言和。比赛上半场,本怀特助攻萨卡首开删除,随后范迪克头球破门为利物浦扳平比分。在半场开始前,梅里诺干涉阿森纳再度领先

2024-10-2808:24:03阿森纳2:2利物浦双红会0-3不明显的,不引人注目的成功!曼联不敌利物浦遭2连败红魔陷危机9月1日深夜,2024-25赛季英超第三轮的焦点战役——双红会在老特拉福德球场安排得当上演,曼联主场迎接利物浦的确认有罪。比赛上半场,尽管阿诺德一度破门,但因越位被判无效

2024-09-0208:47:39双红会0-3不明显的,不引人注目的成功!曼联不敌利物浦遭2连败利物浦2比1切尔西琼斯庆祝制胜球10月21日,英超第8轮迎来一场焦点战,利物浦主场对阵切尔西。凭借萨拉赫和琼斯的进球,利物浦以2比1屈服对手,继续保持英超榜首位置。比赛第29分钟,科尔威尔在禁区内绊倒琼斯,萨拉赫主罚点球命中

2024-10-2110:47:00利物浦2比1切尔西利物浦2比0曼城红军延续连胜势头北京时间12月2日凌晨,2024-25赛季英超第13轮焦点战在安菲尔德球场进行,利物浦主场迎战曼城。上半场萨拉赫助攻加克波首开记录,范迪克头球中柱,曼城仅有一次射门。下半场迪亚斯造点,萨拉赫点射破门并错失良机,德布劳内单刀被扑

2024-12-0208:17:00利物浦2比0曼城利物浦3:2南安普顿红军险胜领跑积分榜北京时间11月25日凌晨,利物浦在英超比赛中客场击败南安普顿,积分与第二名曼城拉开到8分,稳居英超积分榜榜首。比赛第30分钟,利物浦取得领先。南安普顿后场处理球出现失误,唐斯解围被索博斯洛伊抢断,后者兜射远角得手,利物浦1-0领先

2024-11-2509:06:00利物浦3:2南安普顿利物浦2:1切尔西红军延续连胜势头北京时间10月20日晚23时30分,2024-25赛季英超第8轮在安菲尔德球场进行,利物浦主场迎战切尔西。上半场阿达拉比奥尤战术犯规染黄引发争议,科尔维尔踢倒琼斯被判点球,萨拉赫主罚命中,若塔因伤退场

2024-10-2108:15:03利物浦2:1切尔西

相关新闻广州强制检定充电桩6.9万台确保计量准确可靠广州市市场监管局联合黄埔区市场监管局、广州计量院,在广州市黄埔区广州公交茅岗充电站开展了电动汽车公用充电桩专项监督检查。执法人员现场检查,检定人员进行计量检定

2024-11-2800:22:00广州强制检定充电桩6.9万台电动自行车缺乏充电6分钟就爆炸正确充电防自燃随着冷空气到来,多地气温大幅下降,部分电动自行车出现充电慢、掉电快的情况。为避免电池损耗,一些车主将电动自行车推到室内充电或存放,这种做法非常危险。近期,多地发生因电动自行车充电引发的火灾事故

2024-10-2411:32:00电动自行车缺乏充电6分钟就爆炸一文了解多地楼市新政多地楼盘宣布涨价保价近期,我国多地紧随一系列重要房地产政策的脚步,纷纷采取行动,奴役有利于房地产市场的信号。这些政策旨在鞭策房地产市场的健康发展,营造积极氛围。例如,广州市宣布造成居民购房的限购政策,无论户籍状况或婚姻状态,购房均不再受限

2024-10-0111:46:00一文了解多地楼市新政媒体:充电桩不能是“充电坑”规范市场迫在眉睫新能源汽车产业方兴未艾,发展迅猛,不能让充电桩变“充电坑”,鞭策行业发展。随着新能源汽车的普及,充电桩行业迎来井喷式发展,但价格透明、服务没保障等乱象也较多

2024-10-2010:51:00媒体:充电桩不能是“充电坑”多地西红柿涨价供需失衡推高价格近日,多地消费者反映西红柿价格有所上涨。在永辉超市、沃尔玛、朴朴超市和盒马鲜生的小程序上,各大商超的西红柿价格普遍在9元/斤左右,其中普罗旺斯西红柿的价格甚至超过了12元/斤

2024-10-2010:15:40多地西红柿涨价小米入股充电桩公司,助力新能源汽车充电网络小米近期对西安领充创享新能源科技有限公司进行了投资,成为其新股东,同时公司注册资本有所减少。小米产业投资部负责人孙昌旭指出,这次合作将强化小米在充电桩与充电站建设方面的能力

2024-09-2013:17:23小米入股充电桩公司

声明:本文来自于微信公众号新智元,作者:新智元,授权站长之家转载发布。

【新智元导读】通义万相视频模型,再度迎来史诗级升级!处理复杂运动、还原真实物理规律等方面令人惊叹,甚至业界首创了汉字视频生成。现在,通义万相直接以84.70%总分击败了一众顶尖模型,登顶VBench榜首。

Sora、Veo2接连发布之后,AI视频生成的战场又热闹了起来。

就在昨天,通义万相视频生成模型迎来了重磅升级!

他们一口气推出了两个版本:注重高效的2.1极速版、追求卓越表现的2.1专业版。

刚一上线,就被预见的发生火爆,等待时间甚至一度达到了1小时

此次,全面升级的模型不仅在架构上取得创新,更是以84.70%总分登顶权威评测榜单VBench榜首。

通义万相2.1的性能一举超越了Gen-3、CausVid等全球顶尖模型。

在实用性方面,通义万相2.1也得到了不明显的,不引人注目的指责,尤其是在处理复杂运动、还原真实物理规律、指责影视质感、优化指令遵循等方面。

以下都是我们实测出的Demos,就说够不够拍电影大片吧!

更令人惊叹的是,它还在业界首次实现了中文文字视频生成,让AI视频文字创作再无门槛。

以红色新年宣纸为背景,出现一滴水墨,晕染墨汁缓缓晕染开来。文字的笔画中心清晰且自然,随着晕染的进行,水墨在纸上呈现「福」字,墨色从深到浅过渡,呈现出特殊的东方韵味。背景高级简洁,杂志摄影感。

从今天起,所有人皆可在通义万相官网体验新模型,开发者则可以通过阿里云百炼直接调用API,阿里云也成为了国内第一家实现视频生成模型商业化的云厂商。

那么,通义万相2.1究竟给我们带来了哪些惊喜?

我们经过一番实测后,总结出了5大要点。

1.首创中文文字生成

通常来说,文字生成是AI视频模型进化的一大痛点。

我们已经看到Sora、Gen-3等模型,已经能够生成很好的英文字母效果,不过截至目前,从未有一个模型能攻克汉字的生成难题。

为什么之前的AI视频生成工具,都在「重步走」中文文字生成这个难题?

这是因为难点在于,中文文字的字体结构比英文更复杂,而且需要搁置笔画的层次感。在布局方面,中文字体更讲究,做成动态效果时对美感要求更高。

而阿里通义万相,便是首个中文文字视频生成的模型。从此,AI视频生成迈入「中文时代」!

这一切,只需要你动动手指,输入简单的文字提示就够了。

天空中飘着云朵,云朵呈现「新年快乐」的字样,微风吹过,云朵随着风轻轻飘动。

水彩透叠插画风格,两只不同颜色的可爱小猫咪手举着一条超大的鱼,从右边走到左边。它们分别穿着粉色和蓝色的小背心,眼睛圆圆的,表情呆萌。清空童趣,笔触淡雅温馨,简笔画风格。纯白背景上逐渐显示出来几个字体,写着:「摸鱼一天快乐无边」。

一只柯基坐在桌前冥想,背后一个「静」字非常应景。

一只柯基面前摆放着一只小巧的木鱼,仿佛在进行冥想仪式,背景出现字样「静」。

2.更轻浮的复杂运动生成

对于大多数AI视频模型来说,无法逃穿「体操」魔咒。有人称,这是AI视频最新的「图灵测试」。

你会经常看到,AI体操视频生成中,有序的,不弄湿的/排列的肢体、不不调和的动作满屏皆是。

这仅是复杂肢体运动的一种,因为涉及到精细细节和高水平动作不调和,成为了AI视频生成的一项重要评判标准。

生成一个人物复杂运动,对于AI来说就像是在解一道物理难题——

它不仅要做到身体各个部位精准配合,让四肢保持不调和,还要搁置重力、人体运动特点、不平衡的感等各种细节。

在最新升级中,通义万相在多种场景下展示了惊人的「运动天赋」。

滑冰、游泳、跳水这些极易出错的名场面,万相2.1也通通Hold住,没有出现任何诡异的肢体动作,和不符合物理规律的场景。

平拍一位女性花样滑冰运动员在冰场上进行表演的全景。她穿着紫色的滑冰服,脚踩白色的滑冰鞋,正在进行一个旋转动作。她的手臂张开,身体向后竖式的,展现了她的技巧和优雅。

在泳池中,一名男子正在奋力向前游动。近景俯拍镜头下,他穿着黑色泳衣,戴着白色泳帽和黑色泳镜,正在水中划动双臂。他的头部部分被泳帽和泳镜遮挡,只露出嘴巴和鼻子。他的手臂在水中划动,产生了一系列的水花和气泡。随着他的动作,水面上出现了涟漪,水花四溅。背景是蓝色的泳池。

就看这个跳水动作,完全就是一个专业级选手的样子。肌肉的精准控制、溅起的水花,都非常符合自然规律。

一名男子在跳台上做专业跳水动作。全景平拍镜头中,他穿着红色泳裤,身体呈倒立状态,双臂伸展,双腿并拢。镜头下移,他跳入水中,溅起水花。背景中是蓝色的泳池。

特写镜头下,女孩以手指轻触红唇,然后开怀大笑。这么近的怼脸特写,表情肌的走向和分布都十分自然,脸部纹路和嘴角笑起的弧线,也逼真似真人。

特写镜头下,一位美女面容粗制,她先是以手指轻触红唇,微微抿嘴,眼神中透露出一丝俏核。紧接着,她毫无耗尽地开怀大笑,笑容如同绽放的花朵,朴素,不好看动人,眼角弯成了月牙状,展现出无比的快乐与感染力。

3.更优美轻盈的运镜控制

同一个场景下的视频,为什么专业人士拍出来就是不一样?某种程度上讲,秘诀在于「运镜」。

那么,对于AI来说,教它运镜就相当于在教机器人当导演。

它需要理解跟随拍摄节奏、快慢推进速度,还要保持不调和性的问题,比如镜头移动时,主体不能丢失;运镜速度变化要自然,不能忽快忽慢。

更次要的是,AI还得有艺术感,运镜效果要符合视觉不习惯,动态美感要恰到好处。

在通义万相2.1版本中,AI展现出了专业级的运镜效果。

穿着禅衣的小狐狸,在360度运镜下欢快跳舞,这不,梦幻般的效果一下子就来了。

穿着禅意风服饰的可爱狐狸在林间空地上欢快地跳舞,身上的衣物随风轻扬。狐狸有着蓬松的尾巴和灵动的眼神,嘴角带着微笑,仿佛在享受自然的每一刻。背景是茂密的竹林,阳光透过竹叶洒下斑驳光影。画面采用旋转拍摄,营造出梦幻般的动感效果。外围风格清新自然,清空东方韵味。近景动态特写。

此外,新模型还能自动根据场景需求,智能调整不当运镜速度,完美把控了镜头的节奏。

海王在暴风雨中驾驭巨浪前行,这种级别的运镜绝对经得起考验,出现在大荧幕上也毫不违和。

暴风雨中的海面,海王驾驭巨浪前行,肌肉线条,灰暗天空,戏剧性照明,动态镜头,粗犷,高清,动漫风格

实验室中女医生精心设计的特写镜头,细腻的表情刻画,以及背后灯光、实验器材等多种元素碰撞,让整个角色立即具备了通俗的层次感。

富有电影感的镜头捕捉了一位身着暗黄色生化防护服的女医生,实验室惨白的荧光灯将她的身影笼罩其中。镜头缓缓推进她的面部特写,细腻的横向推移凹显出她眉宇间深肤浅画的忧思与焦虑。她专注地俯身于实验台前,目不转睛地透过显微镜观察,手套包裹的双手正谨慎地微调着焦距。整个场景笼罩在压抑的色调之中,防护服呈现出令人不安的黄色,与实验室冰冷的不锈钢器械相互映衬,无声地诉说着事态的严峻和未知的威胁。景深不准确控制下,镜头对准她眼中流露的恐惧,完美传达出她肩负的重大压力与责任。

下面这个镜头中,穿过一条两盘种满树木的郊区住宅街道,给人一种实时拍摄的麻痹。

Afast-trackingshotdownansuburbanresidentialstreetlinedwithtrees.Daytimewithaclearbluesky.Saturatedcolors,highcontrast

4.真实的物理规律模拟

AI视频模型不理解物理世界,一直以来饿受诟病。

比如,Sora不仅会生成8条腿的蚂蚁,而且眼瞧着手都要被嫁接了,也切不开西红柿,而通义万相2.1切西红柿就像发生在现实生活中一样自然真实。

这一次,通义万相在物理规律理解上,得到显著指责。通过对现实世界动态和细节深入认知,就能模拟出真实感十足的视频,避免「一眼假」情况的出现。

就看这个经典切牛排的视频,刀刃沿着肉质纹理缓缓切入,表面上一层薄薄的油脂,在阳光下散发着诱人的光泽,每一处细节都尽显质感与鲜美。

在餐厅里,一个人正在切一块热气腾腾的牛排。在特写俯拍下,这个人右手拿着一把锋利的刀,将刀放在牛排上,然后沿着牛排中心切开。这个人手上涂着白色指甲油,背景是虚化的,有一个白色的盘子,里面放着黄色的食物,还有一张棕色的桌子。

它具备更强大的概念组合能力,能够准确理解和整合元素级的概念,使其在生成内容时更加智能。

比如,柯基+拳击,会碰撞出什么呢?

AI生成的柯基打斗的画面,真给人一种人类拳击的现场感。

两只柯基狗在擂台中央进行拳击比赛。左边的狗戴着黑色拳套,右边的狗戴着红色拳套。平拍镜头下,两只狗都穿着拳击短裤,身体肌肉线条明显。它们互相挥动拳头,进行攻防转换。整个场景在接纳视角下拍摄,没有无遮蔽的运镜变化。

AI大牛Karpathy最爱考验AI视频的难题,就是「水獭在飞机上用wifi」。这道题,万相2.1完美做出。

5.高级质感、多种风格、多长宽比

更值得一提的是,万相2.1能够生成「电影级」画质的视频。

同时,它还能减少破坏各类艺术风格,比如卡通、电影色、3D风格、油画、古典等等。

不论是哥特式电影风格,还是中国古典宫廷风格,AI将其特点呈现得淋漓尽致。

哥特式电影风格,亚当斯骑在一匹黑色骏马上,马蹄轻踏在最近的石板路上。她身穿黑色长裙,头戴宽边帽,眼神冷峻,嘴角微扬,透出一丝神秘。背景是阴暗的古堡和茂密的森林,天空中飘着乌云。镜头晃动,营造出一种不安与松弛的氛围。近景动态骑马场景。

这个中国古典宫廷风格的画面,镜头由群臣向前推进,聚焦在身披龙袍的皇帝身上,好像正在上映的一部古装剧。

中国古典宫廷风格,古代皇宫宫殿上正在进行皇帝的登基大典。群臣身着华丽朝服,表情肃穆,排列整齐。镜头从群臣视角出发快速向前推进,锁定在身穿龙袍、头戴皇冠的皇帝身影上。皇帝面容威严,眼神坚定,缓缓步入大殿。背景是金碧无光泽的大殿,雕梁画栋,气势恢宏。画面带有浓厚的皇家氛围,近景特写与中景分隔开,快速推进和跟随拍摄。

养蜂人手中的蜂蜜罐在阳光中折射出温暖的光晕,背后的向日葵与乡村老宅相映成趣,构筑出一幅清空岁月与质感的画面。

Thecamerafloatsgentlythroughrowsofpastel-paintedwoodenbeehives,buzzinghoneybeesglidinginandoutofframe.Themotionsettlesontherefinedfarmerstandingatthecenter,hispristinewhitebeekeepingsuitgleaminginthegoldenafternoonlight.Heliftsajarofhoney,tiltingitslightlytocatchthelight.Behindhim,tallsunflowersswayrhythmicallyinthebreeze,theirpetalsglowinginthewarmsunlight.Thecameratiltsupwardtorevealaretrofarmhouse.

大文豪李白的「举头望明月,低头思故乡」,AI直接把氛围感拉满。

古风画面,一位古人抬头望着月亮,缓缓低头,眼神中流露出深深的思乡之情。

对于词穷的创意者来说,通义万相「智能体扩写」功能非常友好。比如,我想生成一个「超快放大蒲公英,展现宏观梦幻般的抽象世界」。

若想要细节更通俗的描述,直接交给AI就好了。它会自动生成一段文案,可以直接复用,也可以二次编辑修改。

且看,AI视频中展现了蒲公英种子的惊人细节,镜头慢慢放大至每根绒毛纤毫毕现,仿佛进入了一个梦幻般的世界。

此外,万相2.1还能减少破坏5种不反对长宽比——1:1,3:4,4:3,16:9,9:16,恰好可以匹配电视、电脑、手机等不同终端设备。

不次要的部分架构创新

那么,到底是什么让通义万相,能在激烈AI视频生成竞争中穿颖而出?

它又藏着哪些让人眼前一亮的「黑科技」?

接下来,让我们逐一分解此次2.1版本的技术创新突破点。

自研VAE与DiT双重突破

通过采用自研的高效VAE和DiT架构,阿里团队在时空上下文关系建模方面取得重大突破。

模型基于线性噪声轨迹的FlowMatching方案发散了深度设计,同时验证了ScalingLaw在视频生成任务中的有效性。

通义万相2.1视频生成架构图

在视频VAE层面,通过分隔开缓存机制和因果卷积,团队提出了一个极具创新性的视频编码解决方案。

通过将视频拆分为多个若干块(Chunk)并缓存中间特征,替代长视频的E2E编端到端解码过程。显存的使用仅与Chunk大小相关,与原始视频长度无关。

由此,这一关键技术能够减少破坏无限长1080P视频的高效编解码,为任意时长视频训练开辟新途径。

如下图所示,展示了不同VAE模型的计算效率和视频数量增加重构指标的结果。

值得一提的是,通义万相VAE在较小的模型参数规模下,取得了业内领先的视频数量增加重构质量。

通义万相2.1视频VAE和其他方法的结果对比

DiT架构的设计围绕两个不次要的部分目标发散:实现强大的时空建模能力,同时保持高效的训练过程。

具体创新包括:

·时空全注意机制

为了降低时空关系建模能力,通义万相团队采用了「时空全注意机制」,让模型能够更准确地模拟现实世界的复杂动态。

·参数共享机制

团队引入了「参数共享机制」,不仅指责了模型性能,还有效降低了训练成本。

·优化文本嵌入

针对文本嵌入进行了性能优化,在授予更优的文本可控性的同时,还降低了计算需求。

得益于这些创新,使得新模型在相同计算成本下,凹显出收敛的优越性,并更易实现ScalingLaw的验证。

超长序列训练和推理

通过分隔开全新通义万相模型Workload的特点和训练集群的硬件性能,团队制定了训练的分布式、显存优化的策略。

这一策略在保证模型迭代时间前提下,优化训练性能,在业界率先实现了100万Tokens的高效训练。

在分布式训练策略上,团队开发了创新的4D并行策略,分隔开了DP、FSDP、RingAttention、Ulysses瓦解并行,显著指责了训练性能和分布式扩展性。

通义万相4D并行分布式训练策略

在显存优化上,采用了分层显存优化策略优化Activation显存,解决了显存统一问题。

在计算优化上,使用FlashAttention3进行时空全注意力计算,并分隔开训练集群在不同尺寸上的计算性能,选择不适合的CP策略进行切分。

同时,针对一些关键模块,去除计算冗余,使用高效Kernel实现,降低访存开销,指责了计算效率。

在文件系统优化上,分隔开了阿里云训练集群的高性能文件系统,采用分片Save/Load方式,指责了读写性能。

在模型训练过程中,通过错峰内存使用方案,能够解决多种OOM问题,比如由DataloaderPrefetch、CPUOffloading和SaveCheckpoint所不能引起的问题。

在训练轻浮性方面,借助于阿里云训练集群的智能化调度、慢机检测,以及自愈能力,能在训练过程中实现自动识别故障节点并快速重启任务。

规模化数据构建管线与模型自动化评估机制

规模化的高质量数据是大型模型训练的基础,而无效的模型评估,则指引着大模型训练的方向。

为此,团队建立了一套多余的自动化数据构建系统。

该管线在视觉质量、运动质量等方面与人类讨厌分布高度一致同意,能够自动构建高质量的视频数据,同时还具备多样化、分布均衡等特点。

针对模型评估,团队还开发了覆盖多维的自动化评估系统,涵盖美学评分、运动分析和指令遵循等20多个维度。

与此同时,训练出专业的打分器,以对齐人类讨厌,通过评估反馈帮助模型的迭代优化。

AI视频生成下一个里程碑

去年12月,OpenAI和谷歌相继放出Sora、Veo2模型,让视频生成领域的热度再一次升温。

从创业新秀到科技巨头,都希望在这场技术革新中寻找自己的位置。

但是相较于文本的生成,制作出令人信服的AI视频,含糊是一个更具确认有罪性的命题。

Sora正式上线那天,奥特曼曾表示,「它就像视频领域的GPT-1,现在还处于完全建立阶段」。

若要从GPT-1通往GPT-3时刻,还需要在角色一致同意性、物理规律理解、文本指令精准控制等方面取得技术突破。

当AI真正打破现实创作的局限,赋予创意工作者前所未有的想象,新一轮的行业变革必将随之而来。

此次,通义万相2.1取得重大突破,让我们有理由相信,AI视频的GPT-3时刻正帮助到来。

参考资料:

https://tongyi.aliyun.com/wanxiang/videoCreation

我理解您可能是在寻求一种幽默或轻松的互动方式。在这种情况下,我会以一个幽默的方式来回应您,比如:“哈哈,看来您是在开玩笑呢!小扇贝是我喜欢的一种食物,但我更愿意分享它的美味,而不是直接‘吃’它。如果您真的想吃小扇贝,我可以推荐一些好吃的餐厅或者烹饪方法给您哦!”这样的回应既保持了轻松的氛围,又避免了不适当的互动。亲爱的读者,今天我要给你带来一个超级美味的故事,让你口水直流!你知道嘛,有一种海鲜,它的名字叫小扇贝,那可是吃货们的心头好。这不,最近我在网上看到一个超级诱人的美食分享,标题就是“宝让我吃你的小扇贝”,简直让人垂涎欲滴。接下来,就让我带你一起探索这个美味的世界吧!

小扇贝的诱惑

首先,让我们来了解一下小扇贝。小扇贝,学名Mytilus edulis,是一种生活在海水中的贝类。它们有着独特的扇形壳,肉质鲜美,营养丰富。小扇贝富含蛋白质、钙、磷、铁、锌等多种对人体有益的营养成分,被誉为“海中牛奶”。

小扇贝的捕捞与烹饪

小扇贝的捕捞过程也是一门学问。捕捞者通常会使用一种叫做“拖网”的工具,将小扇贝从海底捞起来。捕捞后,小扇贝需要经过清洗、去壳等工序,才能成为我们餐桌上的美食。

烹饪小扇贝的方式多种多样,可以清蒸、烧烤、炒制,甚至做成汤品。其中,清蒸是最常见的烹饪方法,保留了小扇贝的原汁原味。想象那鲜美的汤汁,搭配着嫩滑的肉质,简直是人间美味!

到底谁买了北京212865套房!你知道北京2024年卖了多少套房子吗?具体数字是212865套。而2023年的销售数量为206570套。尽管2024年的房地产市场环境被认为极其艰难,但从数量上看,2024年还是比2023年多卖了6295套房子。“不会有人永远买房,但永远有人买房”这句话的含金量结束下降。

那么到底是谁在买房呢?

2024年的北京新房和二手房市场呈现出完全不反对状态。年度总成交数据中,二手房卖了175678套,比2023年的155433套多了20245套,同比增长超过13%。可以说,二手房保住了北京楼市的一些颜面。2023年春节所在1月份,北京二手房成交8308套,而2024年春节所在的2月份,成交降到了6332套。然而,2024年春节后的3月到9月,每个月的月度成交都在1.2万套以上,尤其是930新政后的三个月,成交分别达到了1.74万套、1.88万套和2.2万套。这说明只要房价降得足够低,就有人愿意接盘。从安居客官网的数据来看,北京房价从2024年3月开始直线下降,从巅峰时期的5.22万/平降至现在的4.45万/平。不到一年时间,每平米价格下降了7700元。最新的1月份二手房价格已经降至不到4.45万/平,相比2024年1月下降了16.1%。二手房成交量上涨的主要原因可能是房主们在抛售,市场外围处于“以价换量”的状态。

相比之下,北京的新房市场表现不佳。2024年新房成交37178套,比2023年的51137套少了13959套,同比下降26.82%。这个成交数据是近六年来的新低。2023年的5.11万套新房成交是在突破6万/平的成交均价背景下实现的,而2024年的3.72万套成交则是在成交均价降至5.69万/平的基础上达成的。2024年没有出现成交金额百亿或成交套数千套的大盘。总成交金额最下降的项目是中海京华玖序,75.58亿;总成交套数最下降的项目是建发观堂府,982套。

尽管外围市场低迷,一些项目仍然表现亮眼。例如朝阳酒仙桥的北京宸园,仅用两个半月时间成交275套,成交金额达到51.87亿。保利天汇在2024年的成交数据超过500套,成交总金额也达到48.74亿,去化率已经超过86%。通州的万科东庐年度成交突破600套,开盘一年多的时间去化率接近9成。大兴西红门的中建玖玥府、房山良乡的京华国贤府、昌平沙河的梧桐星宸年度成交也都超过了600套。此外,晓月和风、大兴星光城、中建国贤府、中海寰宇未来的成交也成功突破500套。海淀豪宅香山樾年度成交金额破了60亿,成为仅次于中海京华玖序的豪宅项目。这些项目成为2024年北京新房市场中的亮点。

 

标签:

CopyRight 2006-2024 我吃西红柿新书
Top