太仓网站建设,太仓网络公司,太仓网站制作,太仓网页设计,网站推广-昆山云度信息科技有限公司太仓网站建设,太仓网络公司,太仓网站制作,太仓网页设计,网站推广-昆山云度信息科技有限公司

AI视频“卷”成红海,创业公司还有机会吗

AI视频“卷”成红海,创业公司还有机会吗

来(lái)源:@经济观察报(bào)微(wēi)博

经济观察网 记者 任晓(xiǎo)宁 9月11日,AI视频创(chuàng)业公司生数(shù)科技创(chuàng)始团队在北京亮相,这是今年4月份在(zài)中关村论坛一炮而红后,生数科技团队成员的(de)首次露面。

生数科技的产品名(míng)为Vidu,是国内首个长(zhǎng)时长、高一致(zhì)性、高动态性视频大模(mó)型,当时备受外(wài)界关注。不过时(shí)至9月,AI视频(pín)行业已经有了很大变化,Vidu不再一枝独秀,快手、字节跳动、阿里巴巴、智谱AI、MiniMax、商汤等公司都已(yǐ)经推出(chū)AI视频产品。据经济观(guān)察报不完全统计,仅在国内,过去4个月时间便有超过10家公司(sī)推出(chū)了自研AI视频产品。

东(dōng)吴证(zhèng)券今年8月发布的(de)国产AI视频大模型深度报告测算,AI视频(pín)的潜在行业空间为3178亿元。东吴证(zhèng)券还估算(suàn),在全AI模式下,电影、长 剧、动画片和(hé)短剧的制作(zuò)成(chéng)本,相较传统模式将下降超过95%。

AI视频的未来(lái)听(tīng)起来很美好(hǎo),但这个领域,目(mù)前并没有出现(xiàn)一个出圈的爆款应用。无论是AI视频产品还是由AI生(shēng)成的视 频(pín)作(zuò)品,都像 是少数影视专业人士的玩具,局限在小圈子范(fàn)围内(nèi),始终未能像ChatGPT(美国(guó)头部AI应用(yòng))一样在大(dà)众层面获得认可。

AI视频赛道能(néng)成为大众市场吗?它的商业机会在哪里?大厂入局之后,它(tā)的市场竞(jìng)争愈(yù)加激(jī)烈,创业公(gōng)司还有机会吗?生数科技CEO唐 家渝接受经(jīng)济观察报在内的媒 体采访时,回(huí)应了(le)上述问题。

关于竞争和融资

经济观察报:Vidu发布4个月以来,国内陆续(xù)出现很(hěn)多AI视(shì)频公司,头部大厂也都推出了(le)AI视频产品。作为曾经的黑马,Vidu现在还有优势吗?

唐家(jiā)渝:目前在AI视(shì)频语义理解方面,我们能做到业界最好。另外Vidu在视频(pín)动作幅度较(jiào)大的情况下,能保(bǎo)持较好的连贯性,用户公认(rèn)这一点我们做得好。我们最近发布了AI视频主体参照一致性生成能力,这(zhè)是全球首发的能力,可以解决AI生成视频的剧情连贯性问(wèn)题。从这些技术角(jiǎo)度,我们是 有优势的。

Vidu在全(quán)球最早提(tí)出(chū)了Diffu-sion(扩散模型)与(yǔ)Transformer(一(yī)种 基(jī)于自注意力机制的深度学习(xí)模型)融合的底层架构U-ViT,并AI视频“卷”成红海,创业公司还有机会吗坚持自主的底层算法研发,没(méi)有采用开(kāi)源结构,这也是我们的底气。

经(jīng)济观察报(bào):国内AI视频公司已(yǐ)经有10多家,大家的技术(shù)路线和(hé)商业化路(lù)径会不会出现同(tóng)质化趋势?

唐(táng)家渝(yú):在(zài)技术路(lù)线上(shàng),AI视频行业目(mù)前(qián)处于底层架构收敛的状态(tài),可以理解为同质(zhì)化,但并不意味着大家进展都一样。例如现在的大语言模型都会使用(yòng) Transformer架构,但OpenAI(美国头部AI公司)是明(míng)显领先的。

在底层架构统一的基础上,各个公(gōng)司会有一些差异性(xìng)。例如,如何有效(xiào)压缩视频,如何在保证质量(liàng)的情况下快速生成视频,会涉及非常多算法技巧、算法(fǎ)难点(diǎn),这是导致差异性的主要原因。

目前(qián)各个公司的商业方向也是比较类似的,即便是Sora、Runway等国外AI视频(pín)应用,也都 在积极地拥(yōng)抱好(hǎo)莱坞,或者与广(guǎng)告公司合作,这是(shì)AI视频技术(shù)比较好(hǎo)落地的领域。总体来说,AI视频还处于行业(yè)发展前期,还有很长的路要走(zǒu)。

经(jīng)济观察报:今年6月,生(shēng)数科技公布了数亿元融(róng)资(zī),接(jiē)下来会有什么样的融资规划?今年大模型公司融资 都面 临一个困境(jìng),很难依靠技术和团队吸引投资,投资方会要求商业(yè)化能力。你 们是否也面临同样的问题?

唐家渝:我们(men)正在做新一轮(lún)的融资。融(róng)资过(guò)程(chéng)中(zhōng),技(jì)术仍是很关键的东西,目前的AI视频生成只是(shì)初步符合了物理规律,还有很高的技术天花板需要突破,比如更强的 模型能力以(yǐ)及更多模态的协同生成。

我们经过(guò)一年半的成(chéng)长(zhǎng),在(zài)商业化方面已经阶段性交(jiāo)出了比较(jiào)好的(de)答卷。其实大家耳熟能详的一些大 客户,已经接入了Vidu的底层视频生产能力了,只是我们目(mù)前还不(bù)能(néng)公布。

经济观察报:你 们会如 何(hé)选择投资者?有什么考量?

唐(táng)家渝:我们会更愿意选择长期陪伴的投资者,无论是(shì)从资源(yuán)、战略协同上,还是上下游(yóu)产业上,我觉得都可以接受,最主要的还是希望(wàng)大(dà)家能有长期一起往前走的(de)机会。

AI视频“卷”成红海,创业公司还有机会吗cms-style="font-L align-Center">关于商业化

经济观察报:现在(zài)Vidu是(shì)否已(yǐ)经商业化?有(yǒu)哪些已经落地(dì)的商(shāng)业场景?

唐家渝:商业模(mó)式主要(yào)有两(liǎng)种(zhǒng)。一种是SaaS(软件即服务)订阅模式,用(yòng)户(hù)打开Vidu.studio可以直接体验到产品功能。目前我们每月有80个免(miǎn)费积分(fēn),如(rú)果用户有更多的需求(qiú)或想使用更高级的能力,就需要支付订阅费用。另一(yī)种是(shì)API(应用程序编程接口)形式(shì),将模型能力输出形式提供给(gěi)大家,即(jí)MaaS(模型即服务)。现在有很(hěn)多客户需(xū)要具备视频生成(chéng)的能力,作为(wèi)他们已有工作流程的一(yī)个环(huán)节,所以他们希望直接调用模(mó)型的能力。

我们的客户主(zhǔ)要来自与视频内容相关(guān)的领域,比如广告、游戏、短剧和影视等。另一(yī)部分客户是C端(个人用户(hù)端)应用,他们需要AI视频能力支撑他们的新玩法。

经济观察报:在(zài)C端(duān)市(shì)场和(hé)B端(企业客户端)行业,哪个领域的AI视频增长(zhǎng)潜(qián)力更大?

唐家渝:B端的需求比较稳定、确定,能带来比较直接的收入。在接触B端行业的过程 中(zhōng),我们发现,他们提出(chū)的都是 实实在(zài)在的需(xū)求,并不是还没想清楚就简单试一(yī)下(xià),所以B端是我们长期重点关注的方向。

上线一(yī)个月以(yǐ)来,我们的C端用户 增长曲线非常高。所以,我们也在不(bù)断(duàn)探索C端商业化的过程中。

经济观察报:现在AI视频主要是(shì)艺术家、影视专业人(rén)员在用,普通(tōng)人用一下就不用了。这个工具什么时候能普及(jí)到大众?会不会一(yī)直只是 小众人群的玩具?

唐家渝(yú):AI视频(pín)不会一直都是小众产(chǎn)品。就像拍照 一样,一开始只(zhǐ)是摄影爱好者或(huò)摄影师群体使用,现在拍视频、拍照已经成(chéng)为每个人的(de)习惯。

现在的AI视频已经(jīng)发(fā)展到(dào)了一个节点,Vidu最新发布的功能是,只需输入一张图像(xiàng),就可以保持该主体的一致性(xìng),生成各种场(chǎng)景的视频。我(wǒ)们正在努(nǔ)力降低视(shì)频创作的门槛,让Vidu成为一(yī)个大众愿意使(shǐ)用的产品,今年年底应该(gāi)就能普及(jí)到大众。

关(guān)于局限和突围(wéi)

经济观察报:很多人觉得用(yòng)AI生成视频很难,为什么会这样?视频生成技术还存在怎样的局限性或瓶颈?

AI视频“卷”成红海,创业公司还有机会吗="font-L strong-Bold">唐家渝:目前的视频生成模型最大的局限性在于(yú)可控(kòng)性不(bù)足(zú)。比如生成一(yī)段画面,画面里的人物或者(zhě)对(duì)象容易崩坏,生成的结果(guǒ)也有很大的随机性,需要不断地尝试,这(zhè)背后的本质是目前视频生成技术(shù)的稳定性还不够。

从实际落地的层面上看,上面我们(men)提到的广(guǎng)告、短剧等场景,对画(huà)面连(lián)续性、一致性的要(yào)求是很高的。即便是C端用户(hù)单(dān)纯去玩,也会希望(wàng)能一次性就生(shēng)成一个他们想要(yào)的画面,这背后都是围绕可控性的需求。

经济观(guān)察报:这种不可控的瓶(píng)颈能否实现突破?如果技(jì)术(shù)继(jì)续进步,会在哪些方面有所提高?

唐家渝 :我(wǒ)们刚刚发布的主体参(cān)照功能,已经在(zài)一致性生成方面(miàn)带来了很大提(tí)升。

当然,技(jì)术还有(yǒu)更进一(yī)步(bù)提升的空间。比如一个精雕细琢的柜(guì)子,上面有繁复花纹(wén)和镂空部分,对于这样复杂(zá)的结构,目(mù)前AI视频生成成功的(de)概率依旧不高。场景(jǐng)生(shēng)成包含很多组成(chéng)因素,例如AI视频生成(chéng)的一(yī)款运(yùn)动鞋(xié),我希望(wàng)它能在更(gèng)复杂、更(gèng)动(dòng)态化的场景中有更好(hǎo)的表现。这(zhè)些都(dōu)需要不断(duàn)提升模型能力。

未经允许不得转载:太仓网站建设,太仓网络公司,太仓网站制作,太仓网页设计,网站推广-昆山云度信息科技有限公司 AI视频“卷”成红海,创业公司还有机会吗

评论

5+2=