用户生成视(shì)频的方式变得更加多元,可(kě)以文生视频、图(tú)生视频、视频生视频。在不同参数(shù)设置下,每100帧(zhēn)的报价范围从(cóng)3美(měi)分到18美分(fēn)不等。
前脚(jiǎo)《复(fù)仇者(zhě)联(lián)盟》导演罗素兄(xiōng)弟(dì)中(zhōng)的Joe Russo刚刚放话(huà),预计2年后就会出现一部完全(quán)由AI制作的电(diàn)影,后脚(jiǎo)Stability AI就发布了AI生成(chéng)视频新工(gōng)具,制(zhì)作电(diàn)影、至少(shǎo)制(zhì)造动(dòng)画短(duǎn)片难度(dù)由(yóu)此进一步降低。
当地时间5月11日,Stability AI发布Stable Animation SDK,这(zhè)是(shì)一款专为艺术家与开(kāi)发人员设(shè)计的工(gōng)具,旨在(zài)帮(bāng)助(zhù)艺术家(jiā)和开发人员运用最先进的稳定扩散(sàn)模型生(shēng)成动画。
借助这一工(gōng)具,用户可以使用所有Stable Diffusion模(mó)型,包括Stable Diffusion 2.0、Stable Diffusion XL等。
更重要的是,用户生成动画的(de)方式(shì)变(biàn)得更(gèng)加多元,简而言之共(gòng)有三种:文(wén)生视频、图生视频、视频生视频。
1)文本输入:即(jí)是使用文本形式的prompt,调整各种参数后(hòu)生成动(dòng)画,这一功(gōng)能与之(zhī)前的Stable Diffusion、Midjourney或DALL-E 2类(lèi)似。
2)文本(běn)输(shū)入+初始(shǐ)图(tú)像(xiàng)输入:用户提(tí)供一个初始图像,作为动画的起(qǐ)点,再配合(hé)文本(běn)prompt,生(shēng)成最终的动(dòng)画效果。
3)初始视频输入+文(wén)本(běn)输入:用户提供一(yī)个初始(shǐ)视频,以作(zuò)为动画基础。在通(tōng)过参数调(diào)整与(yǔ)文本(běn)prompt指导,最终(zhōng)可输(shū)出(chū)动(dòng)画。
与此同时,Stable Animation可以设置许多参数,包括(kuò)最大帧数、高度(dù)、宽度、采样器、风(fēng)格、色调等等。其中,可用(yòng)的(de)风(fēng)格预设包括动漫(màn)、电影、漫画、数字艺术,增强幻想艺术、线条、朋克(kè)、摄影等多(duō)种(zhǒng)形式。
目前,Stable Animation仅提供软件开发套(tào)件(SDK)和付费API。而部分参数要求可能(néng)会影(yǐng)响价格(gé)。Stability表示,在不同设(shè)置下,每(měi)100帧的报价范围从3美(měi)分到18美分不等。
实(shí)际上,Stability AI之前已推出基于Stable Diffusion的动(dòng)画(huà)工具,例(lì)如用(yòng)户(hù)可以prompt interpolation生成小段动图,而此次升级(jí)后,Stable Animation生(shēng)成视频(pín)的能(néng)力(lì)变(biàn)得更为全面且成熟。
值(zhí)得一提的是,近日发布(bù)的Wes Anderson《指(zhǐ)环王(wáng)》新预告(gào)片中,就有着一(嗤笑的意思yī)些AI工具的(de)踪(zōng)迹。OpenAI前AI主管(guǎn)Andrej Karpathy猜(cāi)测,这部预告片中用到了(le)Midjourney/Stable Diffusion、ControlNet、ElevenLabs、D-Id、ChatGPT、Adobe等工具。
东(dōng)吴证券指出,影视行业作为综合音(yīn)频、视频、文本,是生成式AI的优质(zhì)落地场景;而从AI应用(yòng)的价(jià)值和(hé)路(lù)径来(lái)看(kàn),动画电影有望率(lǜ)先受益。
相比(bǐ)真人(rén嗤笑的意思)电影1-2年的生产周期(qī),动画电影耗(hào)时更(gèng)长(3-4年),工程更复杂,产能限制更加明显。
未经允许不得转载:太仓网站建设,太仓网络公司,太仓网站制作,太仓网页设计,网站推广-昆山云度信息科技有限公司 嗤笑的意思
最新评论
非常不错
测试评论
是吗
真的吗
哇,还是漂亮呢,如果这留言板做的再文艺一些就好了
感觉真的不错啊
妹子好漂亮。。。。。。
呵呵,可以好好意淫了