AI見聞日報(bào):見智實(shí)測“超級網(wǎng)紅”Runway Gen2,一鍵文生視頻,比Midjourney更易用 | 見智研究
今日要點(diǎn):
1、谷歌大手筆投資的Runway正式發(fā)布Gen2,文字生成視頻成真,內(nèi)附見智實(shí)測;
2、360智腦通過中國信通院可信AIGC大語言模型功能評估,為國內(nèi)首家;
(資料圖)
3、阿里達(dá)摩院開源Video-LLaMA,幫大語言模型加上“眼睛”、“耳朵”;
4、AI生成二維碼—將快速應(yīng)用于廣告市場;
每日AI
1、谷歌大手筆投資的Runway正式發(fā)布Gen2,文字生成視頻成真,內(nèi)附見智實(shí)測
今天,真正的文本一鍵生成視頻出現(xiàn)了。Stable Diffusion和《瞬息全宇宙》背后技術(shù)公司Runway,出品的text?to?video的AI視頻編輯工具Gen2,今日開放用戶使用。Gen2,也在內(nèi)測階段就被網(wǎng)友稱贊“視頻界的Midjourney”。
見智今天使用runway的app版本做了一個(gè)貓的視頻;Prompt:?A golden gradient cat is jumping in the grass,同時(shí)又給了一張小貓咪的圖作為模板。
目前來看runway已經(jīng)能夠按照指令生成相應(yīng)的視頻,但是精細(xì)程度和對prompt的理解程度相對圖片生成平臺Midjourney還是明顯要弱一些的。但是隨著用戶大規(guī)模的使用改進(jìn),相信Runway的Gen2很快可以風(fēng)靡小視頻創(chuàng)作領(lǐng)域。
見智點(diǎn)評:隨著多模態(tài)模型的發(fā)展,從文字-圖片-視頻之間的相互生成將改變整個(gè)用戶生態(tài)。對于產(chǎn)業(yè)界來說,只成為素材生產(chǎn)者還遠(yuǎn)遠(yuǎn)不夠,能夠?qū)⑸伤夭倪M(jìn)一步便捷讓用戶生成最終形態(tài)應(yīng)用將是AI應(yīng)用發(fā)展更重要的一步。
2、360智腦通過中國信通院可信AIGC大語言模型功能評估,為國內(nèi)首家
360智腦的360GPT-S2-V8型號產(chǎn)品獲得了中國信息通信研究院“可信AIGC大語言模型基礎(chǔ)能力”評估報(bào)告,報(bào)告顯示必選項(xiàng)目評估內(nèi)容均通過。據(jù)悉,360智腦是國內(nèi)首個(gè)通過中國信通院該項(xiàng)權(quán)威評估的大模型產(chǎn)品。
見智點(diǎn)評:360智腦成為首家通過中國信通院權(quán)威認(rèn)證,一方面說明了通用大模型的基礎(chǔ)能力得到認(rèn)可,重要的是數(shù)據(jù)集的安全性有了國家的背書,更有助于之后大范圍的商用應(yīng)用推廣。同時(shí)關(guān)注明天的360智腦發(fā)布會。
3、阿里達(dá)摩院開源Video-LLaMA,幫大語言模型加上“眼睛”、“耳朵”
阿里達(dá)摩院的研究人員提出了 Video-LLaMA,一個(gè)具有綜合視聽能力大模型。Video-LLaMA 能夠感知和理解視頻中的視頻和音頻信號, ?并能理解用戶輸入的指令,完成一系列基于音視頻的復(fù)雜任務(wù),例如音 / 視頻描述,寫作,問答等。目前論文,代碼,交互 demo 都已開放。另外,在 Video-LLaMA 的項(xiàng)目主頁中,該研究團(tuán)隊(duì)還提供了中文版本的模型,讓中文用戶的體驗(yàn)更絲滑。
見智點(diǎn)評:阿里達(dá)摩院讓Video-LLaMA開源,進(jìn)一步推動國內(nèi)多模態(tài)大模型的發(fā)展進(jìn)程。視聽綜合大模型非常適用于辦公、學(xué)習(xí)領(lǐng)域的應(yīng)用。另外,Video-LLaMA大模型對于靜態(tài)圖像也有比較強(qiáng)的理解能力,能夠完成圖片描述和問答。
4、AI生成二維碼—將快速應(yīng)用于廣告市場
擺脫單調(diào)的黑白,使用 ControlNet 的 AI 生成的二維碼將更具特色和商業(yè)價(jià)值。
具體來看一個(gè)應(yīng)用顯示:識別二維碼推薦的是QRBTF -就是一款能夠制作漂亮有趣二維碼的免費(fèi)開源在線工具;
見智點(diǎn)評:ControlNet是基于Stable_Diffusion進(jìn)行AI生成的一種訓(xùn)練方式,它的特點(diǎn)是計(jì)算方法更高效,因?yàn)橛?xùn)練不需要在原始編碼器上進(jìn)行,所以更節(jié)省GPU內(nèi)存,訓(xùn)練速度也更快。最值得關(guān)注的是,ControlNet這種有控制的生成AI圖像更能夠得到我們想要的圖片結(jié)果,同時(shí)操作方式簡單能夠在PC端運(yùn)行。
從應(yīng)用層面來看,我們看到這種創(chuàng)意形 AI 生成的二維碼更能夠具有品牌專屬特性且方便進(jìn)行品牌或者網(wǎng)站等任何產(chǎn)品的推廣應(yīng)用。在不久的將來,這將在廣告中越來越普遍。
風(fēng)險(xiǎn)提示及免責(zé)條款 市場有風(fēng)險(xiǎn),投資需謹(jǐn)慎。本文不構(gòu)成個(gè)人投資建議,也未考慮到個(gè)別用戶特殊的投資目標(biāo)、財(cái)務(wù)狀況或需要。用戶應(yīng)考慮本文中的任何意見、觀點(diǎn)或結(jié)論是否符合其特定狀況。據(jù)此投資,責(zé)任自負(fù)。關(guān)鍵詞: