AI見(jiàn)聞日?qǐng)?bào):機(jī)器人看YouTube學(xué)會(huì)做家務(wù),大規(guī)模視頻訓(xùn)練機(jī)器人要火了!| 見(jiàn)智研究
今日要點(diǎn)
1、機(jī)器人看YouTube學(xué)會(huì)做家務(wù),大規(guī)模視頻訓(xùn)練機(jī)器人成為重要路徑;
2、AI果不其然對(duì)視頻下手了,十秒剪視頻,Whisper模型讓每個(gè)人都能成為“剪輯師”;
(資料圖片)
3、開(kāi)源大模型明星更新第二版:ChatGLM2-6B推理更快文字更長(zhǎng),允許商用授權(quán);
4、PrivateGPT 開(kāi)源模型可實(shí)現(xiàn)不連網(wǎng)提問(wèn);本地部署未來(lái)空間大;
5、李彥宏表示:百度文心大模型推理速度提升17倍;
每日見(jiàn)智AI
1、機(jī)器人看YouTube學(xué)會(huì)做家務(wù),大規(guī)模視頻訓(xùn)練機(jī)器人成為重要路徑
CMU機(jī)器人研究所助理教授Deepak Pathak展示了一種視覺(jué)機(jī)器人橋方法(VRB);通過(guò)讓機(jī)器觀看人類行為方式的視頻完成行為模擬,并驗(yàn)證了該方法的有效性。
視頻中機(jī)器人下觀看了幾個(gè)人類開(kāi)抽屜的視頻后,”CMU指出,“機(jī)器人可以確定如何打開(kāi)任何抽屜。
CMU依賴于來(lái)自Epic Kitchens和Ego4D等數(shù)據(jù)庫(kù)的視頻,后者擁有“來(lái)自世界各地的近4小時(shí)的以自我為中心的日?;顒?dòng)視頻”。
見(jiàn)智點(diǎn)評(píng):
這種方法的關(guān)鍵在于利用大規(guī)模的視頻數(shù)據(jù)來(lái)訓(xùn)練機(jī)器人,并從中學(xué)習(xí)人類行為和操作。這為機(jī)器人的應(yīng)用提供了更廣泛的可能性,可以通過(guò)觀察互聯(lián)網(wǎng)和YouTube等視頻來(lái)獲取更多的訓(xùn)練數(shù)據(jù)。這種方法可以改進(jìn)機(jī)器人的操作能力,并為機(jī)器人在日常生活中的應(yīng)用提供更多的機(jī)會(huì)
2、AI果不其然對(duì)視頻下手了,十秒剪視頻,Whisper模型讓每個(gè)人都能成為“剪輯師”
荷蘭開(kāi)發(fā)者M(jìn)atthijs Hollemans在HuggingFace上基于Whisper開(kāi)發(fā)了視頻剪輯新功能,現(xiàn)在剪視頻能夠精準(zhǔn)到每個(gè)字。
在平臺(tái)上可以對(duì)上傳的視頻內(nèi)容進(jìn)行同步文字轉(zhuǎn)化,只需要選擇留下的文字,然后就可以直接生成所需的片段。使用過(guò)程非常簡(jiǎn)單,可累比相機(jī)界的“傻瓜相機(jī)”。
見(jiàn)智點(diǎn)評(píng):
AI應(yīng)用層出不窮,此前主要是AI生成圖片內(nèi)卷非常嚴(yán)重,幾乎是每周都有重要更新,現(xiàn)在這個(gè)迭代速度已經(jīng)開(kāi)始向視頻領(lǐng)域蔓延,這個(gè)小白剪視頻的功能讓剪視頻門檻大大降低,同時(shí)節(jié)省了很多制作時(shí)間,效率優(yōu)化超過(guò)90%,對(duì)于視頻創(chuàng)作行業(yè)來(lái)說(shuō)具有重大影響。
3、開(kāi)源大模型明星更新第二版:推理更快文字更長(zhǎng),允許商用授權(quán)
清華大學(xué)KEG和數(shù)據(jù)挖掘小組(THUDM)發(fā)布了第二代ChatGLM2-6B;
相比第一代ChatGLM2-6B來(lái)看,二代在幾項(xiàng)測(cè)評(píng)中都有了不同程度的提高:
a、特別是數(shù)學(xué)推理能力提升幅度571%;
b、支持更多輪次的對(duì)話,并且文字長(zhǎng)度限制也從2K提升至8K;
c、更快的推理能力,相比第一代速度提高42%;
d、向?qū)W術(shù)研究全面開(kāi)放,并且允許申請(qǐng)商用授權(quán);
見(jiàn)智點(diǎn)評(píng):
ChatGLM2-6B是國(guó)內(nèi)最強(qiáng)的開(kāi)源大模型,本次更新具有重大意義,特別是在數(shù)學(xué)推理能力、對(duì)話長(zhǎng)度和輪次、推理速度等方面的優(yōu)化,將對(duì)數(shù)學(xué)教育、學(xué)術(shù)研究、商業(yè)應(yīng)用等領(lǐng)域產(chǎn)生積極影響。
4、PrivateGPT 開(kāi)源模型可實(shí)現(xiàn)不連網(wǎng)提問(wèn);本地部署未來(lái)空間大
開(kāi)發(fā)者Iván Martínez Toro發(fā)布了PrivateGPT開(kāi)源模型,該模型允許用戶在無(wú)需互聯(lián)網(wǎng)連接的情況下,通過(guò)提供自己的文檔來(lái)向模型提問(wèn)。
PrivateGPT可以在家用設(shè)備上進(jìn)行本地運(yùn)行,使用前需要下載名為"gpt4all"的開(kāi)源大語(yǔ)言模型(LLM)。用戶需要將所有相關(guān)文件放入一個(gè)目錄中,以供模型引入所有數(shù)據(jù)。完成LLM的訓(xùn)練后,用戶可以向模型提出任何問(wèn)題,它將使用提供的文檔作為上下文來(lái)回答。PrivateGPT能夠處理超過(guò)58000個(gè)單詞,目前需要大量本地計(jì)算資源(推薦使用高端CPU)進(jìn)行設(shè)置。
Toro表示,當(dāng)前PrivateGPT處于概念驗(yàn)證(PoC)階段,它至少證明了可以在本地創(chuàng)建類似于ChatGPT的大模型??梢灶A(yù)見(jiàn),一旦這種PoC轉(zhuǎn)變?yōu)閷?shí)際產(chǎn)品,PrivateGPT將具備讓公司獲得個(gè)性化、安全和私密的ChatGPT來(lái)提高生產(chǎn)力的潛力。
見(jiàn)智點(diǎn)評(píng):
PrivateGPT開(kāi)啟行業(yè)對(duì)本地化部署的重視程度,這對(duì)于那些關(guān)注數(shù)據(jù)隱私和安全的行業(yè)和個(gè)人非常重要。通過(guò)本地化部署,用戶可以更好地控制和保護(hù)他們的數(shù)據(jù),減少了數(shù)據(jù)泄露和侵犯隱私的風(fēng)險(xiǎn);開(kāi)源模型和本地化部署將在未來(lái)產(chǎn)生積極的影響。
5、李彥宏:百度文心大模型推理速度提升17倍
在世界互聯(lián)網(wǎng)大會(huì)數(shù)字文明尼山對(duì)話上表示:新的國(guó)際競(jìng)爭(zhēng)戰(zhàn)略的關(guān)鍵不在于一個(gè)國(guó)家擁有多少個(gè)大模型,而是看這些大模型能夠應(yīng)用于多少原生AI應(yīng)用,并在多大程度上提升了生產(chǎn)效率。
他還透露,百度文心大模型已經(jīng)更新到3.5版本。相比于3.0版本,新版本的訓(xùn)練速度提升了2倍,推理速度提升了17倍,并且模型的效果總體上提升了超過(guò)50%。在數(shù)據(jù)質(zhì)量、生成效果和內(nèi)容安全性方面都有明顯的提升。
風(fēng)險(xiǎn)提示及免責(zé)條款 市場(chǎng)有風(fēng)險(xiǎn),投資需謹(jǐn)慎。本文不構(gòu)成個(gè)人投資建議,也未考慮到個(gè)別用戶特殊的投資目標(biāo)、財(cái)務(wù)狀況或需要。用戶應(yīng)考慮本文中的任何意見(jiàn)、觀點(diǎn)或結(jié)論是否符合其特定狀況。據(jù)此投資,責(zé)任自負(fù)。關(guān)鍵詞: