久久中文字幕人妻,91久久婷婷国,亚洲精品视频在线入口,国产三级精品久久久无,av毛色国产,红楼AV无码,丝袜无码视频网站,99re视频在线观看,www.久久久性

英偉達(dá)帶火的“具身智能”是什么?AI價值遠(yuǎn)比機(jī)器人更大 | 見智研究|全球視點(diǎn)

近日,“具身智能”概念被英偉達(dá)創(chuàng)始人CEO黃仁勛帶火。

華爾街見聞·見智研究認(rèn)為:具身智能帶來的AI價值遠(yuǎn)比人形機(jī)器人更大。具身智能最大的特質(zhì)就是能夠以主人公的視角去自主感知物理世界,用擬人化的思維路徑去學(xué)習(xí),從而做出人類期待的行為反饋,而不是被動的等待數(shù)據(jù)投喂。在人類的五大感官中視覺獲取的信息占比超過80%,并且讓機(jī)器理解人類語言也是非常重要的,所以機(jī)器視覺和多模態(tài)大模型正是開啟機(jī)器自我感知學(xué)習(xí)的兩把鑰匙。

具身智能是什么?

具身智能簡單來說就是AI的大腦加上軀體。它能夠跟我們生活的環(huán)境進(jìn)行交互,從而展現(xiàn)出智能行為。


【資料圖】

而具身智能為什么被看作AI的iPhone時刻?

原來的人工智能可以看作第三人稱的智能,也就是投喂數(shù)據(jù)給機(jī)器,讓它學(xué)習(xí)什么它就學(xué)習(xí)什么。而現(xiàn)在具身智創(chuàng)造了一種機(jī)器自主學(xué)習(xí)的新方式,能夠以第一人稱的視角來感知和學(xué)習(xí)物理世界,并像人類一樣理解和感知事物的能力,才能在此基礎(chǔ)上進(jìn)行相同思維的發(fā)展,最后表現(xiàn)出人類期待的行為方式。

Windows為何能統(tǒng)治操作系統(tǒng),iPhone為何創(chuàng)造智能手機(jī)時代,最重要的原因就是他們創(chuàng)造了最簡單、最直觀的人機(jī)交互窗口。

發(fā)展人工智能的意義在于能夠讓機(jī)器造福人類,協(xié)助處理事務(wù),提高生產(chǎn)力;更進(jìn)一步則是讓AI進(jìn)行創(chuàng)造,推動科學(xué)研究的進(jìn)展。而這一切的前提是:要讓機(jī)器理解人類社會,要做到這一點(diǎn),需要的就是具身智能。

見智研究認(rèn)為:讓AI擬人化的進(jìn)行感知和理解世界方式,視覺和聽覺是非常重要的??匆姴⒗斫馕锢硎澜缰写嬖诘氖挛?,并且能夠聽懂人類的語言這背后需要的是機(jī)器視覺技術(shù)和多模態(tài)大模型。在具身智能領(lǐng)域的快速發(fā)展下,這兩大領(lǐng)域的技術(shù)創(chuàng)新和需求也會與日俱增。

具身智能比人形機(jī)器人更有價值

具身智能相當(dāng)于AI的大腦,而這個大腦的載體可以是任何形式??梢允且粋€機(jī)械臂,一只機(jī)器狗,更或者是一輛小汽車。

而反觀人形機(jī)器人,當(dāng)下為何被看做是一個不太聰明的鋼鐵巨人,核心還是因?yàn)槿鄙貯I大腦+不太靈活的軀體。

就像馬斯克所表示的,雖然未來有一天人人可能會擁有一個人形機(jī)器人,但是目前展現(xiàn)的Optimus人形機(jī)器人產(chǎn)品也就只能執(zhí)行重復(fù)性的簡單勞動。

見智研究認(rèn)為:我們真正需要的人形機(jī)器人目前還缺少具身智能特質(zhì)。馬斯克也表示:未來會將特斯拉的視覺技術(shù)用于人形機(jī)器人的研發(fā)中。而對于具身智能和人形機(jī)器人所能夠創(chuàng)造的價值,也非常明了了。具身智能的應(yīng)用場景沒有局限性,所以市場空間更廣闊。

關(guān)注具身智能的硬實(shí)力

具身智能的硬實(shí)力包括:機(jī)器視覺和多模態(tài)大模型。

機(jī)器視覺是AI的感知工具,亦為數(shù)據(jù)生產(chǎn)的手段。在人類的五大感官中視覺獲取的信息占比超過 80%。

機(jī)器視覺的端口是攝像頭,作為看懂世界的“眼睛”;機(jī)器視覺的大腦是算法,承擔(dān)分析功能。

見智研究認(rèn)為:相比于單純迭代硬件的參數(shù)指標(biāo),算法和架構(gòu)的升級對于AI來說更重要。因?yàn)閿z像頭的發(fā)展目前已經(jīng)可以實(shí)現(xiàn)對物體的數(shù)據(jù)采集,無論是清晰度還是色彩度都已經(jīng)卷到了夠用的程度。

值得關(guān)注的是,多模態(tài)大模型在機(jī)器領(lǐng)域的應(yīng)用。無論是視覺圖像信號還是人類語言的聲音信號,最后都要轉(zhuǎn)化為機(jī)器能夠理解的語言,從而實(shí)現(xiàn)人機(jī)交互的目的。

從現(xiàn)階段應(yīng)用來看,目前最好的是谷歌的PaLM-E大模型(參數(shù)5620億),可以將視覺和語言同時集成到機(jī)器人的控制中。這種大模型最大程度的解決了需要人工對數(shù)據(jù)進(jìn)行預(yù)處理和注視的繁瑣流程,極大提高了機(jī)器理解的效率。通過將PaLM-E大模型集成到控制中,能夠直接通過攝像頭的數(shù)據(jù)實(shí)現(xiàn)對機(jī)器執(zhí)行命令,并且具備一定程度的抗干擾能力。

小結(jié)

AI的軀體其實(shí)并非是最重要的,核心應(yīng)該是發(fā)展AI大腦,打通人機(jī)交互方式,讓AI能夠主動感知物理世界,擬人化的思維路徑才能做到人類期待的行為反饋。機(jī)器視覺和多模態(tài)大模型正是開啟這個世界的兩把鑰匙。

風(fēng)險提示及免責(zé)條款 市場有風(fēng)險,投資需謹(jǐn)慎。本文不構(gòu)成個人投資建議,也未考慮到個別用戶特殊的投資目標(biāo)、財(cái)務(wù)狀況或需要。用戶應(yīng)考慮本文中的任何意見、觀點(diǎn)或結(jié)論是否符合其特定狀況。據(jù)此投資,責(zé)任自負(fù)。

關(guān)鍵詞:

德江县| 邯郸县| 邹平县| 当阳市| 宁安市| 长丰县| 安吉县| 城步| 岳池县| 全南县| 青铜峡市| 鹤壁市| 翁牛特旗| 陈巴尔虎旗| 平安县| 五峰| 迁安市| 阿拉尔市| 深泽县| 兴义市| 姚安县| 来安县| 手机| 彭泽县| 黎平县| 杭锦旗| 梅河口市| 康马县| 环江| 江阴市| 莱西市| 仙居县| 新巴尔虎左旗| 大厂| 富源县| 梨树县| 汤原县| 怀集县| 梅州市| 饶平县| 高雄市|