圖片來源@視覺中國
文 | 根新未來,作者 | 陳根
打造出跟人類本身具有相同形象的機器人,一直是人類的夢想。畢竟,在很多人第一印象里,機器人應當是類似于人形的機器。尤其是20世紀中葉,科幻作品中大量出現“仿人機器人”的形象,形塑了人們對于機器人的想象。這種機器人往往被設計為擁有四肢、軀干、頭部,甚至五官,與人類尺寸相當。
當然,由于人形機器人技術上的困難,在實際生活中,我們看到的或者是用到的機器人,大部分并非人形。而ChatGPT的爆火,給了人形機器人一次新的機會。當前,人形機器人領域正呈現一片熱鬧非凡的景象,并朝著真正意義上的“人形”一路奔去。
為什么需要人形機器人?
相較于其他形態的機器人,人形機器人具有特殊的意義。
一方面,人形機器人能夠更好地充當人類的勞動力,馬斯克不止一次強調,人類文明所面臨的最大風險之一就是人力短缺,人類更應該將精力放在腦力勞動而不是體力勞動上。然而,要讓機器人更好地充當人類勞動力,就需要讓機器人也適應我們人類的生活。因為我們的社會是根據人類本身來設計的,而一個像是人類的機器人,就能夠很好滿足這一條件。
比如,我們之所以把機器人做成人形,不用輪胎而用雙腳行走,正是為了適應移動時的環境。人類希望機器人的活動范圍不被局限于路面上——為了方便直立行走的人類,我們周遭盡是樓梯和門扉,生活空間中存在著許多可以在步行過程中跨越的高低差。盡管如今全社會都為了照顧輪椅使用者而努力推廣無障礙設施,但人的行動范圍里仍免不了存在障礙物。因此,對于機器人來說,僅僅像掃地機那樣避開地板上的障礙物顯然是不夠的,機器人還要時不時上下樓梯。
人形機器人能夠對應我們的社會而生,才能實現最高效率的勞動力。也就是說,把機器人做成“人形”的理由之一,就在于機器人執行任務時所處的環境其實是遷就人類的體型建造起來的。衣服、桌椅、杯子、手機、汽車等等,人們眼中的這個世界,全都是為了方便人類這種“人形”生物才如此設計的。如果出現了新形態的機器人,人們就必須重新設計一套機器人能夠適應的全新環境。
另一方面,則是需求所致。在很多領域,機器人作為服務者,只有人類的外表才更容易被接受。比如,產后護理、幼兒陪伴、老人看護等——人類與人形機器人更容易產生情感上的交流,這就是“恐怖谷”效應的第一段曲線上升部分。“恐怖谷”效應由日本現代仿真機器人教父森政弘于1970年提出:當仿真機器人的外觀與動作相似,但并非完美擬合時,人類作為觀察者會產生厭惡反應。
比如,我們對人形機器人或玩偶的好感度,會隨其仿真度提高而增加,當仿真度達到一定比例時,當我們看到既不像人類也不像典型機器人的仿真機器人時,情感會突然逆轉,本能覺得不正常并產生厭惡和恐懼等回避反應。只有當仿真度繼續提高,我們的情感反應才會再度回轉。
舉個例子,當我們聽到走廊里傳來家人的腳步聲時,往往會立刻知道“是誰回來了”。有時,我們能隔著老遠就認出朋友的身影。人的行走步態看似相近,但其實大相徑庭——身高和體重各不相同,各年齡段的肌肉量也有所差異。我們區分誰是誰舞臺臺下機械,憑借的可不僅僅是臉型、體型等靜態外觀。我們不僅能通過靜態的肢體特征認人,還能通過肢體的運動特征認人。
從這個角度來看,比起用輪胎滑行的機器人,用雙足走路、會發出腳步聲的機器人更容易被人注意到,從而更讓人有安全感。
人形機器人為什么難做“人”?
二十一世紀,AI技術的快速發展曾讓人形機器人獲得了一次質的躍遷,但當AI的技術進展放緩之后,人形機器人的發展也逐漸慢下來,甚至可以說舉步維艱。
從技術角度來看,一個人形機器人身上集合了超過200種不同的技術:它必須會聽、會看、會移動、做動作、抓取物體、開門、爬樓梯,必要時還要背起人類或幫助人類走動。所以,這意味著在考慮賦予它何種類型的智能之前,要先掌握光學、力學、水力學、電子學、材料學、齒輪傳動和驅動系統。其中,最迫切的問題之一是平衡:人類因為有內耳,所以總能保持平衡,一旦發生平衡障礙,內耳會進行矯正。人形機器人沒有這種工具,它必須能夠自主控制驅動它的力量。
于是,龐大的研發成本,讓不少機器人公司都陷入了財政危機。Pepper、ASIMO、Atlas作為人形機器人行業先驅,或告別市場,或找不到合適的應用場景。
由于缺乏商業價值,本田在2018年逐步停止了人形機器人的研發工作,曾經風靡一時的Asimo機器人也開始慢慢退役,不再進行演出和展覽。停止研發的原因,主要是缺乏商業性,龐大的研發成本使公司無法賺取足夠的利潤。而對于大部分人來說,人形機器人表演已經失去了新鮮感。
雖然近年來,產研界關于人形機器人的動作明顯增多,但對于人形機器人來說,依然缺少一個重大突破推動人形機器人的發展進入下一個階段。當前的人形機器人不僅價格高昂,而且實際的產品體驗往往欠佳。
一方面,當前的人形機器人在硬件層面所牽涉到的很重要的一個問題,就是靈活性。由于機器人是由機械零部件組裝而成,而這些機械零部件跟人體的骨骼與神經控制系統有很大不同,要想讓人形機器人到達類人這樣的靈活度,或者說至少要讓人形機器人看起來像個人,那么要達到這樣的效果,在硬件層面還需要很長的一段路要走。
另一方面,是當前的人形機器人只能對標準化問題的程序進行回復,跟智能幾乎沒有什么關系,超出標準化的問題,人工智能就不再智能,而變成了“智障”。也就是說,當前的AI,在很大程度上還只能做一些數據的統計與分析,包括一些具有規則性的讀聽寫工作,還不具備邏輯性、思考性,而在控制整個硬件軀體方面更是處于起步階段。
因為人體的神經控制系統是一個非常奇妙系統,是人類幾萬年來訓練下所形成的,顯然,當前的人形機器人不論是在單純的AI思考性方面,還是在與機器人硬件的協調控制方面,都還只是處于起步階段。
人形機器人的新拐點
當然,不論我們是否接受,人與機器人共同生活與協作,都將是未來社會的一種常規模式。這也是為什么科技巨頭燒錢都要進入這個行業的原因。
比如,以家電產品“出圈”的戴森就進入了人形機器人領域,目前,戴森已發布的是一款能拿起漂白劑、夾起盤子的機械臂。而戴森的愿景是,在未來10年內推出可以做家務的人形機器人。憑借在掃地機器人、吹風機和吸塵器等產品在家庭服務領域積累的經驗和技術,戴森計劃以自己的優勢技術來打造一個家用保姆人形機器人。
再比如汽車大廠比如特斯拉,2022年,特斯拉帶來了Tesla Bot人形機器人“擎天柱”原型機的全球首秀。在發布環節中,人形機器人從幕后緩緩走上前臺,并向臺下觀眾揮手致意,做出多個簡單動作。馬斯克表示,特斯拉機器人最初的定位是替代人們從事重復枯燥、具有危險性的工作,但遠景目標是讓其服務于千家萬戶的日常工作。事實上,機器人“擎天柱”有明確的生產目標,就是成為特斯拉工廠的生產力。因此公司在大規模量產的同時也在控制成本。為了達成這個目標,特斯拉引入了大量的造車經驗,用在該產品的生產上。
此外,還有以優必選科技和波士頓動力等為代表的純機器人公司。其中,近期,深圳優必選科技就向港交所提交招股說明書、沖刺人形機器人第一股。現在,ChatGPT的橫空出世,人工智能被認為迎來了繼AlphaGo之后再次實現質的突破。隨著AI賦能愈發強大,人形機器人或許也將迎來應用加速落地的新拐點。
ChatGPT的爆發為人形機器人解鎖了更多場景,比如ChatGPT背后的大模型技術,結合后將進一步提升機器人的智能程度——根據研究人員做的心智測試,結果發現,ChatGPT已經擁有9歲小孩的心智了。從智能的本質來看,人類心智與人工智能只不過是這個世界的兩套智能,而這兩套智能的本質都是通過有限的輸入信號來歸納、學習并重建外部世界特征的復雜“算法”。
因此,理論上來看,只要我們持續地對人工智能進行教育,用龐大的數據訓練人工智能,人工智能遲早可以運行名為“自我意識”的算法。
人工智能能夠通過心智測試并不意外,今天的ChatGPT雖然只有9歲小孩的心智,但在更龐大的數據的訓練下,在未來舞臺臺下機械,人工智能將擁有真正與人類相似的思考和心智。人形機器人的應用領域也將從教育及娛樂進一步拓展到健康養老、消殺、物流等賽道,機器人從自動化到自主化智能的轉變將帶來重大發展機遇。
如果說,作為自動執行工作的機器裝置,近年來,隨著人工智能交互技術的應用,人形機器人的智能化程度有了顯著的提升。那么現在,全世界矚目的ChatGPT則為人形機器人加了一把火,或許,隨著ChatGPT的到來,人形機器人也將迎來一個新的發展拐點。(本文首發鈦媒體APP)