安全問題,一直是機器人的核心與焦點命題。
近日,谷歌DeepMind團隊發布了三項重要進展:自動化機器人訓練系統AutoRT、機器人速度優化系統SARA-RT和機器人泛化系統RT-Trajectory,這三項新系統分別從數據采集、決策速度和泛化能力等方面,幫助提升現實世界中機器人的智能水平。
(1)AutoRT:自動化機器人數據收集系統
AutoRT是一個機器人的數據自動采集系統。它整合了大規模的基礎模型,如大型語言模型(LLM)、視覺語言模型(VLM)和機器人控制模型(RT-1、RT-2),通過這一系統,機器人可以部署到全新環境中,并采集各類訓練數據。
它可以同時控制多臺裝備攝像頭和機械臂的機器人,使其在不同環境中完成各種任務,收集數據。
研究人員花費7個月時間,利用AutoRT系統控制機器人在辦公室內完成任務,已經收集了涵蓋77000次試驗和6650個獨特任務的多樣化數據,同時控制最多可達52臺機器人。
AutoRT的優勢在于,借助大規模基礎模型的力量,可以顯著提升機器人對人類語言指令的理解能力,并通過收集更豐富的數據,來訓練機器人適應實際復雜環境。
(2)SARA-RT:加速機器人決策速度
SARA-RT優化了著名的Transformer模型在機器人領域的應用,使得機器人可以做出更快速的決策。
之前基于Transformer的機器人控制模型RT-2,其決策速度受到計算需求的制約,SARA-RT通過一種新的微調方法,將Transformer的二次復雜度降低到線性復雜度,大幅減少了計算量,使機器人的決策速度提高14%,同時準確率還提高10%。
這種可擴展的注意力機制,為將Transformer應用到更大規模的機器人中提供了可能。結合數十億參數量的大型機器人模型,SARA-RT可以實現更快決策和更好性能。
(3)RT-Trajectory:提高機器人動作泛化能力
RT-Trajectory則在提高機器人泛化能力上有重要進展。對人類來說,擦桌子等動作簡單直觀,但機器人需要把抽象指令轉化為具體運動。
RT-Trajectory通過解釋機器人的具體動作,來幫助其深入理解如何完成一個任務,而不僅是簡單匹配指令和動作。它會自動為訓練視頻中的機器人運動添加2D輪廓,作為視覺提示,輔助模型學習。
測試結果表明,在未見訓練數據的41項新任務中,RT-Trajectory控制的機械臂任務成功率達到63%,較先進的RT-2模型提高一倍以上。這表明機器人的泛化能力得到顯著提升。
起草首部機器人憲法,機器人也有價值底線
在推出一系列重要系統進展的同時,谷歌DeepMind團隊還起草了世界上第一部面向智能機器人的憲法。
這部機器人憲法的靈感來源于科幻小說家阿西莫夫的“機器人三定律”,主要核心是確保機器人不傷害人類。DeepMind將這一機器人憲法集成到AutoRT系統中,成為保障人類安全的關鍵組成部分。
具體來看,機器人憲法為LLM模型設置了護欄,確保其生成的任務建議不涉及人類、動物、尖銳物品等不安全內容,同時編程限制了機器人關節的力,并添加了人類控制的物理開關。
這無疑是科技發展史上的一個里程碑事件
之前圍繞著AI倫理的討論多集中在算法本身是否存在偏見等問題上,很少涉及AI尤其是具有物理形態的智能機器人應該遵循哪些道德規范。
首部機器人憲法體現了技術應該為人類服務的理念,而非單純追求功能、效率,同時它也為未來機器人大規模應用時如何規避風險,保障人類安全和權益提供了寶貴借鑒。
當然,作為第一步的嘗試,這部機器人憲法還較為簡單和原則,如何使其擁有更嚴密的邏輯體系,覆蓋機器人可能的各種情形和倫理難題,還需要廣泛討論和不斷完善。但第一步已經邁出,其影響力絕不會限于技術層面,也將推動人類思考我們應該如何與智能機器人共處。
人類文明進步史,是一個不斷學習、探索、犯錯、修正的過程,當我們站在技術發展的新階段,應當以積極、審慎的態度繼續探索新可能。人與機器人的未來如何,你怎么看?