http://bfqmb.cn 2024-12-30 15:08 來源:科創(chuàng)板日報
今日(12月30日),智元機器人聯(lián)合上海人工智能實驗室、國家地方共建人形機器人創(chuàng)新中心以及上海庫帕思,正式開源百萬真機數(shù)據(jù)集AgiBot World,數(shù)據(jù)質(zhì)量從實驗室級上升到工業(yè)級標(biāo)準(zhǔn),后續(xù)還將發(fā)布具身基座大模型。
據(jù)智元機器人方面介紹,AgiBot World是全球首個基于全域真實場景、全能硬件平臺、全程質(zhì)量把控的百萬真機數(shù)據(jù)集。此前,具身智能訓(xùn)練領(lǐng)域大規(guī)模的開源數(shù)據(jù)集是Google的Open X-Embodiment。相較于前者,AgiBot World長程數(shù)據(jù)規(guī)模高出10倍,場景范圍覆蓋面擴大100倍,數(shù)據(jù)質(zhì)量也從實驗室級上升到工業(yè)級標(biāo)準(zhǔn)。
AgiBot World數(shù)據(jù)集復(fù)刻了家居(40%)、餐飲(20%)、工業(yè)(20%)、商超(10%)和辦公(10%)五大核心場景,涵蓋了80余種日常生活中的動作和技能。
在這個具身數(shù)據(jù)的世界里,機器人不再只是進行簡單的桌面任務(wù),而是進入到人類日常生活的方方面面,既有抓取、放置、推、拉等基礎(chǔ)操作,也有攪拌、折疊、熨燙等復(fù)雜動作。
高質(zhì)量的數(shù)據(jù)集對于當(dāng)下人形機器人技術(shù)的發(fā)展尤為重要。人形機器人需要在訓(xùn)練中不斷成長,才能像人一樣的活動并完成任務(wù)。如同小學(xué)生做習(xí)題提高自己的學(xué)習(xí)能力一樣,人形機器人也需要數(shù)據(jù)集這樣的“習(xí)題冊”來提升自己。
但是數(shù)據(jù),尤其是高質(zhì)量的的數(shù)據(jù)仍是發(fā)展人形機器人當(dāng)下一個卡點。現(xiàn)有開源數(shù)據(jù)集,或多或少都存在采集流程缺乏標(biāo)準(zhǔn)化、機器人構(gòu)型過時、數(shù)據(jù)質(zhì)量格式參差不齊等問題,在機器人策略學(xué)習(xí)的過程中甚至?xí)砀弊饔谩?/p>
在數(shù)據(jù)采集方面,傅利葉智能通用機器人事業(yè)部副總裁周斌表示,現(xiàn)在的機器人數(shù)據(jù)采集方式主流的還是以人的遙操的方式采集,未來則需要更擬人化,以提高數(shù)據(jù)對具身智能的泛化和遷移能力;二是提升數(shù)據(jù)維度,如增加觸覺等數(shù)據(jù)輸入,滿足工業(yè)和實際場景需求;三是采用虛實結(jié)合的技術(shù)路徑,提升數(shù)據(jù)集量級,目前物理世界數(shù)據(jù)集仍不足。
通過低成本方式,高質(zhì)量地獲取數(shù)據(jù)對機器人進行訓(xùn)練,是量產(chǎn)前要解決的關(guān)鍵問題。一直以來,業(yè)界也正在積極補齊短板,如特斯拉等公司開展大規(guī)模真機數(shù)據(jù)采集。
12月27日,北京國地共建具身智能機器人創(chuàng)新數(shù)據(jù)采集基地亮相;12月28日,上海提出“搭建超大規(guī)模城市級的模擬應(yīng)用場景,率先賦能具身智能、自動駕駛等大模型實訓(xùn)”。
國家地方共建人形機器人創(chuàng)新中心(“國地中心”),是目前我國發(fā)展人形機器人產(chǎn)業(yè)一個重要載體。該中心當(dāng)前一個重要任務(wù)也是組建機器人訓(xùn)練場收集數(shù)據(jù)。
國地中心總經(jīng)理許彬在接受《科創(chuàng)板日報》記者采訪時表示,這個訓(xùn)練場將落地在浦東張江模力社區(qū),可容納100個人形機器人同時訓(xùn)練,預(yù)計到2027年這一數(shù)字將達(dá)1000個。
AgiBot World是智元機器人本年度開源的第三個項目,相關(guān)數(shù)據(jù)將在HuggingFace、Github以及agibot-world.com項目主頁上分批上傳。
智元機器人方面稱,將陸續(xù)開源千萬仿真數(shù)據(jù),以支持更泛化和更通用的大模型訓(xùn)練;將發(fā)布具身基座大模型,可支持模型微調(diào);發(fā)布全套工具鏈,實現(xiàn)采集、訓(xùn)練和評測閉環(huán)。