本站提供WPK官方正版微撲克下載網(wǎng)址,有WPK安卓版官方下載和ios新版本下載鏈接網(wǎng)址。WPK是一款線上能打德州的智力競技游戲平臺,下載安裝中遇到任何問題或需加入俱樂部請聯(lián)系客服
Helix的平均包裹處理速度從5.0秒提升至4.05秒,效率提升近20%,同時還能處理可變形塑料袋和扁平信封等復(fù)雜包裹類型,非常接近人類操作員的效率。更令人震撼的是條形碼掃描成功率從70%飆升至95%——這意味著機(jī)器人不僅更快,還更精準(zhǔn)。
《擴(kuò)展 Helix:人形物流領(lǐng)域的新突破》 2025年06月07日 自我們首次將 Helix 系統(tǒng)部署在物流環(huán)境中僅僅三個月,該系統(tǒng)的功能和性能就取得了飛躍性進(jìn)步。Helix 系統(tǒng)如今能夠處理更廣泛多樣的包裝類型,并且正逐漸接近人類水平的靈巧度和速度,使我們離實(shí)現(xiàn)完全自主的包裹分揀又近了一步。這一快速進(jìn)展凸顯了 Helix 系統(tǒng)基于學(xué)習(xí)的機(jī)器人方法的可擴(kuò)展性,能夠迅速轉(zhuǎn)化為實(shí)際應(yīng)用中的成效。 新型包裹類型——Helix 系統(tǒng)如今能夠像處理硬質(zhì)紙箱一樣可靠地操縱可變形的聚乙烯袋和扁平信封,針對每種形態(tài)因素調(diào)整其抓取方式和策略,動態(tài)地處理各類物體。 更高的處理速度——盡管處理的包裹類型變得更加復(fù)雜多樣,執(zhí)行速度也提升至每個包裹4.05秒(從約5.0秒降低),實(shí)現(xiàn)了約20%的處理速度提升,同時保持了準(zhǔn)確性。 更高的條形碼掃描成功率——如今,運(yùn)輸標(biāo)簽的朝向在約95%的情況下都能正確地面向掃描儀(從約70%提升),這得益于更好的視覺和控制能力。 自適應(yīng)行為——機(jī)器人展現(xiàn)出了從演示中學(xué)習(xí)到的細(xì)微行為,例如輕拍塑料信封以撫平褶皺,從而提高條形碼的讀取率。 小型包裹物流,如這里所示的例子,是人工智能學(xué)習(xí)的理想環(huán)境,因?yàn)槊總€時間步的包裹和場景都在不斷變化,這使其非常適合神經(jīng)網(wǎng)絡(luò)。 這些改進(jìn)是通過數(shù)據(jù)擴(kuò)展和模型架構(gòu)改進(jìn)實(shí)現(xiàn)的: 時間記憶——一個新的視覺記憶模塊賦予了 Helix 系統(tǒng)有狀態(tài)的感知能力。如今的策略還結(jié)合了過去狀態(tài)的歷史記錄,能夠?qū)崿F(xiàn)時間上延伸的行為,并提高了對中斷的魯棒性。 力反饋——力感應(yīng)被整合到狀態(tài)輸入中,提供了一種觸覺代理,從而實(shí)現(xiàn)了更精確的抓取和包裹操縱。 在這里,我們分析了這些提升的來源,考察了增加演示訓(xùn)練數(shù)據(jù)(從10小時增加到60小時)如何影響性能,以及上述每項(xiàng)架構(gòu)增強(qiáng)如何有助于 Helix 系統(tǒng)在包裹處理的速度和準(zhǔn)確性方面取得進(jìn)步。 擴(kuò)展包裹種類和自適應(yīng)行為 Helix 系統(tǒng)的物流策略已經(jīng)擴(kuò)展到能夠處理更廣泛多樣的包裹。除了標(biāo)準(zhǔn)的硬質(zhì)紙箱,該系統(tǒng)如今還能管理聚乙烯袋(聚乙烯袋)、加襯信封以及其他可變形或薄型包裹,這些包裹帶來了獨(dú)特的挑戰(zhàn)。這些物品可能會折疊、起皺或彎曲,使得抓取和定位標(biāo)簽變得更加困難。Helix 系統(tǒng)通過實(shí)時調(diào)整其抓取策略來解決這一問題——例如,通過快速甩動軟袋使其動態(tài)翻轉(zhuǎn),或者使用捏握方式處理扁平郵件。盡管形狀和質(zhì)地的多樣性增加,Helix 系統(tǒng)卻提高了其吞吐量,平均每個包裹的處理時間約為4.05秒,沒有出現(xiàn)瓶頸。 該物流任務(wù)的目標(biāo)是將包裹旋轉(zhuǎn),使條形碼朝下以便掃描。一個值得注意的行為是 Helix 系統(tǒng)在嘗試掃描之前傾向于拍平塑料包裝。如果運(yùn)輸標(biāo)簽位于彎曲或起皺的表面(常見于填充松散的聚乙烯袋或起泡信封),策略會通過短暫按壓和平整表面來做出反應(yīng)。這種微妙的“平整”動作是從演示中學(xué)習(xí)而來的,確保條形碼能夠完全被掃描儀讀取。這種自適應(yīng)行為突出了端到端學(xué)習(xí)的優(yōu)勢——機(jī)器人從未明確硬編碼的演示策略中學(xué)習(xí),直接從數(shù)據(jù)中學(xué)習(xí),以克服現(xiàn)實(shí)世界中包裝的不完美之處。 至關(guān)重要的是,這些新能力并沒有降低效率。吞吐量隨著多功能性一起增加。Helix 系統(tǒng)每個包裹的平均處理時間從大約5.0秒(在簡化的一組包裹上)降低到了4.31秒,即使隨著新包裹類型的出現(xiàn),任務(wù)變得更加困難。這種速度提升使性能更接近人類操作員的速度。同樣,條形碼方向的成功率也上升到了約95%。這些改進(jìn)共同表明了一個更加靈巧且可靠的系統(tǒng),能夠在廣泛的現(xiàn)實(shí)世界包裹范圍內(nèi)接近人類水平的速度和準(zhǔn)確性。 Helix 系統(tǒng)視覺-運(yùn)動策略的架構(gòu)改進(jìn) 上述許多提升都是通過針對 Helix 系統(tǒng)1視覺-運(yùn)動策略的改進(jìn)實(shí)現(xiàn)的。在過去的兩個月里,我們引入了新的記憶和感知模塊,使控制策略更加具有情境感知能力和魯棒性。這些增強(qiáng)功能使 Helix 系統(tǒng)能夠更好地感知世界的狀態(tài),并感受其正在做的事情,補(bǔ)充了最初部署時建立的視覺和控制基礎(chǔ)。在這里,我們詳細(xì)說明每一項(xiàng)改進(jìn)以及它如何有助于 Helix 系統(tǒng)的物流性能。 視覺記憶 Helix 系統(tǒng)的策略如今維護(hù)著其環(huán)境的短期視覺記憶,而不僅僅是基于即時的相機(jī)幀進(jìn)行操作。具體來說,該模型配備了一個模塊,該模塊從最近的一系列視頻幀中組合特征,為其提供了一個時間上延伸的場景視圖。這種隱式的視覺記憶使得有狀態(tài)的行為成為可能:機(jī)器人可以記住它已經(jīng)檢查過包裹的哪一面,或者傳送帶的哪些區(qū)域是空閑的。例如,如果初始相機(jī)視圖沒有完全揭示標(biāo)簽,Helix 系統(tǒng)可以回憶起之前的部分瞥見,并決定將包裹旋轉(zhuǎn)到記得標(biāo)簽可見的角度。因此,記憶模塊有助于消除冗余動作(機(jī)器人不會“忘記”并重新檢查同一側(cè)兩次),并通過確??紤]了物品的所有必要視圖來提高成功率。本質(zhì)上,視覺記憶賦予了 Helix 系統(tǒng)一種時間上的上下文感,使其能夠在多步驟操作中更具戰(zhàn)略性地行動。這正是將條形碼方向成功率提升至95%的關(guān)鍵——如今的策略可以可靠地執(zhí)行多步驟操作(例如多次小旋轉(zhuǎn)或視角調(diào)整),以找到條形碼,由視覺回憶引導(dǎo),而不是依賴于一次幸運(yùn)的瞥見。 狀態(tài)歷史 我們還將 Helix 系統(tǒng)的本體感知輸入與近期狀態(tài)的歷史記錄相結(jié)合,從而實(shí)現(xiàn)了更快、更具反應(yīng)性的控制。最初,策略是以固定時長的動作塊進(jìn)行操作的:它會觀察當(dāng)前狀態(tài)并輸出一系列運(yùn)動軌跡,然后重新觀察,如此循環(huán)。通過將過去機(jī)器人的狀態(tài)(手、軀干和頭部位置)的窗口納入策略的輸入中,系統(tǒng)在這些動作塊之間保持了連續(xù)性。重要的是,狀態(tài)歷史保留了上下文,因此即使重新規(guī)劃的頻率更高,策略也不會丟失其正在進(jìn)行的操作或使操縱變得不穩(wěn)定。最終結(jié)果是對意外或干擾的更快響應(yīng):如果包裹移動了或者嘗試抓取沒有完美落地,Helix 系統(tǒng)可以在運(yùn)動中途進(jìn)行糾正,且?guī)缀鯖]有延遲。這一增強(qiáng)功能對每個包裹的處理時間的減少做出了顯著貢獻(xiàn)。 力反饋 為了賦予 Helix 系統(tǒng)基本的觸覺,我們將力反饋整合到了策略的輸入觀察中。Helix 系統(tǒng)對環(huán)境和它操縱的物體所施加的力現(xiàn)在成為了輸入神經(jīng)網(wǎng)絡(luò)的狀態(tài)的一部分。這些信息使策略能夠檢測接觸事件并相應(yīng)地進(jìn)行調(diào)整。例如,當(dāng) Helix 系統(tǒng)伸手去拿一個包裹時,它能夠感知到第一次接觸到物體的時候,或者當(dāng)一個包裹被按壓在表面上時。它學(xué)會了利用這些線索來調(diào)節(jié)運(yùn)動:例如,在檢測到與傳送帶接觸時暫停向下的運(yùn)動。通過與觸覺形成閉環(huán),Helix 系統(tǒng)實(shí)現(xiàn)了更精確的處理,最終提高了動作的成功率和一致性,使系統(tǒng)對物體的重量、硬度和放置位置的變化更具魯棒性。 結(jié)果與討論 為了量化這些改進(jìn)的影響,我們在不同的訓(xùn)練數(shù)據(jù)制度和模型配置下對 Helix 系統(tǒng)的物流性能進(jìn)行了受控評估。我們測量了兩個關(guān)鍵指標(biāo):包裹處理速度(每個包裹的平均秒數(shù),越低越好)和條形碼掃描成功率(正確朝向掃描儀的包裹百分比,越高越好)。以下結(jié)果分解了額外的訓(xùn)練數(shù)據(jù)和新的架構(gòu)特性對 Helix 系統(tǒng)整體性能提升的各自貢獻(xiàn)。 擴(kuò)展訓(xùn)練數(shù)據(jù) 首先,我們考察了擴(kuò)展人類演示數(shù)據(jù)量對 Helix 系統(tǒng)熟練度的影響。我們將訓(xùn)練數(shù)據(jù)量約為10小時、20小時、40小時和60小時的演示軌跡的模型進(jìn)行了比較(網(wǎng)絡(luò)架構(gòu)和超參數(shù)相同)。如下面的圖1所示,增加訓(xùn)練數(shù)據(jù)在吞吐量和準(zhǔn)確性方面都帶來了明顯的改進(jìn)。 圖1:訓(xùn)練數(shù)據(jù)量對包裹處理性能的影響。更多的演示數(shù)據(jù)帶來了更快的平均處理速度(每個包裹的秒數(shù),越低越好)和更高的條形碼掃描成功率。下面的所有模型都是相同的,都使用了帶有記憶和反饋模塊的最新 Helix 系統(tǒng)1架構(gòu)。 從10小時增加到60小時的訓(xùn)練演示,Helix每個包裹的平均處理時間從約6.84秒降低到了4.31秒,吞吐量提高了58%,條形碼成功率從88.2%上升到了94.4%。這些回報(bào)表明,我們?nèi)匀惶幱诘蛿?shù)據(jù)階段,因?yàn)殡S著數(shù)據(jù)量的增加,模型性能仍在穩(wěn)步提升。 記憶和反饋模塊的貢獻(xiàn) 接下來,我們評估最近的架構(gòu)增強(qiáng)——視覺記憶、狀態(tài)歷史和力反饋——對性能的貢獻(xiàn)。我們進(jìn)行了消融研究,比較了帶有這些模塊啟用或禁用的Helix模型的不同變體。在這個比較中,所有模型都是在相同的60小時數(shù)據(jù)集上訓(xùn)練的,因此任何指標(biāo)上的差異都反映了這些新功能的有無。圖2總結(jié)了這次消融研究的結(jié)果,列出了處理速度和成功率。 圖2:添加視覺記憶、狀態(tài)歷史和力反饋的性能影響。每一行展示了一個Helix策略的變體(在60小時數(shù)據(jù)上訓(xùn)練),啟用了某些模塊。完整模型(最后一行)包含了所有增強(qiáng)功能。我們報(bào)告了每個變體的平均處理時間(秒/包裹)和條形碼成功率。 在圖2中,我們展示了每個模塊如何消除特定的瓶頸。單目基線缺乏深度和時間上下文,抓取位置不準(zhǔn)確,而且由于無法判斷停留在某個狀態(tài)的時間,常常會長時間暫停。增加立體視覺解決了深度問題——抓取更加干凈利落,吞吐量也有所提高——但長時間暫停的問題仍然存在。解決暫停問題的一個方法是增加動作塊的長度,但這會以降低反應(yīng)時間為代價。相反,引入視覺記憶可以讓策略回憶起袋子是否已經(jīng)被翻轉(zhuǎn),或者標(biāo)簽是否曾經(jīng)可見,消除了冗余的重新定向,并從循環(huán)中再削減了半秒。當(dāng)加入狀態(tài)歷史和力反饋時,機(jī)器人獲得了時間流逝和觸覺的感知:它不再停滯不前,更好地調(diào)節(jié)對硬紙箱的抓取力,并更好地控制對周圍施加的力以避免失去平衡,使首次條形碼掃描成功率提升至94%。最后,通過將網(wǎng)絡(luò)的Transformer解碼器頭參數(shù)數(shù)量增加50%來擴(kuò)展網(wǎng)絡(luò),利用這些更豐富的輸入,將平均處理時間降低到4.05秒,同時保持準(zhǔn)確率在92%以上。 視覺條件反射:人機(jī)交接 盡管Helix在物流場景中的主要目標(biāo)是自主分揀,但相同的端到端模型可以輕松適應(yīng)新的交互。一個例子是通過視覺條件反射實(shí)現(xiàn)的人機(jī)交接行為。我們僅提供了一些額外的演示片段,其中一個人等待包裹交接(這些片段是在主要數(shù)據(jù)收集過程中隨機(jī)收集的),從而讓策略將人伸出的手解釋為交接物品的信號。沒有明確編程新的技能;網(wǎng)絡(luò)只是學(xué)會了,在有人伸手的情況下,合適的動作是將包裹交給對方而不是放在傳送帶上。這種行為使用了與其他所有動作相同的神經(jīng)策略和權(quán)重——差異純粹來自Helix對人的觀察以及它從那些額外示例中學(xué)到的上下文。 結(jié)論 我們展示了如何通過擴(kuò)展高質(zhì)量的演示數(shù)據(jù)集,并結(jié)合視覺記憶、狀態(tài)歷史和力反饋等架構(gòu)改進(jìn),顯著提升了Helix在現(xiàn)實(shí)世界物流中的性能。結(jié)果是一個通用的視覺-運(yùn)動策略,能夠以接近人類水平的速度和高可靠性處理各種包裹——與兩個月前的初始能力相比,這是一個顯著的進(jìn)步。這些改進(jìn)不僅解決了包裹處理中的即時挑戰(zhàn),還為Helix的控制系統(tǒng)帶來了普遍的好處,這些好處可以延續(xù)到其他用例中。通過啟用有狀態(tài)的感知和力感應(yīng),我們在不犧牲效率的情況下,使策略更加穩(wěn)健和靈活。至關(guān)重要的是,策略既從數(shù)據(jù)擴(kuò)展中受益,也從架構(gòu)改進(jìn)中受益,僅靠其中任何一項(xiàng)都無法推動策略性能的提升。 Helix正在穩(wěn)步提升其靈巧性和穩(wěn)健性,縮小了學(xué)習(xí)型機(jī)器人操作與現(xiàn)實(shí)任務(wù)需求之間的差距。正在進(jìn)行的工作將繼續(xù)擴(kuò)大其技能集,并確保在更高的速度和工作負(fù)載下保持穩(wěn)定。。
當(dāng)Helix遇到褶皺的塑料包裝袋時,它會先輕拍平整表面,確保條形碼完整讀取。這都是通過端到端學(xué)習(xí)直接從數(shù)據(jù)中學(xué)習(xí)到的,無需顯式編程。
Figure表示,工程師為Helix植入了三大關(guān)鍵模塊,讓其具備了短期記憶、運(yùn)動歷史感知和力反饋能力:
Adcock補(bǔ)充稱,公司正通過視頻展示機(jī)器人。
Figure:Helix擁有先進(jìn)的感知和控制架構(gòu)
視覺記憶:引入短期視覺記憶模塊,使機(jī)器人能夠記住過去的視覺信息,從而進(jìn)行更智能的多步操作,消除冗余動作,提高任務(wù)成功率。狀態(tài)歷史:通過整合機(jī)器人近期狀態(tài)的歷史數(shù)據(jù),實(shí)現(xiàn)了更快速、更靈敏的控制,讓機(jī)器人在操作過程中保持連貫性,并能及時應(yīng)對突發(fā)狀況。力反饋:整合了觸覺感知能力,機(jī)器人能夠感知與物體和環(huán)境的接觸,從而實(shí)現(xiàn)更精確的抓取和操作,提高了系統(tǒng)對物體差異的穩(wěn)健性。
6月8日,F(xiàn)igure AI的回應(yīng)視頻來了。公司發(fā)布了Helix機(jī)器人60分鐘無剪輯物流分揀視頻,聲稱僅僅三個月的物流環(huán)境部署后,Helix的操作速度和靈活性已開始接近人類水平。
公司表示,Helix正在穩(wěn)步縮小學(xué)習(xí)型機(jī)器人與真實(shí)世界任務(wù)需求之間的差距。一個由人形機(jī)器人在速度、效率和靈活性上與人類并肩工作的未來不再是科幻,而是即將到來的現(xiàn)實(shí)。
近期,“美國版宇樹”Figure AI 與寶馬的合作關(guān)系受到質(zhì)疑,有報(bào)道稱其進(jìn)展不及預(yù)期,對此 Figure AI 曾強(qiáng)烈否認(rèn),Adcock 甚至公開威脅要起訴相關(guān)媒體。
Figure的受控實(shí)驗(yàn)顯示,Helix訓(xùn)練數(shù)據(jù)從10小時增加到60小時,處理時間從6.34秒降至4.31秒,掃描成功率從88.2%升至94.4%。表明其基于學(xué)習(xí)的方法具有強(qiáng)大的可擴(kuò)展性。
然而,公司聯(lián)合創(chuàng)始人兼首席執(zhí)行官Brett Adcock在6日的彭博科技大會上的表現(xiàn),與其競爭對手形成了鮮明對比。當(dāng)Agility Robotics和Boston Dynamics都在現(xiàn)場展示其機(jī)器人產(chǎn)品時,F(xiàn)igure AI卻選擇了缺席。
Figure機(jī)器人:三個月內(nèi)逼近人類?
面對記者關(guān)于為何不進(jìn)行現(xiàn)場演示的追問,Adcock給出的理由顯得頗為牽強(qiáng):
以下為Figure AI官網(wǎng)原文:
"我們的理念是不參加很多活動,我認(rèn)為這是巨大的時間浪費(fèi)。坦率地說,我必須帶一個團(tuán)隊(duì)來這里展示機(jī)器人,他們本可以在辦公室工作。"
Figure稱,公司研發(fā)的 Helix 機(jī)器人在人形機(jī)器人領(lǐng)域展現(xiàn)出多項(xiàng)令人印象深刻的亮點(diǎn),特別是在物流和操作任務(wù)方面取得了顯著進(jìn)步。