當(dāng)前位置: 首頁(yè) > 出行資訊 > 全國(guó) > 正文

HHPoker APP:智源大會(huì)前線速寫(xiě)：多模態(tài)模型的“ChatGPT時(shí)刻”還未到來(lái)

發(fā)布時(shí)間：2025-06-22 來(lái)源：

WEpoker官網(wǎng)提供WPK(微撲克)APP正版最新安卓IOS蘋(píng)果下載地址鏈接。WPK通過(guò)先進(jìn)的加密技術(shù)和嚴(yán)格的監(jiān)管措施,WEpoker確保每一次對(duì)局都公平公正,讓您的每一分投入都安心無(wú)憂

如果從多模態(tài)模型的應(yīng)用落地角度來(lái)看，騰訊混元多模態(tài)生成負(fù)責(zé)人蘆清林認(rèn)為，上下半場(chǎng)的分界線并不清晰。"因?yàn)槲宸值哪Ｐ蛯?duì)應(yīng)五分的用法，八分的模型對(duì)應(yīng)八分的用法。"他表示。一個(gè)判定信號(hào)是，專業(yè)領(lǐng)域的人是否開(kāi)始使用這項(xiàng)技術(shù)。即便技術(shù)研發(fā)人員認(rèn)為模型還存在很多可改進(jìn)的地方，如果專業(yè)人員已經(jīng)開(kāi)始采用，并且覺(jué)得能在實(shí)際工作中帶來(lái)提效或幫助，那么它已經(jīng)達(dá)到了能帶來(lái)實(shí)際改變的階段。

HHPoker APP

今年4月，OpenAI研究科學(xué)家姚順雨的一篇長(zhǎng)帖曾引發(fā)熱議。他表示，AI已進(jìn)入下半場(chǎng)，重心將從解決問(wèn)題轉(zhuǎn)向定義問(wèn)題。在智源大會(huì)分論壇上，AI視覺(jué)領(lǐng)域的明星創(chuàng)企Luma AI首席科學(xué)家宋佳銘直言，"上下半場(chǎng)"的劃分更像是在描述語(yǔ)言模型。如果上半場(chǎng)是預(yù)訓(xùn)練，下半場(chǎng)是推理，目前多模態(tài)模型還未能很好地解決上半場(chǎng)的問(wèn)題。

HHPoker APP

宋佳銘解釋稱，對(duì)于上半場(chǎng)的期望是，多模態(tài)模型能夠通過(guò)一個(gè)大一統(tǒng)的模型，像人一樣處理不同模態(tài)的任務(wù)，并且保持足夠快的推理速度。這個(gè)模型應(yīng)當(dāng)具備多模態(tài)思維鏈，否則在下半場(chǎng)無(wú)法真正打通推理能力。

藍(lán)鯨新聞6月8日訊（記者朱俊熹）回顧生成式AI的演進(jìn)歷程，除大語(yǔ)言模型的爆發(fā)外，還有一條并行推進(jìn)的技術(shù)路線：多模態(tài)大模型。過(guò)去一兩年間，多模態(tài)路線上先后出現(xiàn)OpenAI的視頻生成模型Sora、4o圖像生成功能等重要里程碑。但在6月6日至7日的2025北京智源大會(huì)上，業(yè)界人士的主流觀點(diǎn)是：屬于多模態(tài)的"ChatGPT時(shí)刻"尚未到來(lái)。

字節(jié)跳動(dòng)Seed圖像&視頻生成負(fù)責(zé)人黃偉林則分享了判斷技術(shù)商業(yè)化程度的三個(gè)數(shù)據(jù)指標(biāo)。一是效率數(shù)據(jù)，如用戶在使用AI生圖時(shí)，生成多少?gòu)垐D片會(huì)下載一張。二是APP上的用戶留存數(shù)據(jù)。三是收入數(shù)據(jù)，他指出頭部AI視頻產(chǎn)品ARR（年度經(jīng)常性收入）年底有望達(dá)到1億美元或更多，明年將可能實(shí)現(xiàn)5到10倍的增長(zhǎng)。

在技術(shù)和商業(yè)的結(jié)合層面，Sand.ai聯(lián)合創(chuàng)始人張拯強(qiáng)調(diào)，應(yīng)當(dāng)追求有效的Scaling Law。即在擴(kuò)展模型規(guī)模、提升性能時(shí)，由此帶來(lái)的用戶價(jià)值和經(jīng)濟(jì)回報(bào)是否足以覆蓋所投入的資源成本。如果模型能力提升的代價(jià)過(guò)高，用戶得不到對(duì)應(yīng)的回報(bào)，那么從商業(yè)角度來(lái)看，這樣的Scaling就是無(wú)效的。

智源研究院院長(zhǎng)王仲遠(yuǎn)表示，當(dāng)前的多模態(tài)模型大多是對(duì)靜態(tài)畫(huà)面的理解，描述的是存在的事實(shí)。但人類對(duì)多模態(tài)的理解并不是基于單幀圖像的描述，而是可以從一個(gè)畫(huà)面預(yù)測(cè)下一個(gè)可能的畫(huà)面。"當(dāng)我手接近水時(shí)，可以預(yù)測(cè)我要拿水；如果不小心把它碰倒在地板上時(shí)，會(huì)預(yù)測(cè)水灑下去。如果沒(méi)有蓋子，地板會(huì)被水灑濕。"

曹越指出，沿著DiT架構(gòu)方向會(huì)發(fā)現(xiàn)，隨著模型大小提升，將快速達(dá)到瓶頸，需要找到可擴(kuò)展的解決方案。如果將自回歸的思路引入視頻生成方向，可能會(huì)有顯著不同的體驗(yàn)。其訓(xùn)練方式本質(zhì)就是基于之前一段視頻，來(lái)生成未來(lái)的一段視頻。因此生成視頻時(shí)長(zhǎng)可從現(xiàn)在的5秒提升至幾分鐘，存在較大的技術(shù)提升空間。

在AI視頻創(chuàng)企Sand.ai創(chuàng)始人兼CEO曹越看來(lái)，要想精準(zhǔn)地預(yù)測(cè)并生成未來(lái)的視頻內(nèi)容，關(guān)鍵在于對(duì)過(guò)去視頻內(nèi)容的充分理解。為此，Sand.ai將主要探索方向押注在自回歸這一技術(shù)路徑上。當(dāng)下的多模態(tài)生成領(lǐng)域中，DiT架構(gòu)，即基于Transformer架構(gòu)的擴(kuò)散模型是主流選擇。如果說(shuō)DiT是逐步去噪來(lái)還原圖像或視頻，自回歸則是按順序逐幀、逐塊地生成圖像或視頻。

下一篇：51歲林學(xué)茂被查，曾在電視上公開(kāi)檢討
上一篇：世預(yù)賽-荷蘭2-0客勝芬蘭開(kāi)門(mén)紅德佩閃擊建功鄧弗里斯破門(mén)

相關(guān)閱讀

推薦圖文

羅馬諾：勝利預(yù)計(jì)幾天內(nèi)向費(fèi)耶諾德發(fā)出正式報(bào)價(jià)以求購(gòu)漢茨科

你多少級(jí)了！全球首位QQ 256級(jí)用戶誕生騰訊公關(guān)總監(jiān)：我自愧弗如

最新信息

推薦信息

京公網(wǎng)安備 11010702001433號(hào) 京ICP備11022796號(hào)
電腦版 | 手機(jī)版

婷婷开心六月久久综合丁香,免费大片黄在线观看,黄片中文字幕免费大全110,国产69久久精品成人看,美女免费黄色av网站在线观看,91精品国产91久久久久久,在线观看黄片欧洲

HHPoker APP:智源大會(huì)前線速寫(xiě)：多模態(tài)模型的“ChatGPT時(shí)刻”還未到來(lái)