華為AI存儲加速多模態(tài)大模型進化，助力Open-Sora-Plan復現(xiàn)Sora

2024-12-12 10:20 閱讀 2475 來源：安防知識網評論區(qū)

面向未來，Open-Sora-Plan團隊與華為AI存儲計劃在多模態(tài)視頻理解和視頻生成場景共同研究KV-Cache以查換算技術。

　　12月10日，OpenAI在距其首次發(fā)布號稱“世界模擬器”的視頻生成模型Sora十個月之后，全新發(fā)布正式版Sora Turbo，新版本速度和性能都勝過Sora，用戶不僅可以通過文字提示生成視頻，還能將靜態(tài)圖片轉化為動態(tài)視頻，甚至可以對現(xiàn)有視頻進行創(chuàng)意改編。但Sora的閉源路線，使得“Open AI”變成“Closed AI”，國內學術界和科研機構紛紛開始思考如何復現(xiàn)Sora，從而在視頻生成領域也能占有一席之地。

微信圖片_20241212101739.png 　　其中由北大-兔展AIGC聯(lián)合實驗室共同發(fā)起的Open-Sora-Plan，旨在復現(xiàn)一個“開源版Sora”，目的是通過開源版Sora來推動視頻生成技術的發(fā)展，為開源社區(qū)提供一個Sora模型，用于科研和創(chuàng)作，讓全世界的開發(fā)者都能參與進來。自2024年3月1日正式公開以來，最新發(fā)布的Open-Sora-Plan v1.3.0版本引入了五大新特性：性能更強、成本更低的WFVAE;Prompt refiner;高質量數(shù)據(jù)清洗策略;引入了全新稀疏注意力模塊DiT;以及采用動態(tài)分辨率、支持動態(tài)時長的訓練策略，取得了顯著成果。Open-Sora-Plan也是北京大學鯤鵬昇騰科教創(chuàng)新卓越中心支撐的項目之一。

　　NLP到Sora多模態(tài)，數(shù)據(jù)量千倍增加，讀取帶寬百倍增加，AI數(shù)據(jù)處理復雜度指數(shù)級增長，這為AI存儲帶來了新機會。北大Open-Sora-Plan團隊在使用華為AI存儲過程中，針對數(shù)據(jù)處理、訓練、推理業(yè)務全流程與華為數(shù)據(jù)存儲團隊開展聯(lián)合創(chuàng)新，達成多個技術改進點：

　　1、數(shù)據(jù)清洗階段-以存代算：多模態(tài)數(shù)據(jù)處理算子下移節(jié)省數(shù)據(jù)處理時長。華為AI存儲通過美學評估、光流估計、圖文過濾算子等多模態(tài)數(shù)據(jù)處理算子下移，并做到場景域模態(tài)補齊無感知，將原始數(shù)據(jù)提前轉化成訓練數(shù)據(jù)，節(jié)省數(shù)據(jù)處理的時長。另外華為AI存儲數(shù)據(jù)智能冷熱分級能力既解決了數(shù)據(jù)清洗過程中數(shù)據(jù)膨脹數(shù)十倍帶來的存不下問題，又滿足了性能要求，性價比10倍提升。

　　2、訓練階段-以存強算：“模態(tài)-處理-編碼”感知的自適應加載優(yōu)化提升訓練效率。當前業(yè)界多模態(tài)訓練數(shù)據(jù)加載時未考慮多模態(tài)特性，且對編碼后的數(shù)據(jù)未高效復用，而是每輪訓練重復處理和計算，造成算力浪費。華為AI存儲通過將編碼后的數(shù)據(jù)特征值寫入存儲并高效復用，消除重復計算，優(yōu)化Batch分布，提升shuffle效率，訓練效率提升大于10%。

　　3、推理階段-以查換算：通過KV-Cache復用，減少重計算，提高長視頻理解的性能和精度，提升視頻生成效率。面向未來，Open-Sora-Plan團隊與華為AI存儲計劃在多模態(tài)視頻理解和視頻生成場景共同研究KV-Cache以查換算技術。在長視頻理解場景，無法將所有幀的表征同時喂給大模型，直接抽幀又會造成重要信息丟失，可考慮構建Visual Memory Bank提前對長視頻所有幀的表征建庫并統(tǒng)一管理，為以查換算提供了可能。多模態(tài)問答場景，用戶問題僅聚焦于部分內容中，因此可通過多模態(tài)注意力檢索取出相關表征，避免冗余信息的干擾，實現(xiàn)對關鍵幀和關鍵token的選擇，降低多模型序列長度75%，實現(xiàn)多模態(tài)KV-Cache以查換算。

免責聲明：本站所使用的字體和圖片文字等素材部分來源于互聯(lián)網共享平臺。如使用任何字體和圖片文字有冒犯其版權所有方的，皆為無意。如您是字體廠商、圖片文字廠商等版權方，且不允許本站使用您的字體和圖片文字等素材，請聯(lián)系我們，本站核實后將立即刪除！任何版權方從未通知聯(lián)系本站管理者停止使用，并索要賠償或上訴法院的，均視為新型網絡碰瓷及敲詐勒索，將不予任何的法律和經濟賠償！敬請諒解！

參與評論

回復：

0/300

文明上網理性發(fā)言，評論區(qū)僅供其表達個人看法，并不表明a&s觀點。

0

推薦專題

熱門排行

關于我們

a&s傳媒是全球知名展覽公司法蘭克福展覽集團旗下的專業(yè)媒體平臺，自1994年品牌成立以來，一直專注于安全&自動化產業(yè)前沿產品、技術及市場趨勢的專業(yè)媒體傳播和品牌服務。從安全管理到產業(yè)數(shù)字化，a&s傳媒擁有首屈一指的國際行業(yè)展覽會資源以及豐富的媒體經驗，提供媒體、活動、展會等整合營銷服務。

全球網站
法蘭克福
asmag.com
asmag.com.cn
中國臺灣智慧安防網

免責聲明：本站所使用的字體和圖片文字等素材部分來源于互聯(lián)網共享平臺。如使用任何字體和圖片文字有冒犯其版權所有方的，皆為無意。如您是字體廠商、圖片文字廠商等版權方，且不允許本站使用您的字體和圖片文字等素材，請聯(lián)系我們，本站核實后將立即刪除！任何版權方從未通知聯(lián)系本站管理者停止使用，并索要賠償或上訴法院的，均視為新型網絡碰瓷及敲詐勒索，將不予任何的法律和經濟賠償！敬請諒解！

粵公網安備 44030402000264號

用戶
反饋

中文字幕日韩一区二区不卡,亚洲av永久无码精品天堂动漫,亚洲av无码国产精品麻豆天美,最新版天堂中文在线,中文字幕视频在线看

華為AI存儲加速多模態(tài)大模型進化，助力Open-Sora-Plan復現(xiàn)Sora

華為AI存儲加速多模態(tài)大模型進化，助力Open-Sora-Plan復現(xiàn)Sora