国产成人超清在线视频,国产高清永久免费,国产最新超碰97上传无码,超碰国产人人草人人爽

以科技創(chuàng)新推動產(chǎn)業(yè)創(chuàng)新專題 | 5倍提升!ShortDF突破多模態(tài)模型質(zhì)、效困局

模型
  • 網(wǎng)絡(luò)
  • 2025-09-23 21:23

當前文生圖、文生視頻等生成式人工智能技術(shù)正得到越來越廣泛的應(yīng)用,但在一些嚴肅場景中,生成速度和生成質(zhì)量難以兼顧的矛盾也尤為突出。例如:在服裝設(shè)計領(lǐng)域,快速生成的服裝圖案經(jīng)常出現(xiàn)細節(jié)模糊或邏輯錯誤,如拉鏈不對稱、印花扭曲,無法滿足專業(yè)設(shè)計的精準要求;在電商視頻創(chuàng)作中,加速生成的商品展示視頻容易出現(xiàn)畫面閃爍、物體變形等問題,嚴重影響品牌形象和消費者觀感。

針對這一痛點,中國聯(lián)通數(shù)據(jù)科學與人工智能研究院聚力攻關(guān)并實現(xiàn)了突破:提出模型推理加速方案ShortDF,突破多模態(tài)模型生成效率與質(zhì)量瓶頸,并賦能多場景應(yīng)用。

“質(zhì)”&“效”困局

當前主流的多模態(tài)生成模型(文生圖/文生視頻模型)大多以擴散模型為基礎(chǔ),通過在訓練過程中給清晰的圖像/視頻添加隨機噪聲,再運用反向去噪規(guī)律,實現(xiàn)從指令文本到匹配圖像/視頻的生成。

通俗來講就是:先教會模型“畫面/視頻怎么由正常變混亂”,學習并記住這個過程,然后模型便可照此規(guī)律按指令文本“把混亂畫面/視頻變正常”。其中的去噪過程作為關(guān)鍵核心,可以理解為:從全是噪音的起點出發(fā),按照順序經(jīng)過1000個路口,每個路口都要執(zhí)行相應(yīng)的去噪指令才能實現(xiàn)整體的生成效果。在這個過程中,如何選擇路徑?jīng)Q定了生成效率和質(zhì)量。

現(xiàn)有的路徑選擇方法主要分為兩類:● 馬爾科夫鏈式方法(如DDPM,Denoising Diffusion Models),即按照規(guī)定路線循規(guī)蹈矩走完所有路口(通常1000個左右),雖然穩(wěn)妥但耗時長,生成效率較低?!?人工跳步式方法(如DDIM,Denoising Diffusion Implicit Models),憑借經(jīng)驗人為設(shè)定抄近道僅走少量路口(通常15個左右)從而實現(xiàn)效率提升,但因為路徑缺乏自適應(yīng)性,容易發(fā)生圖像模糊或形變等問題。

2025092317031901.001.jpeg

(ShortDF與傳統(tǒng)方案的對比)

ShortDF創(chuàng)出新解法

中國聯(lián)通數(shù)據(jù)科學與人工智能研究院提出了一種創(chuàng)新方法——ShortDF(Shortest path optimizing in Denoising Diffusion model去噪擴散模型最短路徑優(yōu)化),可在路徑圖中找到合適路徑,并做路徑壓縮。直觀來說,就像具備會進化的“智能導航”,不再固定走完所有步驟,也不預(yù)設(shè)定走哪些步驟,而是動態(tài)選擇最優(yōu)路徑并做路徑壓縮,讓一步抵多步,從而實現(xiàn)效率和質(zhì)量的權(quán)衡。

2025092317031901.002.jpeg

(ShortDF方法原理)

提升5倍!保質(zhì)又提效

ShortDF在多個業(yè)界主流基準數(shù)據(jù)集上均取得了顯著性能提升,其中在CIFAR-10數(shù)據(jù)集上的表現(xiàn)尤為突出:原本需要10步生成的DDIM圖像,ShortDF僅用2步即可完成,實現(xiàn)了約5倍的速度提升,同時圖像清晰度(FID指標)提升18.5%,對比如下所示:

2025092317031901.003.jpeg

(ShortDF與現(xiàn)有方法結(jié)果對比)

這些實驗結(jié)果驗證了ShortDF在多模態(tài)生成任務(wù)的高效推理能力,實現(xiàn)了在保證生成質(zhì)量的前提下推理速度的大幅度提升。憑借這一突破性成果,ShortDF入選CVPR 2025的Highlight論文(全球超1萬篇投稿中僅2.97%入選),獲得國際人工智能學術(shù)界的高度認可,相關(guān)論文及代碼已開源:[Github:UnicomAI/ShortDF](https://github.com/UnicomAI/ShortDF)。

以科技創(chuàng)新推動產(chǎn)業(yè)創(chuàng)新

目前,ShortDF技術(shù)已在多種內(nèi)容生成場景中應(yīng)用,包括“中華器靈”角色生成平臺中的古代文物活化生成、“智衣衿”文創(chuàng)一體機中的漢服人物形象生成、“衣影”平臺中的服裝款式設(shè)計生成等,有效確保了生成質(zhì)量的同時提升了生成效率,優(yōu)化了用戶體驗。ShortDF針對擴散類模型具備通用性,應(yīng)用空間廣泛,適用于文生圖、文生視頻、圖像及視頻編輯等多種功能場景。

2025092317031901.004.jpeg

(漢服人物形象生成)

2025092317031901.005.jpeg

(服裝款式設(shè)計生成)

2025092317031901.006.jpeg

(文物活化生成)

未來,中國聯(lián)通數(shù)據(jù)科學與人工智能研究院將繼續(xù)推動多模態(tài)生成技術(shù)的優(yōu)化與創(chuàng)新,解決模型產(chǎn)業(yè)化落地的“最后一公里”問題,讓高效高質(zhì)的AI生成技術(shù)在文創(chuàng)、工業(yè)、教育、醫(yī)療等更多領(lǐng)域得到更廣泛和深入的應(yīng)用。讓人工智能惠及更多個人及企業(yè),推動人工智能+規(guī)?;l(fā)展。

來源:網(wǎng)絡(luò)

作者:

編輯:leilei

圖片來源:

本文鏈接: http://givenhand.cn/article/20250923/1926.html

  • 創(chuàng)新
  • 產(chǎn)業(yè)
免責聲明:本網(wǎng)站出于傳播商業(yè)信息之目的進行轉(zhuǎn)載發(fā)布,不代表 AIUST.Com 立場。本文所涉文、圖、音視頻等資料之一切權(quán)利和法律責任歸提供方所有和承擔。本網(wǎng)站對文中的圖文等所有信息的真實性不作任何保證或承諾,請讀者僅作參考,并自行核實相關(guān)內(nèi)容。本網(wǎng)站的任何內(nèi)容僅供參考,不能做為投資、采購或行為決策依據(jù),據(jù)此操作者風險自擔。

相關(guān)文章

資訊

原創(chuàng)

薦讀

  • 5G+AR加持 晨星機器人掀起“智能化+人機交互”制造新趨勢 5G+AR加持 晨星機器人掀起“智能化+人機交互”制造新趨勢

    2021世界制造業(yè)大會于11月22日在合肥落下帷幕。為期四天的大會中,作為向世界展示智能制造全面能力的窗口,聯(lián)想展示了一系列讓人驚喜的創(chuàng)新產(chǎn)品?,F(xiàn)場展示的ThinkPad X1 Fold整體重量僅有1公斤,折疊起來之后的厚度大約為24毫米。當保持半開狀態(tài)時,可以像拿本書一樣握住,并且能同時運行兩個應(yīng)用程序。使用固定在中間的鍵盤之后,瞬間變...

  • 智能手機競爭中失敗,日本在聯(lián)網(wǎng)汽車領(lǐng)域舉步維艱 智能手機競爭中失敗,日本在聯(lián)網(wǎng)汽車領(lǐng)域舉步維艱

    據(jù)外媒報道,在制造帶有數(shù)字聯(lián)網(wǎng)服務(wù)的汽車的競爭中,豐田汽車和日產(chǎn)汽車面臨著被本土市場拖累的風險。與美國和歐洲的汽車消費者不同的是,日本消費者不愿意為這些聯(lián)網(wǎng)功能和服務(wù)買單。結(jié)果就是:日本只有10%的汽車...

  • 2020年河南省將推廣應(yīng)用3萬臺工業(yè)機器人 2020年河南省將推廣應(yīng)用3萬臺工業(yè)機器人

    到2020年,推廣應(yīng)用3萬臺工業(yè)機器人,建設(shè)1000條智能生產(chǎn)線、300個智能車間、150個智能工廠……4月16日,在2018兩岸智能裝備制造鄭州論壇上,河南省工信委發(fā)布了《2017年河南省智能制造白皮書》,河南智能制造的2020...

熱門標簽