国产成人超清在线视频,国产高清永久免费,国产最新超碰97上传无码,超碰国产人人草人人爽

【MM2024】阿里云 PAI 團(tuán)隊(duì)圖像編輯算法論文入選 MM2024?

學(xué)習(xí)
  • 廠商稿件
  • 2024-10-15 19:28

近期,阿里云人工智能平臺(tái) PAI 團(tuán)隊(duì)發(fā)表的圖像編輯算法論文在 MM2024 上正式亮相發(fā)表。ACM MM(ACM國(guó)際多媒體會(huì)議)是國(guó)際多媒體領(lǐng)域的頂級(jí)會(huì)議,旨在為研究人員、工程師和行業(yè)專家提供一個(gè)交流平臺(tái),以展示在多媒體領(lǐng)域的最新研究成果、技術(shù)進(jìn)展和應(yīng)用案例。其主題涵蓋了圖像處理、視頻分析、音頻處理、社交媒體和多媒體系統(tǒng)等廣泛領(lǐng)域。此次入選標(biāo)志著阿里云人工智能平臺(tái) PAI 在圖像編輯算法方面的研究獲得了學(xué)術(shù)界的充分認(rèn)可。

文本到圖像合成 (TIS) 已成為計(jì)算機(jī)視覺與自然語(yǔ)言處理 (NLP) 交叉領(lǐng)域的重要前沿,其能夠根據(jù)文本描述生成視覺上引人注目的圖像?;谖谋疽龑?dǎo)的圖像編輯任務(wù)使用戶能夠通過(guò)簡(jiǎn)單的文字描述來(lái)指導(dǎo)圖像的修改,無(wú)需使用復(fù)雜的圖像編輯軟件或具備專業(yè)知識(shí)即可實(shí)現(xiàn)編輯效果。其中 Traing-free 的文本引導(dǎo)圖像編輯 (TIE) 已成為一個(gè)重要的研究方向,利用預(yù)訓(xùn)練的 TIS 模型,直接通過(guò)文本提示來(lái)編輯圖像,用戶可以直接輸入文本,對(duì)圖像進(jìn)行多種編輯操作,包括顏色變化、物體的添加或去除、風(fēng)格轉(zhuǎn)換等。這種交互式編輯方式顯著降低了圖像編輯的門檻,使得創(chuàng)意表達(dá)變得更加便捷和個(gè)性化。

盡管當(dāng)前的 TIE 算法取得了顯著進(jìn)展,但它們?nèi)源嬖谝恍┚窒扌浴H鐖D1所示,現(xiàn)有 TIE 方法在編輯多個(gè)對(duì)象時(shí)面臨挑戰(zhàn)。多對(duì)象編輯的復(fù)雜性會(huì)導(dǎo)致編輯對(duì)象丟失(例如,丟失一個(gè)蘋果)、屬性缺失(例如,斑點(diǎn))和背景保留不完整等問(wèn)題。

2024101511491530.001.jpg

圖1. 圖像編輯的效果對(duì)比以及我們提出方法的結(jié)果

在本文中,我們提出了 VICTORIA 編輯算法,它利用語(yǔ)言知識(shí)來(lái)解決在對(duì)象場(chǎng)景編輯中因缺失目標(biāo)(如對(duì)象、屬性和背景)而導(dǎo)致的問(wèn)題。VICTORIA 通過(guò)分析輸入編輯文本中單詞之間的依存關(guān)系,并將這種關(guān)系反映在注意層的中間表示中,從而修正并生成目標(biāo)圖像。圖2展示了 VICTORIA 的整體框架。首先,我們通過(guò)控制自注意機(jī)制來(lái)確保原始圖像和編輯后圖像之間的空間一致性。其次,VICTORIA 分析輸入編輯文本中單詞之間的依存關(guān)系,并在生成目標(biāo)編輯圖像的過(guò)程中主動(dòng)干預(yù)交叉注意力圖,從而提升目標(biāo)編輯區(qū)域的生成結(jié)果。最后,VICTORIA 通過(guò)交叉注意圖進(jìn)行圖像部分掩碼,有效保留原始圖像中無(wú)需被編輯的區(qū)域。

2024101511491530.002.jpg

圖 2:VICTORIA 在對(duì)圖像進(jìn)行編輯的過(guò)程示意圖

VICTORIA 偽代碼如下:

2024101511491530.003.jpg

圖 3:VICTORIA 在合成圖像編輯和真實(shí)圖像編輯場(chǎng)景下的偽代碼

圖4展示了 VICTORIA 的編輯結(jié)果,它成功地修改了原始圖像中多個(gè)物體的各種屬性、風(fēng)格、場(chǎng)景和類別。

2024101511491530.004.jpg

圖 4:VICTORIA編輯結(jié)果示例

圖5對(duì)比展示了 VICTORIA 與其他一些 SOTA 圖像編輯技術(shù)的效果。無(wú)論是對(duì)真實(shí)照片還是合成圖像,VICTORIA 均展現(xiàn)出了高效的編輯能力。在所有的案例中,VICTORIA 都能夠?qū)崿F(xiàn)與描述提示高度一致的精細(xì)編輯,同時(shí)最大限度地保留了原圖的結(jié)構(gòu)細(xì)節(jié)。

2024101511491530.005.jpg

圖 5:VICTORIA與其他編輯方法的對(duì)比

為了更好地服務(wù)開源社區(qū),這一算法的源代碼已經(jīng)貢獻(xiàn)在自然語(yǔ)言處理算法框架 EasyNLP 中,歡迎各界從業(yè)人員和研究者使用。

阿里云人工智能平臺(tái) PAI 長(zhǎng)期招聘正式員工/實(shí)習(xí)生。團(tuán)隊(duì)專注于深度學(xué)習(xí)算法研究與應(yīng)用,重點(diǎn)聚焦大語(yǔ)言模型和多模態(tài) AIGC 大模型的應(yīng)用算法研究和應(yīng)用。簡(jiǎn)歷投遞和咨詢:chengyu.wcy@alibaba-inc.com。

論文信息

論文名字:Attentive Linguistic Tracking in Diffusion Models for Training-free Text-guided Image Editing

論文作者:劉冰雁、汪誠(chéng)愚、黃俊、賈奎

論文pdf鏈接:https://openreview.net/pdf?id=efTur2naAS


來(lái)源:廠商稿件

作者:投稿

編輯:leilei

圖片來(lái)源:

本文鏈接: http://givenhand.cn/article/20241015/1740.html

  • 算法
免責(zé)聲明:本網(wǎng)站出于傳播商業(yè)信息之目的進(jìn)行轉(zhuǎn)載發(fā)布,不代表 AIUST.Com 立場(chǎng)。本文所涉文、圖、音視頻等資料之一切權(quán)利和法律責(zé)任歸提供方所有和承擔(dān)。本網(wǎng)站對(duì)文中的圖文等所有信息的真實(shí)性不作任何保證或承諾,請(qǐng)讀者僅作參考,并自行核實(shí)相關(guān)內(nèi)容。本網(wǎng)站的任何內(nèi)容僅供參考,不能做為投資、采購(gòu)或行為決策依據(jù),據(jù)此操作者風(fēng)險(xiǎn)自擔(dān)。

相關(guān)文章

資訊

原創(chuàng)

薦讀

  • 5G+AR加持 晨星機(jī)器人掀起“智能化+人機(jī)交互”制造新趨勢(shì) 5G+AR加持 晨星機(jī)器人掀起“智能化+人機(jī)交互”制造新趨勢(shì)

    2021世界制造業(yè)大會(huì)于11月22日在合肥落下帷幕。為期四天的大會(huì)中,作為向世界展示智能制造全面能力的窗口,聯(lián)想展示了一系列讓人驚喜的創(chuàng)新產(chǎn)品。現(xiàn)場(chǎng)展示的ThinkPad X1 Fold整體重量?jī)H有1公斤,折疊起來(lái)之后的厚度大約為24毫米。當(dāng)保持半開狀態(tài)時(shí),可以像拿本書一樣握住,并且能同時(shí)運(yùn)行兩個(gè)應(yīng)用程序。使用固定在中間的鍵盤之后,瞬間變...

  • 智能手機(jī)競(jìng)爭(zhēng)中失敗,日本在聯(lián)網(wǎng)汽車領(lǐng)域舉步維艱 智能手機(jī)競(jìng)爭(zhēng)中失敗,日本在聯(lián)網(wǎng)汽車領(lǐng)域舉步維艱

    據(jù)外媒報(bào)道,在制造帶有數(shù)字聯(lián)網(wǎng)服務(wù)的汽車的競(jìng)爭(zhēng)中,豐田汽車和日產(chǎn)汽車面臨著被本土市場(chǎng)拖累的風(fēng)險(xiǎn)。與美國(guó)和歐洲的汽車消費(fèi)者不同的是,日本消費(fèi)者不愿意為這些聯(lián)網(wǎng)功能和服務(wù)買單。結(jié)果就是:日本只有10%的汽車...

  • 2020年河南省將推廣應(yīng)用3萬(wàn)臺(tái)工業(yè)機(jī)器人 2020年河南省將推廣應(yīng)用3萬(wàn)臺(tái)工業(yè)機(jī)器人

    到2020年,推廣應(yīng)用3萬(wàn)臺(tái)工業(yè)機(jī)器人,建設(shè)1000條智能生產(chǎn)線、300個(gè)智能車間、150個(gè)智能工廠……4月16日,在2018兩岸智能裝備制造鄭州論壇上,河南省工信委發(fā)布了《2017年河南省智能制造白皮書》,河南智能制造的2020...

熱門標(biāo)簽