首頁(yè) >快訊 >

CoDi技術(shù)問(wèn)世:微軟實(shí)現(xiàn)任意模態(tài)內(nèi)容生成與對(duì)齊


(相關(guān)資料圖)

【ITBEAR科技資訊】7月11日消息,微軟最近宣布推出一項(xiàng)名為可組合擴(kuò)散模型(CoDi)的創(chuàng)新人工智能技術(shù),該模型旨在解決多模態(tài)內(nèi)容互動(dòng)和生成中的挑戰(zhàn)。

為了應(yīng)對(duì)傳統(tǒng)單一模態(tài)AI模型的限制,微軟的研究團(tuán)隊(duì)與北卡羅來(lái)納大學(xué)教堂山分校合作開(kāi)發(fā)了CoDi。與獨(dú)立生成的多模態(tài)信息流可能存在不一致和對(duì)齊問(wèn)題不同,CoDi采用了一種獨(dú)特的可組合生成策略,通過(guò)擴(kuò)散過(guò)程中的多模態(tài)對(duì)齊,生成相互交織的模式。

據(jù)ITBEAR科技資訊了解,這項(xiàng)創(chuàng)新技術(shù)的一個(gè)重要特點(diǎn)是CoDi能夠處理任意輸入模式并生成任意模態(tài)的內(nèi)容。無(wú)論是同步視頻和音頻,還是其他多模態(tài)數(shù)據(jù),CoDi都能有效地處理并生成一致、高質(zhì)量的結(jié)果。

CoDi作為Microsoft項(xiàng)目i-Code的一部分,旨在利用人工智能增強(qiáng)人機(jī)交互體驗(yàn)。該項(xiàng)目由Microsoft Azure認(rèn)知服務(wù)研究團(tuán)隊(duì)與北卡羅來(lái)納大學(xué)教堂山分校共同開(kāi)發(fā),致力于為用戶(hù)提供更豐富、多樣化的多模態(tài)內(nèi)容生成能力。

微軟的可組合擴(kuò)散模型(CoDi)引起了業(yè)界的廣泛關(guān)注。該技術(shù)的應(yīng)用前景廣闊,不僅能夠?yàn)樘摂M現(xiàn)實(shí)、增強(qiáng)現(xiàn)實(shí)等領(lǐng)域帶來(lái)更真實(shí)、沉浸式的體驗(yàn),還能在多媒體創(chuàng)作、內(nèi)容生成等領(lǐng)域發(fā)揮重要作用。

隨著人工智能技術(shù)的不斷發(fā)展,微軟的CoDi模型將為多模態(tài)內(nèi)容的互動(dòng)和生成帶來(lái)更多可能性,為用戶(hù)提供更豐富、創(chuàng)新的體驗(yàn)。未來(lái),我們可以期待看到CoDi在各個(gè)領(lǐng)域的應(yīng)用和進(jìn)一步發(fā)展。

關(guān)鍵詞:

責(zé)任編輯:Rex_11

推薦閱讀