久久人妻免费公开视频 ,国产成人久久精品二区三区

<wbr id="gwwga"></wbr>

搜索

APP

起點(diǎn)課堂會(huì)員權(quán)益

職業(yè)體系課特權(quán)

線下行業(yè)大會(huì)特權(quán)

個(gè)人IP打造特權(quán)

30+門(mén)專項(xiàng)技能課

1300+專題課程

12場(chǎng)職場(chǎng)軟技能直播

12場(chǎng)求職輔導(dǎo)直播

12場(chǎng)專業(yè)技能直播

會(huì)員專屬社群

榮耀標(biāo)識(shí)

開(kāi)通會(huì)員

發(fā)布

注冊(cè) | 登錄

Pika聯(lián)創(chuàng)參與新研究：Diffusion能搶GPT的活了！成功挑戰(zhàn)自回歸文本范式

量子位

2024-04-17

0 評(píng)論 473 瀏覽 0 收藏

🔗 B端产品经理需要进行售前演示、方案定制、合同签订等，而C端产品经理需要进行活动策划、内容运营、用户激励等

自回歸模型和擴(kuò)散模型的“專長(zhǎng)”并不同，如果讓后者去挑戰(zhàn)前者所擅長(zhǎng)的部分，會(huì)得到怎樣的結(jié)果？不妨來(lái)看看本文的分享。

縱觀生成式AI領(lǐng)域中的兩個(gè)主導(dǎo)者：自回歸和擴(kuò)散模型。

一個(gè)專攻文本等離散數(shù)據(jù)，一個(gè)長(zhǎng)于圖像等連續(xù)數(shù)據(jù)。

如果，我們讓后者來(lái)挑戰(zhàn)前者的主場(chǎng)，它能行嗎？

斯坦福博士的最新研究，就搞了這么一個(gè)擴(kuò)散模型VS自回歸模的同臺(tái)PK。

結(jié)果：

挑戰(zhàn)成功?。ㄏ旅鏋樯墒疽鈭D，最后得到的文本是“Hello world，Iam a languagediffusionmodel，namedSEDD”）

并且他們的擴(kuò)散模型在困惑度和質(zhì)量上已率先超越自回歸的GPT-2。

趕緊來(lái)瞧瞧。

一、擴(kuò)散模型挑戰(zhàn)離散數(shù)據(jù)

用自回歸來(lái)處理離散文本數(shù)據(jù)，即根據(jù)之前的token來(lái)預(yù)測(cè)下一個(gè)token，這可能是目前我們能想象到的最簡(jiǎn)單可行的方法。

為什么這么說(shuō)？

B 端产品经理如何快速成长？

产品与业务架构主要是将整个业务工作流进行分层，梳理，然后抽象出一个个需求，将业务需求与产品合情合理的映射起来，最终使业务数据在产品中流动，执行，记录，使用。

查看详情 >

作者在這里用GAN舉了個(gè)例子：

對(duì)于圖像生成，GAN首先根據(jù)隨機(jī)噪聲生成圖像，然后使用判別器來(lái)“懲罰”偏差，因此梯度信息可以反向傳播到生成器。

但如果我們假設(shè)用GAN來(lái)生成文本，就行不通了。

因?yàn)楸M管我們可以定義同樣原理的生成器和判別器，但文本的離散性質(zhì)使得更新生成器非常難。

（圖像是連續(xù)的，因此可以通過(guò)反向傳播來(lái)計(jì)算梯度，但文本是一堆無(wú)法區(qū)分的離散值，計(jì)算梯度信號(hào)相當(dāng)繁瑣，基本只能粗略估計(jì)）

所以說(shuō)，文本建模領(lǐng)域基本成了自回歸的天下（如transformer的發(fā)揚(yáng)光大就是基于自回歸模型）。

不過(guò)，這個(gè)架構(gòu)也有根本性的缺陷：

最有名的“批評(píng)”來(lái)自Lecun，他就認(rèn)為自回歸transformer“注定要失敗”，因?yàn)樯蓵?huì)“偏離”數(shù)據(jù)分布并導(dǎo)致模型在采樣過(guò)程中發(fā)散。

除此之外，自回歸架構(gòu)的采樣也具有高度迭代性，這對(duì)為并行計(jì)算而高度優(yōu)化的GPU來(lái)說(shuō)也不夠match。

最后，由于這類架構(gòu)的模型都是按照從左往右地完成任務(wù)，因此一次執(zhí)行多個(gè)控制任務(wù)也很困難（例如補(bǔ)充給定了前綴和后綴的文本）。

正是這些缺點(diǎn)促使作者開(kāi)始構(gòu)思另一種概率模型，因此有了本文的主角：

分?jǐn)?shù)熵離散擴(kuò)散模型（SEDD，Score Entropy Discrete Diffusion）。

簡(jiǎn)單來(lái)說(shuō)，為了將擴(kuò)散模型擴(kuò)展到離散空間，就必須將“分?jǐn)?shù)函數(shù)”（也就是對(duì)數(shù)概率的梯度）概念推廣到離散空間。

幸運(yùn)的是，有一種替代方案可以呈現(xiàn)具體分?jǐn)?shù)，即概率的局部比率。

如下圖所示，左邊為分?jǐn)?shù)函數(shù)，它直觀地“指向”連續(xù)空間中的較高密度區(qū)域，具體分?jǐn)?shù)（右）將其推廣到離散空間。

這些具體的比率（分?jǐn)?shù)）可以通過(guò)得分熵（score entropy）損失函數(shù)來(lái)學(xué)習(xí)，從而實(shí)現(xiàn)離散擴(kuò)散模型的快速、可擴(kuò)展訓(xùn)練。

在這之中，由于作者只知道可以使用得分熵從數(shù)據(jù)中學(xué)習(xí)具體得分（對(duì)應(yīng)于學(xué)習(xí)概率模型），但仍然不知道如何生成樣本。

因此還借用了擴(kuò)散模型的核心思想，并使用學(xué)習(xí)到的具體分?jǐn)?shù)將隨機(jī)值迭代地去噪為數(shù)據(jù)點(diǎn)。

為此，他們還定義了向離散文本樣本中“添加噪聲”的含義：

對(duì)于連續(xù)空間，這是通過(guò)添加高斯噪聲自然產(chǎn)生的，但在離散空間中，則是被迫直接在不同元素之間“跳躍”。

而最終，他們的SEDD模型通過(guò)學(xué)習(xí)將樣本不斷迭代去噪為文本，完成從純隨機(jī)輸入生成文本的任務(wù)。

二、超越GPT-2

總的來(lái)看，與自回歸模型相比，該擴(kuò)散模型可以在生成過(guò)程中利用完整的全局上下文，從而獲得更好的整體生成效果。

對(duì)比起來(lái)，自回歸模型特別是像GPT-2這樣的會(huì)發(fā)生“漂移”現(xiàn)象，從而破壞整體性能的穩(wěn)定性。

并且即使在較小的模型規(guī)模下，SEDD也能始終生成高質(zhì)量的文本（綠框，讀者很通順），而GPT-2就比較困難（紅框，一眼看上去就很多錯(cuò)誤）。

具體測(cè)試中，SEDD在困惑度指標(biāo)上表現(xiàn)出了很強(qiáng)的競(jìng)爭(zhēng)力：

此外，作者還發(fā)現(xiàn)：

使用更少的采樣步驟，SEDD照樣在控制生成質(zhì)量上的表現(xiàn)也比GPT-2要好。

最后，團(tuán)隊(duì)以完全零樣本的方式從任意位置提示SEDD后發(fā)現(xiàn)：對(duì)于標(biāo)準(zhǔn)（從左到右）和非標(biāo)準(zhǔn)（填充）提示方法，SEDD都可以與最好的GPT-2解碼方法一較高下。

如下圖所示：

提示標(biāo)記以藍(lán)色表示，不管它在前面中間還是結(jié)尾，SEDD都能夠生成有意義的文本。

三、Pika創(chuàng)始人是作者之一

本研究一共3位作者：

一作為斯坦福計(jì)算機(jī)專業(yè)博士生Aaron Lou，康奈爾本科畢業(yè)。

二作也是該校博士生Chenlin Meng。

她的名字不算陌生，Pika就是她（下圖右）和“學(xué)妹”郭文景一起創(chuàng)辦的。（Meng 2020年入學(xué)斯坦福，郭2021年入學(xué)）

看起來(lái)，一邊創(chuàng)業(yè)的她也一邊兼顧著學(xué)業(yè)。

最后，通訊作者為一二作的導(dǎo)師Stefano Ermon，他是斯坦福計(jì)算機(jī)科學(xué)系副教授。

論文地址：https://arxiv.org/abs/2310.16834

參考鏈接：

https://aaronlou.com/blog/2024/discrete-diffusion/

https://twitter.com/aaron_lou/status/1763242384958386306?s=20

作者：豐色發(fā)自凹非寺

來(lái)源公眾號(hào)：量子位（ID：QbitAI），追蹤人工智能新趨勢(shì)，關(guān)注科技行業(yè)新突破

本文由人人都是產(chǎn)品經(jīng)理合作媒體 @量子位授權(quán)發(fā)布，未經(jīng)許可，禁止轉(zhuǎn)載。

題圖來(lái)自 Unsplash，基于CC0協(xié)議

該文觀點(diǎn)僅代表作者本人，人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。

更多精彩內(nèi)容，請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App

量子位

追蹤人工智能新趨勢(shì)，關(guān)注科技行業(yè)新突破

74篇作品 199448總閱讀量

蘋(píng)果沒(méi)有對(duì)手：Vision Pro提供的不是一個(gè)殺手級(jí)應(yīng)用，而是一個(gè)殺手級(jí)平臺(tái)

06-271519 瀏覽

與瑞幸合作，茅臺(tái)圖什么？很多分析都沒(méi)說(shuō)到點(diǎn)子上

09-12923 瀏覽

UI转产品，涨薪30%，只需90天：我的成功之路

刚刚

如何從產(chǎn)品經(jīng)理招聘信息中挖掘關(guān)鍵信息？

07-265328 瀏覽

社區(qū)圖書(shū)館，收留了年輕人的詩(shī)與遠(yuǎn)方

08-073968 瀏覽

酷狗概念版、豆瓣FM、波點(diǎn)音樂(lè)……哪個(gè)小眾音樂(lè)APP最好聽(tīng)？

06-056831 瀏覽

評(píng)論

目前還沒(méi)評(píng)論，等你發(fā)揮！

成功跳槽，我告诉你3年的B端产品应该是这样的

专题

43217人已学习18篇文章

区块链，如何影响我们的世界

继蒸汽机、电力、互联网之后，区块链很可能是下一代颠覆性的核心技术。

专题

14397人已学习13篇文章

了解货运平台

互联网IT技术与产业的结合，衍生出了许多生命力强大的平台经济，货运领域就是如此衍生而来的。本专题的文章帮助大家了解货运平台。

专题

20243人已学习19篇文章

后台权限管理设计指南

好的权限系统可以明确公司内不同人员、不同部门的分工，便于管理等优势。本专题的文章提供了后台权限管理设计指南。

专题

37459人已学习23篇文章

电商运营的玩法你知多少？

不知道这些问题，你出去都不敢说自己是做电商运营的。

用户留存：用户运营基本功之一

Sora产品的爆火，给了我们不少的震撼，感叹AI在内容创作领域的进步实在是太快了。本专题的文章分享了对于Sora的解读和思考。

Pika聯(lián)創(chuàng)參與新研究：Diffusion能搶GPT的活了！成功挑戰(zhàn)自回歸文本范式

一、擴(kuò)散模型挑戰(zhàn)離散數(shù)據(jù)

二、超越GPT-2

三、Pika創(chuàng)始人是作者之一

Pika聯(lián)創(chuàng)參與新研究：Diffusion能搶GPT的活了！成功挑戰(zhàn)自回歸文本范式

一、擴(kuò)散模型挑戰(zhàn)離散數(shù)據(jù)

三、Pika創(chuàng)始人是作者之一