用ChatGPT剽竊的罪,OpenAI要親手洗刷

0 評(píng)論 6208 瀏覽 7 收藏 14 分鐘

ChatGPT 的推出讓我們對(duì) AI 人工智能的能力有了進(jìn)一步的認(rèn)知,也有不少人動(dòng)起了腦筋,想用 ChatGPT 來(lái)幫自己“作弊”。而現(xiàn)在,OpenAI 推出了 AI 文本檢測(cè)器,用來(lái)辨別文本的實(shí)際編寫(xiě)主體。如何解讀這一動(dòng)作?一起來(lái)看作者的分析。

聊天機(jī)器人ChatGPT的利用價(jià)值迅速被人類(lèi)發(fā)掘:學(xué)生用它寫(xiě)作業(yè)、程序員讓它幫忙寫(xiě)代碼、新聞網(wǎng)站用它“水”文章……于是,學(xué)校不高興了,公司不高興了,創(chuàng)作者也不高興了。

如今,ChatGPT的“造物主”O(jiān)penAI親自出馬,要解決各方人士利用這個(gè)工具“作弊”的問(wèn)題。

2月1日,OpenAI宣布推出名為AI文本檢測(cè)器(AI Text Classifier)的新工具,來(lái)輔助辨別文本到底是人類(lèi)編寫(xiě)的,還是AI編寫(xiě)的。

目前,該工具已經(jīng)可以免費(fèi)試用。提交文本后,分類(lèi)器會(huì)生成評(píng)估結(jié)果,包括以下5種:非常不可能、不太可能、不確定、可能、非??赡埽ㄊ茿I生成的)。

不過(guò),這個(gè)AI文本分類(lèi)器離成熟還很遠(yuǎn)。不僅只能識(shí)別1000字符以下的文本,而且可靠性還有待提高。

一名AI研究員Sebastian Raschka用莎士比亞《麥克白》的第一章測(cè)試該工具,得到的評(píng)估結(jié)果是“非??赡堋笔茿I創(chuàng)作的。Sebastian 在推特有14萬(wàn)粉絲,他貼出截圖后評(píng)論區(qū)有人戲謔道:“電影靈感:ChatGPT是一個(gè)時(shí)空穿越者,實(shí)際上人類(lèi)的創(chuàng)作語(yǔ)言從一開(kāi)始就是由它影響?!?/p>

用ChatGPT剽竊的罪,OpenAI要親手洗刷

OpenAI其實(shí)對(duì)該工具的“不完美”也開(kāi)誠(chéng)布公,在網(wǎng)頁(yè)的說(shuō)明部分明確寫(xiě)著,根據(jù)他們的測(cè)試,只有約26%的AI生成文本識(shí)別為“非??赡堋?,還有9%的人類(lèi)創(chuàng)作會(huì)被誤判。OpenAI表示:“它仍然存在一些局限性,因此它應(yīng)該被作為確定文本來(lái)源的輔助工具,而非主要判定工具。”

與其說(shuō)“不完美”,不如說(shuō)這個(gè)工具還很初級(jí)。但即便如此OpenAI也迫不及待地將之發(fā)布,一方面是需要各方反饋完善工具,另一方面也是對(duì)ChatGPT引發(fā)的主要爭(zhēng)議的一種回應(yīng)。

我的罪,我自己先治了,姿態(tài)有時(shí)候比結(jié)果還重要。

01

ChatGPT已經(jīng)在美國(guó)教育界引起了廣泛的擔(dān)憂(yōu)。

美國(guó)的在線(xiàn)課程網(wǎng)站Study.com向1萬(wàn)名18歲以上的學(xué)生發(fā)起調(diào)查,詢(xún)問(wèn)他們使用ChatGPT的情況,結(jié)果竟然有89%的學(xué)生表示自己會(huì)使用ChatGPT完成作業(yè),還有48%的學(xué)生用它完成測(cè)驗(yàn),53%的學(xué)生用它寫(xiě)論文,22%的學(xué)生用它生成論文大綱。

即便是考慮到調(diào)查規(guī)模不大、樣本代表性不佳等問(wèn)題,這樣的比例依然令人震驚。

《紐約時(shí)報(bào)》曾報(bào)道一個(gè)例子。美國(guó)北密歇根大學(xué)教授安東尼·奧曼(Antony Aumann)在批改學(xué)生的世界宗教課作業(yè)的時(shí)候,看到一篇文章以罩袍禁令的道德影響為題,行文段落簡(jiǎn)潔,例子準(zhǔn)確,邏輯嚴(yán)密,在一眾作業(yè)中很出挑。

但是安東尼教授沒(méi)有直接給高分,他起了疑心。在教授的質(zhì)問(wèn)下,該學(xué)生向他承認(rèn),這篇文章其實(shí)是用ChatGPT生成的。

雖然教育界也有一種聲音,認(rèn)為應(yīng)當(dāng)將ChatGPT這樣的新工具納入到教學(xué)當(dāng)中,而不是千方百計(jì)抵制它。也的確有一些大學(xué)開(kāi)始這么做,支持的教育者認(rèn)為這就像是在數(shù)學(xué)課上使用計(jì)算器,如果能減輕學(xué)生負(fù)擔(dān),用用也沒(méi)問(wèn)題,這可以使他們有更多時(shí)間思考深層次的問(wèn)題。

但反對(duì)的聲音似乎更加響亮。

1月3日,以“擔(dān)心對(duì)學(xué)生學(xué)習(xí)的負(fù)面影響”以及“對(duì)內(nèi)容的安全性和準(zhǔn)確性的擔(dān)憂(yōu)”為由,紐約市頒布了ChatGPT禁令,不管是老師和學(xué)生,都不能通過(guò)公立學(xué)校的網(wǎng)絡(luò)和設(shè)備使用ChatGPT。

紐約市教育局發(fā)言人稱(chēng):雖然該工具能夠?yàn)閱?wèn)題提供快速簡(jiǎn)單的答案,但并不能培養(yǎng)批判性思維和解決問(wèn)題的能力,而這對(duì)學(xué)術(shù)成就和終生發(fā)展都至關(guān)重要。

這是一個(gè)強(qiáng)有力的信號(hào):紐約市擁有全美最大的公立學(xué)校系統(tǒng)。

OpenAI也察覺(jué)到了爭(zhēng)議的嚴(yán)重性,該公司CEO山姆·阿爾特曼(Sam Altman)曾提出要嘗試用水印標(biāo)記ChatGPT生成的內(nèi)容。即將信號(hào)嵌入到生成的文本中,人類(lèi)不能一眼看出,但是機(jī)器一驗(yàn)便知。

但在OpenAI還在提議時(shí),外界早已開(kāi)始行動(dòng),例如馬里蘭大學(xué)的幾位研究者已經(jīng)對(duì)語(yǔ)言模型輸出的水印進(jìn)行了深入研究。而如OpenAI新推出的工具那樣直接判斷文本是否為AI創(chuàng)作的第三方檢測(cè)工具也已經(jīng)流行多時(shí)。

02

一些大學(xué)已經(jīng)行動(dòng)起來(lái),包括斯坦福大學(xué)在內(nèi)的一些機(jī)構(gòu),聯(lián)合推出名為DetectGPT的工具,來(lái)辨別AI生成的文本。

而要說(shuō)第三方檢測(cè)工具中,最受歡迎是GPTZero。這個(gè)工具出自一位22歲的普林斯頓大學(xué)華裔學(xué)生愛(ài)德華(Edward Tian)之手,今年1月3日上線(xiàn),一周內(nèi)就有超過(guò)3萬(wàn)人使用,一度導(dǎo)致程序崩潰。而推特上的演示視頻,更是吸引了超過(guò)700萬(wàn)人次的觀看。

用ChatGPT剽竊的罪,OpenAI要親手洗刷

近日,愛(ài)德華又發(fā)布了迭代版本GPTZeroX,升級(jí)的最大特點(diǎn)是可以識(shí)別“人類(lèi)+AI”混寫(xiě)的文本,檢測(cè)出來(lái)后由ChatGPT生成的內(nèi)容會(huì)被黃色高亮標(biāo)記出來(lái)。

而且GPTZeroX還可以批量導(dǎo)入文件,支持word、PDF和TXT等格式。這對(duì)于教師來(lái)說(shuō)是一個(gè)很實(shí)用的功能,畢竟學(xué)生的作業(yè)動(dòng)輒就是幾十份。

GPTZero上線(xiàn)一天之內(nèi),已經(jīng)涌進(jìn)了40萬(wàn)訪(fǎng)問(wèn)量,收到了220萬(wàn)次服務(wù)請(qǐng)求。

愛(ài)德華表達(dá)了對(duì)教育工作者的支持,他曾在推特上表示:我承諾,本網(wǎng)站對(duì)個(gè)體教師和教育工作者保持免費(fèi)。

除了教育領(lǐng)域以外,ChatGPT還帶來(lái)了其他的困擾。和“學(xué)術(shù)欺詐”類(lèi)似的,已經(jīng)有不少程序員利用ChatGPT寫(xiě)代碼。

此前已經(jīng)有人在網(wǎng)上發(fā)帖稱(chēng),作為初級(jí)程序員經(jīng)常使用ChatGPT,但是近期突然發(fā)現(xiàn)在公司無(wú)法訪(fǎng)問(wèn)該工具了。

除此之外,早在去年12月,IT技術(shù)問(wèn)答網(wǎng)站Stack Overflow就已經(jīng)推出新政策,禁止用ChatGPT生成的內(nèi)容在該社區(qū)回答問(wèn)題。

“由于 GPT 足以讓網(wǎng)站用戶(hù)相信答案有價(jià)值,社區(qū)通常用來(lái)確定其同行貢獻(xiàn)合法性的信號(hào)經(jīng)常無(wú)法檢測(cè)到 GPT 生成的答案存在嚴(yán)重問(wèn)題。結(jié)果,客觀上錯(cuò)誤的信息進(jìn)入了網(wǎng)站。在目前的狀態(tài)下,GPT 可能會(huì)破壞讀者對(duì)我們網(wǎng)站提供由主題專(zhuān)家撰寫(xiě)的答案的信任。”Stack Overflow如是說(shuō)明。

可以說(shuō),OpenAI在2月的第一天發(fā)布AI文本輔助檢測(cè)工具,不是一個(gè)令人驚訝的消息,甚至顯得有些姍姍來(lái)遲。

03

根據(jù)OpenAI的說(shuō)法,ChatGPT的走紅實(shí)屬意料之外的事情,這也可以解釋為什么如今的爭(zhēng)議OpenAI看起來(lái)毫無(wú)準(zhǔn)備。

《財(cái)富》雜志近期的一篇深度報(bào)道稱(chēng),OpenAI發(fā)布ChatGPT是抱著“孤注一擲”的態(tài)度,公司聯(lián)合創(chuàng)始人兼現(xiàn)任總裁格雷戈·布羅克曼表示:“我承認(rèn),我當(dāng)時(shí)的立場(chǎng)是,不知道它能否成功?!?/p>

OpenAI此前已經(jīng)擁有全世界最強(qiáng)大的大預(yù)言模型之一GPT-3,以約三分之二的互聯(lián)網(wǎng)、整個(gè)百科和兩個(gè)大型圖書(shū)數(shù)據(jù)進(jìn)行集中訓(xùn)練,但是給出的結(jié)果總是差強(qiáng)人意。于是有團(tuán)隊(duì)提出了“強(qiáng)化學(xué)習(xí)”的方案,也就是讓它直接與人類(lèi)對(duì)話(huà),在試錯(cuò)中學(xué)習(xí)。

而ChatGPT就是在這樣的背景之下被推出的。

相比之下,谷歌的自然語(yǔ)言平臺(tái)LaMDA早在2021年5月的開(kāi)發(fā)者大會(huì)上初次亮相,2022年谷歌又發(fā)布了LaMDA2。在演示中,LaMDA也表現(xiàn)出了極其強(qiáng)悍的能力。甚至在去年中旬,“LaMDA已經(jīng)具備意識(shí)”的都市傳說(shuō)曾經(jīng)鬧得沸沸揚(yáng)揚(yáng)。

但是谷歌一直不愿向公眾發(fā)布LaMDA。谷歌表示,部分原因在于LaMDA存在較高的誤差,且容易對(duì)用戶(hù)造成傷害。此類(lèi)瑕疵被谷歌稱(chēng)為“有毒性的”,谷歌擔(dān)心貿(mào)然推出LaMDA會(huì)對(duì)公司的聲譽(yù)造成影響。

而ChatGPT爆火后引發(fā)的一連串混亂,也恰恰印證了谷歌的擔(dān)憂(yōu)。

ChatGPT已經(jīng)成為OpenAI重要的一款產(chǎn)品,盡管公司稱(chēng)走紅不在計(jì)劃內(nèi),這個(gè)工具還引發(fā)了各種爭(zhēng)議,ChatGPT依然進(jìn)一步使得AIGC(人工智能自動(dòng)生成內(nèi)容)成為當(dāng)今最熱門(mén)的賽道,也加速了OpenAI向商業(yè)世界的邁進(jìn)。

微軟和OpenAI的合作關(guān)系快速升溫。在2019年就首次向OpenAI投資10億美元的微軟,在1月24日宣布已經(jīng)擴(kuò)大雙方的合作:微軟將向OpenAI進(jìn)行一項(xiàng)為期多年、價(jià)值數(shù)十億美元的投資,并將OpenAI的模型納入微軟的消費(fèi)級(jí)和企業(yè)級(jí)產(chǎn)品中。

有知情人士稱(chēng),投資數(shù)額將高達(dá)100億美元。

此外,有消息稱(chēng)微軟計(jì)劃在3月將ChatGPT融入到搜索引擎必應(yīng)中。谷歌也已經(jīng)坐不住了,也已經(jīng)發(fā)出“紅色警報(bào)”,要重新思考人工智能策略,計(jì)劃發(fā)布20款支持人工智能的新產(chǎn)品,并將在今年發(fā)布搜索聊天界面的演示版本。

2月1日,CNBC報(bào)道稱(chēng)谷歌正在測(cè)試一款名為“學(xué)徒巴德(Apprentice Bard)”的聊天機(jī)器人,該產(chǎn)品基于LaMDA,將直接與ChatGPT抗衡。最關(guān)鍵的是,它的回答可以包括最近的事件,而ChatGPT對(duì)2021年之后幾乎一無(wú)所知。

OpenAI看起來(lái)在用一款產(chǎn)品去打擊另一款產(chǎn)品,實(shí)際上是在為ChatGPT的多領(lǐng)域應(yīng)用鋪平道路。

在可以預(yù)見(jiàn)的將來(lái),這個(gè)賽道將硝煙四起。ChatGPT將只是“拋磚引玉”的里程碑式印跡,還是一款長(zhǎng)青的商業(yè)產(chǎn)品,還有待時(shí)間的檢驗(yàn)。

參考資料:

  • 財(cái)聯(lián)社:《加碼豪賭人工智能!微軟官宣向大火的OpenAI追加數(shù)十億投資》
  • 硅星人:《用魔法打敗魔法:抓住AI槍手 ChatGPT檢測(cè)器“千呼萬(wàn)喚始出來(lái)”》
  • 量子位:《“ChatGPT克星”升級(jí):老師可以把全班作業(yè)丟進(jìn)去檢測(cè)了》
  • 新智元:《學(xué)校封殺,大廠(chǎng)禁用,ChatGPT引發(fā)大面積恐慌!》
  • 澎湃新聞:《聊天機(jī)器人ChatGPT成作弊工具,教育如何應(yīng)對(duì)科技挑戰(zhàn)》

作者:畢安娣;編輯:王靖

來(lái)源公眾號(hào):字母榜(ID:wujicaijing),讓未來(lái)不止于大。

本文由人人都是產(chǎn)品經(jīng)理合作媒體@字母榜 授權(quán)發(fā)布,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來(lái)自 Unsplash,基于CC0協(xié)議。

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒(méi)評(píng)論,等你發(fā)揮!