看完大模型們作答的高考作文,對AI的鼓吹與恐懼皆可緩一緩了

鄰章
0 評論 2441 瀏覽 1 收藏 8 分鐘
🔗 产品经理的不可取代的价值是能够准确发现和满足用户需求,把需求转化为产品,并协调资源推动产品落地,创造商业价值。

在今年的高考作文題目公布之后,多家科技公司嘗試展示自家生成式AI大模型的文學(xué)創(chuàng)作能力。不過在實際測試中,由AI大模型生成的作文卻表現(xiàn)出思辨性不足、論點論據(jù)不足、觀點不新穎等問題,而這些問題若想得到解決,還需一定時間。

一直以來,用AI工具進(jìn)行文學(xué)創(chuàng)作都是科技公司們樂于嘗試的事情,特別是在如“高考”這種全民關(guān)注的特殊時間節(jié)點,用AI撰寫高考作文等就更被科技公司追捧。

今年,明爭暗斗或更勝以往。

核心原因當(dāng)然是自去年Open AI以生成式AI應(yīng)用ChatGPT以近乎于質(zhì)變的能力,引發(fā)全球生成式AI大模型狂熱,讓大家公認(rèn)AI技術(shù)來到了“iPhone”時刻。?

國內(nèi)科技互聯(lián)網(wǎng)公司們也紛紛跟進(jìn)并在今年拿出了自家的生成式AI大模型產(chǎn)品—— 據(jù)不完全統(tǒng)計:從今年二月至今,國內(nèi)AI大模型發(fā)布會就開了接近20場,諸如百度文心一言、阿里巴巴通義千問、科大訊飛星火大模型等,并都幾乎對外宣稱 自家產(chǎn)品技術(shù)具備領(lǐng)先性。

在此,“高考作文”這一綜合考驗考生材料理解能力、文字功底、思辨能力、文字創(chuàng)新能力的綜合考題,無疑也是檢驗各家大模型技術(shù)創(chuàng)造能力的試金石。

也正是基于此,投身于生成式AI大模型的廠商們,也是摩拳擦掌,準(zhǔn)備一展自家生成式AI大模型的文學(xué)創(chuàng)作能力。

諸如周鴻祎在微博就分享了一篇由360智腦創(chuàng)作的今年全國甲卷高考作文。

但從最終結(jié)果來看,其表現(xiàn)是基本功不錯但在思辨性層面則不足,也較難拿到高分。

語文特級教師王大績在微博中對360智腦生成的這篇AI作文點評稱:“作文語言曉暢,層次清晰,寫作基本功很好,在基礎(chǔ)等級的層面,表現(xiàn)不錯。作文也談到了高科技,但是對科技發(fā)展條件下,本應(yīng)成為時間的主人,何以卻成為時間的仆人,未能抓住關(guān)鍵,思考不夠透徹。因此未形成鞭辟入里的辨析,題目所要求的時代感比較淡泊,在發(fā)展等級方面,表現(xiàn)一般?!?/p>

事實上,這種在文學(xué)創(chuàng)作層面思辨性不足的現(xiàn)實,不止是360智腦一家,其實幾乎是當(dāng)前生成式AI大模型的“通病”。

在搜狐科技以高考作文全國卷(甲)為題,對百度文心一言、阿里通義千問、科大訊飛星火認(rèn)知大模型、360智腦、ChatGPT五款主流大語言模型產(chǎn)品進(jìn)行同題測試,并邀請到五位語文名師進(jìn)行點評各模型生成作文水平的活動中,就不難發(fā)現(xiàn):五款大模型基本都理解到了高考作文全國卷(甲)的作文立意,沒有出現(xiàn)偏題、跑題現(xiàn)象,也都能在短時間內(nèi)生成相應(yīng)文章。

但同時大模型們也存在著對作文具體要求理解不清(諸如創(chuàng)作的文章字?jǐn)?shù)未達(dá)到不少于800字的要求)、行文死板、割裂感明顯、語言空洞、“理工味”明顯;并且更為重要的是它們創(chuàng)作的文章,都普遍存在著論點論據(jù)不足、觀點不新穎等在文學(xué)創(chuàng)作上最為致命的問題。這也導(dǎo)致這五款大模型創(chuàng)作的高考作文,綜合得分最高的ChatGPT,也只拿到了48分。

坦率來講,ChatGPT的48分和百度文心一言的46.5分,在高考作文得分中,其實也不算低,甚至可能會超過許多考生的作文得分,但也與優(yōu)秀作文沒有沾不上邊,只能說是較為普通的水準(zhǔn)。

而這些大模型在文學(xué)創(chuàng)作上暴露出的這些問題,也讓我們看到當(dāng)前生成式AI技術(shù)的不足。甚至可以說,那些叫囂著現(xiàn)在ChatGPT等生成式AI技術(shù)就能進(jìn)行文學(xué)創(chuàng)作,取代創(chuàng)意人員的話語,著實有些夸大其辭乃至危言聳聽了。

當(dāng)然,我們也不否認(rèn)ChatGPT等生成式AI技術(shù)在持續(xù)養(yǎng)料喂養(yǎng)下,能夠迅速成長的潛力,但要擺脫當(dāng)前大模型在文學(xué)創(chuàng)作中存在的創(chuàng)造性不足問題 ,可能也并不是大模型們一朝一夕就能搞定的事情,其可能還需要較長的時間。

在此,幾乎可以說:在看過用生成式AI作答的高考作文后,我認(rèn)為對AI取代文學(xué)創(chuàng)作的鼓吹也好,恐懼也罷,其實都可以暫時先緩一緩了。

寫在最后

ChatGPT等大模型技術(shù)所具備的郵件 & 新聞 & 論文撰寫、視頻腳本、文案、翻譯、代碼編寫等能力,讓生成式AI技術(shù)在很大程度上超越了過往這類AI應(yīng)用偏娛樂的屬性,進(jìn)入了真正的生產(chǎn)力乃至是創(chuàng)造性階段。

由此 也有不少業(yè)內(nèi)驚呼 : 創(chuàng)造性工作機(jī)會,可能會被GPT們率先取代了,開始陷入悲觀預(yù)期。

事實上,對于生成式AI技術(shù)展現(xiàn)出的實力,我一直以來的觀點都是:既沒必要過度鼓吹,同時也沒必要過度恐懼,以一顆平常心去對待技術(shù)的發(fā)展更迭,或許會更好。

站在技術(shù)浪潮面前,我們更應(yīng)該做的事情是,及早的學(xué)會善用這些技術(shù),以助力我們工作效率與生活質(zhì)量的提升。

專欄作家

鄰章,微信公眾號:TMT317,人人都是產(chǎn)品經(jīng)理專欄作家。專注科技互聯(lián)網(wǎng)評論,致力傳遞價值思考。關(guān)注電商、移動互聯(lián)網(wǎng)、人工智能、智能手機(jī)等產(chǎn)業(yè)。

本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載

題圖來自unsplash,基于CC0協(xié)議

該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!
专题
12524人已学习15篇文章
互联网医疗是医疗行业与互联网的综合应用,其以互联网及相关技术为载体和支撑,开展线下传统或线上衍生的医疗健康服务。本专题的文章分享了对互联网医疗的分析和见解。
专题
49350人已学习14篇文章
产品经理往往会承担一定的项目管理职能,那么该如何做好项目管理呢?
专题
12835人已学习14篇文章
数字营销有着精准度高、成本较低、效果可量化等优点,很多企业都尝试了数字营销。本专题的文章分享了数字营销的相关内容。
专题
15361人已学习13篇文章
说到“账号”,想必大家对于这个名词已经习以为常。现在市场上的大多数应用,都会有自己的账号体系。本专题的文章分享了如何搭建账号体系。
专题
69469人已学习26篇文章
学会数据化运营能够提升效率,让你的工作事半功倍。
专题
45362人已学习12篇文章
产品经理和运营都要懂一点的推荐算法基础和进阶知识