實測4款頭部PPT生成大模型:配圖錯誤頻發(fā)、數(shù)據(jù)可視化集體翻車
大模型從圖文、圖片、視頻卷到了PPT生成,但距離“一鍵生成”的終極目標還有明顯距離,這就得看誰能持續(xù)“燒錢”完成進步了。
繼聊天機器人、文本創(chuàng)作、圖像生成、視頻生成之后,大模型高調“卷”入PPT生成中。
入局者既包括傳統(tǒng)辦公軟件開發(fā)商,如金山辦公推出WPS AI、iSlide推出iSlide AI;也包括互聯(lián)網巨頭百度、阿里等攜百度文庫、夸克AI PPT出場;還有科大訊飛、天工AI、月之暗面Kimi等AI領域的重量級選手。各家紛紛拿出看家本領,爭相在PPT賽道上贏得先機。
比如,國產大模型Kimi聯(lián)合AiPPT推出PPT助手,而科大訊飛也不甘示弱,發(fā)布了訊飛智文2.0版本的智能文檔AI助理,一鍵生成PPT升級版。這些工具不僅能提煉文檔核心生成大綱,還能一鍵切換主題模板,甚至支持多文檔到PPT的轉換……每一個功能都寫著“省時省力”,每一個營銷點都體現(xiàn)著“卷”的決心。
畢竟“天下苦PPT久矣”,PPT制作一直是職場人士的一大痛點,技術的較量若能推動辦公生產力的革新,用戶自然喜聞樂見。但是,面對如此硬核的用戶真需求,如若企業(yè)只是打著AI的幌子交一份偽答卷,無疑將達到反效果,傷了用戶的心。
因此,「科技新知」本次將在國產大模型中挑選四名選手進行實測,包括Kimi、訊飛智文、百度文庫、WPS,以觀察大模型企業(yè)對打工人的誠意幾何。
為確保測評結果的客觀性和參考價值,我們采用以下設定:
1.使用統(tǒng)一的中文提示詞,包括簡易提示詞和復合提示詞;
2.每個大模型的測試項目都包括:輸入主題生成PPT、上傳文檔生成PPT;
3.統(tǒng)一使用電腦網頁版及其默認設置;
4.統(tǒng)一呈現(xiàn)一次生成結果,不進行二次調整優(yōu)化。
以下是各個模型表現(xiàn)情況:
生成方式1:輸入主題生成PPT
指令:你是一名經驗豐富的影視產業(yè)觀察者,被邀請至高校的課堂做分享,主題是2024年國內五一檔電影及其票房分析,現(xiàn)在需要你據(jù)此做一份PPT,要求要有清晰的結構和邏輯,精準的數(shù)據(jù)支持,精美的視覺設計,須包含圖表,總頁數(shù)不超過20頁。
指令說明:作為一個信息溝通工具,PPT應有效地在繁雜的信息中提煉要點、歸納總結,并將多數(shù)據(jù)部分做可視化呈現(xiàn)。因此,為測試這幾款AI PPT的基本能力,本輪測試專門選用具備多主體、多數(shù)據(jù)主題。
WPS AI:
WPS AI:近900字的PPT大綱,層級分明、內容全面,不禁讓人對這個匯報充滿期待,但最終生成的PPT卻只是把大綱填充進用戶所挑選的模板中,具體內容仍需用戶自行檢索、歸納、分析。
如“背景介紹”部分,WPS AI非常直白地留下一句“分析2024年國內五一檔電影市場,了解電影產業(yè)發(fā)展趨勢”,相當于只給用戶提供一個思考思路,但相信不少讀者跟「科技新知」一樣,希望AI能完成到分析這一步;對于“影視產業(yè)現(xiàn)狀概覽的市場規(guī)?!币矁H有一句“高度概括”的表述:國內影視產業(yè)持續(xù)增長,市場規(guī)模不斷擴大——水得太明顯了。
Kimi
Kimi:1分鐘的時間里,Kimi生成了近2000字的大綱,試圖用20頁PPT完成背景介紹、情況簡介、票房數(shù)據(jù)分析、受眾分析、成敗因素分析、營銷策略分析、政策環(huán)境與市場監(jiān)管、未來市場展望……只能說全面,十分全面。但問題也在于此——主題不突出,未能聚焦“2024年國內五一檔電影及其票房分析”。
和WPS AI一樣,在“一鍵生成PPT”上,Kimi給到的也是一個思路框架、分析模板,如在“2024年票房數(shù)據(jù)分析”中,Kimi給出的回答是“詳細列出2024年五一檔期間各部影片的票房數(shù)據(jù),包括總票房、單日票房、觀影人次等關鍵指標。分析票房數(shù)據(jù)背后的市場因素,如影片質量、宣傳力度、觀眾口碑等?!辈坏貌怀姓J,這是一個相當完整的分析思路,相較于WPS AI也更為詳細。
百度文庫:
百度文庫:如圖所示,百度文庫所生成的PPT目錄頁即其大綱的全部,看起來是位惜字如金的選手。意料之外的是,低期待等來了小驚喜,在前三個產品的測試中,百度文庫幾乎是最符合「科技新知」對“一鍵生成PPT”所設想的,包括結構完整、詳略得當、主題突出、能引用官方數(shù)據(jù)并做分析。
但在生成大綱環(huán)節(jié)上,百度文庫出現(xiàn)兩段100%重復的內容,由此生成出來的PPT也同樣發(fā)生重復。但基于其在內容上的優(yōu)異表現(xiàn),這點不足倒也影響不大,只增加了后期手動刪除的步驟。
訊飛智文:
訊飛智文:出現(xiàn)多處排版疊字現(xiàn)象,但瑕不掩瑜,有別于WPS AI和Kimi的籠統(tǒng)和全面,訊飛智文對主題的把握更為準確,能夠合理分配各部分內容的比例,并能圍繞主題對相關維度做有效分析,如不同影片類型分布及特點、購票渠道與觀影模式、重點城市票房數(shù)據(jù)等;信息抓取和文本生成能力較為突出,符合主題且有足夠的豐富度。
生成方式2:上傳文檔生成PPT
指令:你是一名大學生,要做一個課程期末匯報,文檔名稱為“電影《傲慢與偏見》人物形象分析匯報”,字數(shù)1500,包含電影簡介與創(chuàng)作者簡介、故事梗概、主要角色人物形象分析、人物刻畫手法及小結,請你根據(jù)這份匯報講稿生成一份PPT。
指令說明:這項測試是為根據(jù)文檔生成一份匯報演講稿。按一般人平均語速約240字/分鐘計算,整個匯報約6分半。主要評估AI的語言和場景理解能力、文本閱讀能力、概括提煉能力等。
WPS AI:
WPS AI:整體而言,是名簡約派選手,包含封面及尾圖,成品僅6頁。排版合理,但配圖毫無關聯(lián);對文檔內容的處理中規(guī)中矩,只做了基于文檔本身的處理,沒有做文檔外的內容補充。
Kimi:
Kimi:盡管上傳的文檔已經是完成的一篇匯報演講稿,但Kimi似乎有自己另外的想法,它基于演講稿的框架和模板做排篇布局,提煉要點,但沒有展開分析,而是提供給用戶思考的方向,更像是一份“半成品”。用戶需再根據(jù)其指示自行填充內容。此外,Kimi在本輪表現(xiàn)中竟存在內容與小標題顛倒(混淆?倒置?還是說正文與小標題識別錯誤,位置顛倒之類的會清晰一點?)的低級錯誤。
百度文庫:
百度文庫:根據(jù)其提供的選項,我們在“原文一致”和“適當擴寫”中選擇了后者,成稿確實有基于文檔內容補充有效信息和完善,并且擴充內容能夠圍繞“人物形象”這個關鍵詞展開,邏輯合理。排版無太大問題,較為致命的是配圖出現(xiàn)錯誤,用成《小婦人》的電影截圖。
訊飛智文:
訊飛智文:排版依舊沒有將模板和文字內容進行合理編排,出現(xiàn)多處疊字現(xiàn)象,且PPT頁面字數(shù)過多,不僅影響觀感,也不利于觀眾對信息的快速獲取。但通過聯(lián)網擴寫,成品能基于演講稿對匯報內容進行有效地完善。此外,其提供的AI配圖是個亮點,雖然圖文相關性還有待加強,但已比前幾家的圖片表現(xiàn)要好。
生成方式3:其余相關維度測評
除整體成稿呈現(xiàn)外,我們還從以下幾個相關維度進行測評:響應速度與效率、使用成本和價格、模板與樣式、用戶體驗與交互、安全與隱私保護。
四款AI大模型PPT生成時間
“一鍵生成”無疑是被PPT硬控的打工人和學生黨夢寐以求的功能。畢竟,一份精美的PPT從挑選模板開始,就要耗費大量的時間和精力。再到梳理結構、確定文本、斟酌用詞、排版布局、設計優(yōu)化等,可稱為繁瑣的集合??傮w來看,本期測試的四款產品無論是通過輸入主題生成還是上傳文檔生成,成品時間都控制在2.5分鐘內。其背后考驗的是高效的數(shù)據(jù)管理機制及算法系統(tǒng)等。
看起來,速度與質量有時難兼得。在輸入主題生成中,訊飛智文以整體時間1分鐘的優(yōu)異成績勝出,且內容質量高。在上傳文檔時,WPS AI僅用了29s,但內容在四家中墊底。
四款AI PPT測評對象對比表
在使用成本方面,AI新秀Kimi出手相當闊綽,目前,其PPT助手功能均可免費使用。其余三家均采用付費會員權益。但在當前拉新階段,三家也都設有免費或低價限時體驗包。
挑模板往往是PPT人艱難的第一步。整體來看,四款產品的PPT模板庫均以教育、職場辦公、科技、商務場景為主,適用場景及主題還有待進一步豐富。Kimi的大手筆貫穿全程,免費模板量居榜一,而百度文庫多數(shù)模板均為VIP權益,即使是免費模板,生成后下載到本地電腦也需付費。
從樣式上來看,各家生成的PPT在字體、動畫效果和幻燈片切換上都以“基礎款”打底,支持在線編輯或下載后編輯。
WPS AI界面
Kimi界面
百度文檔界面
訊飛智文界面
從交互體驗來看,四款產品注冊登錄方式便捷,均可通過手機驗證碼注冊登錄;支持網頁操作;從界面上看,WPS AI、Kimi和訊飛智能走的是極簡風,用戶能快速找到所需功能,百度文庫頁面則較為復雜,“AI生成PPT”則位于頁面最右的智能助手,操作界面只有整個首頁的五分之一。
在安全與隱私保護方面,四家均無明顯的隱私政策,未就如何收集、使用和保護用戶數(shù)據(jù)在顯眼處做相關說明。
測評觀察:技術進步與用戶期待的較量
不得不承認,在對四款AI PPT產品的測評中,我們見證了人工智能在內容創(chuàng)作領域的重要進步。僅需簡單輸入指令、點擊生成,一雙無形的手便以驚人的速度開始編排并“立即生成”,這對于被PPT綁架的用戶無疑是一種解脫。
速度固然重要,但質量才是核心。對話、文本生成是大部分企業(yè)切入賽道的第一個發(fā)力點,在日復一日的數(shù)據(jù)訓練中,大模型的自然語言處理能力得到顯著提升,這也為其往多模態(tài)發(fā)展打下了堅實的基礎?;诖耍诒敬螠y評中,四款產品在邏輯分析上都有相當不錯的表現(xiàn)。
但在文本內容生成上,各家大部分還停留于“提供思路”的層次,在提取有效信息,生成準確且有深度的文本上還有待加強,如WPS AI和Kimi。相比較而言,百度文庫和訊飛智文在本次測試中表現(xiàn)出另一梯隊的水準。如果說WPS AI和Kimi可以一鍵生成一份合格率為50%的PPT,那百度文庫和訊飛智文基本是80%的水平,這或許也得益于其背后百度、百度文庫和科大訊飛在知識引擎和內容數(shù)據(jù)上的積累。
欣喜有之,遺憾亦有之。在「科技新知」最期待的數(shù)據(jù)可視化部分,四名選手則無一例外地選擇“視而不見”。數(shù)據(jù)——懸在大廠人頭上的“達摩克利斯之劍”,同樣是PPT里的靈魂擔當,通常包含數(shù)據(jù)比對,并以圖表、圖形等形式呈現(xiàn),使其更直觀、易懂。這也是當代打工人做PPT的共識。為此,在“輸入主題生成”測試中,我們專門挑選了有數(shù)據(jù)信息的主題,并下達具體指令,要求成稿“須包含圖表”,結果卻沒有看到相應內容的生成。遺漏用戶需求,也反映出對PPT使用痛點和場景理解的不夠深刻。
另一個不容忽視的問題是,PPT常見應用場景既包括學校,也有科研機構、政府及企業(yè)等,也意味著大量的數(shù)據(jù)隱私、商業(yè)秘密等。而當前AI PPT大模型產品在數(shù)據(jù)隱私保護上還顯得標準不足、底氣不足,也都默契地在宣傳營銷層面避而不談。
這么看來,PPT離“一鍵生成”的終極目標還有距離。各路玩家趕路之余,還需繼續(xù)練好內功。
大模型綜合能力的提升,很大程度上依賴于海量數(shù)據(jù)的喂養(yǎng),其開發(fā)與訓練是一項需要全方位資源投入的復雜工程。它不僅依賴頂尖人才團隊和前沿技術,也離不開豐富的高質量語料庫,這要求開發(fā)者具備持續(xù)的數(shù)據(jù)采集和處理能力。同時,還需投資大量硬件資源以提供必要的算力資源。
簡而言之,大模型的開發(fā)是一場對技術深度、數(shù)據(jù)廣度和算力強度的綜合考驗,而每一項技術進步的背后都是“燒錢”。
“百模大戰(zhàn)”是過去式了,已經到了求生的階段。解鎖新應用場景,是大模型逐步走向商業(yè)化的必經之路。據(jù)月狐數(shù)據(jù)測算,2024年6月智能PPT行業(yè)用戶規(guī)模已達到920萬,行業(yè)近3月用戶規(guī)模復合增速達21%。面對“PPT”這一需求龐大的內容生成領域,誰又甘心在這場爭奪賽中掉隊?
搶占剛需的市場,企業(yè)務必要拿出實實在在的真本領了。除此之外,針對用戶的培育模式也值得考究,它關乎企業(yè)能否長遠地贏得市場與人心?;仡欉@幾年全球流行的在線辦公軟件發(fā)展歷程,從一開始的免費送福利造福上班族,到后來設置使用限制,逐步按功能收費“割韭菜”,引來一片罵聲。至今為止,關于這些企業(yè)的實際產出回報率及用戶留存率的具體數(shù)據(jù)仍顯匱乏,使得外界難以全面評估其經營成效。
面對你我日益被AI重塑的生活,不管拷問得多細致都不為過。畢竟每一個為科技買單的用戶,都還要再付諸時間、隱私及信任。承載著打工人與學生黨厚望的PPT“幫手”,可別把好牌打得稀巴爛。
作者丨余寐 編輯丨賽柯
本文由人人都是產品經理作者【科技新知】,微信公眾號:【科技新知】,原創(chuàng)/授權 發(fā)布于人人都是產品經理,未經許可,禁止轉載。
題圖來自Unsplash,基于 CC0 協(xié)議。
iSlide也好用,就是得花錢
試用過百度文庫的上傳文檔生成,只能說能作為一個基礎底吧,還需要手動大改