通用VS垂直,訊飛星火與網(wǎng)易子曰不同的“大模型解法”

劉曠
0 評論 5050 瀏覽 7 收藏 17 分鐘

隨著AI的快速發(fā)展,越來越多的互聯(lián)網(wǎng)科技公司參與到AI的賽道上來,包教育領域也開始發(fā)展AI大模型。那發(fā)展趨勢會是怎么樣的呢?一起來看看作者是如何分析的。

隨著大模型商業(yè)化應用的提速,全世界各國都開始孵化和孕育各自的行業(yè)大模型。在此背景下,國內各個細分行業(yè)的垂直大模型,日益受到產(chǎn)業(yè)界的關注和重視。

相比通用大模型,垂直大模型具有門檻較低、數(shù)據(jù)質量較好且靠近落地場景的優(yōu)勢,因而伴隨著大模型產(chǎn)業(yè)化的深入,其發(fā)展空間進一步打開,正在成為下一階段行業(yè)競爭的焦點。

事實上,一些受大模型影響特別明顯的垂直行業(yè)如教育行業(yè),已經(jīng)率先掀起了大模型競賽。

一、大模型成教育領域新變量

今年以來,教育領域包括網(wǎng)易有道、好未來、科大訊飛等行業(yè)巨頭,先后公布了自己在AI大模型領域的布局和進展,由此大模型之風迅速席卷教育行業(yè)。而在教育領域紛紛刮起大模型之風的背后,則與多方面的因素有關。

首先,教育領域和AI大模型有很高的契合度,因而具備更好的落地條件。當前AI大模型大都具備自然語音處理、語音識別、圖像識別等諸多能力,其為智能教育在視、聽、音等多模態(tài)下,實現(xiàn)教育場景全覆蓋提供了可能,成為“AI+教育”的核心引擎。

此外,隨著多模態(tài)生成技術的成熟,多模態(tài)生成模型的深度融合,將進一步使AI教學、AI虛擬互動趨于立體化,打破扁平的文本式結構。通過圖像、視頻、數(shù)字人生成等技術為教輔產(chǎn)品提供豐富的教學素材和內容呈現(xiàn)形式,打造全新的智能教育生態(tài)。

其次,用戶對于教育智能產(chǎn)品的接受度日漸提升,AI大模型能夠為用戶帶去更加智能的教育體驗。目前AI教育已經(jīng)發(fā)展一段時間了,用戶對于智能化的教育產(chǎn)品,也有了相應的認知與了解,而AI大模型的應用,則能為智能教育的發(fā)展增添新動能。

比如,智能硬件接入AI大模型之后,硬件的交互體驗得到了加強,產(chǎn)品智能化也有了“質”的飛躍。

最后,AI大模型可以同時在B端和C端發(fā)力,在撬動龐大教育市場的同時,可以做到最小成本實現(xiàn)“因材施教”的教學目標,非常契合當下教育市場的階段需求。

一般而言,教育的投入來源有二:一方面是C端的教育培訓消費,另一方面是B端的教育信息化投入,而這兩方面都可以構筑起規(guī)模相當龐大的市場。

如在C端,AI有望成為學生的“智能老師”,為孩子提供作文批改和英語對話等個性化場景學習服務,實現(xiàn)因材施教;在B端,則可以聚焦相對標準化的考場閱卷、在線教學等場景,大幅度提升考試閱卷的效率和準確率。

基于此,大模型正在成為教育領域全新變量。

二、不同路線、不同思路

從整個行業(yè)來看,由于參與玩家的背景不同,其所走的路線也存在顯著差異。

目前來看,發(fā)力教育領域的大模型廠商主要分為兩類:一是以百度文心一言、科大訊飛星火大模型為代表的通用大模型廠商,其面向的是包括教育在內的泛行業(yè)企業(yè);二是以網(wǎng)易有道、學而思等為代表的垂直大模型廠商,其主要專注教育細分領域。

結合各個廠商的情況來看,不同路線的背后,實際上對應著廠商的不同思路。

對于大廠而言,由于它們總體綜合實力較強,具備構建大模型的一些底層技術能力,因而其更傾向于走通用大模型路線,后期借助大模型與場景結合,快速搭建起服務生態(tài)。

目前業(yè)內包括百度、騰訊、阿里、科大訊飛等廠商,都紛紛依托自身的技術優(yōu)勢、團隊優(yōu)勢和資金支持,在通用大模型領域實現(xiàn)了搶跑。

比如阿里發(fā)布了通義千問大模型、華為發(fā)布了盤古大模型、百度發(fā)布了文心一言、科大訊飛發(fā)布了星火大模型等,在搶奪市場機會的同時,其直面產(chǎn)業(yè)的“傾向”也越來越明顯。

比如,百度就宣稱與超過300家企業(yè)成為生態(tài)伙伴;4月阿里云也宣布與七家企業(yè)推動大模型在油氣、電力、交通等行業(yè)落地;華為早前也發(fā)布了盤古金融、電力、藥物分子三個垂直領域大模型;而剛剛公布MaaS解決方案的騰訊,已和數(shù)十個行業(yè)的22家企業(yè)達成大模型共建合作;科大訊飛更是宣布,星火大模型首批接入36個行業(yè)3000余家企業(yè)……

可見,當下推動大模型場景落地、打通服務生態(tài),依然是通用大模型廠商的核心任務。

對于垂直行業(yè)廠商而言,其在行業(yè)深耕已久,對用戶的需求理解和場景落地具備更強的洞察能力,又綜合了專家經(jīng)驗、組織能力、工程能力的knowhow優(yōu)勢,具備高質量觸達用戶場景的競爭力。

與通用大模型廠商不同,一些重要的行業(yè)玩家如新華三、京東、網(wǎng)易有道、攜程等,則聚焦大模型與產(chǎn)業(yè)的融合機會,緊盯垂直賽道。

比如,京東發(fā)布了言犀大模型、京醫(yī)千詢大模型,攜程發(fā)布了攜程問道大模型,網(wǎng)易有道發(fā)布了基于教育的子曰大模型。相比通用大模型廠商而言,垂直大模型廠商在相關行業(yè)深耕已久,因而在尋找產(chǎn)業(yè)機會方面往往走得更加深入。

以網(wǎng)易有道為例,網(wǎng)易有道早在2016年就開始構建AI協(xié)同基礎能力,同步組建語音、視覺、聲音等團隊,積累了四大底層技術:有道神經(jīng)網(wǎng)絡翻譯(NMT)、計算機視覺、智能語音AI技術、高性能計算等。

同時網(wǎng)易有道深耕在線教育多年,已經(jīng)在名師、線上網(wǎng)課、用戶體量等方面構建起了比較優(yōu)勢,這讓網(wǎng)易有道相比行業(yè)外的廠商更了解教育,相比教育行業(yè)內的友商更懂AI。

基于這種優(yōu)勢,網(wǎng)易有道更容易抓住大模型在教育領域的落地機會,并借助它打造差異化的智能硬件,以及差異化的服務和用戶體驗,夯實其行業(yè)競爭力。

從這個角度來看,通用大模型廠商與垂直大模型廠商只是分工不同,并沒有絕對優(yōu)劣之分。

三、有道打響教育大模型應用第一槍

作為國內首個自研教育大模型,網(wǎng)易“子曰”大模型的發(fā)布,正式打響了教育領域垂直大模型應用第一槍,其現(xiàn)實意義不言而喻。

一方面,相比底層技術,靠近前端應用的垂直大模型的技術價值、商業(yè)價值更具想象空間。正如前文所述,隨著大模型逐步深入產(chǎn)業(yè),其應用價值愈加凸顯。

以7月26日網(wǎng)易有道推出的子曰大模型為例,其基于大模型成功推出了6個已經(jīng)落地,或者即將落地的應用,分別是虛擬人口語教練、中文作文指導、英語語法精講、AIBOX、文檔問答和LLM翻譯。

以表現(xiàn)最為出彩的虛擬人口語教練為例,它已經(jīng)在應用層面無限接近真人口語老師的水平了。

比如,它在跟你互動過程中,會根據(jù)你的回答做出類似人類的評價,例如它問你“Can you tell me what you know about Chinese history?”你回答:“more than 5000 years,I learned”,它會跟一句:“yes,that is great,do you know about the Han Dynasty ……”

形成聯(lián)系上下文的有來有往的對話文本,全程虛擬人表情生動、發(fā)音地道,突破了以往“教條”的劇本式交流局限。

另外,它還具備很強的即時反饋機制和糾錯能力。

比如,筆者在跟它對話過程中,它能夠根據(jù)筆者的發(fā)音和文字,生成練習報告給筆者以即時反饋,幫助筆者快速鎖定語言卡點,覆蓋8個話題場景和68個話題的內容儲備,讓其口語表達更精準,交流體驗更接近真人水平。

而在虛擬人口語教練良好用戶體驗的背后,離不開其強大的底層“黑科技”實力。

比如,虛擬人口語教練在語音識別能力方面進行了巨大的革新,它支持多語種的流式低延遲語音識別技術,讓虛擬人Echo在中式英語、英語、中英混合等場景下游刃有余;聲學降噪、回聲消除、自動語音檢測、自動斷句等技術,則讓它像一個真正的傾聽者和交流者。

在AI虛擬人的驅動方面,有道基于自主研發(fā)的情感識別算法和實時渲染驅動引擎,對播放的語音數(shù)據(jù)進行深度分析,使其面部表情更接近真人。

在其他應用方面,它的表現(xiàn)也毫不遜色。

比如,在AI作文指導方面,它不僅能夠批改,還能夠像老師一樣作指導;另外,它在語法精講、LLM翻譯、AIbox、文檔問答等方面,都已經(jīng)在落地或者正在落地,正在成為一個“全能的AI語言文字助手”。

預計未來隨著更多AI應用的落地,它將會在更多方面對用戶生產(chǎn)力提升產(chǎn)生重大影響。

另一方面,網(wǎng)易有道子曰教育大模型的發(fā)布,也標志著網(wǎng)易有道多年深耕AI,在通用AI能力上走向了成熟,具備了產(chǎn)生應用的強大實力。

前文提到,好的垂直大模型需要深厚的AI通用能力作為底座才能夠走的更遠,作為教育行業(yè)首個垂直大模型廠商,網(wǎng)易子曰大模型的推出,實際上正是建構在網(wǎng)易有道多年的AI通用技術能力之上。

作為國內NLP能力領先的公司,有道多年來一直致力于基于Transformer模型的創(chuàng)新和應用,還積累了OCR、ASR、TTS、CAPT等幾大核心技術。正是這些技術的有效整合,打開了新的想象空間,讓有道成為國內率先將AIGC技術落地教育場景內的企業(yè)。

如今,有道正在多個業(yè)務場景推進“子曰”大模型應用落地,探索AI個性化教學的前沿陣地,將以技術創(chuàng)新和產(chǎn)品研發(fā)的優(yōu)勢,實現(xiàn)更廣維度的突破(如有道縱橫以及有道智慧體育等),為整個教育行業(yè)賦能。

四、產(chǎn)業(yè)需要探路先鋒

在垂直大模型持續(xù)升溫之下,包括京東、攜程、網(wǎng)易有道等在內的廠商,已經(jīng)開始扮演起“探路先鋒”的角色,開始在零售、旅游和教育領域探索落地場景,并對產(chǎn)業(yè)發(fā)揮直接引領作用。

一來,當前大模型進展雖然激烈,但還處于初級階段,屬于垂直大模型的機會窗口尚未關閉。垂直廠商迫切需要利用自己掌握的高質量數(shù)據(jù)集,將數(shù)字化延伸到產(chǎn)業(yè)的“神經(jīng)末梢”處,但其所面臨的內外部挑戰(zhàn)很大,因此各產(chǎn)業(yè)迫切需要破局者。

當前國內大模型這個賽道,依舊處于早期階段,相比國外的GPT-4和Bard、LLaMA等廠商已經(jīng)展開競爭來說,國內的通用大模型廠商尚未展開直接較量。

在國內通用大模型還處于“懵懂”狀態(tài)之下,國內的垂直大模型廠商也不存在太多的競爭,其依舊面臨眾多的機會。對于垂直大模型廠商而言,只需要緊跟潮流、精準解決用戶痛點,就有機會脫穎而出。

當然,挑戰(zhàn)同樣存在。

比如通用大模型廠商參與行業(yè)競爭,核心關卡突破面臨挑戰(zhàn),數(shù)據(jù)安全問題需要解決等等,都需要有像攜程、京東、網(wǎng)易有道,這樣引領性的行業(yè)巨頭參與其中,加速垂直大模型產(chǎn)業(yè)化的落地進程。

二來,從整個行業(yè)來說,無論是通用大模型還是垂直大模型,最終的商業(yè)化都需要落地產(chǎn)業(yè),但如何將大模型能力與產(chǎn)業(yè)應用結合,從而創(chuàng)造出商業(yè)價值沒有先例可循,同樣需要一批探路者去開辟。

前文提到,當前國內大模型無論是通用大模型還是垂直大模型,都還處于早期階段,產(chǎn)業(yè)落地和技術商業(yè)化尚無先例可循。

而不論是通用大模型還是垂直大模型,其商業(yè)化最終都指向產(chǎn)業(yè)和場景,因此諸如子曰大模型這樣的垂直大模型落地,對于AI大模型產(chǎn)業(yè)化、商業(yè)化落地具有現(xiàn)實意義。

作為業(yè)內首個教育類垂直大模型,網(wǎng)易子曰大模型的發(fā)布,標志著教育領域的大模型開始進入實質應用階段,其也或將引領全新的產(chǎn)業(yè)浪潮。而作為參與者與推動者,網(wǎng)易有道也將成為這場浪潮的受益者。

專欄作家

劉曠,微信公眾號:劉曠(liukuang110),人人都是產(chǎn)品經(jīng)理專欄作家。海南三車網(wǎng)絡科技有限公司董事長、購團邦資訊創(chuàng)始人、知名自媒體。

本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,不得轉載。

題圖來自Unsplash,基于CC0協(xié)議。

該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務。

更多精彩內容,請關注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!
专题
34938人已学习13篇文章
为了给用户提供更好的体验,你需要一套合理的推送策略。
专题
19958人已学习13篇文章
本专题的文章分享了TO G产品的入门指南,包括什么是G端产品、产品的特点...
专题
15286人已学习12篇文章
逻辑图是用图标符号、说明文字以及连接线等,形象化地表达复数要素之间的相互作用关系。本专题的文章分享了如何绘制逻辑图。
专题
14499人已学习13篇文章
价格是竞争的重要手段,所以对于一个产品来说,产品定价是非常重要的。本专题的文章分享了如何给产品定价和产品定价的策略。
专题
37615人已学习20篇文章
“搜索功能”拆解:小功能,大细节。
专题
15732人已学习12篇文章
CDP,即客户数据平台,是企业用来集中管理和整合客户数据的工具。本专题的文章分享了什么是CDP和如何搭建CDP平台。