華為大咖說(shuō) | 企業(yè)應(yīng)用AI大模型的“道、法、術(shù)”—— 法:場(chǎng)景篇

1 評(píng)論 2717 瀏覽 4 收藏 20 分鐘

人人都談AI大模型是未來(lái)趨勢(shì),企業(yè)里也焦慮的不行,不搞AI怕掉隊(duì),搞了AI又難看到收益。問(wèn)題出在哪兒呢?

從我們最近這幾年搞企業(yè)AI應(yīng)用的經(jīng)驗(yàn)來(lái)看,AI應(yīng)用要成功,首先要找到好場(chǎng)景,但說(shuō)起來(lái)容易做起來(lái)難。于是我們就提出了“AI場(chǎng)景12問(wèn)”,下面就是我對(duì)這套方法對(duì)詳細(xì)解析。

這是我的AI應(yīng)用系列第二篇,想談?wù)劇叭绾握覀€(gè)好場(chǎng)景”。場(chǎng)景找對(duì)了,那就成功一大半,這個(gè)道理放在AI大模型的應(yīng)用上,再合適不過(guò)。

核心觀點(diǎn):

本輪AI革命,在企業(yè)應(yīng)用還遠(yuǎn)未成熟,可奈何大家求AI心切,因此識(shí)別“好場(chǎng)景”至關(guān)重要

場(chǎng)景識(shí)別對(duì)了,大家投入才有回報(bào);場(chǎng)景識(shí)別不好,折騰一圈,一地雞毛

分享AI場(chǎng)景“12問(wèn)”及其背后的思考邏輯

PS.觀點(diǎn)不保證絕對(duì)正確,歡迎留言討論,兼聽(tīng)則明。

01 為什么AI大模型這么“挑活兒”?

當(dāng)我們站在企業(yè)內(nèi)部看AI大模型落地場(chǎng)景時(shí),很容易被兩種情緒裹挾:要么AI無(wú)所不能,要么AI啥也不是。

當(dāng)然,感謝業(yè)界的同行們一直不斷推出新產(chǎn)品,最近聽(tīng)到的第二種聲音越來(lái)越少了,更多是急迫地希望做些什么。

坦率講,目前的企業(yè)AI大模型應(yīng)用場(chǎng)景,如果挨個(gè)拉出來(lái)盤ROI,有正收益的是少數(shù),特別是動(dòng)輒幾百上千張卡的場(chǎng)景,單純看眼下收益,都是很難講的。

但是,AI變革的浪潮已至,我們又必須要跟上,所以如何選擇一個(gè)好場(chǎng)景,就至關(guān)重要了。

這里我想分享“AI場(chǎng)景12問(wèn)”和其中的思考邏輯。

02 如何識(shí)別好場(chǎng)景:AI場(chǎng)景“12問(wèn)”

整體上,希望通過(guò)三個(gè)維度來(lái)評(píng)估:

D1:商業(yè)價(jià)值

D2:場(chǎng)景成熟度

D3:持續(xù)運(yùn)營(yíng)

這三個(gè)方面,分別代表著是否值得做、是否能做、做了以后是否能持續(xù)演進(jìn)。

D1:商業(yè)價(jià)值

之前這個(gè)維度叫“業(yè)務(wù)價(jià)值”,為了更突出我們是商業(yè)組織,我特地改成了“商業(yè)價(jià)值”。

① 業(yè)務(wù)場(chǎng)景是否能清晰度量?jī)r(jià)值?

什么叫度量?jī)r(jià)值,無(wú)非是增收、降本、增效。能夠直接帶來(lái)收入增長(zhǎng)或者成本降低,那是最好的,如果不能直接帶來(lái)收入,那效率提升也是不錯(cuò)的。

舉個(gè)最近的例子:

1.如果AI助手能直接跟客戶打電話,并且成單,那這就是“增收”,這是可遇不可求的場(chǎng)景;

2.如果AI助手可以替代我們的一些資源(包括人和物),那這就是“降本”,這種場(chǎng)景次之;

3.如果AI助手可以在作業(yè)過(guò)程中起到部分替代或輔助作用,使得我們的現(xiàn)有人或物做事時(shí),更快、質(zhì)量更好、效果更加,這就是“增效”,這種場(chǎng)景最次。

這里關(guān)于場(chǎng)景價(jià)值評(píng)估,我經(jīng)驗(yàn)也有限,總結(jié)了這么幾個(gè)小技巧,可供參考:

1.重點(diǎn)關(guān)注“增收”和“降本”類場(chǎng)景,盡可能將“提效”類場(chǎng)景轉(zhuǎn)換成這兩種場(chǎng)景,具體給出計(jì)算邏輯,一旦邏輯清晰,計(jì)算和評(píng)估非常簡(jiǎn)單,價(jià)值顯而易見(jiàn)。

2.“提效”類場(chǎng)景數(shù)量最多,但魚龍混雜,是很需要花精力探討和分析的。說(shuō)實(shí)在的,每個(gè)人都有“提效”的訴求,我也恨不能找個(gè)AI幫我碼字,這樣對(duì)于我來(lái)說(shuō)可以輕松愉快一些,但是這對(duì)于公司來(lái)說(shuō)意義有限,這就是最大的矛盾點(diǎn)。

3.如果真的要做“提效”類場(chǎng)景,避免使用百分比。我們太多場(chǎng)景喜歡用“提效xx%”,年年做,年年提,擠擠總會(huì)有,這個(gè)游戲很容易玩兒,但是壞處是在業(yè)務(wù)側(cè)很難形成真正的壓力和動(dòng)力,Nice to have,不做也無(wú)所謂,這樣的后果就是戰(zhàn)略資源被消耗掉了。如果要提,就把具體業(yè)務(wù)KPI的from和to拿出來(lái),計(jì)算邏輯寫清楚。

4.“降本”的收益計(jì)算要從“投資”角度來(lái)看。這里我舉個(gè)“巡檢”的小例子,在沒(méi)有AI的時(shí)候,只能每天人工檢查x次,有了AI,可以每分鐘都檢查一次,這么一算,看似節(jié)約了不少成本。實(shí)際上,這個(gè)事兒就搞反了,應(yīng)該看業(yè)務(wù)上愿意投多少錢來(lái)增加人力做巡檢,AI節(jié)約的只是這些投資。

② 落地后收益評(píng)估,3年期ROI是否為正?

ROI評(píng)估這事兒非常重要,投資不看回報(bào),那是非營(yíng)利性組織,咱們不能這么搞。

這一條存在,是為了加強(qiáng)第一條的存在感,同時(shí)也避免為了一個(gè)小場(chǎng)景過(guò)度的投入資源。

這里其實(shí)我們給AI類的投資留了個(gè)buffer,就是“3年期ROI”,核心是因?yàn)锳I大模型的應(yīng)用太新了,能夠上線即巔峰的場(chǎng)景又太少,大部分場(chǎng)景上線以后都不能直接形成價(jià)值,需要持續(xù)地喂養(yǎng)和優(yōu)化,因此我們希望資源和人力的投入可以在中期形成真正的業(yè)務(wù)價(jià)值。至于為啥是3年,說(shuō)實(shí)話,這個(gè)數(shù)是我自己預(yù)估的,可能不同領(lǐng)域情況會(huì)有差異。

D2:場(chǎng)景成熟度

場(chǎng)景成熟度包括業(yè)務(wù)成熟度、數(shù)據(jù)成熟度、技術(shù)成熟度。這三個(gè)成熟度,是從華為AI團(tuán)隊(duì)借鑒來(lái)的,從數(shù)據(jù)、業(yè)務(wù)、技術(shù)三個(gè)角度來(lái)審視。具體細(xì)節(jié)內(nèi)容上,增加了一些自己的思考。?

D2.1?業(yè)務(wù)成熟度

③ 業(yè)務(wù)場(chǎng)景有明確的業(yè)務(wù)Owner(對(duì)投資和結(jié)果負(fù)責(zé))

Owner很重要,這個(gè)事兒可以倒著想,如果一個(gè)AI場(chǎng)景,沒(méi)有業(yè)務(wù)Owner,會(huì)導(dǎo)致什么問(wèn)題:

1.沒(méi)有人投資,這是最直接的。雖然我們現(xiàn)在很多AI基建的投資都是IT空載,但是AI應(yīng)用的落地,終究是要業(yè)務(wù)投的,業(yè)務(wù)要感知到這個(gè)投資;

2.沒(méi)有人對(duì)結(jié)果負(fù)責(zé),這個(gè)也很重要。一般業(yè)務(wù)Owner是業(yè)務(wù)流程Owner,也是業(yè)務(wù)部門主官。他能夠?qū)Y(jié)果關(guān)切,一方面說(shuō)明我們做的事兒對(duì)口,另一方面也是對(duì)業(yè)務(wù)團(tuán)隊(duì)的驅(qū)動(dòng)力(AI場(chǎng)景落地能不能成,我越來(lái)越覺(jué)得跟IT有關(guān)系,但是很有限)。

④ 業(yè)務(wù)場(chǎng)景有明確的流程規(guī)則(業(yè)務(wù)說(shuō)得清)

這個(gè)不過(guò)多贅述,是不是說(shuō)得清這事兒,其實(shí)就是業(yè)務(wù)是不是成熟,還是很容易辨別的。一個(gè)還在不斷調(diào)整、不斷變化的業(yè)務(wù),過(guò)早地搞AI,甚至數(shù)字化,對(duì)雙方都是一種煎熬。

⑤ 業(yè)務(wù)場(chǎng)景有明確的用戶觸點(diǎn)(業(yè)務(wù)已數(shù)字化)

智能化的基礎(chǔ)是數(shù)字化,業(yè)務(wù)數(shù)字化的程度,決定了AI能不能落地。這輪AI大模型的應(yīng)用,和傳統(tǒng)的IT應(yīng)用最大的差異,就是AI大模型需要數(shù)據(jù)喂養(yǎng)。沒(méi)有數(shù)字化,何來(lái)數(shù)據(jù)呢。(這里提到的數(shù)據(jù),是全場(chǎng)景、全流程、全方位的知識(shí)數(shù)據(jù),主打的就是“全”,越完整越好)

再一個(gè),沒(méi)有數(shù)字化,就意味著我們的AI落地以后,沒(méi)有現(xiàn)成的觸點(diǎn)接入,就意味著沒(méi)有現(xiàn)成的流量繼承,就意味著AI運(yùn)營(yíng)的成本會(huì)大大增加。

從另一個(gè)角度看,如果一個(gè)業(yè)務(wù)場(chǎng)景還沒(méi)有數(shù)字化,或者數(shù)字化程度不高,以我的經(jīng)驗(yàn)來(lái)看,一定是有隱情的,還是不碰的好,要碰也是要先把數(shù)字化補(bǔ)上再說(shuō)。

D2.2 數(shù)據(jù)成熟度

先提一嘴,這里提到的數(shù)據(jù),包含知識(shí)數(shù)據(jù),且暫時(shí)以知識(shí)數(shù)據(jù)為主。另外,這兩條,是從AI訓(xùn)練的兩個(gè)階段來(lái)看對(duì)數(shù)據(jù)的訴求,一個(gè)是冷啟動(dòng),一個(gè)是持續(xù)運(yùn)營(yíng)。

⑥ 業(yè)務(wù)數(shù)據(jù)是否足夠支撐0~1冷啟動(dòng)(范圍清晰、完整、易獲得)

足夠支撐冷啟動(dòng),就意味著能夠達(dá)到上線標(biāo)準(zhǔn)。目前我們以AI答準(zhǔn)率60%為基線,判定一個(gè)場(chǎng)景是否能夠上線。當(dāng)然,也不排除有一些非常通用的場(chǎng)景,不需要額外數(shù)據(jù),基模型能力就能夠支撐,不過(guò),這種“天使”場(chǎng)景可遇不可求,不在后續(xù)討論范圍內(nèi)。

具體落地時(shí),還考慮要到業(yè)務(wù)是否能夠清晰地說(shuō)清楚需要哪些數(shù)據(jù)、是不是方便拿到這些數(shù)據(jù)。目前大部分知識(shí)類場(chǎng)景都是通過(guò)RAG(檢索增強(qiáng)生成(RAG)是指對(duì)大型語(yǔ)言模型輸出進(jìn)行優(yōu)化,使其能夠在生成響應(yīng)之前引用訓(xùn)練數(shù)據(jù)來(lái)源之外的權(quán)威知識(shí)庫(kù))來(lái)實(shí)現(xiàn),R的本質(zhì)就是搜索,搜索就要有個(gè)知識(shí)清單,這個(gè)清單包括哪些知識(shí),要業(yè)務(wù)輸出,然后IT來(lái)評(píng)估可行性。比如,我遇到有場(chǎng)景需要CSDN的技術(shù)博客,這類就很難獲取。

⑦ 業(yè)務(wù)數(shù)據(jù)是否隨作業(yè)持續(xù)產(chǎn)生、更新和反饋

一個(gè)AI場(chǎng)景冷啟動(dòng)結(jié)束后,就到了持續(xù)運(yùn)營(yíng)階段。這個(gè)階段由于企業(yè)場(chǎng)景的用戶基數(shù)極其有限,沒(méi)辦法獲得海量的用戶側(cè)反饋(OpenAI的MAU有1億,我們可能大部分場(chǎng)景不會(huì)超過(guò)1千),這就使得我們將不遺余力地挖掘和利用作業(yè)過(guò)程中的每一個(gè)反饋和留痕數(shù)據(jù),確保最大化地從這些有限的數(shù)據(jù)中汲取價(jià)值。

這塊扯遠(yuǎn)一點(diǎn),我們后來(lái)探討出一種玩法,叫“作業(yè)即標(biāo)注”也就是說(shuō),每一次作業(yè)動(dòng)作的過(guò)程中,都預(yù)埋了標(biāo)注和反饋過(guò)程。這當(dāng)然需要巧妙的設(shè)計(jì),甚至略微改動(dòng)原有IT的交互邏輯,更甚至通過(guò)犧牲一點(diǎn)點(diǎn)用戶體驗(yàn)為代價(jià)。

D2.3?技術(shù)成熟度

⑧ 現(xiàn)有技術(shù)能力是否能夠支撐場(chǎng)景實(shí)現(xiàn)(技術(shù)可行、風(fēng)險(xiǎn)可控)

前面整這么多,總體上都是在做業(yè)務(wù)場(chǎng)景的評(píng)估和分析,也就是業(yè)務(wù)側(cè)的梳理和分析為主?;谇懊嬖u(píng)估OK的前提下,技術(shù)同學(xué)要開(kāi)始工作了。

這里有個(gè)巨大的“陷阱”,或者是認(rèn)知上的反差:AI大模型為什么POC(POC:Proof of Concept,為觀點(diǎn)提供證據(jù))這么簡(jiǎn)單,做好卻這么難?

在傳統(tǒng)IT開(kāi)發(fā)的場(chǎng)景上,技術(shù)可行性是容易評(píng)估的,一般技術(shù)架構(gòu)或者SE同學(xué)都能夠勝任;但是針對(duì)AI大模型相關(guān)場(chǎng)景,很多時(shí)候是要評(píng)測(cè)的,也就是要試一下,做個(gè)POC。

不過(guò),AI大模型的POC反倒是我見(jiàn)過(guò)最容易的,就是搞幾句提示詞拿基模型試一下。這輪AI創(chuàng)新的非常重要一環(huán),就是引入了自然語(yǔ)言指令,使得人人都能操作AI大模型。

然而,企業(yè)垂域場(chǎng)景,大概率第一次試結(jié)果是不太好的(大概就是瞎貓碰見(jiàn)死耗子的概率,我印象非常深刻,不論是文本還是多模態(tài),沒(méi)有超過(guò)10%的)。

于是下一步就是要AI技術(shù)專家或者AI SE來(lái)判斷下,這個(gè)場(chǎng)景是否可以改進(jìn)。改進(jìn)就分兩塊,要么是“等”,要么是“調(diào)”。

等,就是等AI基模型能力提升。

調(diào),就是要看,這個(gè)場(chǎng)景是不是能做微調(diào):針對(duì)典型任務(wù)(高頻、規(guī)范、標(biāo)準(zhǔn)),準(zhǔn)備幾百上千條數(shù)據(jù)調(diào)一下是合適的,但是針對(duì)尚未從業(yè)務(wù)上收斂、抽象的任務(wù),是沒(méi)法調(diào)的,也就是用少量數(shù)據(jù)沒(méi)法教會(huì)大模型干活。

另外還有一個(gè),就是“風(fēng)險(xiǎn)可控”,當(dāng)然這背后雖然可以建立一套AI安全的玩兒法,但是無(wú)論如何AI大模型的“幻覺(jué)”是一種不可消解的風(fēng)險(xiǎn),只能做風(fēng)險(xiǎn)規(guī)避和一定程度的接納。如果某個(gè)場(chǎng)景不能容忍任何不確定性,那就確實(shí)還不適合,至少當(dāng)下不行。

⑨公司內(nèi)是否有成功經(jīng)驗(yàn),可以復(fù)用/借鑒

這里我特地強(qiáng)調(diào),是公司內(nèi)部有成功經(jīng)驗(yàn),有三個(gè)意圖:

1.正視自己的技術(shù)能力差距,無(wú)論是基模型還是模型應(yīng)用。比如我們看到GPT4可以干啥、甚至微軟office的copilot可以干啥,對(duì)于我們的參考意義有限。把有限的資源押注在這樣一些不確定性上,是很有風(fēng)險(xiǎn)的,卡點(diǎn)會(huì)非常多。

2.公司內(nèi)部的同學(xué)已經(jīng)做成,已經(jīng)拿出來(lái)分享的場(chǎng)景,反而是我們喜而樂(lè)見(jiàn)的,這意味著“觸手可及”,拿來(lái)抄個(gè)作業(yè)很順手,哪怕不能抄,交流交流學(xué)習(xí)討論下也是不錯(cuò)的。

3.我一直認(rèn)為我們是AI技術(shù)應(yīng)用團(tuán)隊(duì),要以業(yè)務(wù)成功為唯一目標(biāo),把突破創(chuàng)新讓給更專業(yè)的人,做好AI應(yīng)用過(guò)程的學(xué)習(xí)、提煉、總結(jié),是我們的“道”。不求高精尖,只求能落地,越簡(jiǎn)單、低成本、易復(fù)制,就說(shuō)明把AI應(yīng)用玩兒明白了。

D3:持續(xù)運(yùn)營(yíng)

這一章節(jié)是我們最后加的,并不是不重要,而是在早期易被忽視,很難充分意識(shí)到其重要性。

“持續(xù)運(yùn)營(yíng)”放在這里,是為了突出“生”和“養(yǎng)”同等重要,甚至“養(yǎng)好”比“生好”在項(xiàng)目成功、業(yè)務(wù)成功方面更重要,也是希望跟業(yè)務(wù)主管強(qiáng)調(diào)這方面的重要性。

上圖是一個(gè)AI助手的持續(xù)運(yùn)營(yíng)示例,可供參考,核心是業(yè)務(wù)和IT的聯(lián)合,且以業(yè)務(wù)側(cè)為主(在業(yè)務(wù)運(yùn)營(yíng)、知識(shí)運(yùn)營(yíng)之外,新增了AI訓(xùn)練師角色)。

⑩ 有清晰的業(yè)務(wù)運(yùn)營(yíng)目標(biāo)

一個(gè)AI場(chǎng)景,除了業(yè)務(wù)價(jià)值的指標(biāo)之外,還需要很多過(guò)程指標(biāo),需要觀測(cè)其分子分母、周邊因素、關(guān)鍵依賴(比如知識(shí))、副作用等等,業(yè)務(wù)運(yùn)營(yíng)是需要設(shè)計(jì)的。

?業(yè)務(wù)目標(biāo)有運(yùn)營(yíng)數(shù)據(jù)支撐(過(guò)程可度量)

原則上一個(gè)相對(duì)成熟的業(yè)務(wù),會(huì)有一套現(xiàn)成的業(yè)務(wù)運(yùn)營(yíng)體系,我們要做的是從其中摘到AI應(yīng)用強(qiáng)相關(guān)的部分,再加入IT側(cè)的過(guò)程指標(biāo),如AI應(yīng)用情況(比如性能、并發(fā)、UV/PV、資源消耗)、反饋情況(比如答準(zhǔn)率、搜準(zhǔn)率)、NSS等等。

?業(yè)務(wù)有持續(xù)運(yùn)營(yíng)的組織、資源、機(jī)制和能力

運(yùn)營(yíng)要有流程和組織支撐,才能有生命力。我司的管理哲學(xué)就是把公司制度建筑在流程上,所以沒(méi)有固定的模式在支撐,運(yùn)營(yíng)工作會(huì)變成“腳踩西瓜皮”,干到哪兒算哪兒,甚至有一搭沒(méi)一搭地搞,哪怕搞看板、搞分析、搞預(yù)警,都沒(méi)個(gè)啥用,最后生成一堆任務(wù)也沒(méi)人執(zhí)行。

當(dāng)然,這一切背后,其實(shí)只有一個(gè),就是要業(yè)務(wù)主管非常清楚地意識(shí)到,這里需要投入,而且需要持續(xù)投入。

以上這十二個(gè)問(wèn)題,并不是我個(gè)人的經(jīng)驗(yàn),是華為的集體智慧。

最后,我還想說(shuō),目前業(yè)界關(guān)于AI應(yīng)用有兩種認(rèn)知:

1.一種是“AI+”:真正的AI應(yīng)用是沒(méi)有AI就無(wú)法運(yùn)行的。畢竟大家總用“汽車”和“馬車”來(lái)類比AI和傳統(tǒng)IT,給馬車裝個(gè)內(nèi)燃機(jī)可能不是我們想做的。現(xiàn)在的很多創(chuàng)新類的AI產(chǎn)品,包括chatgpt就屬于這種。

2.一種是“+AI”:就是在很多場(chǎng)景上,增加AI屬性,一點(diǎn)點(diǎn)翻盤。這個(gè)觀點(diǎn)一樣有支撐,就像移動(dòng)互聯(lián)網(wǎng)來(lái)了之后,PC網(wǎng)站還在,線下門店也還在,但是互相支撐后,效果更好了?,F(xiàn)在的copilot式操作,就是這么個(gè)玩法。

這里的核心,是你拿AI當(dāng)什么。如果你認(rèn)為這是生產(chǎn)力工具,那一定是all in,全換,過(guò)去不值得留戀。如果你認(rèn)為這是基礎(chǔ)設(shè)施,那一定是適用的先來(lái),適配一個(gè)切換一個(gè)。

我自己內(nèi)心是認(rèn)可生產(chǎn)力工具的說(shuō)法的,但是現(xiàn)實(shí)情況是企業(yè)要運(yùn)轉(zhuǎn),運(yùn)轉(zhuǎn)邏輯是寫好的,現(xiàn)在掀桌子就都沒(méi)得吃。

所以,我一直有個(gè)觀點(diǎn),當(dāng)下的AI大模型場(chǎng)景應(yīng)用,是面向未來(lái)的一種蓄力和能力儲(chǔ)備,從量變到質(zhì)變的過(guò)程。比如我們從去年單獨(dú)看客服AI,到現(xiàn)在可以看客戶服務(wù)全流程,逐漸把售前、售中、售后都拉齊以后,一個(gè)AI+的雛形就有了,這個(gè)過(guò)程可能需要3~5年甚至更久,但非常值得。

作者:鄭巖(華為云AI變革首席專家)

本文由人人都是產(chǎn)品經(jīng)理作者【鄭巖】,微信公眾號(hào):【時(shí)習(xí)知】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來(lái)自Unsplash,基于 CC0 協(xié)議。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 說(shuō)的很有道理,但感覺(jué)是車轱轆話。這篇文章把AI換成互聯(lián)網(wǎng),在十年前也說(shuō)得通;把AI換成ERP,在二十年前也說(shuō)得通??瓷先ナ钦f(shuō)AI,實(shí)際上放在新興技術(shù)或者科技上都可以帶入,希望能看到更有深度關(guān)于AI的說(shuō)明

    來(lái)自廣東 回復(fù)