NotebookLM 是 Google 的 ChatGPT 時(shí)刻嗎?

0 評(píng)論 478 瀏覽 0 收藏 31 分鐘

Google 最近推出的 NotebookLM 在 AI 領(lǐng)域引起了廣泛的關(guān)注和討論。這款實(shí)驗(yàn)性的 AI 工具,允許用戶上傳文件并通過(guò)對(duì)話方式與文檔互動(dòng),其音頻總結(jié)功能更是將信息獲取方式提升到了新的層次。本文深入探討了 NotebookLM 的技術(shù)原理、設(shè)計(jì)理念以及未來(lái)的發(fā)展方向,同時(shí)討論了它是否標(biāo)志著 Google 的“ChatGPT 時(shí)刻”。

并不擅長(zhǎng) to C 產(chǎn)品的 Google 推出的 NotebookLM 在近期刷了屏,Andrej Karpathy 稱 NotebookLM 讓他想起了 “ChatGPT 時(shí)刻”,Sam Altman 也公開(kāi)表示,“NotebookLM 很酷”。

NotebookLM 的前身是 Project Tailwind,最初是 Google 推出的一款實(shí)驗(yàn)性的 AI 工具。它允許用戶上傳多種格式的文件,隨后用戶可以用對(duì)話的方式和這些文檔進(jìn)行交互,而近期推出音頻總結(jié)更是能將 AI 對(duì)文檔總結(jié)生成播客,讓用戶用“聽(tīng)內(nèi)容”的方式獲取信息,最終引起了產(chǎn)品的病毒式傳播。從一個(gè)“20% 項(xiàng)目”快速增長(zhǎng)到擁有 6 萬(wàn) Discord 社群成員的現(xiàn)象級(jí)產(chǎn)品。?????

本篇內(nèi)容是紅杉美國(guó)的 Pat Grady 和 Sonya Huang 對(duì) NotebookLM 的核心開(kāi)發(fā)團(tuán)隊(duì)成員的訪談。其中,Raiza Martin 是 NotebookLM 的產(chǎn)品負(fù)責(zé)人,而 Jason Spielman 是技術(shù)負(fù)責(zé)人。

團(tuán)隊(duì)成員除了討論 NotebookLM 的誕生背景、關(guān)鍵技術(shù)原理外,也分享了他們觀察到的 NotebookLM 的 一系列 use case。關(guān)于如何打造一款 AI- native 產(chǎn)品,NotebookLM 團(tuán)隊(duì)也有著有趣的理解:

1)上下文是 LLM 交互的一個(gè)重要特點(diǎn),只有基于上下文才能創(chuàng)造粘性極高的用戶體驗(yàn);

2)今天 AI 應(yīng)用的開(kāi)發(fā)處于“擬物化”的階段,和 iOS 早期一樣,這是因?yàn)檫€有大量用戶才剛開(kāi)始接觸到 AI,開(kāi)發(fā)者需要通過(guò)用戶熟悉交互或者場(chǎng)景來(lái)讓他們習(xí)慣和 AI 互動(dòng);?

3)Claude Artifacts 的動(dòng)態(tài) UI 也許是 AI 交互的未來(lái)形態(tài)之一。

         ?? 目錄 ??        

   01 NotebookLM 是 Google 的  

        ChatGPT 時(shí)刻嗎

   02 NotebookLM 的用例

   03 如何設(shè)計(jì)出好的 AI-native 產(chǎn)品

   04 NotebookLM 的未來(lái)

一、NotebookLM 是 Google 的 ChatGPT 時(shí)刻嗎?

Sonya Huang:  雖然 NotebookLM 只是一個(gè)實(shí)驗(yàn)性的嘗試,但它很快就形成了病毒式傳播。所以大家都把 NotebookLM 看作是 Google 的 ChatGPT 時(shí)刻,你們?cè)趺纯催@個(gè)觀點(diǎn)?

Raiza Martin: 對(duì)我來(lái)說(shuō),把 NotebookLM 比成 ChatGPT 時(shí)刻可能太大了,但我也看到很多人通過(guò)項(xiàng)目感受到原來(lái) AI 是這樣的、也體會(huì)到了 AI 的能力,從這個(gè)層面上,NotebookLM 和 ChatGPT 帶來(lái)的影響可能是類似的。

Jason Spielman: 我在第一次聽(tīng) Audio Overview 的時(shí)候,隨著第二個(gè)主持人聲音的出現(xiàn)、音頻總結(jié)變成了一個(gè)播客的時(shí)候真的是一種令人震驚的體驗(yàn)。但我認(rèn)為,更本質(zhì)上,Gemini 1.5 Pro 很好地處理這些復(fù)雜文本,并以相當(dāng)簡(jiǎn)潔的方式呈現(xiàn)出來(lái),這一點(diǎn)也很重要。所以對(duì)我來(lái)說(shuō),語(yǔ)言模型和聲音的結(jié)合確實(shí)是一個(gè)很重要的時(shí)刻。

Sonya Huang:你們自己會(huì)怎么定義 NotebookLM?

Raiza Martin:Notebook 是一個(gè) AI 驅(qū)動(dòng)的研究和寫(xiě)作工具,今天很多人可能會(huì)把它用來(lái)將某個(gè)內(nèi)容生成語(yǔ)音總結(jié)或者 Podcast。

Sonya Huang: 作為一個(gè) Killer App,Notebook 是怎么誕生的?是偶然還是刻意設(shè)計(jì)的結(jié)果?

Raiza Martin: 我們一直在研究多模態(tài)的生成和輸出,我認(rèn)為聲音是下一個(gè)重要方向,在這個(gè)基礎(chǔ)上我們選擇了對(duì)話的形式。Notebook 發(fā)布之前我們并不知道它會(huì)成為一個(gè)所謂的 Killer app,我們只是覺(jué)得它的體驗(yàn)會(huì)讓人感到很新奇,但從結(jié)果來(lái)看人們和這個(gè)產(chǎn)品的交互體驗(yàn)比我們想象中更驚人。

去年我們一直在做 AI Test Kitchen 這個(gè)項(xiàng)目,Notebook 最初可能只是一個(gè)完成度只有 20% 的項(xiàng)目。當(dāng)時(shí)我們團(tuán)隊(duì)中有一位工程師在開(kāi)發(fā)一個(gè)叫做“talk to small corpus”,我一開(kāi)始并不理解這個(gè)項(xiàng)目,但后來(lái)我和他交流時(shí),他解釋說(shuō),這個(gè)項(xiàng)目的核心思想是利用 LLM 和自己的數(shù)據(jù)對(duì)話,從而從中提取有用信息。當(dāng)時(shí)我就覺(jué)得這個(gè)想法很有趣。

AI Test Kitchen 是 Google 在 2022 年推出的一個(gè)實(shí)驗(yàn)性平臺(tái),最初在 Google 的 I/O 開(kāi)發(fā)者大會(huì)上亮相,目的是共同負(fù)責(zé)任地學(xué)習(xí)、改進(jìn)和創(chuàng)新 AI。AI Test Kitchen 提供了多種交互式實(shí)驗(yàn),讓用戶能夠體驗(yàn)到最新的 AI 技術(shù),例如使用 LaMDA 對(duì)話模型,用 MusicFX 生成音樂(lè),或者通過(guò) ImageFX 將文字轉(zhuǎn)化為圖像等等,平臺(tái)也允許用戶提交反饋。

也由此我會(huì)繼續(xù)想這項(xiàng)技術(shù)具體能有哪些應(yīng)用場(chǎng)景。作為一名成人學(xué)習(xí)者,我突然意識(shí)到,如果我能利用 LLM 與教科書(shū)進(jìn)行對(duì)話,那將會(huì)是一件很有意義的事情。我能想象到這項(xiàng)技術(shù)不僅可能改變我的生活,還可能改變?cè)S多人的生活。

從那時(shí)起,我們就開(kāi)始著手考慮如何打造這項(xiàng)技術(shù)的第一個(gè)版本,并將其介紹給大眾。去年 5 月,我們推出了 Project Tailwind,這個(gè)項(xiàng)目就是這個(gè)想法的具體實(shí)現(xiàn)。用戶可以上傳一個(gè) PDF 文件作為信息源,然后與之進(jìn)行對(duì)話交流。

Jason Spielman: 我認(rèn)為 NotebookLM 最獨(dú)特的地方在于它是基于源文檔的(source-grounded)。在開(kāi)始做這個(gè)項(xiàng)目時(shí),我都沒(méi)意識(shí)到我們?nèi)粘?chuàng)造的每樣?xùn)|西,往往都是基于某些已有的資料或文檔。所以目前來(lái)說(shuō),我會(huì)把它稱為一個(gè)基于源文檔的工具。但實(shí)際上,它正在發(fā)展成為一個(gè)用于創(chuàng)作和其他多種用途的源文檔工具。

Sonya Huang:  Notebook 的播客和音頻總結(jié)的體驗(yàn)確實(shí)很神奇,背后的技術(shù)原理是什么?比如,為什么它聽(tīng)起來(lái)如此逼真的?生成的對(duì)話是怎么做到能吸引聽(tīng)眾的?

Raiza Martin: 首先,這絕對(duì)是團(tuán)隊(duì)協(xié)作的成果。其次,能實(shí)現(xiàn)這些體驗(yàn)的核心還是得益于 Google 強(qiáng)大的模型能力。最關(guān)鍵的是 Gemini 1.5 模型,它能夠處理用戶輸入到 NotebookLM 的所有數(shù)據(jù),并在此基礎(chǔ)上生成全新的內(nèi)容。NotebookLM 的音頻功能也是基于 Google 的語(yǔ)音模型實(shí)現(xiàn)的。這些不同模型的結(jié)合最終造就了 Notebook 的獨(dú)特體驗(yàn)。當(dāng)然,除了模型本身的能力外,我們團(tuán)隊(duì)在如何有效利用這些模型方面也下了不少功夫。

在 Gemini 1.5 和音頻模型之間還有一個(gè)很關(guān)鍵的組件是一個(gè)叫做 Content Studio 的工具。Content Studio 在用戶提供的內(nèi)容源到最終生成的播客的過(guò)程中扮演了內(nèi)容編輯的角色?;?Content Studio ,Notebook 在生成內(nèi)容的過(guò)程中擁有了某種程度上的“創(chuàng)作空間”。

Sonya Huang: 你們是否考慮在未來(lái)把 Studio 這個(gè)功能開(kāi)放給用戶?比如讓用戶可以自己調(diào)整內(nèi)容,讓內(nèi)容更有趣一些,或者更正式一些?

Raiza Martin: 現(xiàn)在使用 Notebook 的用戶很多,對(duì)于我們來(lái)說(shuō)下一步就是讓用戶有更多可控性,讓他們可以自己來(lái)調(diào)整生產(chǎn)的內(nèi)容。其實(shí)一開(kāi)始我聽(tīng)到這些需求我會(huì)直覺(jué)性地反應(yīng)說(shuō):“好,那就把這些調(diào)節(jié)選項(xiàng)加上吧”。但我現(xiàn)在在嘗試更加謹(jǐn)慎地思考這個(gè)問(wèn)題。大家喜歡上這個(gè)功能是因?yàn)樗屓烁械襟@喜。那么,我們?cè)鯓硬拍茉诒3诌@種驚喜和魔力的同時(shí),還能給用戶一些可控性?

Jason Spielman: 我認(rèn)為 NoteLM 音頻總結(jié)功能爆發(fā)式增長(zhǎng)的部分原因就在于它是一個(gè)簡(jiǎn)單的一鍵式體驗(yàn)。我之前在電話里向我奶奶解釋如何使用這個(gè)功能,結(jié)果發(fā)現(xiàn)根本不需要解釋。我只要告訴她“把資料導(dǎo)入進(jìn)去”,她就回答“我看到了,然后點(diǎn)這個(gè)按鈕就能生成是吧”?我覺(jué)得正是這種創(chuàng)建的簡(jiǎn)易性真正催化了 Notebook 的爆發(fā)式增長(zhǎng)。所以,在考慮增加一些可控性的選項(xiàng)時(shí),我們會(huì)很謹(jǐn)慎地去做這件事,保持這種產(chǎn)品簡(jiǎn)單易用的特性。

Pat Grady:  今天幾乎所有 AI 產(chǎn)品都還在圍繞對(duì)話框來(lái)展開(kāi),你們是怎么想到讓用戶“聽(tīng)內(nèi)容”這件事的?為什么人們會(huì)想要通過(guò)聽(tīng)播客的形式來(lái)了解某些信息?

Raiza Martin: 這件事來(lái)自 Jason 之前提到的一點(diǎn),那就是:我們要怎么以一種人們易于理解也易于接受的方式來(lái)呈現(xiàn)新的事物,讓他們?cè)敢馊L試?當(dāng)我們想到可以讓用戶上傳素材,然后生成新的語(yǔ)音內(nèi)容時(shí),我們就在想,到底能生成哪些語(yǔ)音內(nèi)容呢?Google 的這個(gè)語(yǔ)音模型非常強(qiáng)大,既可以生成獨(dú)白,也可以生成對(duì)話,還可以讓用戶來(lái)選擇生成什么格式的內(nèi)容。但真正能引起人們共鳴的點(diǎn)在于,播客是一種對(duì)話形式,它能做的不只是把文本轉(zhuǎn)成語(yǔ)音,讓我們?nèi)ヂ?tīng)朗讀的文本。我認(rèn)為,一旦我們看到這種形式實(shí)際的應(yīng)用,就會(huì)知道這就是我們要去做的事情。

二、NotebookLM 的用例

Sonya Huang:你們提到人們最初是沖著播客功能來(lái)的,然后因?yàn)槠渌δ芰粝聛?lái)。能分享一下音頻之外的好的 use case 嗎?

Raiza Martin: 我在前面提到過(guò) NotebookLM 在教育場(chǎng)景的 use case,我看到很多學(xué)生和教育工作者在使用 NotebookLM,我覺(jué)得這件事對(duì)我個(gè)人來(lái)說(shuō)很有意義。但令人驚訝的是,我發(fā)現(xiàn)有很多人在工作中也會(huì)使用 NotebookLM。

一個(gè)很好的例子是我們?cè)?Google 內(nèi)部試用 NotebookLM 時(shí)看到的一個(gè) use case。Google 廣告團(tuán)隊(duì)中有很多廣告銷售人員和廣告專家,這些廣告銷售人員的銷售培訓(xùn)和文檔往往有幾百頁(yè)那么長(zhǎng),并且這些內(nèi)容還會(huì)經(jīng)常變化。要熟悉這些內(nèi)容到能夠銷售的程度是很困難的。所以銷售團(tuán)隊(duì)內(nèi)部通常的做法是,或者說(shuō)在有 NotebookLM 之前的做法是,互相詢問(wèn)。一個(gè)典型場(chǎng)景是,他們會(huì)提出類似這樣的問(wèn)題:“Joe,這個(gè)產(chǎn)品到底是怎么運(yùn)作的?我該怎么向客戶推薦?”等 Joe 回復(fù)后,他們?cè)侔鸦貜?fù)復(fù)制粘貼到郵件里,稍作修改就發(fā)出去了。

但實(shí)際上,像 Joe 這樣閱讀了所有文檔、掌握了大量知識(shí)的人,他們會(huì)通過(guò) NotebookLM 創(chuàng)建一個(gè)文檔,然后分享給其他銷售人員,這樣就有上百人自動(dòng)開(kāi)始使用這個(gè) Notebook,也因此他們不用再去咨詢 Joe 了。我覺(jué)得這件事很有趣,因?yàn)檫@是一個(gè)非常簡(jiǎn)單的應(yīng)用場(chǎng)景,但在此基礎(chǔ)上還可以開(kāi)發(fā)出更多用途。

Jason Spielman: 我最近和一個(gè)做銷售的朋友聊天,他也提到自己做了一個(gè) Notebook,在和客戶交流中遇到某些問(wèn)題不清楚答案的時(shí)候,就會(huì)和這個(gè) Notebook 對(duì)話,然后得到對(duì)應(yīng)的答案。我認(rèn)為這種知識(shí)分發(fā)的方式對(duì)于大規(guī)模的銷售團(tuán)隊(duì)或數(shù)據(jù)中心來(lái)說(shuō)非常有幫助。

另一個(gè)我覺(jué)得很有意思的 use case 是,很多在 VC 行業(yè)工作的人在日常工作中要看很多公司信息和對(duì)應(yīng)的文件,我有位 VC 朋友說(shuō),他現(xiàn)在會(huì)把收到的文檔或 deck 放進(jìn) Notebook 里面,從而更加快速地處理這些信息,工作效率差不多提高了 10 倍。

三、如何設(shè)計(jì)出好的 AI-native 產(chǎn)品?

Sonya Huang: 你們?cè)诋a(chǎn)品設(shè)計(jì)上做了哪些取舍來(lái)讓 Notebook 好用且便捷?

Jason Spielman: 我想先說(shuō)明的是,我們到現(xiàn)在還是在持續(xù)不斷地做這些產(chǎn)品層面的決策,我覺(jué)得我們現(xiàn)在的重點(diǎn)在于快速推出產(chǎn)品,然后通過(guò)和用戶密切互動(dòng)來(lái)理解什么是最好的、他們想要什么。今天模型能力迭代得很快,很難說(shuō)基于模型能力再來(lái)決定做具體什么事情。

但具體來(lái)講的話我認(rèn)為我們有一個(gè)決策是做對(duì)了,就是讓左側(cè)的 Source 欄很突出。我認(rèn)為我們是一個(gè)基于源文檔的項(xiàng)目,我們需要明確表示你是在與你上傳的源文檔對(duì)話。所以我認(rèn)為左側(cè)的 Source 欄是這個(gè)產(chǎn)品的一個(gè)關(guān)鍵部分。另外一點(diǎn)就是正如我之前提到的,一鍵生成音頻總結(jié)對(duì)于產(chǎn)品傳播來(lái)說(shuō)也很有效,我們?cè)诋a(chǎn)品設(shè)計(jì)上整體傾向于這種簡(jiǎn)單的體驗(yàn)。

Raiza Martin: 我想補(bǔ)充一點(diǎn)我們?cè)诋a(chǎn)品層面上的考慮,特別是在產(chǎn)品優(yōu)先級(jí)上,我們一直在思考的問(wèn)題是如何讓一個(gè)新事物變得很直觀。要做到這一點(diǎn)非常困難,特別是像“首先用戶必須上傳一個(gè)源文檔”這種細(xì)節(jié),用戶通常會(huì)對(duì)這一步產(chǎn)生抵觸,他們可能第一反應(yīng)會(huì)問(wèn)“為什么?”,因?yàn)樵谑褂?ChatGPT 或 Gemini 的時(shí)候第一步并不需要上傳任何文檔,直接就能用。所以我認(rèn)為在“上手即用”這個(gè)方向上,我們還有很多工作要做。

Sonya Huang: 你認(rèn)為在讓人們適應(yīng)這種新的 AI 原生體驗(yàn)時(shí),還面臨哪些最大的挑戰(zhàn)?

Jason Spielman: 我覺(jué)得今天 AI 產(chǎn)品設(shè)計(jì)所處的階段可以總結(jié)為“擬物化(skeuomorphic)時(shí)代”。擬物化是指用虛擬對(duì)象來(lái)映射現(xiàn)實(shí)世界。在早期 iOS 中可以看到這個(gè)特點(diǎn),比如 Apple 的 Note 應(yīng)用頂部有皮革邊框,記事本頁(yè)面是黃色的,這是為了幫助用戶更容易從物理世界過(guò)渡到虛擬世界。我覺(jué)得今天我們?cè)?AI 產(chǎn)品上的實(shí)踐也處于類似階段,我們首先要構(gòu)建一些 UI 來(lái)滿足用戶當(dāng)下的需求。但我也想強(qiáng)調(diào)的是,在不斷給用戶創(chuàng)造新奇體驗(yàn)的同時(shí),也要意識(shí)到,對(duì)許多用戶來(lái)說(shuō),這是他們第一次與 AI 互動(dòng)。

Sonya Huang: 我認(rèn)為 Midjourney 做得非常好的一點(diǎn)是,它很好地解決了用戶不擅長(zhǎng)提 prompt 的問(wèn)題。在你看來(lái)有沒(méi)有哪些 AI 應(yīng)用在解決這些 UI 挑戰(zhàn)也做得很好的?

Raiza Martin: 我最近用了 Pika,我很喜歡 Pika 的效果預(yù)覽功能,通過(guò)這個(gè)功能用戶可以很清楚地看到上傳圖片后會(huì)發(fā)生什么、得到什么。在看到這些效果預(yù)覽的時(shí)候我就覺(jué)得這些嘗試很有趣,所以我上傳了一張飲料的圖片,然后選擇了一個(gè)蛋糕效果,想把飲料變成蛋糕。等待飲料變成蛋糕的過(guò)程讓我興奮不已,我甚至當(dāng)時(shí)就在想是不是可以付費(fèi)了。所以我覺(jué)得這種效果預(yù)覽不僅可以激發(fā)用戶使用產(chǎn)品的意愿,甚至還可以驅(qū)動(dòng)付費(fèi)。

Jason Spielman: 我覺(jué)得 Claude Artifacts 做得很不錯(cuò)。我認(rèn)為他們?cè)诖a生成方面做得非常出色。我覺(jué)得我們今天所處的階段是怎么平衡 AI 和人類之間的關(guān)系,我們想要?jiǎng)?chuàng)建一個(gè) AI 產(chǎn)品絕對(duì)不想要取代一群人的工作,而是想提供更好的支持。我之所以認(rèn)為 Claude Artifacts 是一個(gè)完美的例子,就是因?yàn)槲覀冊(cè)诤?AI 交流的同時(shí),它就已經(jīng)在開(kāi)始按照我們的交流去構(gòu)建一些東西了。

Sonya Huang: 在你看來(lái),NotebookLM 的產(chǎn)品思路和 Claude 相比是有哪些異同?

Jason Spielman: 首先,我們和 Claude 最根本的不同是我們還是圍繞一個(gè)特定文檔來(lái)展開(kāi)交互的工具(source-grounded tool)。

Raiza Martin: 圍繞這一點(diǎn)來(lái)說(shuō)的話,LLM 交互中圍繞上下文展開(kāi)是一個(gè)很重要的特點(diǎn),我覺(jué)得也正是因?yàn)樯舷挛牡拇嬖诓拍軇?chuàng)造粘性極高的用戶體驗(yàn)。Anthropic、OpenAI 以及 Google 等所有參與 LLM 研究的人肯定都知道這一點(diǎn),但我認(rèn)為關(guān)鍵在于在什么時(shí)候引入這個(gè)特點(diǎn),以及基于什么樣的交互界面?

這也是我對(duì)于 NotebookLM 感到興奮的原因。因?yàn)槲覀儚囊婚_(kāi)始就突出了上下文交互這一點(diǎn)。當(dāng)用戶意識(shí)到 source-grounded 的重要性時(shí),就會(huì)發(fā)現(xiàn) NotebookLM 會(huì)是他們?cè)趯ふ业墓ぞ?。所以我們?dāng)下也會(huì)更專注于這一點(diǎn),在其它 LLM 工具還在專注其它 use case 時(shí),我們會(huì)在這個(gè)方向上先走得更遠(yuǎn)。

Sonya Huang: 你之前提到 Chat 是 AI 產(chǎn)品設(shè)計(jì)中的一種擬物化交互界面,NotebookLM 現(xiàn)階段在嘗試更前沿的方式,這種形態(tài)可能會(huì)是什么樣子?

Jason Spielman: 我個(gè)人對(duì)動(dòng)態(tài) UI 很感興趣,Claude Artifacts 就是一個(gè)動(dòng)態(tài) UI 例子。但總體上我覺(jué)得我們目前還處于一個(gè)探索階段,但考慮到用戶是不是也能很好理解 AI 產(chǎn)品的意圖,我們能做的事情是比較有限的。所以現(xiàn)在我們要平衡這種 AI 帶來(lái)的無(wú)限可能和面前的有限需求。

Raiza Martin: 我會(huì)更多地考慮傾向于新的模式。我自己做了很多原型設(shè)計(jì),也實(shí)驗(yàn)了很多自己的行為。我最喜歡的一個(gè)嘗試是我可以邊走邊和我的 LLM 交談,或者說(shuō)和一整個(gè) AI 生態(tài)系統(tǒng)進(jìn)行交互。

我個(gè)人最近最喜歡的例子之一是,我開(kāi)始通過(guò)這種方式來(lái)“寫(xiě)”日記。不是我自己來(lái)寫(xiě),而是通過(guò)來(lái)回對(duì)話,讓 LLM 為我創(chuàng)建一個(gè)日志,然后基于這個(gè)日志來(lái)形成一個(gè)可視化的內(nèi)容,呈現(xiàn)的信息大致是,這周我不開(kāi)心的天數(shù)比開(kāi)心的天數(shù)多,哪些是讓我開(kāi)心的事情,哪些是讓我不開(kāi)心的事情。我認(rèn)為在交互中會(huì)產(chǎn)生更多豐富的內(nèi)容。

我們現(xiàn)在嘗試的這種基于一個(gè)特定源文檔的 AI 有一些非常實(shí)用的 use case,主要集中在工作和學(xué)習(xí)場(chǎng)景。但個(gè)人用例也非常吸引人,所以我在思考如何把我的這些個(gè)人產(chǎn)品實(shí)踐的經(jīng)驗(yàn)帶回到 NotebookLM 中,也許是在 Mobile App 里。

四、NotebookLM 的未來(lái)

Sonya Huang: 關(guān)于 NotebookLM 的增長(zhǎng)有哪些可以分享的?

Raiza Martin: 我可以簡(jiǎn)單分享一些情況。在推出音頻總結(jié)功能之前,NotebookLM 的增長(zhǎng)一直比較平穩(wěn),但自從推出這項(xiàng)功能后,產(chǎn)品的增長(zhǎng)速度就迅速加快了。所以音頻總結(jié)成了吸引用戶嘗試我們產(chǎn)品的一個(gè)非常好的切入點(diǎn)。另外值得一提的是,雖然用戶最初是被音頻總結(jié)吸引來(lái)的,但他們往往會(huì)因?yàn)槠渌δ芏^續(xù)使用我們的產(chǎn)品。這個(gè)現(xiàn)象很有意思,它讓我們看到用戶到底想從 Notebook 這樣的工具中獲得什么。

Pat Grady: 你們往前推進(jìn)這個(gè)項(xiàng)目的思路很像一家創(chuàng)業(yè)公司,團(tuán)隊(duì)足夠精簡(jiǎn)、和用戶交互足夠多、產(chǎn)品快速迭代。這和大家印象中 Google 做事情的方式不太一樣。加入 Google 對(duì)你們做 NotebookLM 有什么幫助嗎?

Raiza Martin: Google 做得比較好、也比較特別的兩點(diǎn)是,首先,在模型完善之前,我們就能接觸到它們,提前了解計(jì)劃推出的功能,這能幫我們從不同的角度去思考該如何開(kāi)發(fā)產(chǎn)品,從而可以更好地去規(guī)劃該怎么完善產(chǎn)品的整個(gè)開(kāi)發(fā)流程。其次,我們團(tuán)隊(duì)里的人都非常聰明,很有才華,也很善于合作,而且都很希望能打造出好的產(chǎn)品。

所以,作為產(chǎn)品的開(kāi)發(fā)者,能夠同時(shí)集齊這兩大要素,就很幸運(yùn)了,之后只需要去執(zhí)行交付就可以了。只要繼續(xù)做下去,就一定能做出有意思的產(chǎn)品。

我覺(jué)得,我們做的一件打破常規(guī)的事是,我們最在意的是先把產(chǎn)品做出來(lái)。因?yàn)槲抑霸?Google 工作過(guò),我經(jīng)常會(huì)想這樣做會(huì)不會(huì)產(chǎn)生這樣那樣的影響什么的,要考慮的事情太多了,但其實(shí)一旦我們的目標(biāo)是推出產(chǎn)品,就必須不惜一切代價(jià)去實(shí)現(xiàn)它。

Jason Spielman: 現(xiàn)在很多人會(huì)誤以為 Google 做事情很慢。但是我在 Google 工作的 7 年里,我其實(shí)發(fā)現(xiàn)事情推進(jìn)得非???。有些團(tuán)隊(duì)的規(guī)模很大,他們每天影響的用戶能有幾個(gè)億,所以會(huì)在決策上更加審慎。我們團(tuán)隊(duì)現(xiàn)在其實(shí)是處在一個(gè)最好的位置,既擁有大公司擁有的規(guī)模和數(shù)據(jù)優(yōu)勢(shì),但也足夠精簡(jiǎn),我們團(tuán)隊(duì)大概有 10 人左右,所以我們的速度也會(huì)很快。

Sonya Huang: 你們對(duì) NotebookLM 下一步的規(guī)劃是什么?

Raiza Martin: 說(shuō)實(shí)話,就是繼續(xù)往下開(kāi)發(fā) NotebookLM。我們希望用戶體驗(yàn)?zāi)芨?,能讓他們真的?NotebookLM 用起來(lái),讓人們?cè)敢饬粝聛?lái)繼續(xù)用它。

Pat Grady: 你們覺(jué)得現(xiàn)階段 NotebookLM 還有哪些是沒(méi)做到的?

Raiza Martin: 如果我能回到過(guò)去,在發(fā)布之前多設(shè)計(jì)一些功能,我想要在產(chǎn)品層面實(shí)現(xiàn)更好的內(nèi)容分享。我在刷 X 的時(shí)候會(huì)常常看到有一部分人為了呈現(xiàn) NotebookLM 使用了一些視頻或可視化工具,而不是最原生的 NotebookLM 的界面,我就覺(jué)得自己錯(cuò)過(guò)了這部分用戶,因?yàn)樗麄內(nèi)ビ昧藙e的平臺(tái)。所以,對(duì)我來(lái)說(shuō),NotebookLM 缺的是音頻總結(jié)的分享和協(xié)作功能。

Jason Spielman: 我比較期待能增加寫(xiě)作功能。比如很多人都會(huì)做 Q&A 調(diào)查,然后基于 Q&A 收集到的答案來(lái)完成新的內(nèi)容創(chuàng)作,所以我很期待能讓 NotebookLM 參與到用戶創(chuàng)造內(nèi)容的整個(gè)過(guò)程里。

Sonya Huang: NotebookLM 生成的內(nèi)容質(zhì)量確實(shí)高,對(duì)我來(lái)說(shuō),甚至已經(jīng)可以取代人類做的播客了。但為什么你們會(huì)認(rèn)為現(xiàn)在 NotebookLM 做得還不夠好,還不能取代人類做的播客?

Raiza Martin: 在我們的觀察中,用戶想要做成播客的內(nèi)容,和很多人類做的播客內(nèi)容其實(shí)并不重合。比如說(shuō),我非常喜歡 Lenny’s Podcast,但我不會(huì)想要把他的播客做成一篇文章,再重新生成新的播客去聽(tīng),而是會(huì)直接聽(tīng)他的播客,聽(tīng)他對(duì)某個(gè)話題的看法是什么。

有些用戶會(huì)用 NotebookLM 給他們的簡(jiǎn)歷或者 LinkedIn 的個(gè)人資料頁(yè)來(lái)制作音頻總結(jié),還有些初創(chuàng)公司的創(chuàng)始人會(huì)把他們公司登陸頁(yè)的內(nèi)容放到  NotebookLM 里,來(lái)看看他們的信息表達(dá)得是不是足夠清楚。這些做法都很有意思,因?yàn)橹皬膩?lái)沒(méi)有人會(huì)給自己的簡(jiǎn)歷做播客。

Jason Spielman: NotebookLM 的音頻交互其實(shí)和播客是不同的媒體形態(tài)。雖然 NotebookLM 生成的音頻聽(tīng)起來(lái)是播客,但 Raiza 舉的這些例子也很好地說(shuō)明了,人們會(huì)把它用在各種各樣的場(chǎng)景中。我覺(jué)得可以去想問(wèn)什么今天社交媒體上有很多 reaction 視頻。人們現(xiàn)在來(lái)聽(tīng)這期播客不僅僅是因?yàn)槲覀?,也是因?yàn)樗麄兿肼?tīng)到你們作為投資人對(duì)這個(gè)領(lǐng)域的看法,所以當(dāng)我們?cè)谟懻摬タ偷臅r(shí)候,不同立場(chǎng)、背景的人之間的討論互動(dòng)也是要考慮到的。

Raiza Martin: 關(guān)于這一點(diǎn)我想分享一個(gè)很有意思的點(diǎn)。雖然很多用戶都在分享他們生成的音頻總結(jié),但這個(gè)東西其實(shí)是很私人的。就像我做了個(gè)人簡(jiǎn)歷的播客,但其實(shí)我并不是為了讓其他人來(lái)聽(tīng)我的簡(jiǎn)歷。還有人在 TikTok 上上傳了她從 2004 年開(kāi)始寫(xiě)的日記,像這種事情如果做成播客一起聽(tīng),肯定很有意思,但是對(duì)她來(lái)說(shuō),有意思的是她自己寫(xiě)的日記可以被轉(zhuǎn)成音頻的過(guò)程,她可能也不會(huì)專門(mén)去聽(tīng)同類型的播客。

我最喜歡的一個(gè) use case 是,最近有人說(shuō),周末的時(shí)候他們的大學(xué)群里突然因?yàn)槟臣麓蠹伊牧撕芏鄡?nèi)容,不過(guò)他們并沒(méi)有選擇在當(dāng)時(shí)去讀這些消息,而是把它們?nèi)繌?fù)制粘貼到一個(gè)文檔中,放到周一早上開(kāi)車上班的時(shí)候聽(tīng),我覺(jué)得這真的很棒,個(gè)性化生成就是這樣的。

Sonya Huang: 今天的 NotebookLM  除了有 Podcast 這個(gè) Killer feature 之外,還提供了一個(gè)面向很多場(chǎng)景應(yīng)用的 horizontal 的交互的界面,你認(rèn)為接下來(lái)還會(huì)做什么?是繼續(xù)強(qiáng)化播客這個(gè)功能嗎?比如有沒(méi)有可能可以生成一段 YouTube 視頻?

Raiza Martin: 輸出視頻的話需要看成本什么時(shí)候能降下來(lái)。

對(duì)于我們來(lái)說(shuō),首先,我們現(xiàn)在想要實(shí)現(xiàn)的是,讓用戶能夠?qū)敫鞣N類型的內(nèi)容,然后用 AI 創(chuàng)造出新內(nèi)容。播客當(dāng)然是我們想要繼續(xù)探索的一種輸出形式,因?yàn)槲覀円呀?jīng)看到人們都很重視播客。

其次,我們也想往其他方面發(fā)展,做一些更實(shí)用的東西,因?yàn)槊總€(gè)人的偏好都不一樣,甚至就在兩三天前,還有人問(wèn)我,“能輸出播客確實(shí)很好,但你能讓輸出的代碼質(zhì)量更高一點(diǎn)嗎”?這個(gè)方向也很好,但對(duì)我們來(lái)說(shuō)都只是 roadmap,我們確實(shí)要想想怎么去探索輸出的形式。

編譯:牛佳晨
本文由人人都是產(chǎn)品經(jīng)理作者【海外獨(dú)角獸】,微信公眾號(hào):【海外獨(dú)角獸】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來(lái)自Unsplash,基于 CC0 協(xié)議。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒(méi)評(píng)論,等你發(fā)揮!