在线观看国产精品第一区免费,亚洲欧美成人网

搜索

APP

起點(diǎn)課堂會(huì)員權(quán)益

職業(yè)體系課特權(quán)

線下行業(yè)大會(huì)特權(quán)

個(gè)人IP打造特權(quán)

30+門(mén)專項(xiàng)技能課

1300+專題課程

12場(chǎng)職場(chǎng)軟技能直播

12場(chǎng)求職輔導(dǎo)直播

12場(chǎng)專業(yè)技能直播

會(huì)員專屬社群

榮耀標(biāo)識(shí)

發(fā)布

注冊(cè) | 登錄

NotebookLM 是 Google 的 ChatGPT 時(shí)刻嗎？

海外獨(dú)角獸

2024-10-18

0 評(píng)論 478 瀏覽 0 收藏

31 分鐘

Google 最近推出的 NotebookLM 在 AI 領(lǐng)域引起了廣泛的關(guān)注和討論。這款實(shí)驗(yàn)性的 AI 工具，允許用戶上傳文件并通過(guò)對(duì)話方式與文檔互動(dòng)，其音頻總結(jié)功能更是將信息獲取方式提升到了新的層次。本文深入探討了 NotebookLM 的技術(shù)原理、設(shè)計(jì)理念以及未來(lái)的發(fā)展方向，同時(shí)討論了它是否標(biāo)志著 Google 的“ChatGPT 時(shí)刻”。

并不擅長(zhǎng) to C 產(chǎn)品的 Google 推出的 NotebookLM 在近期刷了屏，Andrej Karpathy 稱 NotebookLM 讓他想起了 “ChatGPT 時(shí)刻”，Sam Altman 也公開(kāi)表示，“NotebookLM 很酷”。

NotebookLM 的前身是 Project Tailwind，最初是 Google 推出的一款實(shí)驗(yàn)性的 AI 工具。它允許用戶上傳多種格式的文件，隨后用戶可以用對(duì)話的方式和這些文檔進(jìn)行交互，而近期推出音頻總結(jié)更是能將 AI 對(duì)文檔總結(jié)生成播客，讓用戶用“聽(tīng)內(nèi)容”的方式獲取信息，最終引起了產(chǎn)品的病毒式傳播。從一個(gè)“20% 項(xiàng)目”快速增長(zhǎng)到擁有 6 萬(wàn) Discord 社群成員的現(xiàn)象級(jí)產(chǎn)品。?????

本篇內(nèi)容是紅杉美國(guó)的 Pat Grady 和 Sonya Huang 對(duì) NotebookLM 的核心開(kāi)發(fā)團(tuán)隊(duì)成員的訪談。其中，Raiza Martin 是 NotebookLM 的產(chǎn)品負(fù)責(zé)人，而 Jason Spielman 是技術(shù)負(fù)責(zé)人。

團(tuán)隊(duì)成員除了討論 NotebookLM 的誕生背景、關(guān)鍵技術(shù)原理外，也分享了他們觀察到的 NotebookLM 的一系列 use case。關(guān)于如何打造一款 AI- native 產(chǎn)品，NotebookLM 團(tuán)隊(duì)也有著有趣的理解：

1）上下文是 LLM 交互的一個(gè)重要特點(diǎn)，只有基于上下文才能創(chuàng)造粘性極高的用戶體驗(yàn)；

2）今天 AI 應(yīng)用的開(kāi)發(fā)處于“擬物化”的階段，和 iOS 早期一樣，這是因?yàn)檫€有大量用戶才剛開(kāi)始接觸到 AI，開(kāi)發(fā)者需要通過(guò)用戶熟悉交互或者場(chǎng)景來(lái)讓他們習(xí)慣和 AI 互動(dòng)；?

3）Claude Artifacts 的動(dòng)態(tài) UI 也許是 AI 交互的未來(lái)形態(tài)之一。

?? 目錄 ??

01 NotebookLM 是 Google 的

ChatGPT 時(shí)刻嗎

02 NotebookLM 的用例

03 如何設(shè)計(jì)出好的 AI-native 產(chǎn)品

04 NotebookLM 的未來(lái)

一、NotebookLM 是 Google 的 ChatGPT 時(shí)刻嗎？

Sonya Huang: 雖然 NotebookLM 只是一個(gè)實(shí)驗(yàn)性的嘗試，但它很快就形成了病毒式傳播。所以大家都把 NotebookLM 看作是 Google 的 ChatGPT 時(shí)刻，你們?cè)趺纯催@個(gè)觀點(diǎn)？

Raiza Martin: 對(duì)我來(lái)說(shuō)，把 NotebookLM 比成 ChatGPT 時(shí)刻可能太大了，但我也看到很多人通過(guò)項(xiàng)目感受到原來(lái) AI 是這樣的、也體會(huì)到了 AI 的能力，從這個(gè)層面上，NotebookLM 和 ChatGPT 帶來(lái)的影響可能是類似的。

Jason Spielman: 我在第一次聽(tīng) Audio Overview 的時(shí)候，隨著第二個(gè)主持人聲音的出現(xiàn)、音頻總結(jié)變成了一個(gè)播客的時(shí)候真的是一種令人震驚的體驗(yàn)。但我認(rèn)為，更本質(zhì)上，Gemini 1.5 Pro 很好地處理這些復(fù)雜文本，并以相當(dāng)簡(jiǎn)潔的方式呈現(xiàn)出來(lái)，這一點(diǎn)也很重要。所以對(duì)我來(lái)說(shuō)，語(yǔ)言模型和聲音的結(jié)合確實(shí)是一個(gè)很重要的時(shí)刻。

Sonya Huang:你們自己會(huì)怎么定義 NotebookLM？

Raiza Martin:Notebook 是一個(gè) AI 驅(qū)動(dòng)的研究和寫(xiě)作工具，今天很多人可能會(huì)把它用來(lái)將某個(gè)內(nèi)容生成語(yǔ)音總結(jié)或者 Podcast。

Sonya Huang: 作為一個(gè) Killer App，Notebook 是怎么誕生的？是偶然還是刻意設(shè)計(jì)的結(jié)果？

Raiza Martin: 我們一直在研究多模態(tài)的生成和輸出，我認(rèn)為聲音是下一個(gè)重要方向，在這個(gè)基礎(chǔ)上我們選擇了對(duì)話的形式。Notebook 發(fā)布之前我們并不知道它會(huì)成為一個(gè)所謂的 Killer app，我們只是覺(jué)得它的體驗(yàn)會(huì)讓人感到很新奇，但從結(jié)果來(lái)看人們和這個(gè)產(chǎn)品的交互體驗(yàn)比我們想象中更驚人。

去年我們一直在做 AI Test Kitchen 這個(gè)項(xiàng)目，Notebook 最初可能只是一個(gè)完成度只有 20% 的項(xiàng)目。當(dāng)時(shí)我們團(tuán)隊(duì)中有一位工程師在開(kāi)發(fā)一個(gè)叫做“talk to small corpus”，我一開(kāi)始并不理解這個(gè)項(xiàng)目，但后來(lái)我和他交流時(shí)，他解釋說(shuō)，這個(gè)項(xiàng)目的核心思想是利用 LLM 和自己的數(shù)據(jù)對(duì)話，從而從中提取有用信息。當(dāng)時(shí)我就覺(jué)得這個(gè)想法很有趣。

AI Test Kitchen 是 Google 在 2022 年推出的一個(gè)實(shí)驗(yàn)性平臺(tái)，最初在 Google 的 I/O 開(kāi)發(fā)者大會(huì)上亮相，目的是共同負(fù)責(zé)任地學(xué)習(xí)、改進(jìn)和創(chuàng)新 AI。AI Test Kitchen 提供了多種交互式實(shí)驗(yàn)，讓用戶能夠體驗(yàn)到最新的 AI 技術(shù)，例如使用 LaMDA 對(duì)話模型，用 MusicFX 生成音樂(lè)，或者通過(guò) ImageFX 將文字轉(zhuǎn)化為圖像等等，平臺(tái)也允許用戶提交反饋。

也由此我會(huì)繼續(xù)想這項(xiàng)技術(shù)具體能有哪些應(yīng)用場(chǎng)景。作為一名成人學(xué)習(xí)者，我突然意識(shí)到，如果我能利用 LLM 與教科書(shū)進(jìn)行對(duì)話，那將會(huì)是一件很有意義的事情。我能想象到這項(xiàng)技術(shù)不僅可能改變我的生活，還可能改變?cè)S多人的生活。

從那時(shí)起，我們就開(kāi)始著手考慮如何打造這項(xiàng)技術(shù)的第一個(gè)版本，并將其介紹給大眾。去年 5 月，我們推出了 Project Tailwind，這個(gè)項(xiàng)目就是這個(gè)想法的具體實(shí)現(xiàn)。用戶可以上傳一個(gè) PDF 文件作為信息源，然后與之進(jìn)行對(duì)話交流。

Jason Spielman: 我認(rèn)為 NotebookLM 最獨(dú)特的地方在于它是基于源文檔的（source-grounded）。在開(kāi)始做這個(gè)項(xiàng)目時(shí)，我都沒(méi)意識(shí)到我們?nèi)粘?chuàng)造的每樣?xùn)|西，往往都是基于某些已有的資料或文檔。所以目前來(lái)說(shuō)，我會(huì)把它稱為一個(gè)基于源文檔的工具。但實(shí)際上，它正在發(fā)展成為一個(gè)用于創(chuàng)作和其他多種用途的源文檔工具。

Sonya Huang: Notebook 的播客和音頻總結(jié)的體驗(yàn)確實(shí)很神奇，背后的技術(shù)原理是什么？比如，為什么它聽(tīng)起來(lái)如此逼真的？生成的對(duì)話是怎么做到能吸引聽(tīng)眾的？

Raiza Martin: 首先，這絕對(duì)是團(tuán)隊(duì)協(xié)作的成果。其次，能實(shí)現(xiàn)這些體驗(yàn)的核心還是得益于 Google 強(qiáng)大的模型能力。最關(guān)鍵的是 Gemini 1.5 模型，它能夠處理用戶輸入到 NotebookLM 的所有數(shù)據(jù)，并在此基礎(chǔ)上生成全新的內(nèi)容。NotebookLM 的音頻功能也是基于 Google 的語(yǔ)音模型實(shí)現(xiàn)的。這些不同模型的結(jié)合最終造就了 Notebook 的獨(dú)特體驗(yàn)。當(dāng)然，除了模型本身的能力外，我們團(tuán)隊(duì)在如何有效利用這些模型方面也下了不少功夫。

在 Gemini 1.5 和音頻模型之間還有一個(gè)很關(guān)鍵的組件是一個(gè)叫做 Content Studio 的工具。Content Studio 在用戶提供的內(nèi)容源到最終生成的播客的過(guò)程中扮演了內(nèi)容編輯的角色?；?Content Studio ，Notebook 在生成內(nèi)容的過(guò)程中擁有了某種程度上的“創(chuàng)作空間”。

Sonya Huang: 你們是否考慮在未來(lái)把 Studio 這個(gè)功能開(kāi)放給用戶？比如讓用戶可以自己調(diào)整內(nèi)容，讓內(nèi)容更有趣一些，或者更正式一些？

Raiza Martin: 現(xiàn)在使用 Notebook 的用戶很多，對(duì)于我們來(lái)說(shuō)下一步就是讓用戶有更多可控性，讓他們可以自己來(lái)調(diào)整生產(chǎn)的內(nèi)容。其實(shí)一開(kāi)始我聽(tīng)到這些需求我會(huì)直覺(jué)性地反應(yīng)說(shuō)：“好，那就把這些調(diào)節(jié)選項(xiàng)加上吧”。但我現(xiàn)在在嘗試更加謹(jǐn)慎地思考這個(gè)問(wèn)題。大家喜歡上這個(gè)功能是因?yàn)樗屓烁械襟@喜。那么，我們?cè)鯓硬拍茉诒３诌@種驚喜和魔力的同時(shí)，還能給用戶一些可控性？

Jason Spielman: 我認(rèn)為 NoteLM 音頻總結(jié)功能爆發(fā)式增長(zhǎng)的部分原因就在于它是一個(gè)簡(jiǎn)單的一鍵式體驗(yàn)。我之前在電話里向我奶奶解釋如何使用這個(gè)功能，結(jié)果發(fā)現(xiàn)根本不需要解釋。我只要告訴她“把資料導(dǎo)入進(jìn)去”，她就回答“我看到了，然后點(diǎn)這個(gè)按鈕就能生成是吧”？我覺(jué)得正是這種創(chuàng)建的簡(jiǎn)易性真正催化了 Notebook 的爆發(fā)式增長(zhǎng)。所以，在考慮增加一些可控性的選項(xiàng)時(shí)，我們會(huì)很謹(jǐn)慎地去做這件事，保持這種產(chǎn)品簡(jiǎn)單易用的特性。

Pat Grady: 今天幾乎所有 AI 產(chǎn)品都還在圍繞對(duì)話框來(lái)展開(kāi)，你們是怎么想到讓用戶“聽(tīng)內(nèi)容”這件事的？為什么人們會(huì)想要通過(guò)聽(tīng)播客的形式來(lái)了解某些信息？

Raiza Martin: 這件事來(lái)自 Jason 之前提到的一點(diǎn)，那就是：我們要怎么以一種人們易于理解也易于接受的方式來(lái)呈現(xiàn)新的事物，讓他們?cè)敢馊L試？當(dāng)我們想到可以讓用戶上傳素材，然后生成新的語(yǔ)音內(nèi)容時(shí)，我們就在想，到底能生成哪些語(yǔ)音內(nèi)容呢？Google 的這個(gè)語(yǔ)音模型非常強(qiáng)大，既可以生成獨(dú)白，也可以生成對(duì)話，還可以讓用戶來(lái)選擇生成什么格式的內(nèi)容。但真正能引起人們共鳴的點(diǎn)在于，播客是一種對(duì)話形式，它能做的不只是把文本轉(zhuǎn)成語(yǔ)音，讓我們?nèi)ヂ?tīng)朗讀的文本。我認(rèn)為，一旦我們看到這種形式實(shí)際的應(yīng)用，就會(huì)知道這就是我們要去做的事情。

二、NotebookLM 的用例

Sonya Huang:你們提到人們最初是沖著播客功能來(lái)的，然后因?yàn)槠渌δ芰粝聛?lái)。能分享一下音頻之外的好的 use case 嗎？

Raiza Martin: 我在前面提到過(guò) NotebookLM 在教育場(chǎng)景的 use case，我看到很多學(xué)生和教育工作者在使用 NotebookLM，我覺(jué)得這件事對(duì)我個(gè)人來(lái)說(shuō)很有意義。但令人驚訝的是，我發(fā)現(xiàn)有很多人在工作中也會(huì)使用 NotebookLM。

一個(gè)很好的例子是我們?cè)?Google 內(nèi)部試用 NotebookLM 時(shí)看到的一個(gè) use case。Google 廣告團(tuán)隊(duì)中有很多廣告銷售人員和廣告專家，這些廣告銷售人員的銷售培訓(xùn)和文檔往往有幾百頁(yè)那么長(zhǎng)，并且這些內(nèi)容還會(huì)經(jīng)常變化。要熟悉這些內(nèi)容到能夠銷售的程度是很困難的。所以銷售團(tuán)隊(duì)內(nèi)部通常的做法是，或者說(shuō)在有 NotebookLM 之前的做法是，互相詢問(wèn)。一個(gè)典型場(chǎng)景是，他們會(huì)提出類似這樣的問(wèn)題：“Joe，這個(gè)產(chǎn)品到底是怎么運(yùn)作的？我該怎么向客戶推薦？”等 Joe 回復(fù)后，他們?cè)侔鸦貜?fù)復(fù)制粘貼到郵件里，稍作修改就發(fā)出去了。

但實(shí)際上，像 Joe 這樣閱讀了所有文檔、掌握了大量知識(shí)的人，他們會(huì)通過(guò) NotebookLM 創(chuàng)建一個(gè)文檔，然后分享給其他銷售人員，這樣就有上百人自動(dòng)開(kāi)始使用這個(gè) Notebook，也因此他們不用再去咨詢 Joe 了。我覺(jué)得這件事很有趣，因?yàn)檫@是一個(gè)非常簡(jiǎn)單的應(yīng)用場(chǎng)景，但在此基礎(chǔ)上還可以開(kāi)發(fā)出更多用途。

Jason Spielman: 我最近和一個(gè)做銷售的朋友聊天，他也提到自己做了一個(gè) Notebook，在和客戶交流中遇到某些問(wèn)題不清楚答案的時(shí)候，就會(huì)和這個(gè) Notebook 對(duì)話，然后得到對(duì)應(yīng)的答案。我認(rèn)為這種知識(shí)分發(fā)的方式對(duì)于大規(guī)模的銷售團(tuán)隊(duì)或數(shù)據(jù)中心來(lái)說(shuō)非常有幫助。

另一個(gè)我覺(jué)得很有意思的 use case 是，很多在 VC 行業(yè)工作的人在日常工作中要看很多公司信息和對(duì)應(yīng)的文件，我有位 VC 朋友說(shuō)，他現(xiàn)在會(huì)把收到的文檔或 deck 放進(jìn) Notebook 里面，從而更加快速地處理這些信息，工作效率差不多提高了 10 倍。

三、如何設(shè)計(jì)出好的 AI-native 產(chǎn)品？

Sonya Huang: 你們?cè)诋a(chǎn)品設(shè)計(jì)上做了哪些取舍來(lái)讓 Notebook 好用且便捷？

Jason Spielman: 我想先說(shuō)明的是，我們到現(xiàn)在還是在持續(xù)不斷地做這些產(chǎn)品層面的決策，我覺(jué)得我們現(xiàn)在的重點(diǎn)在于快速推出產(chǎn)品，然后通過(guò)和用戶密切互動(dòng)來(lái)理解什么是最好的、他們想要什么。今天模型能力迭代得很快，很難說(shuō)基于模型能力再來(lái)決定做具體什么事情。

但具體來(lái)講的話我認(rèn)為我們有一個(gè)決策是做對(duì)了，就是讓左側(cè)的 Source 欄很突出。我認(rèn)為我們是一個(gè)基于源文檔的項(xiàng)目，我們需要明確表示你是在與你上傳的源文檔對(duì)話。所以我認(rèn)為左側(cè)的 Source 欄是這個(gè)產(chǎn)品的一個(gè)關(guān)鍵部分。另外一點(diǎn)就是正如我之前提到的，一鍵生成音頻總結(jié)對(duì)于產(chǎn)品傳播來(lái)說(shuō)也很有效，我們?cè)诋a(chǎn)品設(shè)計(jì)上整體傾向于這種簡(jiǎn)單的體驗(yàn)。

Raiza Martin: 我想補(bǔ)充一點(diǎn)我們?cè)诋a(chǎn)品層面上的考慮，特別是在產(chǎn)品優(yōu)先級(jí)上，我們一直在思考的問(wèn)題是如何讓一個(gè)新事物變得很直觀。要做到這一點(diǎn)非常困難，特別是像“首先用戶必須上傳一個(gè)源文檔”這種細(xì)節(jié)，用戶通常會(huì)對(duì)這一步產(chǎn)生抵觸，他們可能第一反應(yīng)會(huì)問(wèn)“為什么？”，因?yàn)樵谑褂?ChatGPT 或 Gemini 的時(shí)候第一步并不需要上傳任何文檔，直接就能用。所以我認(rèn)為在“上手即用”這個(gè)方向上，我們還有很多工作要做。

Sonya Huang: 你認(rèn)為在讓人們適應(yīng)這種新的 AI 原生體驗(yàn)時(shí)，還面臨哪些最大的挑戰(zhàn)？

Jason Spielman: 我覺(jué)得今天 AI 產(chǎn)品設(shè)計(jì)所處的階段可以總結(jié)為“擬物化（skeuomorphic）時(shí)代”。擬物化是指用虛擬對(duì)象來(lái)映射現(xiàn)實(shí)世界。在早期 iOS 中可以看到這個(gè)特點(diǎn)，比如 Apple 的 Note 應(yīng)用頂部有皮革邊框，記事本頁(yè)面是黃色的，這是為了幫助用戶更容易從物理世界過(guò)渡到虛擬世界。我覺(jué)得今天我們?cè)?AI 產(chǎn)品上的實(shí)踐也處于類似階段，我們首先要構(gòu)建一些 UI 來(lái)滿足用戶當(dāng)下的需求。但我也想強(qiáng)調(diào)的是，在不斷給用戶創(chuàng)造新奇體驗(yàn)的同時(shí)，也要意識(shí)到，對(duì)許多用戶來(lái)說(shuō)，這是他們第一次與 AI 互動(dòng)。

Sonya Huang: 我認(rèn)為 Midjourney 做得非常好的一點(diǎn)是，它很好地解決了用戶不擅長(zhǎng)提 prompt 的問(wèn)題。在你看來(lái)有沒(méi)有哪些 AI 應(yīng)用在解決這些 UI 挑戰(zhàn)也做得很好的？

Raiza Martin: 我最近用了 Pika，我很喜歡 Pika 的效果預(yù)覽功能，通過(guò)這個(gè)功能用戶可以很清楚地看到上傳圖片后會(huì)發(fā)生什么、得到什么。在看到這些效果預(yù)覽的時(shí)候我就覺(jué)得這些嘗試很有趣，所以我上傳了一張飲料的圖片，然后選擇了一個(gè)蛋糕效果，想把飲料變成蛋糕。等待飲料變成蛋糕的過(guò)程讓我興奮不已，我甚至當(dāng)時(shí)就在想是不是可以付費(fèi)了。所以我覺(jué)得這種效果預(yù)覽不僅可以激發(fā)用戶使用產(chǎn)品的意愿，甚至還可以驅(qū)動(dòng)付費(fèi)。

Jason Spielman: 我覺(jué)得 Claude Artifacts 做得很不錯(cuò)。我認(rèn)為他們?cè)诖a生成方面做得非常出色。我覺(jué)得我們今天所處的階段是怎么平衡 AI 和人類之間的關(guān)系，我們想要?jiǎng)?chuàng)建一個(gè) AI 產(chǎn)品絕對(duì)不想要取代一群人的工作，而是想提供更好的支持。我之所以認(rèn)為 Claude Artifacts 是一個(gè)完美的例子，就是因?yàn)槲覀冊(cè)诤?AI 交流的同時(shí)，它就已經(jīng)在開(kāi)始按照我們的交流去構(gòu)建一些東西了。

Sonya Huang: 在你看來(lái)，NotebookLM 的產(chǎn)品思路和 Claude 相比是有哪些異同？

Jason Spielman: 首先，我們和 Claude 最根本的不同是我們還是圍繞一個(gè)特定文檔來(lái)展開(kāi)交互的工具（source-grounded tool）。

Raiza Martin: 圍繞這一點(diǎn)來(lái)說(shuō)的話，LLM 交互中圍繞上下文展開(kāi)是一個(gè)很重要的特點(diǎn)，我覺(jué)得也正是因?yàn)樯舷挛牡拇嬖诓拍軇?chuàng)造粘性極高的用戶體驗(yàn)。Anthropic、OpenAI 以及 Google 等所有參與 LLM 研究的人肯定都知道這一點(diǎn)，但我認(rèn)為關(guān)鍵在于在什么時(shí)候引入這個(gè)特點(diǎn)，以及基于什么樣的交互界面？

這也是我對(duì)于 NotebookLM 感到興奮的原因。因?yàn)槲覀儚囊婚_(kāi)始就突出了上下文交互這一點(diǎn)。當(dāng)用戶意識(shí)到 source-grounded 的重要性時(shí)，就會(huì)發(fā)現(xiàn) NotebookLM 會(huì)是他們?cè)趯ふ业墓ぞ?。所以我們?dāng)下也會(huì)更專注于這一點(diǎn)，在其它 LLM 工具還在專注其它 use case 時(shí)，我們會(huì)在這個(gè)方向上先走得更遠(yuǎn)。

Sonya Huang: 你之前提到 Chat 是 AI 產(chǎn)品設(shè)計(jì)中的一種擬物化交互界面，NotebookLM 現(xiàn)階段在嘗試更前沿的方式，這種形態(tài)可能會(huì)是什么樣子？

Jason Spielman: 我個(gè)人對(duì)動(dòng)態(tài) UI 很感興趣，Claude Artifacts 就是一個(gè)動(dòng)態(tài) UI 例子。但總體上我覺(jué)得我們目前還處于一個(gè)探索階段，但考慮到用戶是不是也能很好理解 AI 產(chǎn)品的意圖，我們能做的事情是比較有限的。所以現(xiàn)在我們要平衡這種 AI 帶來(lái)的無(wú)限可能和面前的有限需求。

Raiza Martin: 我會(huì)更多地考慮傾向于新的模式。我自己做了很多原型設(shè)計(jì)，也實(shí)驗(yàn)了很多自己的行為。我最喜歡的一個(gè)嘗試是我可以邊走邊和我的 LLM 交談，或者說(shuō)和一整個(gè) AI 生態(tài)系統(tǒng)進(jìn)行交互。

我個(gè)人最近最喜歡的例子之一是，我開(kāi)始通過(guò)這種方式來(lái)“寫(xiě)”日記。不是我自己來(lái)寫(xiě)，而是通過(guò)來(lái)回對(duì)話，讓 LLM 為我創(chuàng)建一個(gè)日志，然后基于這個(gè)日志來(lái)形成一個(gè)可視化的內(nèi)容，呈現(xiàn)的信息大致是，這周我不開(kāi)心的天數(shù)比開(kāi)心的天數(shù)多，哪些是讓我開(kāi)心的事情，哪些是讓我不開(kāi)心的事情。我認(rèn)為在交互中會(huì)產(chǎn)生更多豐富的內(nèi)容。

我們現(xiàn)在嘗試的這種基于一個(gè)特定源文檔的 AI 有一些非常實(shí)用的 use case，主要集中在工作和學(xué)習(xí)場(chǎng)景。但個(gè)人用例也非常吸引人，所以我在思考如何把我的這些個(gè)人產(chǎn)品實(shí)踐的經(jīng)驗(yàn)帶回到 NotebookLM 中，也許是在 Mobile App 里。

四、NotebookLM 的未來(lái)

Sonya Huang: 關(guān)于 NotebookLM 的增長(zhǎng)有哪些可以分享的？

Raiza Martin: 我可以簡(jiǎn)單分享一些情況。在推出音頻總結(jié)功能之前，NotebookLM 的增長(zhǎng)一直比較平穩(wěn)，但自從推出這項(xiàng)功能后，產(chǎn)品的增長(zhǎng)速度就迅速加快了。所以音頻總結(jié)成了吸引用戶嘗試我們產(chǎn)品的一個(gè)非常好的切入點(diǎn)。另外值得一提的是，雖然用戶最初是被音頻總結(jié)吸引來(lái)的，但他們往往會(huì)因?yàn)槠渌δ芏^續(xù)使用我們的產(chǎn)品。這個(gè)現(xiàn)象很有意思，它讓我們看到用戶到底想從 Notebook 這樣的工具中獲得什么。

Pat Grady: 你們往前推進(jìn)這個(gè)項(xiàng)目的思路很像一家創(chuàng)業(yè)公司，團(tuán)隊(duì)足夠精簡(jiǎn)、和用戶交互足夠多、產(chǎn)品快速迭代。這和大家印象中 Google 做事情的方式不太一樣。加入 Google 對(duì)你們做 NotebookLM 有什么幫助嗎？

Raiza Martin: Google 做得比較好、也比較特別的兩點(diǎn)是，首先，在模型完善之前，我們就能接觸到它們，提前了解計(jì)劃推出的功能，這能幫我們從不同的角度去思考該如何開(kāi)發(fā)產(chǎn)品，從而可以更好地去規(guī)劃該怎么完善產(chǎn)品的整個(gè)開(kāi)發(fā)流程。其次，我們團(tuán)隊(duì)里的人都非常聰明，很有才華，也很善于合作，而且都很希望能打造出好的產(chǎn)品。

所以，作為產(chǎn)品的開(kāi)發(fā)者，能夠同時(shí)集齊這兩大要素，就很幸運(yùn)了，之后只需要去執(zhí)行交付就可以了。只要繼續(xù)做下去，就一定能做出有意思的產(chǎn)品。

我覺(jué)得，我們做的一件打破常規(guī)的事是，我們最在意的是先把產(chǎn)品做出來(lái)。因?yàn)槲抑霸?Google 工作過(guò)，我經(jīng)常會(huì)想這樣做會(huì)不會(huì)產(chǎn)生這樣那樣的影響什么的，要考慮的事情太多了，但其實(shí)一旦我們的目標(biāo)是推出產(chǎn)品，就必須不惜一切代價(jià)去實(shí)現(xiàn)它。

Jason Spielman: 現(xiàn)在很多人會(huì)誤以為 Google 做事情很慢。但是我在 Google 工作的 7 年里，我其實(shí)發(fā)現(xiàn)事情推進(jìn)得非?？?。有些團(tuán)隊(duì)的規(guī)模很大，他們每天影響的用戶能有幾個(gè)億，所以會(huì)在決策上更加審慎。我們團(tuán)隊(duì)現(xiàn)在其實(shí)是處在一個(gè)最好的位置，既擁有大公司擁有的規(guī)模和數(shù)據(jù)優(yōu)勢(shì)，但也足夠精簡(jiǎn)，我們團(tuán)隊(duì)大概有 10 人左右，所以我們的速度也會(huì)很快。

Sonya Huang: 你們對(duì) NotebookLM 下一步的規(guī)劃是什么？

Raiza Martin：說(shuō)實(shí)話，就是繼續(xù)往下開(kāi)發(fā) NotebookLM。我們希望用戶體驗(yàn)?zāi)芨?，能讓他們真的?NotebookLM 用起來(lái)，讓人們?cè)敢饬粝聛?lái)繼續(xù)用它。

Pat Grady: 你們覺(jué)得現(xiàn)階段 NotebookLM 還有哪些是沒(méi)做到的？

Raiza Martin: 如果我能回到過(guò)去，在發(fā)布之前多設(shè)計(jì)一些功能，我想要在產(chǎn)品層面實(shí)現(xiàn)更好的內(nèi)容分享。我在刷 X 的時(shí)候會(huì)常常看到有一部分人為了呈現(xiàn) NotebookLM 使用了一些視頻或可視化工具，而不是最原生的 NotebookLM 的界面，我就覺(jué)得自己錯(cuò)過(guò)了這部分用戶，因?yàn)樗麄內(nèi)ビ昧藙e的平臺(tái)。所以，對(duì)我來(lái)說(shuō)，NotebookLM 缺的是音頻總結(jié)的分享和協(xié)作功能。

Jason Spielman: 我比較期待能增加寫(xiě)作功能。比如很多人都會(huì)做 Q&A 調(diào)查，然后基于 Q&A 收集到的答案來(lái)完成新的內(nèi)容創(chuàng)作，所以我很期待能讓 NotebookLM 參與到用戶創(chuàng)造內(nèi)容的整個(gè)過(guò)程里。

Sonya Huang: NotebookLM 生成的內(nèi)容質(zhì)量確實(shí)高，對(duì)我來(lái)說(shuō)，甚至已經(jīng)可以取代人類做的播客了。但為什么你們會(huì)認(rèn)為現(xiàn)在 NotebookLM 做得還不夠好，還不能取代人類做的播客？

Raiza Martin: 在我們的觀察中，用戶想要做成播客的內(nèi)容，和很多人類做的播客內(nèi)容其實(shí)并不重合。比如說(shuō)，我非常喜歡 Lenny’s Podcast，但我不會(huì)想要把他的播客做成一篇文章，再重新生成新的播客去聽(tīng)，而是會(huì)直接聽(tīng)他的播客，聽(tīng)他對(duì)某個(gè)話題的看法是什么。

有些用戶會(huì)用 NotebookLM 給他們的簡(jiǎn)歷或者 LinkedIn 的個(gè)人資料頁(yè)來(lái)制作音頻總結(jié)，還有些初創(chuàng)公司的創(chuàng)始人會(huì)把他們公司登陸頁(yè)的內(nèi)容放到 NotebookLM 里，來(lái)看看他們的信息表達(dá)得是不是足夠清楚。這些做法都很有意思，因?yàn)橹皬膩?lái)沒(méi)有人會(huì)給自己的簡(jiǎn)歷做播客。

Jason Spielman: NotebookLM 的音頻交互其實(shí)和播客是不同的媒體形態(tài)。雖然 NotebookLM 生成的音頻聽(tīng)起來(lái)是播客，但 Raiza 舉的這些例子也很好地說(shuō)明了，人們會(huì)把它用在各種各樣的場(chǎng)景中。我覺(jué)得可以去想問(wèn)什么今天社交媒體上有很多 reaction 視頻。人們現(xiàn)在來(lái)聽(tīng)這期播客不僅僅是因?yàn)槲覀?，也是因?yàn)樗麄兿肼?tīng)到你們作為投資人對(duì)這個(gè)領(lǐng)域的看法，所以當(dāng)我們?cè)谟懻摬タ偷臅r(shí)候，不同立場(chǎng)、背景的人之間的討論互動(dòng)也是要考慮到的。

Raiza Martin: 關(guān)于這一點(diǎn)我想分享一個(gè)很有意思的點(diǎn)。雖然很多用戶都在分享他們生成的音頻總結(jié)，但這個(gè)東西其實(shí)是很私人的。就像我做了個(gè)人簡(jiǎn)歷的播客，但其實(shí)我并不是為了讓其他人來(lái)聽(tīng)我的簡(jiǎn)歷。還有人在 TikTok 上上傳了她從 2004 年開(kāi)始寫(xiě)的日記，像這種事情如果做成播客一起聽(tīng)，肯定很有意思，但是對(duì)她來(lái)說(shuō)，有意思的是她自己寫(xiě)的日記可以被轉(zhuǎn)成音頻的過(guò)程，她可能也不會(huì)專門(mén)去聽(tīng)同類型的播客。

我最喜歡的一個(gè) use case 是，最近有人說(shuō)，周末的時(shí)候他們的大學(xué)群里突然因?yàn)槟臣麓蠹伊牧撕芏鄡?nèi)容，不過(guò)他們并沒(méi)有選擇在當(dāng)時(shí)去讀這些消息，而是把它們?nèi)繌?fù)制粘貼到一個(gè)文檔中，放到周一早上開(kāi)車上班的時(shí)候聽(tīng)，我覺(jué)得這真的很棒，個(gè)性化生成就是這樣的。

Sonya Huang: 今天的 NotebookLM 除了有 Podcast 這個(gè) Killer feature 之外，還提供了一個(gè)面向很多場(chǎng)景應(yīng)用的 horizontal 的交互的界面，你認(rèn)為接下來(lái)還會(huì)做什么？是繼續(xù)強(qiáng)化播客這個(gè)功能嗎？比如有沒(méi)有可能可以生成一段 YouTube 視頻？

Raiza Martin: 輸出視頻的話需要看成本什么時(shí)候能降下來(lái)。

對(duì)于我們來(lái)說(shuō)，首先，我們現(xiàn)在想要實(shí)現(xiàn)的是，讓用戶能夠?qū)敫鞣N類型的內(nèi)容，然后用 AI 創(chuàng)造出新內(nèi)容。播客當(dāng)然是我們想要繼續(xù)探索的一種輸出形式，因?yàn)槲覀円呀?jīng)看到人們都很重視播客。

其次，我們也想往其他方面發(fā)展，做一些更實(shí)用的東西，因?yàn)槊總€(gè)人的偏好都不一樣，甚至就在兩三天前，還有人問(wèn)我，“能輸出播客確實(shí)很好，但你能讓輸出的代碼質(zhì)量更高一點(diǎn)嗎”？這個(gè)方向也很好，但對(duì)我們來(lái)說(shuō)都只是 roadmap，我們確實(shí)要想想怎么去探索輸出的形式。

編譯：牛佳晨
本文由人人都是產(chǎn)品經(jīng)理作者【海外獨(dú)角獸】，微信公眾號(hào)：【海外獨(dú)角獸】，原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理，未經(jīng)許可，禁止轉(zhuǎn)載。

題圖來(lái)自Unsplash，基于 CC0 協(xié)議。

更多精彩內(nèi)容，請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App