AI+音樂|對話 Suno CEO:破圈的音樂生成產(chǎn)品是如何誕生的?
最近,Suno 隨著 V3 的發(fā)布迎來了破圈,那么這款音樂生成產(chǎn)品,是如何誕生的?這篇文章里,作者對 Suno 誕生的背景、Suno 的創(chuàng)作方式等方面做了解讀,我們不妨來看一下。
最近,音樂生成產(chǎn)品 Suno 隨著 V3 的發(fā)布迎來了破圈。這款產(chǎn)品的第一次發(fā)布是在去年 12 月 20 日,在第一時間體驗(yàn)了產(chǎn)品之后我們看到音樂創(chuàng)作和消費(fèi)有望隨著創(chuàng)作門檻的極大降低而成為消費(fèi)級產(chǎn)品的內(nèi)容形態(tài),于是我們發(fā)表了第一篇 Suno 的研究文章。
近日我們進(jìn)一步整理了 Suno CEO:Mikey Shulman 的最新訪談和滾石雜志的報道,關(guān)于 Suno 誕生的背景、音樂創(chuàng)作的方式與消費(fèi)的可能性。
Sense 思考:
我們嘗試基于文章內(nèi)容,提出更多發(fā)散性的推演和深思,歡迎交流。
Suno AI通過結(jié)合人工智能技術(shù)與音樂創(chuàng)作,為用戶提供了一個全新的音樂創(chuàng)作平臺。這種技術(shù)的應(yīng)用不僅降低了音樂制作的門檻,還為音樂愛好者和專業(yè)人士提供了新的創(chuàng)作工具,從而推動了音樂創(chuàng)作的民主化。
Suno AI 可以作為一個教育工具,幫助學(xué)習(xí)者理解音樂結(jié)構(gòu)和創(chuàng)作過程。通過實(shí)踐操作,學(xué)習(xí)者可以更快地掌握音樂創(chuàng)作的技巧,這可能會改變傳統(tǒng)的音樂教育模式。
Suno AI 等工具的出現(xiàn)可能會改變音樂產(chǎn)業(yè)的運(yùn)作方式。從音樂制作到分發(fā),AI 技術(shù)的應(yīng)用可能會導(dǎo)致新的商業(yè)模式和服務(wù)的出現(xiàn),從而影響音樂創(chuàng)作者、發(fā)行商和消費(fèi)者的互動。
AI Native 產(chǎn)品分析——Suno
1.產(chǎn)品:Suno
2. 創(chuàng)立時間:2022 年
3. 創(chuàng)始團(tuán)隊
Mikey Shulman:擔(dān)任首席執(zhí)行官,他曾擔(dān)任Kensho的機(jī)器學(xué)習(xí)主管,麻省理工學(xué)院斯隆管理學(xué)院的講師,哥倫比亞大學(xué)應(yīng)用物理專業(yè)的學(xué)士學(xué)位和哈佛大學(xué)物理學(xué)專業(yè)的博士學(xué)位;
Camachoeorg Kucsko:Kensho Technologies的首席構(gòu)架師,在哈佛大學(xué)畢業(yè)后加入Suno團(tuán)隊。
4. 產(chǎn)品簡介:
Suno AI是一款由麻省理工團(tuán)隊開發(fā)的強(qiáng)大人工智能音樂生成器。用戶可以通過簡單的文本提示進(jìn)行創(chuàng)作,生成多種音樂風(fēng)格的高質(zhì)量音樂和語音。
5. 融資情況:
2023年:Suno.ai進(jìn)行了種子輪融資,融資金額達(dá)到140萬美元;
一、創(chuàng)始人背景與音樂之路
Suno,一款開創(chuàng)性的AI音樂創(chuàng)作工具,在迅速增長的人工智能音樂生成器領(lǐng)域中脫穎而出。與主要關(guān)注器樂作品的傳統(tǒng)工具不同,Suno的獨(dú)特之處在于它能夠創(chuàng)作包含歌詞和人聲的完整歌曲。這一獨(dú)特技能讓Suno與Google的MusicFX以及Meta的AudioGen等競爭者顯著區(qū)別開來。
Suno由一支專門從事AI和機(jī)器學(xué)習(xí)的專家團(tuán)隊創(chuàng)立,他們之前在Kensho Technologies工作過,Suno旨在使音樂創(chuàng)作民主化。包括擁有哈佛物理學(xué)博士學(xué)位的Mikey Shulman在內(nèi)的創(chuàng)始人都是音樂家,他們將Suno視為解決音樂聽眾與創(chuàng)作者之間數(shù)量不平衡的工具。他們的愿景是讓全球十億人能夠使用Suno發(fā)揮自己潛在的音樂才能,提供一個大家都可以簡單使用的歌曲創(chuàng)作平臺。
Mikey Schulman是Suno的CEO聯(lián)合創(chuàng)始人之一,在一次訪談中Schulman回顧了自己的音樂之路。
他從學(xué)習(xí)了多種樂器,并在高中和大學(xué)期間在紐約的一些小型俱樂部里演奏貝斯。盡管演出并不總是那么成功,但與人們一起制作音樂的過程充滿了樂趣。
Mikey:“音樂一直是我生活中很重要的一部分。我從小學(xué)習(xí)小提琴和吉他,大學(xué)時組建了一支樂隊。”
后來,Mikey在哈佛大學(xué)學(xué)習(xí)物理,但他的職業(yè)生涯最終轉(zhuǎn)向了人工智能和機(jī)器學(xué)習(xí)領(lǐng)域。
Mikey:“雖然我學(xué)的是物理,但音樂始終是我的激情所在,我錄過一張EP。作為業(yè)余音樂人,錄音棚工作比現(xiàn)場演出要枯燥得多。我記得有一次錄音時因?yàn)椴恍⌒膹囊巫由匣聛?,?dǎo)致一個很棒的錄音報廢,不得不重新錄。這種事在現(xiàn)場演出時絕對不會發(fā)生?!?/p>
Mikey研究生畢業(yè)后,就在Kensho Technologies工作,該公司后來被S&P Global收購。
Mikey:“我在讀研究生的最后一年,剛好認(rèn)識了 Keno 的一些人,其中一位 Martin 現(xiàn)在是我的聯(lián)合創(chuàng)始人。一次午餐時他們問我什么時候去面試,我說我是學(xué)生,隨時都行。結(jié)果他們說那現(xiàn)在就去吧,我就跟著上樓面試了。雖然面得很糟糕,但他們還是決定給我一個機(jī)會?!?/p>
在Kensho,Mikey和他的團(tuán)隊成員開始探索音頻AI的可能性。Mikey和他的團(tuán)隊在Kensho進(jìn)行的一項(xiàng)關(guān)于語音轉(zhuǎn)寫的項(xiàng)目,讓他們對音頻AI產(chǎn)生了濃厚的興趣。盡管這個項(xiàng)目專注于財經(jīng)領(lǐng)域,但他們認(rèn)識到音頻AI在更廣泛的音樂創(chuàng)作領(lǐng)域內(nèi)的潛力。
Mikey:“Keno 主要是利用 NLP 和機(jī)器學(xué)習(xí)處理大量金融文檔,2018年被標(biāo)普全球收購。收購后我們獲得了大量的金融文檔數(shù)據(jù),簡直是夢想成真。我們還做了一個語音項(xiàng)目,就是將上市公司的財報電話會議實(shí)時轉(zhuǎn)錄成文字。這是 Keno 第一次涉足音頻 AI 領(lǐng)域。我們發(fā)現(xiàn),如果擁有幾十年積累的高質(zhì)量轉(zhuǎn)錄數(shù)據(jù),再加上機(jī)器學(xué)習(xí)算法,就可以大幅提升準(zhǔn)確率,遠(yuǎn)超市面上的語音轉(zhuǎn)文字服務(wù)?!?/p>
Mikey和他的合作伙伴意識到,在金融服務(wù)公司追求音頻AI可能并不合適。他們認(rèn)為有更大的機(jī)會在音樂創(chuàng)作方面利用AI技術(shù)。Mikey特別指出,盡管最初他們沒有確定產(chǎn)品的具體形式,但他們知道這個方向充滿了機(jī)遇和挑戰(zhàn)。
Mikey:“Keno 主要還是做文本方面的項(xiàng)目。這個音頻項(xiàng)目是在被收購一年后開始做的。雖然金融領(lǐng)域確實(shí)有很多音頻方面值得探索的地方,但我認(rèn)為音頻 AI 在金融之外有更廣闊的應(yīng)用空間。另外金融行業(yè)出于風(fēng)險考慮,在創(chuàng)新方面會相對保守一些。文本領(lǐng)域有太多有趣的項(xiàng)目值得投入,很難分散精力去做音頻?!?/p>
Suno團(tuán)隊早期的一個重要里程碑是發(fā)布了一個名為”Bark”的開源文本到語音項(xiàng)目。這個項(xiàng)目受到了社區(qū)的廣泛關(guān)注,他們發(fā)現(xiàn)人們最感興趣的是音樂生成,而不僅僅是文本到語音。他們發(fā)現(xiàn),盡管人們試圖使用Bark生成音樂,但這并不是訓(xùn)練該模型的初衷。但正是這一點(diǎn)激勵了他們更進(jìn)一步發(fā)展Suno,專注于音樂生成。
Mikey:“我們仔細(xì)評估了音頻領(lǐng)域的各種機(jī)會,發(fā)現(xiàn)大部分人并不喜歡處理音頻數(shù)據(jù),可能這就是我們的特別之處,我們是真的很喜歡音頻(笑)。我們一開始就決定要走 foundation model 的路線,因?yàn)閺拈L遠(yuǎn)來看,這是最有前途的方向,雖然當(dāng)時業(yè)界幾乎沒有用 transformer 做音頻的先例。說實(shí)話,剛離開 Keno 時,我們還沒完全確定是要做語音還是音樂。畢竟我們在語音領(lǐng)域有更多經(jīng)驗(yàn),也有不少人勸我們說語音市場更大,不要去做音樂。
但有兩件事改變了我們的想法:
1.作為音樂愛好者,我們還是忍不住要去嘗試音樂;
2.我們開源了一個叫 bark 的語音模型后,在 GitHub 上獲得了很多關(guān)注。通過一個調(diào)查表單,我們發(fā)現(xiàn)用戶最感興趣的領(lǐng)域其實(shí)是音樂,而不是語音。”
Mikey希望讓Suno重新定義音樂的創(chuàng)作和消費(fèi)體驗(yàn),無論你是音樂專業(yè)人士,還是從未嘗試過創(chuàng)作的普通用戶,Sunno都希望成為你表達(dá)內(nèi)心情感、講述生活故事的全新方式。
Mikey:“我們的目標(biāo)就是讓每個人都能將腦海中的音樂靈感,通過簡單易用的工具,轉(zhuǎn)化為實(shí)際的音樂作品。無論你是音樂專業(yè)人士,還是從未嘗試過創(chuàng)作的普通用戶,Suno都希望成為你表達(dá)內(nèi)心情感、講述生活故事的全新方式。未來,我們還計劃探索更多有趣的人機(jī)交互方式。比如也許你可以哼唱一段旋律,模型就能以此為靈感,生成一首完整的歌曲;又或者你可以上傳一些圖片或視頻,講述你的生活片段,模型就能據(jù)此創(chuàng)作出與之相匹配的背景音樂。我們希望充分利用AI的能力,激發(fā)人們的創(chuàng)造力,讓音樂創(chuàng)作成為一種全新的生活方式。當(dāng)然,我們也深知音樂行業(yè)對知識產(chǎn)權(quán)的重視。Sunno致力于以合法合規(guī)的方式發(fā)展音樂AI。我們訓(xùn)練模型時只使用了無版權(quán)問題的音樂數(shù)據(jù)。生成的歌曲也經(jīng)過了仔細(xì)地過濾,確保不會侵犯任何藝術(shù)家的權(quán)益。用戶創(chuàng)作的歌曲,其版權(quán)將完全由用戶自己所有。我們的目標(biāo)是成為連接音樂人和AI的橋梁,讓雙方都能從這項(xiàng)技術(shù)中受益,而不是相互取代?!?/p>
二、Suno的創(chuàng)作方式
Suno的獨(dú)特之處在于它不僅生成音樂的旋律和伴奏,還能創(chuàng)作歌詞和人聲。這意味著它可以產(chǎn)生完整的歌曲,包括所有必要的音樂元素。它的音樂元素甚至包含了不同種語言,甚至是方言,粵語,四川話的音樂都可以生成。
使用Suno的時候,用戶可以選擇兩種模式。
- 基礎(chǔ)模式:用戶提供一個AI風(fēng)格的文本提示,并可以選擇讓歌曲保持純樂器,無歌詞的演奏。
- 自定義模式:用戶可以使用自己的歌詞,設(shè)置多種流派風(fēng)格的音樂,并給主動給歌曲命名。
用戶使用Suno的創(chuàng)作流程很簡單,當(dāng)用戶使用Suno時,用戶首先選擇生成模式(基礎(chǔ)或自定義),然后輸入相關(guān)的提示信息,如歌曲的主題、風(fēng)格或特定的歌詞。Suno利用這些輸入生成一首完整的歌曲,并提供音軌供用戶試聽,同時提供歌詞和代表歌曲主題的圖片。
Suno以端到端的方式生成歌曲,意味著歌曲的人聲、樂器和其他所有部分都是一次性生成的,并且使Suno能夠創(chuàng)建歌詞和人聲的決定大大增加了模型訓(xùn)練的復(fù)雜性。這需要Suno的創(chuàng)始團(tuán)隊投入大量的努力,以確保模型能理解和生成人類的歌聲和歌詞。
在Suno最新的版本v3中引入了更多自然 sounding 和較少 auto-tune 樣式的人聲,以及為用戶提供對創(chuàng)作過程更細(xì)致控制的新功能。例如,用戶可以鎖定他們喜歡的歌曲部分并重新生成不符合預(yù)期的部分。
三、Suno的創(chuàng)作意義
Suno提供了一條讓人們可以用文本探索音樂的道路,讓任何人都可以享受制作音樂的樂趣,無論創(chuàng)作者是否有音樂背景。Suno希望賦能更多人將內(nèi)心的旋律轉(zhuǎn)化為現(xiàn)實(shí),讓音樂創(chuàng)作不再局限于專業(yè)音樂人。
Suno不僅關(guān)注于如何以新的方式創(chuàng)作音樂,也致力于探索如何以新的方式體驗(yàn)和分享音樂。Suno的出現(xiàn)可能預(yù)示著音樂消費(fèi)和分享方式的變革,其中音樂不再僅僅是被動消費(fèi)的對象,而是可以根據(jù)聽眾的具體情感和需求動態(tài)生成的體驗(yàn)。
Suno通過使音樂創(chuàng)作更加普及和個性化,有可能改變?nèi)藗兣c音樂的關(guān)系,促進(jìn)音樂作為一種表達(dá)和溝通方式的發(fā)展。這種自然語言創(chuàng)造音樂的分享方式將會產(chǎn)生一種新的社交模式——音樂社交。
音樂社交不僅僅是關(guān)于分享音樂本身,它還是一種新的互動方式,讓人們可以通過音樂來連接和理解彼此。在這個平臺上,用戶不僅可以發(fā)布自己的音樂作品,還可以發(fā)現(xiàn)來自世界各地的創(chuàng)作者和他們的作品,從而激發(fā)新的靈感和創(chuàng)意。這種跨文化的交流和合作將推動音樂的創(chuàng)新,使其成為一種真正全球化的語言。
隨著Suno社區(qū)的不斷壯大,我們也將看到更多基于音樂的社交活動和事件的出現(xiàn)。從在線音樂會到創(chuàng)作工作坊,Suno為用戶提供了一個平臺,讓他們可以共同參與和享受音樂的樂趣。這不僅加深了社區(qū)成員之間的聯(lián)系,也為音樂愛好者帶來了全新的體驗(yàn)和機(jī)會。
參考材料:
https://www.tomsguide.com/ai/i-tried-the-radio-quality-suno-ai-music-generator-heres-how-it-sounds
https://www.rollingstone.com/music/music-features/suno-ai-chatgpt-for-music-1234982307/
https://gosummarize.com/youtube/@lightspeedvp/mikey-shulman-suno-and-the-sound-of-ai-music
編譯:Evan;編輯:Vela
來源公眾號:深思SenseAI;關(guān)注全球 AI 前沿,走進(jìn)科技創(chuàng)業(yè)公司,提供產(chǎn)業(yè)多維深思。
本文由人人都是產(chǎn)品經(jīng)理合作媒體 @深思SenseAI 授權(quán)發(fā)布,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自 Unsplash,基于CC0協(xié)議
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。
Suno所開創(chuàng)的音樂創(chuàng)作與分享模式是一場深刻的變革,它讓音樂變得更加親民、更加多元、更加具有創(chuàng)新性。我為能夠見證和參與這一變革而感到興奮和自豪。