Plaud 推出過(guò)兩款 AI 硬件產(chǎn)品,分別是粘在手機(jī)背面的 AI 錄音卡片 Plaud Note 和可穿戴 AI 錄音硬件 NotePin。兩款產(chǎn)品累計(jì)銷量突破了100萬(wàn)臺(tái)。軟件層面,Plaud Intelligence 內(nèi)置了多款主流大模型,能將會(huì)議、通話和語(yǔ)音筆記的錄音,轉(zhuǎn)化為結(jié)構(gòu)化摘要、思維導(dǎo)圖和待辦事項(xiàng)。
Plaud 是如何做大模型產(chǎn)品的?Plaud 中國(guó)區(qū) CEO、AI 產(chǎn)研負(fù)責(zé)人莫子皓,在這篇文章中詳細(xì)介紹了 Plaud 「軟硬結(jié)合」的產(chǎn)品理念。有趣的一點(diǎn)是,「讓人去對(duì)齊大模型,讓大模型去引導(dǎo)人?!?/p>
以下為原文內(nèi)容。
超 12000 人的「AI 產(chǎn)品市集」社群!不錯(cuò)過(guò)每一款有價(jià)值的 AI 應(yīng)用。
邀請(qǐng)從業(yè)者、開(kāi)發(fā)人員和創(chuàng)業(yè)者,飛書(shū)掃碼加群:
進(jìn)群后,你有機(jī)會(huì)得到:
最新、最值得關(guān)注的 AI 新品資訊;
不定期贈(zèng)送熱門新品的邀請(qǐng)碼、會(huì)員碼;
最精準(zhǔn)的AI產(chǎn)品曝光渠道
我們的理念是通過(guò)軟硬結(jié)合的方式去追求人與大模型結(jié)合的智能邊界。我們堅(jiān)信將會(huì)有新的 LLM native 的工作(不是辦公)范式。
獲取 - 提取 - 使用 (capture - extract - utilize)是 Plaud 選擇的道路。
01
何為軟硬結(jié)合?
硬件不是為軟件服務(wù),軟件也不是為硬件服務(wù),軟硬結(jié)合為大模型服務(wù)。大模型需要什么?
大模型需要足夠多的 context
Plaud 一方面是可穿戴設(shè)備(貼在手機(jī)背面我們也理解為可穿戴設(shè)備的一種),另外一方面是獲取用戶 off-line context 的傳感器。
但是 plaud 和手機(jī)的關(guān)系不是互相排斥的關(guān)系,因此手機(jī)攝像頭拍照功能,手機(jī)屏幕的輸入功能,也都能成為我們 context 的一部分。
這也是為什么這一次 Plaud 的更新包含了圖片/文字輸入等不同模態(tài)的輸入。
大模型需要知道人的意圖
選擇開(kāi)關(guān)機(jī),選擇點(diǎn)擊標(biāo)注重點(diǎn),這些都是對(duì)大模型有意義有價(jià)值的對(duì)齊的信息。
我對(duì) 24 小時(shí) always-on 的錄制音頻或者視頻或者無(wú)規(guī)律的間歇性錄制音頻視頻的方式都不太認(rèn)可。這是因?yàn)樽層脩舯磉_(dá)并讓大模型知道意圖的成本遠(yuǎn)比事后大模型自己分析挖掘猜想找到用戶意圖的成本要低很多,而且?guī)?lái)的準(zhǔn)確性也比事后的模糊度帶來(lái)更大的使用上的優(yōu)勢(shì)。
而一場(chǎng)對(duì)話中間,大家低頭記筆記大部分的目的是為了記住這一刻的觀點(diǎn)或者靈感,事后再進(jìn)行整理和細(xì)化。
這也是為什么這一次 Plaud 的更新一個(gè)很重要的功能點(diǎn)是 press to highlight,在開(kāi)啟 Pluad 錄音的過(guò)程中,只需要點(diǎn)擊一下按鈕,Plaud 就會(huì)自動(dòng)記錄 hightlight,并且自動(dòng)幫你總結(jié)這段時(shí)間的內(nèi)容壓縮成短句,同時(shí)在結(jié)束后的 summary 里面會(huì)單獨(dú)把 hightlight 拎出來(lái)去做更深入的展開(kāi)。
大模型需要足夠多的表達(dá)場(chǎng)景
大模型就像一個(gè)全知全能的神,只能讓「神」在你的一次點(diǎn)擊之后在你規(guī)定的地方和你說(shuō)話,這是對(duì)神的能力的極大限制。
無(wú)法展開(kāi)太多,只能說(shuō)這里有很多有意思的事情可以做。
總的來(lái)說(shuō),硬件是使用大模型智能的鑰匙,軟件是使用大模型智能的介質(zhì),而大模型的智能才是皇冠上的那顆明珠
我們的大模型產(chǎn)品理念:通過(guò)軟硬結(jié)合去追求人與大模型結(jié)合的智能邊界。
02
把一切反過(guò)來(lái)想
我的頭像是我寫的幾句話一直都很喜歡:
Plaud is not getting things done is getting context in
Plaud does not help you to work better we help you to think better
Plaud does not generate polished files we generate sparkling ideas
我們學(xué)習(xí)巨人的經(jīng)驗(yàn)但我們不去模仿,沒(méi)有人能通過(guò)模仿別人走向卓越。
大家做許多產(chǎn)品用戶問(wèn)一個(gè)問(wèn)題能生成非常長(zhǎng)的報(bào)告,大模型幫助用戶去尋找更多的公開(kāi)的信息,讓用戶可以做各種 research,從少變多。
我們選擇幫用戶記錄更多未公開(kāi)和未結(jié)構(gòu)化的私有信息,大模型幫助用戶把這些信息變成足夠短足夠精煉和足夠有用的「智能」,從多變少。
大家做許多產(chǎn)品讓人去問(wèn)大模型,并且讓大模型去給答案。
我們選擇讓大模型主動(dòng)問(wèn)人并且主動(dòng)給出答案。
大家做許多產(chǎn)品讓大模型和人對(duì)齊,一步一步引導(dǎo)大模型產(chǎn)出好結(jié)果。
我們選擇讓人和大模型對(duì)齊,讓大模型引導(dǎo)人一步一步問(wèn)出好的問(wèn)題。
總是用戶在提問(wèn)提要求,總是讓模型去找更多的信息,我們?cè)噲D反過(guò)來(lái)。
所有人都在服務(wù)使用工具創(chuàng)造價(jià)值的人,程序員 / 設(shè)計(jì)師 / 文檔使用者。
我們選擇服務(wù)用對(duì)話來(lái)創(chuàng)造價(jià)值的人,銷售 / 顧問(wèn) / 非文檔使用者。
我們的大模型產(chǎn)品理念:不模仿、不抄襲、不妨反過(guò)來(lái)想。
03
我們與大模型的關(guān)系
我的簽名:不是整理和總結(jié)價(jià)值,而是智識(shí)價(jià)值。
我特別堅(jiān)定的相信大模型已經(jīng)在很多方面(接近所有)都已經(jīng)遠(yuǎn)超人的能力,那么我們現(xiàn)在去使用模型的方式和我們跟模型的關(guān)系就應(yīng)該是讓人和模型對(duì)齊。
大模型在超長(zhǎng)文本處理上所突破人類邊界的點(diǎn)在,一方面突破了記憶力的上限,另外一方面突破的注意力帶寬的上限。而模型具備人所不具備的全面的智慧和知識(shí)??偨Y(jié)以上的這幾個(gè)點(diǎn),模型自然而然可以發(fā)現(xiàn)和找到一些我們都想象不到的角度和價(jià)值。
人總是很難跳出框架去想象自己做不到的事情,小學(xué)生肯定無(wú)法去設(shè)想大學(xué)生之前玩的是什么游戲,但是這就是產(chǎn)品經(jīng)理的價(jià)值和工作所在,想象,并交付超出預(yù)期的產(chǎn)品和價(jià)值。
我們的大模型產(chǎn)品理念:插上想象的翅膀,尋找和使用智能的邊界。
04
到底什么是 「格式」 信息與智能傳遞的本質(zhì)
編程語(yǔ)言是人在學(xué)習(xí)機(jī)器說(shuō)話,讓機(jī)器可以聽(tīng)懂人的命令。
而大模型之偉大,是機(jī)器學(xué)會(huì)了人是怎么說(shuō)話的,機(jī)器可以和人交流。
但是我們總沉浸在讓大模型去做 ppt 去做網(wǎng)頁(yè)去去寫文檔。只是這些所有的 format 和格式是人和人交流所需要的介質(zhì),所以我們總是在讓大模型去幫助人來(lái)和人交流。
我們?cè)俅畏催^(guò)來(lái)想,我們是不是可以讓人去幫助大模型來(lái)和大模型交流?如果 LLM - A 或者 agent A 的輸出是下一個(gè) LLM -B 或者 agent-B 的輸入,那么 ppt pages pdf 都不重要甚至都極度低效。那么應(yīng)該以什么方式交流?人在里面是什么角色?
我們有答案,只是我們會(huì)用一款產(chǎn)品來(lái)把我們的答案呈現(xiàn)。
在我看來(lái)寫 prompt 寫代碼 和 寫文章本質(zhì)上是一樣的事情,而文字和語(yǔ)言才是人的思維想法的承載器,我們?cè)谶@一塊讓 LLM 參與的實(shí)在是太少了。
我們的大模型產(chǎn)品理念 思考大模型和 agent 之間是怎么交流 如何讓讓去幫助大模型思考和協(xié)作。
05
capture - extract - utilize
我相信,對(duì)話就是智能。但是過(guò)去蘊(yùn)含在對(duì)話里面的智能都沒(méi)有能被很好的獲取,更不用提使用。因此 Plaud 第一步做的 Capture 就是把我們的 context 如何能夠更好更全面的記錄下來(lái)。
而到了 extract,我特別不喜歡會(huì)議紀(jì)要這個(gè)詞。這個(gè)詞天然就有一種只是記錄的感覺(jué),記錄下來(lái)就是為了存檔,為了后面查漏補(bǔ)缺使用。但是智能一定不僅僅是這樣,智能是多維的,智能是有表象和內(nèi)在的,智能是生產(chǎn)資料。
所以我最喜歡說(shuō)的是,summary 是獲取信息的終點(diǎn),但是是工作發(fā)生的起點(diǎn)。
而為什么我總用工作不用辦公這個(gè)詞,這就只能意會(huì)不能言傳,而我們會(huì)用 enhance performance & enhance productivity 來(lái)衡量我們使用智能的結(jié)果。
Plaud 的理念是通過(guò)軟硬結(jié)合的方式去追求人與大模型結(jié)合的智能邊界
Plaud 堅(jiān)信將會(huì)有新的 LLM native 的工作(不是辦公)范式
雖然我們已經(jīng)賣了 100 萬(wàn)臺(tái),也發(fā)布了我們 app3.0 和 最新的 plaud intelligence,但我們覺(jué)得我們也才剛剛開(kāi)始。
最后作為產(chǎn)品經(jīng)理,要非常感謝 OpenAI 和 ChatGPT,讓我這種上個(gè)時(shí)代的移動(dòng)互聯(lián)網(wǎng)產(chǎn)品經(jīng)理找到了激情和夢(mèng)想,為我創(chuàng)造了偉大的時(shí)代。ChatGPT 也是這個(gè)時(shí)代做的最好最偉大的產(chǎn)品,讓我看到了硅谷的榮光。也要感謝 Cursor 和 Dia,是你們這種構(gòu)建一個(gè) environment 讓人與 LLM 協(xié)作,讓工作在這個(gè) environment 發(fā)生的產(chǎn)品設(shè)計(jì)給了我很多的靈感。
以我面試總喜歡說(shuō)的話作為結(jié)尾。我這一代產(chǎn)品經(jīng)理,是看著 CS183A 入行的,聽(tīng)著 YC 的講座學(xué)做產(chǎn)品的,那已經(jīng)是 10 年前了。當(dāng)時(shí)絕對(duì)沒(méi)法想象,10 年后的自己,可以有這樣一個(gè)做全球產(chǎn)品的機(jī)會(huì),去和老師們?cè)谕粋€(gè)舞臺(tái)表演,萬(wàn)萬(wàn)不能辜負(fù)這個(gè)偉大的時(shí)代,一切只是為了做出偉大的產(chǎn)品。
PS:最后,特別希望在這個(gè)時(shí)代還有才華、有夢(mèng)想的產(chǎn)品經(jīng)理/研發(fā)/算法同學(xué)可以加入 Plaud,跟我們一起探尋智能的邊界。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.