想象過不同語言的人可以像母語一樣自然交流,是一個什么場景嗎?
期待過不再需要學(xué)習(xí)外語,就能和老外自由交流嗎?
在科幻作品里,關(guān)于跨語言溝通的想象數(shù)不勝數(shù)。而在現(xiàn)實中,素有深圳小硅谷的南山,跑出了一家專注解決跨語言溝通問題的科技公司:時空壺。
不但上了新聞聯(lián)播,還被深度報道了近4分鐘!
“為什么你們能做到?”
“這個技術(shù)難在哪里?”
新聞聯(lián)播稱它為“外貿(mào)小公司”。時空壺這公司也的確小,就150多號人??伤鼞{著平均年齡只有28歲的研發(fā)團(tuán)隊,拿到了100多項全球?qū)@J(rèn)證。
產(chǎn)品遠(yuǎn)銷全球170多個國家和地區(qū),北美市場占率超40%,過去三年銷量年均100%的增長,這成績不可謂不亮眼。
今年海關(guān)總署還將他們的產(chǎn)品,列為2024年“中國制造升級”案例進(jìn)行展示。
時空壺出圈的原因,說來也簡單。懂AI,會翻譯。
一個經(jīng)典例子,直到現(xiàn)在,很多翻譯設(shè)備,還是沒搞懂“手沖”咖啡里的“手沖”。
像你想點(diǎn)杯咖啡,其他“實時翻譯耳機(jī)”,說不定會讓你“洗手”去。
(谷歌翻譯都翻車了)
而時空壺與AI大模型進(jìn)行深度融合,擁有聯(lián)系前后文的能力,能幫你下單一杯“手沖咖啡”。
有人可能會覺得,這就是個翻譯對錯的小問題,別人修個bug就追上了。
其實,這能力的差距,中間隔著巨大技術(shù)鴻溝!
接入了大模型后的時空壺,不僅僅是擁有了聯(lián)系上下文的能力。更為關(guān)鍵的本質(zhì),是時空壺的AI翻譯從簡單的“直譯”進(jìn)化為理解語境、把握情感的"意譯"。
現(xiàn)在雖然市面上有很多“AI實時翻譯耳機(jī)”,但你如果用過時空壺W4 Pro后,你會發(fā)現(xiàn)這完全是兩個時代的產(chǎn)品。
時空壺專注跨語言溝通領(lǐng)域9年,先后推出了翻譯耳機(jī)、AI同傳耳機(jī)、AI同聲傳譯器,在行業(yè)里開創(chuàng)了不少先河,并長期引領(lǐng)著行業(yè)發(fā)展。
在體驗上,時空壺率先突破了雙向同傳技術(shù),不僅成功實現(xiàn)了雙人同傳對話,如今更是將翻譯延遲壓縮到僅有3-5秒(作為直接對比,目前聯(lián)合國級別的同聲傳譯人員同傳延遲大概在2秒左右)。
全球范圍內(nèi),除了時空壺,仍然沒有任何一家其它公司的翻譯產(chǎn)品,能夠?qū)崿F(xiàn)這種聽翻譯、說母語同步進(jìn)行的跨語言溝通產(chǎn)品。
甚至可以不夸張的說一句,時空壺已經(jīng)成為中國AI出海企業(yè)的標(biāo)桿。
從洗手,到手沖,到跨國戀愛
人類機(jī)翻花了71年
人類被機(jī)翻,已經(jīng)折磨了70多年。
早在1954年,美國獲得了一大批前蘇聯(lián)的資料,但苦于俄文翻譯員不足。藍(lán)色巨人IBM展示了一個基于6項語法規(guī)則的計算機(jī)翻譯系統(tǒng),可將60個簡單的俄語斷句直譯為英語。
這可以說是人類歷史上的第一次“機(jī)翻”。
那時候政府大力支持機(jī)器翻譯,有樂觀派宣稱:“三年之后機(jī)器翻譯一定非常成熟。”
可這一等,就是71年,但過程是美好的。
2025年,“機(jī)翻”已經(jīng)能幫助人類跨國戀愛。
今年1月,時空壺創(chuàng)始人田力,約了一位用戶吃飯。
他是拉斯維加斯曼達(dá)里灣酒店的調(diào)酒師,在哥倫比亞有個女朋友。
他們語言不通,有時她來美國找他,有時他去哥倫比亞。他們用的就是時空壺的產(chǎn)品在跨國戀愛。
時空壺讓大家能直接交流,建立更好的人際關(guān)系。
從回合制到雙向同傳
隔著一座大山
人類最理想的跨語言對話是什么樣的呢?
大概就是“全世界都在說中國話”的感覺吧。像呼吸般自然,你完全忽略了“翻譯”的存在。
還要懂得察言觀色。例如翻譯“你流氓”,到底是情侶間的打情罵俏,還是嚴(yán)重指控。
要能翻譯方言,也要還原出弄堂煙火氣中的人情世故與時代嬗變。
就像自動駕駛技術(shù),分L1到L5一樣。時空壺和翻譯領(lǐng)域的專家學(xué)者,一起研究搞了個AI實時翻譯分級。
具體就像打怪升級。
L1,就是文本翻譯。以前大家上學(xué)時用電子詞典查單詞,一個字一個字翻譯,效率低,還容易出錯。
L2,這一步最關(guān)鍵的升級,便是從文字升級成語音的交替翻譯,就像玩回合制。比如你說完一句話,對方等翻譯機(jī)延遲10秒左右聽到到內(nèi)容。兩個人像打乒乓球,輪流說,輪流翻譯。
市面上,很多所謂的“AI實時翻譯耳機(jī)”牢牢的被鎖死在這級。
L2升級到L3,大家卡在哪里呢?
你以為給耳機(jī)裝上AI就是L3級別的“AI翻譯耳機(jī)”嗎?很多產(chǎn)品還缺關(guān)鍵的一步,那就是“聽清”,很多都只能應(yīng)付過去。
簡單來說,兩個人各帶一個翻譯耳機(jī)聊天時,你的聲音常常會串臺到對方的耳機(jī)上,加上環(huán)境雜音,耳機(jī)根本就聽不清你在說什么。
很多廠商只能用取巧的土辦法:回合制。一方說完,另一方才能說,中間還要再相隔一個10秒到數(shù)十秒的翻譯時間。
用翻譯軟件,和國外交流過的朋友,最懂這體驗有多糟糕!這天根本聊不下去。
原本1分鐘就能聊完的事,因為語言不通,被迫用上手機(jī)翻譯APP,時間就會膨脹成8-9分鐘。
而現(xiàn)在,同樣的內(nèi)容,時空壺任意一款搭載雙向同傳技術(shù)的產(chǎn)品,可以輕松實現(xiàn)1分30秒甚至1分20秒。
時空壺的解決方案就特別優(yōu)雅,三麥克風(fēng)陣列+矢量降噪技術(shù),就像給耳機(jī)裝了個雷達(dá)。徹底突破L3級雙向同傳的壁壘。
通過聲音到達(dá)麥克風(fēng)的時間差和強(qiáng)度差,計算出你嘴巴的位置和距離。
哪怕你在廣交會那種一堆人嘰嘰喳喳,喇叭聲、人聲混雜的地方,時空壺的耳機(jī),也能像狙擊槍一樣只瞄準(zhǔn)你一個人的聲音,其他噪音全過濾掉。
戴這耳機(jī)跨國聊天,對話過程中隨時可以插話,也可以同時說,并且翻譯延遲只有3-5秒。
“這如同為聲音世界裝上了顯微鏡。”時空壺研發(fā)負(fù)責(zé)人石偉說,他們追求的終極目標(biāo)是利用降噪技術(shù),完全消除說話者以外的雜音、噪聲。
除此之外,在L2與L3之間,另一個大家都意想不到的高墻便是——通信。
大家一開始的設(shè)想,是兩個人各戴一只耳機(jī)來交流,但第一步就走不通了。
大家會用耳機(jī)分享音樂,但很少人會想著分享耳機(jī)一起通話。這對AI翻譯耳機(jī)來說,就出現(xiàn)了個巨Bug!
標(biāo)準(zhǔn)的藍(lán)牙耳機(jī),走的都是單通道錄音,根本沒辦法兩只耳機(jī)分別錄音。
在深圳這種全球硬件之都,都找不到解決方案,甚至找國外的高通,國內(nèi)的海思等芯片大廠,都沒好的答案。
所以被逼上絕路的時空壺,只能自己干。
2017年開始自研通信技術(shù),死磕了4年,才在2021年,拿出了首款能雙向同傳翻譯耳機(jī)W3。
于是,L2終于有了一條通向L3的橋梁。
來到L3,終于有點(diǎn)真人聊天的感覺。語音同聲傳譯,兩個人戴耳機(jī)聊天,你說完5秒內(nèi)就能聽到翻譯,盡管依舊有延遲,但現(xiàn)在,你們可以做到隨時插話,隨時聽懂,不用憋著等,一句話3秒左右的延遲秒,翻譯基本不卡殼。
時空壺目前就是L3中段的水平。
而再進(jìn)一步的L4:將是讀心術(shù)級,從直譯到意譯的質(zhì)變。不僅要翻譯字面意思,還要能聽說話的是生氣,還是開玩笑。
L5:鋼鐵俠管家級,習(xí)慣甚至讀懂弦外之音翻譯。比如你皺眉說“我沒事”,它會翻譯成“他其實在生氣”。
有了分級標(biāo)準(zhǔn),大家終于能搞清,你花的錢,到底買了個怎樣的產(chǎn)品。
L3碾壓局
從10秒到3秒
為什么時空壺能碾壓式的占領(lǐng)北美40%市場?
因為AI翻譯耳機(jī)市場,已經(jīng)成為一個依靠技術(shù)突破,制造爆款的行業(yè)。
時空壺恰好就在打一盤技術(shù)碾壓局,L3碾壓L2。
友商的翻譯,說白了就語音識別→文本翻譯→語音合成三步,每一步誤差疊加,導(dǎo)致最終延遲放大,普遍延遲超過10秒!
而時空壺L3級的翻譯,卻能實現(xiàn)對話的聽音、翻譯、播音并行,將延遲控制在3-5秒以內(nèi)!
大語言模型
毀滅了“雙人同床”
時空壺CMO吳衛(wèi)兵表示:“時空壺”海外銷售額占比達(dá)70%,今年的訂單已經(jīng)排到將近6個月之后了。
2025年美國CES,時空壺公布了其開發(fā)出的業(yè)界首個AI同傳翻譯大模型Babel OS,那實際效果,是不是和銷量體現(xiàn)的那樣強(qiáng)呢?
基哥試了下經(jīng)典的“雙人同床”測試。
基哥普通話不準(zhǔn),把雙人同傳,說成雙人同床。友商翻譯自然齊齊翻車,還有翻譯成雙人同船的。
同樣的測試,時空壺就可以結(jié)合你上下文,你剛說過“同聲傳譯”,聯(lián)系上下文,后面“雙人同傳”自然才是對的。
時空壺大模型對翻譯內(nèi)容自動進(jìn)行糾錯。
在聽懂人話,弄懂人情世故上,這是時空壺的一小步,也是全行業(yè)邁向人工智能的一大步。
有人說“翻譯是遺憾的藝術(shù)”,因為你永遠(yuǎn)不能完全理解一個民族的思想。
這其實就是個準(zhǔn)確度問題,過去的產(chǎn)品,主要依賴逐字直譯。聰明一點(diǎn)的可能會刪掉各種重復(fù)用詞,但遇到例如中文梗,這反而會弄巧成拙,弄出笑話。
“明明明明明白白喜歡他但他就是不說”。
一些友商會自作主張把重復(fù)的“明”過濾了再翻譯。
而時空壺在大模型的加持下,能根據(jù)當(dāng)下的文化背景,把好玩的中文梗翻譯出來。
這其實是很實用的進(jìn)步,大家聊天可以更隨性的使用俚語,更具當(dāng)?shù)靥厣谋磉_(dá)。
時空壺將直譯,進(jìn)化為意譯了。
當(dāng)語言障礙消失,大家能更聚焦于思想碰撞本身,時空壺不是賣耳機(jī),而是賣“互相理解”的可能性。
在無人區(qū)行走
在混沌中尋找出路
時空壺創(chuàng)始人田力的創(chuàng)業(yè)哲學(xué):在混沌中尋找出路才是小公司的出路。
在無人區(qū)行走,就像發(fā)現(xiàn)新大陸一樣有先發(fā)優(yōu)勢。前提是你沒有“死在沙灘上”,而是真的登陸了。
而就算登陸了,田力也很坦率的表示:領(lǐng)先窗口期只有半年。
所以時空壺,現(xiàn)在轉(zhuǎn)頭又扎進(jìn)了新的無人區(qū)。
海外旅游,語言不通是一大障礙,而在飛機(jī)地鐵,又或者在小眾景點(diǎn)時,網(wǎng)絡(luò)糟糕就是雪上加霜。
手機(jī)翻譯軟件,依賴網(wǎng)絡(luò)的翻譯設(shè)備,往往陷入癱瘓,大家都會陷入交流焦慮。
而時空壺已經(jīng)找到了解決的鑰匙。
本地化AI推理,端側(cè)模型勢在必行。
目前最先進(jìn)的翻譯模型,參數(shù)規(guī)模動輒數(shù)十億,上百億,想要完全離線,直接在耳機(jī)或手持設(shè)備上部署大模型翻譯,還非常困難。
但在最新升級的新T1手持翻譯機(jī)上,大家已經(jīng)可以感受到?jīng)]有網(wǎng)絡(luò)后的翻譯體驗。即便是在非洲草原無網(wǎng)環(huán)境下,翻譯準(zhǔn)確率也能達(dá)到95%,解決行業(yè)“最后一公里”難題。
而在此基礎(chǔ)上,時空壺正研究如何用僅有過去1%參數(shù)量的模型,在終端設(shè)備上實現(xiàn)翻譯體驗。大概今年下半年會發(fā)布相關(guān)消息。
斷網(wǎng)也強(qiáng)大的翻譯智能體,終將覆蓋更多的同傳產(chǎn)品。
“技術(shù)因解決問題而生,解決問題只能一步一個腳印來,沒有任何捷徑?!碧锪φf。
小結(jié)
根據(jù)中國翻譯協(xié)會《人工智能與翻譯報告》,AI翻譯技術(shù)已從實驗室走向大規(guī)模商用,廣泛應(yīng)用于跨境商貿(mào)、文化交流、教育醫(yī)療等領(lǐng)域。
而時空壺,是毫無疑問的領(lǐng)軍者。
時空壺的創(chuàng)始人田力,常常問公司的新同事:“30年后翻譯產(chǎn)品會變成什么樣?”
有人說是腦機(jī)接口,如三體人用腦電波交流,有人說是《流浪地球》里吳京與俄羅斯人交流時各戴一個耳機(jī)。
實際是,郭帆導(dǎo)演真的用過時空壺的耳機(jī),還調(diào)侃說:現(xiàn)在科幻電影不好拍,還沒拍完,產(chǎn)品先做出來了。
現(xiàn)在,從華爾街的談判桌到撒哈拉的游牧帳篷,從醫(yī)學(xué)會議的精密術(shù)語到跨國戀愛的深夜私語,都有時空壺的身影,
時空壺有個會議室叫“巴別魚”,來自《銀河系漫游指南》。主角在宇宙飛船上聽不懂外星人說話,塞了一只魚在耳朵里,就能聽懂外星人說話。
這或許正是科技最動人的模樣:讓每一種聲音都被聽懂,每一份意圖都被尊重。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.