當(dāng)全球大模型浪潮洶涌而至,中國科技企業(yè)面臨的不只是技術(shù)競速,更是產(chǎn)業(yè)落地、用戶體驗與國際競爭的多重博弈。當(dāng)大模型的敘事被逐漸拉回現(xiàn)實,一場關(guān)于技術(shù)主權(quán)、國產(chǎn)替代與真實需求的深層次較量悄然展開。
作為中國人工智能“國家隊”的代表,科大訊飛正在用自己的路徑給出另一種回答:堅持全國產(chǎn)算力,在翻譯、數(shù)學(xué)、推理等核心領(lǐng)域構(gòu)建大模型能力;將產(chǎn)品嵌入學(xué)習(xí)機、翻譯機、智能辦公本等具體場景,以“高頻剛需”對抗空泛熱潮;在韓國眾籌平臺成為銷冠、日本市場試水硬件出海,跳出國內(nèi)內(nèi)卷的價格戰(zhàn),驗證中國技術(shù)能否真正走出去。
從“看得見的技術(shù)突破”到“用得上的用戶體驗”,從“實驗室模型”到“市場反饋”,訊飛試圖把AI重新拉回生產(chǎn)一線和出海前沿。這不僅是一個企業(yè)的突圍路線,更是中國AI在國際秩序重構(gòu)中自我定位的一次投射。以下是在2025世界人工智能大會上與科大訊飛副總裁趙翔的對話實錄:
Q:訊飛大模型的特色是什么?
趙翔:人工智能的發(fā)展潮起潮落,現(xiàn)在是第四次人工智能浪潮??拼笥嶏w是一家科技公司,從1999年至今,我們一直專注于此事,研究人工智能,經(jīng)過這些年的努力,我們已經(jīng)積累了一定的經(jīng)驗和技術(shù)。
我們是認(rèn)知性的全國重點實驗室,同時也是語音和語言處理的國家工程中心,可以說,我們是帶有國字號的國家隊。去年6月份,我們的“多語種智能語音關(guān)鍵技術(shù)及產(chǎn)業(yè)化項目”獲得2023年度國家科學(xué)技術(shù)進(jìn)步獎一等獎,這是人工智能領(lǐng)域的唯一獎項,我認(rèn)為它非常重要。這給我們帶來了很大的信心。
2022年,OpenAI發(fā)布ChatGPT3.5之后,全世界的科技公司和大模型公司都開始一路狂奔,各項技術(shù)均有所突破,各種技術(shù)流派百花齊放。我們科大訊飛的大模型是基于長思維鏈進(jìn)行深度推理,本次升級后,不僅在文本,而且在翻譯、數(shù)學(xué)、邏輯推理等重要方面表現(xiàn)非常優(yōu)異。
目前我們的產(chǎn)品基于100%的全國產(chǎn)算力??拼笥嶏w作為一家中國企業(yè),有這樣的使命。我們將與中國其他主要從事算力的公司,如華為公司合作,共同發(fā)展業(yè)務(wù),而這關(guān)系到我國未來在關(guān)鍵領(lǐng)域的核心技術(shù)發(fā)展,是非常重要的。目前,我們的大大模型全中國唯一基于全國產(chǎn)算力的大模型。
訊飛目前的業(yè)務(wù)應(yīng)用場景非常廣闊,而僅憑技術(shù)是不夠的。我認(rèn)為,改變世界的不僅僅是技術(shù)本身,更重要的是能夠落地應(yīng)用到產(chǎn)品。只有將其落地到我們的產(chǎn)業(yè)中,才能讓消費者體驗到我們所發(fā)揮的價值,這樣才能夠正帶動中國經(jīng)濟發(fā)展。
在本次上海世界人工智能大會上,我們的翻譯、企業(yè)辦公以及各行各業(yè)的各方面,不僅是我自己??拼笥嶏w負(fù)責(zé)智能硬件,包括許多行業(yè)的解決方案,都運用到了AI的許多領(lǐng)域,這個能力能夠應(yīng)用于真實場景,解決社會上老百姓的高頻剛需問題。
因此,我認(rèn)為從三個方面來看,訊飛的特色首先是自主核心技術(shù),其次是全國產(chǎn)化,第三個特點是豐富的應(yīng)用場景。
Q:目前終端產(chǎn)品聽起來很棒,但用戶體驗并不好,有雷聲大雨點小的感覺,您認(rèn)為未來突破口在哪里?
趙翔:智能硬件產(chǎn)品,隨著技術(shù)大模型的發(fā)展,入場的玩家會越來越多。我將智能硬件終端產(chǎn)品分為三類。
第一類是大家比較熟悉的基礎(chǔ)設(shè)備。最典型的代表是我們的電腦和手機。第二類是可穿戴設(shè)備,目前最熱門的可穿戴設(shè)備是智能眼鏡。其他的,耳機、智能手環(huán)也都屬于此列。第三類是一些是新的形態(tài)。其中包括家庭機器人、外骨骼機器人和具身智能機器人等。
我認(rèn)為最核心的問題在于,這些設(shè)備沒有基于我們的技術(shù)和軟硬件結(jié)合來解決問題,許多產(chǎn)品尚不成熟。為了解決客戶場景問題,我們得搞清楚,哪些產(chǎn)品是消費者不需要?這類客群的特點是什么?。對一個產(chǎn)品,用戶只有發(fā)自內(nèi)心的喜愛它,并且離不開它,那它才具有生命力和持續(xù)發(fā)展的能力。
我們目前從事技術(shù)和產(chǎn)品工作。訊飛已經(jīng)開發(fā)了幾項產(chǎn)品,當(dāng)然,整體規(guī)模與大型手機廠商還無法相比,但我們?nèi)蕴幱诓粩噙M(jìn)步的階段。我們推出的幾款產(chǎn)品非常受消費者喜愛,例如我們的學(xué)習(xí)機、翻譯機和智能辦公本等設(shè)備,是引領(lǐng)行業(yè)的。
Q:現(xiàn)如今科技企業(yè)內(nèi)卷嚴(yán)重,大打價格戰(zhàn),如何解決這個問題?
趙翔:首先我們需要提高技術(shù)應(yīng)用成效。技術(shù)并非掛在實驗室里的空話,而是要真正地為用戶帶來體驗、效果。
以我們的翻譯為例,我們這次發(fā)布的端到端同傳大模型的升級,優(yōu)勢主要體現(xiàn)在以下幾個方面。首先,我們的語音翻譯效果具體比1月份發(fā)布的版本有20%的提升,滿分100分的測試,可以拿到90分,這其中包括翻譯語句的完整性、翻譯的準(zhǔn)確性和語言質(zhì)量等指標(biāo)。這是我們與中國翻譯協(xié)會合作的結(jié)果。
其次是翻譯速度加快。我們希望能達(dá)到真人同傳以及翻譯員的速度,因此在中英翻譯中,我們從開口說話到機器翻譯開始播報,中間接延遲僅為兩秒。如果用戶有速度上的需要,我們可以立即開始翻譯。
第三是翻譯結(jié)果的播報不能有機器播報聲音。我們是根據(jù)自然語言來理解的,理解被翻譯對象在講什么。根據(jù)對文字的理解,讓得機器如同真人一樣,在哪些地方停頓、延續(xù),怎么讓表達(dá)更加鏗鏘有力或者稍加婉轉(zhuǎn),然后自適應(yīng),通過調(diào)節(jié)語速和語氣,讓整個播報過程更像真人在講話。
第四個是行業(yè)翻譯,正常且簡單的輕翻譯在日常溝通是可行的,能解決用戶的一部分問題。但我們很多用戶是商務(wù)人士,有商務(wù)談判的需求,那在使用我們的翻譯機時,就會更看重行業(yè)術(shù)語翻譯的嚴(yán)謹(jǐn)性。
舉個例子,你在國外去到一家本地醫(yī)院,非醫(yī)療行業(yè)的人未必能夠熟練掌握行業(yè)專有名詞。
但是我們不一樣,我們是機器翻譯,通過大量學(xué)習(xí),在我們的大模型當(dāng)中儲備有8萬個專業(yè)詞匯,涵蓋了各行各業(yè),像醫(yī)療、金融和制造等領(lǐng)域。
Q:目前各大訊飛出海的情況如何?
趙翔:目前科大訊飛正全力出海。我認(rèn)為出海業(yè)務(wù)對中國企業(yè)來說是非常好機會。
首先,我今天查看了今年一季度掃地機全球市場份額排名。前五名中有四個是中國品牌,位列第一到第四,第五名才是國外品牌。而且這四個中國品牌的所占市場份額超過50%,可以說是半壁江山,在全球范圍內(nèi)的影響非常大。
我們目前也在出海,最初我們嘗試推廣在中國市場已經(jīng)取得成功的產(chǎn)品,例如現(xiàn)在的智能辦公本,計劃進(jìn)入韓國市場。硬件產(chǎn)品本身與我們在中國銷售的產(chǎn)品是相同的,同時我們進(jìn)行了一些優(yōu)化,首先是在語言上,基于大語言模型制作韓語版本。
其次,我們根據(jù)韓國用戶的需求,在軟件層面的交互上進(jìn)行改進(jìn)。但韓國人的使用方式與我們與預(yù)期不一樣,仍需適應(yīng)。起初我們還有點兒擔(dān)心自己能力不足,因此沒有選擇大型電商平臺、線下量販店或者連鎖店等渠道。為了能大規(guī)模鋪開,我們決定利用韓國眾籌平臺進(jìn)行試水,反饋回的效果非常好。
在韓國,第一大眾籌平臺是Wadiz,它占據(jù)韓國眾籌市場的80%份額。我們在Wadiz平臺上進(jìn)行眾籌后,竟成功成為單品銷售額第一的冠軍。我們的產(chǎn)品廣受韓國消費者的好評。雖然仍有部分問題亟需改進(jìn),但這給我們帶來很大啟發(fā),增強了訊飛出海的信心。
韓國第一大眾籌平臺是Wadiz
Q:在出海過程中,科大訊飛有遇到哪些需求,又解決了哪些問題?
趙翔:我們目前的出海情況是剛剛起步。中國企業(yè)都在做出海,我們需要賦能大家出海,不僅僅是自己出海,要反內(nèi)卷。除了剛才提到的技術(shù),為了提高用戶使用體驗,我們需要采取一整套方法,即走出去賺錢。開拓國際市場。
這是我的真實經(jīng)歷,有一次在用戶調(diào)研時,我結(jié)識了一位浙江的飲水機銷售人員。他沒有讀過大學(xué),從0開始,將飲水機的年銷售額做到2億元。當(dāng)然,他賣的飲水機不是面向普通消費者的家庭飲水機,而是面向機構(gòu)的商用飲水機。法國戴高樂機場,阿聯(lián)酋迪拜國際機場。還有美國洛杉磯和紐約機場的飲水機都是從他那里買的。
哪怕是今天的大學(xué)生,英語也未必好,特別是口語不行,沒法準(zhǔn)確表達(dá)。我的這位用戶,他根本沒有讀過大學(xué),也不會說英語,但他不僅在英文國家,而且在南美國家,尤其是講西班牙語的國家都能做生意。他就說了因為他在用訊飛的翻譯機,帶著我們的翻譯機一起走天下。
大阪世博會中國館,日本主持人帶著科大訊飛翻譯機在街上對中國游客進(jìn)行采訪 圖源:視頻截圖
我們的翻譯機就是他依靠的依靠,他是浙江人,有那種敢打敢拼精神,如果產(chǎn)品質(zhì)量不好,那么在國外不就用不上,沒法做好自己的事。目前在語言溝通上沒遇到什么障礙,不僅是英文,我們的翻譯機支持80多個語種。像許多一帶一路國家的官方語言都不是英文。
還有一個例子,就是智能錄音筆在日本的銷售情況非常不錯。不錯到什么程度呢?在日本有一家專門從事辦公品類的公司主動找到我們,說他們突然發(fā)現(xiàn)科大訊飛的翻譯機在他的平臺上已經(jīng)排名第一,用戶非常認(rèn)可我們。
在解釋原因的時候,我們告訴他日本人對用戶隱私特別關(guān)注,所以我們?yōu)槿毡咎峁┝艘豢钔耆x線的產(chǎn)品,不需要聯(lián)網(wǎng)使用。這款產(chǎn)品是完全離線且在無網(wǎng)絡(luò)情況下,將本地運算錄音轉(zhuǎn)換為文字的。這款產(chǎn)品在日本銷售得非常好,而以前市面上并沒有這種產(chǎn)品??拼笥嶏w在日本這兩年的表現(xiàn)非常好,就是因為我們能夠滿足本地用戶們實際的需要。
日本個人情報保護(hù)委員會 圖源:pixabay
Q:在人工智能大會的開幕式上使用了科大訊飛的同聲傳譯,科大訊飛剛剛發(fā)布了同傳大模型,如何將賦能到現(xiàn)有翻譯產(chǎn)品中,用戶能感受到哪些最直接的變化又有哪些?
趙翔:訊飛在翻譯領(lǐng)域是什么地位呢?首先,我們擁有全棧技術(shù)能力,也就是同傳技術(shù),其次,我們是實現(xiàn)全場景覆蓋最多的公司。
廣泛場景覆蓋:我們致力于將核心技術(shù)賦能于多樣化的設(shè)備和業(yè)務(wù)場景,是目前翻譯場景和產(chǎn)品覆蓋最廣的公司之一。我們希望在擁有核心技術(shù)之后將其賦能到不同場景的設(shè)備中。
在近期世界人工智能大會上,我們成功提供了現(xiàn)場同傳服務(wù),實現(xiàn)了演講者母語與目標(biāo)語言文字及聲音的同步呈現(xiàn),對翻譯效果和嚴(yán)謹(jǐn)性的要求極高。
在WAIC2025,雙獎得主杰弗里·辛頓作為今年的重磅嘉賓在主論壇發(fā)表演講,在這背后,科大訊飛為其同傳提供實時翻譯支持。
在10人或者20人的中小型會議室中,我們的翻譯機完全可以實現(xiàn)類似同傳效果。演講者在臺上拿一個領(lǐng)夾麥,通過藍(lán)牙連接翻譯機在上面進(jìn)行講解,其他聽眾便可以在屏幕上看到翻譯文字。
我們現(xiàn)在開發(fā)了一個功能,看大屏文字可能會累,那就直接掃碼,用手機或其他外部設(shè)備鏈接,直接看到演講者的內(nèi)容,體驗就會很舒服。我也可以配備耳機將其形成翻譯的聲音播報給演講者。
如果臺下的人需要與臺上的人互動怎么辦?按我可以給大家再發(fā)一個領(lǐng)夾麥,誰發(fā)言誰就拿著。臺下人與臺上人進(jìn)行互動時,翻譯機就能對方也能理解我在講什么,因此在中小型會議上表現(xiàn)很好。通過全向360度角的收音和翻譯,即在一個會議室里,只要將翻譯機在中間,整個會議室的人都會參與其中。
訊飛已經(jīng)開發(fā)翻譯APP,用于簡單的輕翻譯應(yīng)用,目前尚未進(jìn)行大規(guī)模宣傳。等上線時,我們會根據(jù)用戶需求進(jìn)行調(diào)整。我們提供SAAS服務(wù),用戶可以通過線上開會解決問題。如果需要進(jìn)行線上會議或者觀看視頻,,我們在線上也能提供相應(yīng)的同傳服務(wù),根據(jù)用戶需求配備不同的產(chǎn)品和服務(wù),解決各種翻譯問題。
Q:未來大模型與硬件結(jié)合的規(guī)劃是什么?是否有新的爆發(fā)點?
趙翔:這是一個與時俱進(jìn)并慢慢發(fā)生變化的過程,有些硬件產(chǎn)品的形態(tài)可能沒太有改變,仍屬于同類產(chǎn)品,但實現(xiàn)的功能與原來會有所不同。
一方面,我覺得,未來可穿戴設(shè)備可能是個非常大的發(fā)展方向,例如眼鏡,這是業(yè)界最看好的項目。目前,眼鏡的主要問題在于鏡片,它的生態(tài)等各方面也存在問題。今年我注意到一些廠商在世界上發(fā)布了新的智能眼鏡,包括智能眼鏡和耳機,我們訊飛也有一款名為科大訊飛的會議耳機,具備翻譯和一些其他功能,總之這是一個非常大的方向。
那另一個方面是智能硬件在工業(yè)領(lǐng)域的應(yīng)用。在工業(yè)領(lǐng)域替代人,輔助完成簡單的重復(fù)性勞動,例如具身智能的外骨骼機器人,目前的發(fā)展就是這樣。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.