近日,618年中大促正如火如荼進行,各大電商平臺已早早開始了這場消費狂歡的競速。數(shù)據(jù)顯示,在競爭激烈的智能網(wǎng)絡(luò)產(chǎn)品中,科大訊飛脫穎而出,成功奪得翻譯機、錄音筆、智能機器人等多個產(chǎn)品品類的銷售冠軍。
在普通大眾的印象中,這家以語音技術(shù)見長的人工智能企業(yè)似乎是近些年來國內(nèi)的一股新鮮力量,畢竟人工智能熱潮前后才不過五六年的時間。但事實上,這家公司已在智能語音與人工智能領(lǐng)域深耕多年。6月9日,科大訊飛迎來了它的20周歲生日。
一個決定,一個誕生
在科大訊飛20周年內(nèi)部講話中,劉慶峰說:“未來十年,我們有三個關(guān)鍵戰(zhàn)略路徑。第一,要堅定不移地實施頂天立地的技術(shù)戰(zhàn)略,我們的價值核心基礎(chǔ)是技術(shù)的持續(xù)領(lǐng)先和引領(lǐng)、立足于未來的產(chǎn)業(yè)需求、發(fā)展高科技并實現(xiàn)產(chǎn)業(yè)化;第二,要堅定不移地推行我們平臺+賽道的產(chǎn)品戰(zhàn)略,產(chǎn)品要成功、生態(tài)也要成功;第三,要堅定不移地推動to B和to C的雙輪驅(qū)動。用A.I.賦能個人成為產(chǎn)業(yè)的拓荒者和領(lǐng)導(dǎo)者,我相信科大訊飛在未來十年產(chǎn)業(yè)版圖的前途會非常巨大。”
這些年劉慶峰做了無數(shù)次演講,而上述一幕只是這些年間的無數(shù)分之一。演講之后,面對滿堂的鼓掌與喝彩,也許劉慶峰眼前會掠過自己26歲時的影子。
1999年,26歲的劉慶峰必須做出一個至關(guān)重要的選擇。
一是出國讀博,已經(jīng)有學(xué)校愿意提供幾萬美元的獎學(xué)金。而這條路的盡頭,或許是窮經(jīng)皓首的劉博士,亦或許是一顆耀眼的學(xué)界明星;
二是接受剛剛組建微軟亞洲研究院的李開復(fù)提供的微軟獎學(xué)金,到微軟實習(xí)一個月。更大的公司,更大的平臺,更平穩(wěn)的過渡;
三是帶領(lǐng)實驗室的師兄弟們,一起做一番事業(yè),前路一片混沌。
三個選擇,三種人生。劉慶峰選擇了最難的第三條路,而這看似沖動的決定背后,卻是十分具體而審慎的選擇。
在當(dāng)時,劉慶峰正擔(dān)任福建中銀集團與中科大建立的聯(lián)合實驗室、中文語音合成第一個產(chǎn)業(yè)化的實體中銀天鷹智能多媒體實驗室的總工程師,和師兄弟一起開始為中銀集團提供技術(shù)支持。
在上個世紀末,所有人都并不清楚語音要具體做什么。今天想搞個語音PDA,明天又想做個語音聽寫軟件,后天又搞工商查詢系統(tǒng),團隊疲憊不堪。兄弟們受不了,便找到劉慶峰說,要么你出來當(dāng)CEO,要么我們就解散。
與此同時,劉慶峰的博士生導(dǎo)師王仁華也對他說,這個事情可以成,這么多優(yōu)秀的年輕人能團結(jié)在一起,在科大的歷史上還從來沒有過,要是解散就太可惜了。
而且,當(dāng)時語音技術(shù)大都掌握在國外的高校和企業(yè)手中,而國內(nèi)關(guān)于這片土地還仍是一片待開墾狀態(tài)。因此有一句話一直在劉慶峰腦袋里揮之不去,那個聲音在說:“中文語音技術(shù)應(yīng)當(dāng)由中國人做到全球最好,中文語音產(chǎn)業(yè)應(yīng)當(dāng)掌握在中國人自己手中。”
青年的熱血澆筑理想,風(fēng)華正茂,揮斥方遒。
夢開始的地方,在合肥市西園新村的出租小屋。由于計算機散發(fā)的熱量,本來狹窄局促的房間顯得更加悶熱,夏季來臨,計算機圍成一圈,房頂?shù)跻粋€電扇,每個人都汗流浹背,一邊擦汗一邊擦鍵盤。
回想起創(chuàng)業(yè)之初的情形,劉慶峰說,我們在工作室旁邊的農(nóng)村里找了一戶人家給我們做飯,中午吃飯也沒椅子,大家就都蹲在那個地上。因為做語音需要,我們請了一個播音員女孩子,她來的時候還很興奮,結(jié)果來了三天,她很委屈,一邊吃飯一邊說,這哪是搞研究的,就是一幫難兄難弟。
而平行宇宙中的劉慶峰,或許正身穿白襯衫,出入于微軟研究院,做著一份更加“體面”的工作。
等風(fēng)來
創(chuàng)業(yè)生涯,九死一生,這不是開玩笑。
早在1998年,劉慶峰帶隊參加了在北京的863語音合成評測,這一次中科大在評測中獲得了3分(5分是播音員水準,4分是普通人發(fā)音表現(xiàn),而3分則是勉強可以接受的),這是當(dāng)時語音合成獲得最高的分數(shù),“唯一達到了可實用階段”。
隨后,在1998年8月的“國家火炬計劃十周年成就暨高新技術(shù)產(chǎn)品博覽會”中,中科大的語音合成系統(tǒng)被選為唯一的軟件標志性產(chǎn)品而列在特展位上。同年12月,在新加坡舉行的國際漢語口語處理研討會(ISCSL)上,中科大的KD語音合成系統(tǒng)被與會各國專家高度評價,劉慶峰介紹KD系統(tǒng)的論文也獲得了大會的最佳學(xué)生論文獎。
這是一個技術(shù)上極其強勁的團隊,但在商海中一樣必須面對暗礁涌動。
2000年,個人電腦開始進入中國家庭,很多用戶根本不會操作,科大訊飛看準了這個“痛點”,推出了第一款產(chǎn)品“暢言2000”。借助語音方便電腦操作,在當(dāng)時打出了“會說話就會用電腦”的廣告。
劉慶峰將銷售渠道鋪到了全國10多個省,他們甚至預(yù)想了產(chǎn)品熱銷的豐滿夢想,但由于語音輸入和控制并非硬需求,大多數(shù)人還是更習(xí)慣于使用鍵盤和鼠標,加之價格太高,暢言2000幾乎無人問津,科大訊飛也由此虧掉兩千多萬。
秋末,科大訊飛經(jīng)歷了市場的沉痛打擊后,于巢湖半湯溫泉,迎來自己命運的第二次抉擇。
半湯會議持續(xù)了兩天,雖然劉慶峰希望借助溫泉這樣一個放松的環(huán)境來想清楚公司的前路。但秋末的寒冷依然使會議的氣氛變得肅殺。
有人說直接解散吧。
有人說可以做別的賺錢更快的行業(yè)。
十幾個人各抒己見,會場一片狼藉。最后,劉慶峰做出了最終的決定:繼續(xù)做語音,誰不樂意,直接走人。
“燃燒最亮的火把,要么率先燎原,要么最先熄滅”,這是劉慶峰在當(dāng)年的年度大會上說的一句話,這句話至今仍被掛在訊飛大廈的墻上,激勵著每個訊飛人在智能語音與人工智能道路上不忘初心,堅守前行。
回顧科大訊飛二十年來的發(fā)展歷程,這是兩個關(guān)乎命運的決定。而隨后將科大訊飛帶到“全球50大最聰明公司第六名”、“中國第一個語音上市公司”、“中國第一個在校大學(xué)生創(chuàng)業(yè)上市的公司”這樣位置的,則是一個堅持。
智能語音和人工智能,這一在創(chuàng)業(yè)初期就決定好的方向,在二十年里科大訊飛一直沒有動搖過,并且從來都是全力以赴,而非當(dāng)作一個簡單的業(yè)務(wù)線來做。
而這樣的堅持,在最近幾年終于等到了屬于自己的風(fēng)。
2010年10月,科大訊飛發(fā)布國內(nèi)首個以智能語音和人機交互為核心的人工智能開放平臺——訊飛開放平臺,隨后基于該平臺相繼推出訊飛輸入法、訊飛聽見等示范性應(yīng)用,推動與廣大合作伙伴攜手構(gòu)建以訊飛為中心的人工智能產(chǎn)業(yè)生態(tài)。截至2019年5月31日,訊飛開放平臺開發(fā)者總量超過103萬,總應(yīng)用數(shù)超過64萬,累計終端用戶數(shù)超過23.9億,AI大學(xué)學(xué)員總量超過30萬。
而在之后的短短幾年間,各式各樣的智能語音公司如雨后春筍般長了出來,行業(yè)終于開始蓬勃向上,而在此之前,科大訊飛已經(jīng)深耕并等待了十幾年。
前路繁花
5月21日,上海世博中心,科大訊飛召開了2019新品發(fā)布會。
新品發(fā)布會上,劉慶峰透露,2018年11月,科大訊飛機器翻譯系統(tǒng)參加CATTI全國翻譯專業(yè)資格(水平)科研測試,達到英語二級《口譯實務(wù)(交替?zhèn)髯g類)》和三級《口譯實務(wù)》合格標準,意味達到了專業(yè)譯員水平。
這是歷史上首次參加并通過國家級權(quán)威口譯水平科研評測的人工智能系統(tǒng),這也標志著機器自動翻譯在輔助人類跨語言信息溝通交流方面上了一個新臺階。
此外,2019年3月,機器閱讀理解國際權(quán)威評測SQuAD 2.0任務(wù)中科大訊飛再次登頂冠軍,并同時在EM和F1兩個指標上全球首次均超越人類平均水平,一舉創(chuàng)下比賽的全新紀錄。
“這個里程碑是由中國人寫下的,這是英文的自然語言理解,機器已經(jīng)超過真人水平”,劉慶峰說。26歲劉慶峰腦子里的那個聲音:“中文語音技術(shù)應(yīng)當(dāng)由中國人做到全球最好,中文語音產(chǎn)業(yè)應(yīng)當(dāng)掌握在中國人自己手中。”已經(jīng)成為現(xiàn)實。
上述在語音智能領(lǐng)域所取得的歷史性突破,離不開背后堅定的戰(zhàn)略決心。早在2015年訊飛的年度董事會上,相關(guān)高層就已經(jīng)作出了一個非常重要的決定:不再只追求當(dāng)前的稅后利潤增長,要把資金投到?jīng)Q定未來的戰(zhàn)略方向上。
結(jié)合財報來看,科大訊飛連續(xù)多年的研發(fā)投入占銷售收入的比例達到20%、甚至25%,這就是在為未來做大量儲備,把利潤填充到了未來發(fā)展的戰(zhàn)略準備之中。
而這些投入也獲得了相應(yīng)的回報。現(xiàn)如今,科大訊飛在語音合成、語音識別、機器翻譯、醫(yī)學(xué)影像、人臉識別、自然語言理解等方面的國際比賽中,多次刷新全球紀錄,僅2018年,科大訊飛拿12個國際權(quán)威賽事的“世界第一”。此外,目前,科大訊飛主持和參與制定的國家標準有2項、國際標準有1項,累計獲得國內(nèi)外的有效專利有 260 件。
而在具體成果方面,科大訊飛更是提出了嚴謹?shù)腁I價值兌現(xiàn)標準。劉慶峰認為,跨越鴻溝后的人工智能技術(shù)價值兌現(xiàn)有三大標準,分別是:“必須要有看得見摸得著的真實應(yīng)用案例”,“要有能夠規(guī)模化和可推廣的對應(yīng)產(chǎn)品”,“要可以通過統(tǒng)計數(shù)據(jù)去說明應(yīng)用成效”。
同時根據(jù)該標準,推出了一系列切實可用的新產(chǎn)品。
雙輪驅(qū)動,初露鋒芒
在中國,想只靠提供技術(shù)就成為一家大企業(yè),在客觀上存在有諸多困境,而清楚意識到這一點的科大訊飛,從來都沒有放棄過C端的布局。
2016年年底,科大訊飛做出新的組織結(jié)構(gòu)調(diào)整,拆分出消費者事業(yè)部。經(jīng)過兩年的勵精圖治,在2018年這一調(diào)整也已經(jīng)初見成效。
科大訊飛2018年財報顯示,ToC業(yè)務(wù)實現(xiàn)營業(yè)收入25.17億,同比增長96.54%;實現(xiàn)毛利12.96億,同比增長70.77%;ToC業(yè)務(wù)在整體營收中占比達31.80%,毛利占比達32.72%。,To B - To C雙輪驅(qū)動的良好格局正在形成,在各種經(jīng)濟周期下實現(xiàn)相互補充、相互促進。
而這一系列營收上的突破,很大程度上得益于產(chǎn)品突破。
科大訊飛2019新品發(fā)布會中,發(fā)布了五大單品和一個操作系統(tǒng),具體是訊飛翻譯機3.0、訊飛智能錄音筆、訊飛智能辦公本、訊飛學(xué)習(xí)機X1 Pro、訊飛轉(zhuǎn)寫機和iFLYOS 2.0。
其中,在去年成為“新國禮”的訊飛翻譯機,全年提供翻譯服務(wù)5億+次,伴隨用戶走遍全球197個國家和地區(qū),電商用戶好評率達99%。全新升級的訊飛翻譯機3.0實現(xiàn)了醫(yī)療、外貿(mào)、體育、金融、能源、計算機、法律等七大熱門行業(yè)翻譯,支持粵語、四川話、東北話、河南話四大方言與英語的互譯,整體支持的語言已經(jīng)覆蓋到近200個國家和地區(qū)。
就在最近,訊飛翻譯機3.0、訊飛智能錄音筆SR501、訊飛智能錄音筆SR701等三款新產(chǎn)品還斬獲了2019亞洲消費電子展(CES Asia 2019)的創(chuàng)新大獎,代表了當(dāng)屆該領(lǐng)域內(nèi)的創(chuàng)新趨勢和產(chǎn)業(yè)方向。
錄音筆作為一款早已被市場驗證過的傳統(tǒng)工具,在科大訊飛AI技術(shù)的加持下,煥發(fā)出了全新生機。無論是硬件方面麥克風(fēng)的豪華配置,還是訊飛自研的算法降噪,都使得智能錄音筆在拾音方面上了一個全新的臺階。
而科大訊飛超強的語音識別技術(shù),也使得錄音筆兼具了語音轉(zhuǎn)文字功能,識別準確率高達98%,真正實現(xiàn)了錄音1小時,出稿 5分鐘。
這些都體現(xiàn)了深入還原需求場景,解決用戶痛點的產(chǎn)品思維。而這一系列產(chǎn)品所取得的成績,也為科大訊飛的商業(yè)前景和進一步生態(tài)布局,奠定了重要基礎(chǔ)。
結(jié) 語
回望來路,科大訊飛從語音合成技術(shù)提供商,到語音識別技術(shù)應(yīng)用于彩鈴業(yè)務(wù),從第一個基于深度學(xué)習(xí)的語音識別系統(tǒng),到語音交互乃至人工智能領(lǐng)域的探索。
腳步不停,景色變幻。但唯一不變的是以智能語音與人工智能領(lǐng)域為核心的深耕。
或許有一天,隨著科技的飛速發(fā)展和外部環(huán)境的急速變化,科大訊飛會延展出更多的業(yè)務(wù)線條,但有一些內(nèi)核是永遠不會變的,那就是底層的價值觀。
2019新品發(fā)布會中,劉慶峰登臺展示了一段實時變聲黑科技,他在臺上說什么,臺下立馬會以另外一種聲音傳達出來。科大訊飛的這項技術(shù),可通過提取原聲語音中的內(nèi)容信息,包括原聲的節(jié)奏和情感,再結(jié)合特定人的音色進行轉(zhuǎn)換結(jié)合,惟妙惟肖的復(fù)刻模仿特定人的聲音,這種基于音色與內(nèi)容分離的聲音轉(zhuǎn)換技術(shù),實現(xiàn)了聲音的cosplay。該項技術(shù)在Voice Conversion Challenge 2018國際音色轉(zhuǎn)換大賽中獲得全部指標第一名,也是音色和相似度上唯一一家超過4.0MOS分的系統(tǒng)。
不過,劉慶峰現(xiàn)場明確表示不會輕易將該技術(shù)在各種APP中對外開放,因為技術(shù)是一把雙刃劍,存在安全風(fēng)險,“一定是要有一種健康、安全又有趣的方式來跟這個世界對接”。
“人工智能要持續(xù)發(fā)展,最核心的是它的價值觀如何陽光健康,與人為善。”
自2008年上市以來,科大訊飛始終秉持著這樣的價值觀。無論是“方言保護計劃”,還是“AI教育公益”,抑或是“AI醫(yī)療公益”,“AI無障礙公益計劃”等一系列行為舉措,都體現(xiàn)出了科大訊飛的價值導(dǎo)向,以及積極承擔(dān)起的社會責(zé)任。
科大訊飛2019新品發(fā)布會的slogan是“你的世界,因AI而能”,旨在宣揚人工智能(AI)對世界的巨大影響。
但事實上,科技本無善惡,其背后的研發(fā)運營人員才是決定科技應(yīng)用的關(guān)鍵因素。
仔細想想,這何嘗不也是我們的世界,“因AI(科技)而能,因愛而能”。