2016年,互聯(lián)網(wǎng)巨頭都在秀人工智能的肌肉。繼Google AlphaGo下棋贏得人類之后,今天百度又有一個(gè)人工智能應(yīng)用曝光了:度秘實(shí)況解說NBA總決賽。據(jù)一位百度工程師朋友圈照片顯示,在昨天上午勇士對(duì)騎士的比賽中,度秘模擬人工解說員對(duì)比賽進(jìn)行了實(shí)時(shí)講解,同時(shí)提供新聞速遞和經(jīng)典回顧。除此之外,度秘還支持互動(dòng),能夠回答關(guān)于比賽的各種問題,比如“庫里得了多少分”。
度秘背后的原理是怎樣的?據(jù)觀察,度秘暫時(shí)還未能做到直接看NBA視頻來理解比賽,而是通過抓取各種相關(guān)的新聞資訊、網(wǎng)友聊天,來實(shí)現(xiàn)“實(shí)況解說”的,它能夠回答用戶問題,也是基于對(duì)文字的理解??梢?,度秘背后最關(guān)鍵的技術(shù),是自然語言處理技術(shù),即NLP。
自然語言處理技術(shù)主要是語義理解,比語音識(shí)別更加復(fù)雜,背后需要以深度學(xué)習(xí)為基礎(chǔ)的人工智能技術(shù)。自然語言處理技術(shù)是Siri等語音助手變得聰明好用的關(guān)鍵所在,用戶說話習(xí)慣、斷句方式、說話場(chǎng)景不同,背后往往有不同的意圖,機(jī)器要理解并不容易?;趥鹘y(tǒng)的規(guī)則算法是不可能窮舉各種表達(dá)方式的,只有基于統(tǒng)計(jì)的深度學(xué)習(xí)才能不斷提高語義理解的準(zhǔn)確度。度秘的應(yīng)用表明,自然語言處理技術(shù)不只是可以用來更好地理解用戶的語言,還能更好地理解網(wǎng)絡(luò)內(nèi)容,并再次組織,形成以假亂真的“直播解說”。
百度的自然語言處理技術(shù)尤其是中文處理技術(shù),經(jīng)驗(yàn)還是比較豐富的。百度過去一直在做的就是解析用戶自然語言形式的搜索請(qǐng)求,并在海量網(wǎng)絡(luò)內(nèi)容中尋求答案,而后者同樣是自然語言形式。百度不斷在嘗試去理解人類的語言,以及不同的文字,另一個(gè)典型應(yīng)用是百度翻譯,它能夠理解不同語言的文章,進(jìn)行機(jī)器翻譯,已經(jīng)達(dá)到實(shí)用水平,獲得國家科技進(jìn)步二等獎(jiǎng)。自然語言處理,一方面需要海量語料、詞庫的積累,為統(tǒng)計(jì)算法提供基礎(chǔ);另一方面,需要模擬神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)算法,這是一個(gè)被人類研究了幾十年的技術(shù),最近一年實(shí)現(xiàn)從量變到質(zhì)變的突破,不論是AlphaGo還是度秘還是Siri,背后均是類似技術(shù)。
AlphaGo戰(zhàn)勝人類之后,人工智能這一技術(shù)性概念,被全世界熟知,相關(guān)應(yīng)用越來越多,谷歌Home、谷歌Duo、Amazon Alexa、Siri、度秘等等典型應(yīng)用愈發(fā)被人們接受。不管是基于語音還是文字,這些應(yīng)用的背后,均會(huì)用到一個(gè)關(guān)鍵技術(shù)“自然語言處理”,通過這個(gè)技術(shù)機(jī)器可以理解人類、與人類對(duì)話、還有學(xué)習(xí)世界上的文字去變得更聰明。
在今年百度聯(lián)盟峰會(huì)上李彥宏的演講主題是人工智能是“下一幕”,所展示的“智能識(shí)圖”,需要機(jī)器去理解人類的問題;此前度秘還進(jìn)入了上海KFC的一家餐廳,像服務(wù)員一樣接收人類指令去訂餐,這也用到了自然語言處理技術(shù);之前傳得很火的機(jī)器寫稿,背后也是自然語言處理技術(shù),將網(wǎng)絡(luò)上的文字和數(shù)據(jù)再次組織起來,跟度秘做的事情很相似。
毫不夸張地說,沒有自然語言處理,大部分人工智能應(yīng)用形同虛設(shè)。
“度秘直播解說員”眼下還在內(nèi)測(cè),很可能會(huì)在今年奧運(yùn)會(huì)期間對(duì)外開放,為大家解說不同的比賽。相對(duì)于傳統(tǒng)解說員而言,度秘的解說在生動(dòng)性上可能會(huì)有差距,著名的解說員如黃健翔、柯凡、楊毅們,都有自己的風(fēng)格,引經(jīng)據(jù)典、旁征博引,還有幽默之類的情感因素,機(jī)器短期內(nèi)是做不到的。不過,機(jī)器的好處就是它不知疲倦,可為你解說每一場(chǎng)比賽,并且還能進(jìn)行個(gè)性化定制,每個(gè)人都可擁有屬于自己風(fēng)格的解說員,解說員還可以隨時(shí)回答你的問題。未來度秘與語音合成技術(shù)結(jié)合起來,就可以做林志玲版、范冰冰版或者你老婆版的比賽解說了,這會(huì)讓比賽解說變得更加有趣。
除了解說比賽之外,度秘背后的自然語言處理技術(shù),有著許多應(yīng)用空間。這幾年人工智能技術(shù)的發(fā)展實(shí)現(xiàn)了從量變到質(zhì)變,相關(guān)應(yīng)用將會(huì)成為實(shí)際,而不是停留在想象或概念階段,具體來說,以下領(lǐng)域會(huì)因?yàn)樽匀徽Z言處理技術(shù)的成熟而率先爆發(fā):
1、家庭機(jī)器人:家庭機(jī)器人需要“能說、會(huì)聽、會(huì)動(dòng)”,會(huì)動(dòng)就是能做飯倒茶拖地按摩,這一點(diǎn),是機(jī)器人公司在做的事情;而“能說會(huì)聽”就是人工智能的事情了,需要自然語言處理能力,在語音識(shí)別之后,去理解人類的命令,與人類對(duì)話。因此自然語言處理技術(shù)成熟之后,家庭機(jī)器人將會(huì)普及,尤其是陪聊類的,例如兒童、老人、單身男陪伴類的,你可以定制一個(gè)林志玲回家陪你聊天。
2、客服機(jī)器人:不論是電商系統(tǒng)的在線咨詢,還是客服電話的在線咨詢,現(xiàn)在的體驗(yàn)都很糟糕,主要是要排隊(duì)等待,很多互聯(lián)網(wǎng)公司的客服電話,能打進(jìn)去算是中大獎(jiǎng)了,但這些公司又不可能大幅擴(kuò)張客服隊(duì)伍,人力成本實(shí)在是太高了。有了人工智能的客服機(jī)器人,它就可以去理解用戶的問題,文字、語音均可,并與用戶進(jìn)行對(duì)話,就像真人一樣。這將大幅提升客服體驗(yàn)并節(jié)省人力成本。
3、助理式搜索:美國曾有一個(gè)“人工搜索”引擎,你提出一個(gè)問題,有專人去幫你找答案,需要付費(fèi)。印度的justdial、中國移動(dòng)12580以及中國電信114熱線,同樣是基于免費(fèi)電話的搜索服務(wù),背后有專員給你找答案。這樣的搜索服務(wù)體驗(yàn)有好的地方,就是個(gè)性化的助理,可給你準(zhǔn)確的答案或安排你的行程,不過使用成本太高,基于電話不夠方便,又費(fèi)時(shí)間又花錢,并未普及?,F(xiàn)在自然語言技術(shù)成熟,其與搜索結(jié)合起來,就可給每個(gè)用戶提供一個(gè)免費(fèi)的私人搜索助理,基于文字或語音均可。
人工智能是一個(gè)很泛的概念,語音識(shí)別、圖像識(shí)別、語義理解、自然語言處理、機(jī)器翻譯諸多技術(shù)均可歸為其中,自然語言處理技術(shù)則是人工智能普及的基礎(chǔ)。在過去,它是人工智能普及最大的瓶頸,現(xiàn)在從谷歌、蘋果和百度等公司的動(dòng)作來看,這個(gè)瓶頸很快就被消除了。家庭機(jī)器人、客服機(jī)器人、助理式搜索、定制化解說,很快就會(huì)成為現(xiàn)實(shí)。