外星代理人 作品相關 語音應用引爆在即

作者 ︰ 燕飛

語音應用引爆在即

2011/11/23

多年來,語音識別技術始終磕磕巴巴、欲語還休。現在,橫空出世,將這項技術推向了主流,同時還帶來了非常廣泛的應用前景。

語音識別並不是什麼新鮮事物。多年來,消費電子產品、汽車和自動呼叫中心一直就在「傾听」使用者的指令。從2009年開始,谷歌公司()就一直在采錄語音信箱的信息。而在此之前三年,微軟公司()也將類似的技術置入了。那麼,隻果這個名為的全新虛擬個人助理到底有什麼神奇之處呢?

它能讀懂你的心。

換句話說,不僅僅是語音識別技術,它還能理解語言——正是這一點開始改變用戶與手機的互動方式。現在,很多人預測,將對這項長期以來呼之欲出的技術起到重大推動作用,正如隻果的觸控系統讓觸控技術躋身主流一樣。這項技術將掃清眾多創新應用發展道路上的障礙。市場調研公司稱,今年語音識別行業的產值將達到約27億美元。該公司還預計,2012年,市場將掀起後語音應用熱潮。

是什麼讓如此與眾不同呢?戰略咨詢公司總裁提姆?巴佳瑞稱,答案在于精確性。他說︰「推出的是真正的新一代人機界面,它對語音理解及精確把握語音的市場產生了重大影響。」

當然談不上完美無缺。這項技術在理解某些口音上還頗為困難,不過隻果已經在努力解決這些小問題了。但對一款軟件來說,的表現可圈可點。的始創者是位于加州的門羅帕克市的研究實驗室,據它稱,的關鍵在于自然語言處理技術。的工作原理是︰捕捉語音信號,直接將其轉換為文本,它們與用戶在手機屏幕上看到的文本並無二致。然後將這些語句與某些預先編制好的指令配比,比如「撥打電話」,或「編輯短信」。

這一技術潛力巨大,絕不是只適用于平板電腦和智能手機。語音識別系統公司是語音識別軟件的開發者,這款軟件在醫療保健行業的應用已經長達十年之久。內科醫生的桌面上正運行著的最新軟件,它利用一個夾式微型話筒來錄音。隨著問診的推進,這款軟件會及時更新病人的電子健康記錄。公司醫療保健部門的資深研發副總裁喬?佩特羅稱︰「病人可能在這一秒說的是母親的病史,下一秒又提起父親的病歷。而這些情況這款軟件都能理解。」

它是如何做到的呢?它的工作原理和非常相似︰通過從它所識別的語匯中獲取意義,然後參照一個醫療信息數據庫,將其與病人的病史做比對。隨後,它會運用統計推斷的方法,在其所發現的信息片段之間建立聯系,甚至為對癥治療給出建議。全美大約有45萬名內科醫生正在使用公司的軟件。佩特羅稱,這一技術的準確率超過90%,而且還會隨著時間推移而不斷提高。顯然,這款軟件盈利前景良好,因此公司決定,將其第四財季的收入預期調高約1,000萬美元。

然而,研究人員對這一技術的未來抱有更大的希望。思凱普?里佐是南加州大學創新技術學院()的助理總監。他正在開發一種互動仿真技術,用以幫助退伍軍人針對創傷後緊張癥()尋求醫療咨詢服務。這款軟件名為,它的最終目的是要設法理解人們口語背後的情緒狀態。里佐稱︰「這是個十分巨大的挑戰。因為必須采集語音模式,然後得像人類的大腦那樣對它們進行分析。」里佐稱,人類或許能察覺自己的好友或家人情緒異常,因為這時人們的語速往往會變慢,重音也更少,但電腦要捕捉這些信號可就相當困難了。

不過這個領域的有些研究卻能更快獲得成果,而不用再苦苦等待。去年春天,里佐的研究伙伴——麻省理工學院()教授阿歷克斯?彭特蘭在美國銀行()的呼叫中心開展了一項類似的語音推斷技術試驗,旨在分析員工的溝通對業務成功的影響。彭特蘭讓員工連續六周在脖子上戴著小型電子設備,它們能記錄員工的實際位置以及身體語言和聲音。所記錄的數據能顯示這些員工是在和誰溝通,他們站著時與溝通對象距離有多遠,談話的語調如何。彭特蘭稱︰「我們發現,效率最高的員工不光與大量對象交談,他們還與同樣表現出這種特點的同事交談。」結果,他說,只需要調整一下員工的茶歇時間,使這類員工之間的步調更為同步,這個呼叫中心每年就能節省1,500萬美元。

用戶現在對的廣泛關注很可能將大大促進這類研究,並進一步推進其應用。里佐說︰「語音識別技術確實是技術領域至高無上的聖杯()。我們已經掌握了這項技術的90%,但剩下的10%要求攻克更多難關。一旦到了引爆點,我們將迎來一片十分廣闊的市場。」看起來,這個引爆點很可能非莫屬。

(快捷鍵 ←)上一章   本書目錄   下一章(快捷鍵 →)
外星代理人最新章節 | 外星代理人全文閱讀 | 外星代理人全集閱讀