售前電話
135-3656-7657
售前電話 : 135-3656-7657
近年來,語音識別技術(shù)已得到廣泛應用,但其識別準確性依舊有待提升。拋開各種口音與方言干擾,考慮到用戶可能在各種極端情況下講話,如何辨認非標準發(fā)音已成為業(yè)內(nèi)亟需解決的問題。
日前,科技公司Voxil公布了其最新研究成果——一款復雜的語音識別程序,Voxil 稱其為自然語言識別領(lǐng)域的重大突破。
Voxil CEO Caleb Roush 在接受洋蔥新聞采訪時稱,我們最新的語音識別軟件專為吃貨用戶服務,即使用戶正在咀嚼或口中塞滿食物,也能精確識別用戶所說的內(nèi)容。毫無疑問,這款軟件將幫助 Siri 等語音助手極大提升用戶體驗。
Roush 表示,軟件算法較為復雜,也正因為如此,它可以精準過濾外界噪音,例如咀嚼聲、牙齒摩擦聲、松脆的食物在口中被壓碎的聲音、雙唇和舌頭運動的聲音等,并從中分辨出用戶含混不清的說話聲,其識別準確度可達到驚人的 99%。
Voxil 公司甚至提出了一個名為 GAR 的新概念,稱為提升識別精度,軟件自帶 GPS 功能,可精準定位用戶坐標并判定其所在餐廳類別,從而結(jié)合大數(shù)據(jù),根據(jù)可能提供的食物種類對識別內(nèi)容做出相應調(diào)整。
洋蔥日報記者對真正的吃貨在享受美食時并不愿講話 這一角度提出了疑問,但 Voxil 公司并未給出正面回答。Roush 僅表示公司已著手研究如何在用戶吃太多無法講話的情況下通過腦電感應識別用戶意圖,并透露相關(guān)智能硬件將在不久后面向公眾發(fā)布。