人工智慧語音助理再升級!無聲也可以做到語音辨識!

人工智慧語音助理竟然變得更厲害了!連無聲都可以做到語音辨識耶!

 

speechin-necklace-1.jpeg

目錄

1. 圖書館內喊「嗨 SIRI」 太尷尬?讓無聲人工智慧語音助理幫助你

2. 拯救你的無聲尷尬!透過下巴動作就能辨識的語音助理項鍊 SpeeChin

3. 已可辨識中英文!移動偵測問題仍待解決

 

圖書館內喊「嗨 SIRI」 太尷尬?讓無聲人工智慧語音助理幫助你

 

 

直接開口詢問、指示 SIRI,進而解決自己本身需求,已經是 3C 智慧產品廣泛使用的日常風景。然而,如果是在安靜的環境中呢?想像一下,如果你在靜謐的圖書館或是針落有聲的會議室裡,開口詢問:「嘿 Siri,明天天氣如何?」似乎就有點尷尬。

 

當你急需向你的人工智慧助理下指令,卻遇到上述情況,需要保持安靜、無法說話又該怎麼辦?

 

拯救你的無聲尷尬!透過下巴動作就能辨識的語音助理項鍊 SpeeChin

不用擔心!為了拯救你的無聲尷尬,康乃爾大學資訊科學助理教授 Cheng Zhang 和博士生  Ruidong Zhang,發明了一款項鍊型的人工智慧語音助理「SpeeChin」。這款項鍊配備了紅外線鏡頭、微處理器、電池和藍牙模組,項鍊外盒配有可提高穩定性的機翼造型平衡器,亦於項鍊盒底部配置了一枚硬幣以平衡配重。

 

SpeeChin 特性如同一般項鍊,使用銀鍊掛在脖子上,其紅外線鏡頭裝置於 3D 列印的項鍊盒上方,使鏡頭穩定指向佩戴者的下巴。SpeeChin 能夠基於下巴運動軌跡,捕捉「頸部和臉部皮膚變形圖像」,進而辨識無聲語言。目前的實驗結果顯示,SpeeChin 已能辨識簡單的英文和中文單詞。

 

已可辨識中英文!移動偵測問題仍待解決

在最初的實驗裡,研究人員測量了 10 名英文使用者及 10 名中文使用者,共 20 位參與者的下巴基線,接著使用差分圖像訓練 SpeeChin 辨識簡單指令,應用機器學習演算法將辨識結果傳到配對的智慧型手機,就像用另一種方式溝通的 Siri。隱私問題也不必擔憂,SpeeChin 只會對準佩戴者的下巴,不會拍到使用者的臉。

 

實驗方式為:10 位英文使用者無聲說出 54 條指令,包括數字、互動、呼叫語音助理、標點和導航,10 位中文參與者的 44 條指令也一樣。最後實驗結果顯示,SpeeChin 的英文/中文命令辨識能力平均準確率分別為 90.5% 和 91.6%。

 

此外,研究人員還要求其中 6 名參與者在行走時默念 10 個中文和英文片語,然而因為參與者頭部以不可預測的方式移動,所以最後成功率比較低。顯示移動偵測的準確度仍然是尚待解決的問題。

 

為什麼無聲語音辨識要做成項鍊的形式呢?研究人員認為:項鍊是人們習慣的裝飾品,至於耳掛式設備則會可能會有不太舒服的佩戴體驗。雖然人們可能會想「我的手機就是語音辨識設備了啊」,但是難免還是會遇到無法出聲的人或場合,此時無聲語音辨識的研究或許就能派上用場。

 

 

 

 

 

推薦閱讀:
元宇宙也有翻譯蒟蒻了!Meta推全球語言都可翻譯的人工智慧


Google提出Android隱私沙盒,標榜保護用戶資料安全


白帽SEO、黑帽SEO,到底差在哪?


RWD 和 AWD 的差異與優缺點


人工智慧救救爛畫質!經典懷舊動畫變高清!


人工智慧顛覆你我想像,讓你在元宇宙也吃得到大麥克!


無人披薩店你去過嗎?披薩還是人工智慧做的呢!

arrow
arrow

    jimchen19901212 發表在 痞客邦 留言(0) 人氣()