百度袋鼠開放平臺發(fā)布:用語音、手勢操控技術(shù)推動交互升級。隨著智能設(shè)備消費升級大潮的到來,傳統(tǒng)的按鍵遙控器、不靈敏的觸摸屏似乎已顯得有些不合時宜。為此,很多廠商紛紛加入智能控制研發(fā)行列,試圖找到人與設(shè)備最簡單、快捷的對話方式。近期,走在人工智能領(lǐng)域前列的百度推出了“袋鼠開放平臺“,通過語音指令識別、手勢控制等技術(shù),致力于提升人機交互的體驗和效率。據(jù)了解,現(xiàn)階段該平臺將免費為企業(yè)和開發(fā)者提供基礎(chǔ)的技術(shù)支持與服務(wù)。
袋鼠開放平臺是一套無接觸操控技術(shù)解決方案,包含語音控制和手勢識別兩大功能模塊。不難理解,無接觸操控指的是用戶不需要與設(shè)備發(fā)生直接接觸即可完成相應(yīng)的指令輸入。例如,駕駛者在駕駛過程中用語音控制手機、人們在社交中的語音輸入、VR設(shè)備中的手勢操作都是該類技術(shù)的典型應(yīng)用場景。
自然、直接的手勢識別技術(shù)
從遠古時代起,手勢便是人與人之間然而而常見的溝通方式。現(xiàn)如今,在數(shù)字時代,手勢控制的作用已經(jīng)延伸到人與設(shè)備之間,打破對傳統(tǒng)物理介質(zhì)的依賴,并廣泛被應(yīng)用于電子、醫(yī)療、工業(yè)制造等各個行業(yè)。
袋鼠開放平臺中的嵌入式計算機視覺解決方案利用深度學習和計算機視覺技術(shù),提供了無需觸摸的手勢智能控制技術(shù), 以提升用戶在VR(虛擬現(xiàn)實)、AR(增強現(xiàn)實)、智能家居和物聯(lián)網(wǎng)設(shè)備、汽車系統(tǒng)以及其他電子產(chǎn)品的使用體驗。用戶通過比出各種手勢,可輕松控制音/視頻播放、手勢拍照和玩體感游戲等等,且操作簡單。借助此技術(shù),用戶可在VR/AR世界中看見“雙手”。該技術(shù)具有諸多優(yōu)勢,例如,使用單目攝像頭,無其他額外硬件成本、占用系統(tǒng)資源較少、能耗低、識別度精準度高等等。
精準高效語音控制與輸入技術(shù)
在中國以中文為基礎(chǔ)的對話式人工智能產(chǎn)業(yè)的風口已經(jīng)到來,而世界范圍內(nèi),對話式人工智能產(chǎn)業(yè)也已全面爆發(fā)。袋鼠開放平臺緊跟風口,研發(fā)了袋鼠語音控制系統(tǒng)。
袋鼠開放平臺的語音控制系統(tǒng)基于百度語音識別、自然語言處理、機器學習、大數(shù)據(jù)等技術(shù)研發(fā),并深度結(jié)合VR、智能家居、汽車系統(tǒng)等不同行業(yè)相關(guān)詞表需求,實現(xiàn)覆蓋多行業(yè)的可定制詞表,力圖讓人機交互更加自然順暢。通過該技術(shù),用戶可以自如地通過該技術(shù)實現(xiàn)語音輸入、語音搜索、語音翻譯和語音控制等需求。為追求更高的適用性,袋鼠開放平臺還為合作企業(yè)提供根據(jù)實際需求定制的不同行業(yè)的專業(yè)詞庫、指令詞庫等。
袋鼠開放平臺的手勢控制及語音指令和輸入實現(xiàn)了人類與技術(shù)交互的更多可能性,使用戶真正的享受沉浸式的虛擬現(xiàn)實,同時解放雙手讓語音交互變得更加準確,流暢、自然。
近年來,手勢控制及語音指令和輸入的應(yīng)用越來越受到營銷、娛樂、游戲等行業(yè)的關(guān)注,無接觸智能操控必然是未來交互方式的重要發(fā)展方向。現(xiàn)階段,手勢控制和語音控制的交互方式還處于快速發(fā)展的階段,并有非常大的發(fā)展和完善空間。相信無接觸智能操控的發(fā)展會給人們帶來更多更美好的體驗,徹底解放大眾的雙手,讓生活、工作變得更輕松,更智能。