6月6日,蘋果發(fā)布一系列新產(chǎn)品,最受關(guān)注的是它的智能音箱HomePod,名稱上它延續(xù)了iPod音樂播放器的命名。亞馬遜的echo智能音箱是目前的領(lǐng)先產(chǎn)品,據(jù)預(yù)測(cè)2017年銷量可能達(dá)1000萬(wàn)臺(tái)。
當(dāng)下,人們很關(guān)注這些設(shè)備背后的東西,也就是人工智能。這兩款智能音箱的共同點(diǎn)是,它們都是智能音箱和能語(yǔ)音對(duì)話的“人工智能助手”的組合:蘋果音箱背后是Siri,亞馬遜音箱背后是A lexa。這些所謂的人工智能助手設(shè)想的使用場(chǎng)景是,我們?nèi)祟悤?huì)和機(jī)器對(duì)話。你可以跟這些音箱說(shuō)話,讓它們干點(diǎn)什么,比如,我們跟蘋果音箱說(shuō),“嘿,Siri”,就可以啟動(dòng)它。
問(wèn)題是,你想跟機(jī)器聊天嗎?我不想。我的iPhone手機(jī)有一個(gè)功能總是被誤按出來(lái),然后發(fā)出奇怪的聲音:“我聽不懂你在說(shuō)什么”。它就是蘋果的智能語(yǔ)音助手Siri。當(dāng)然,跟朋友說(shuō)起這個(gè)缺點(diǎn)時(shí),她說(shuō)了另外一種情況,她上小學(xué)的兒子總是搶手機(jī)玩,用各種二次元語(yǔ)言調(diào)戲Siri,玩得不亦樂乎。玩樂性質(zhì)的人機(jī)互動(dòng)不是新鮮事,玩具公司孩之寶的能人機(jī)互動(dòng)的菲比精靈(Furby)早在1997年就出現(xiàn),孩子與玩具說(shuō)話的確會(huì)覺得很好玩。
那么,語(yǔ)音交互可以變成一個(gè)不是玩具的產(chǎn)品嗎?現(xiàn)在,人工智能技術(shù)產(chǎn)生最大進(jìn)展的領(lǐng)域是語(yǔ)音識(shí)別與合成、自然語(yǔ)言理解、圖像識(shí)別和機(jī)器翻譯等。技術(shù)的進(jìn)步讓跟機(jī)器對(duì)話成為可能,現(xiàn)在它可以聽得懂、能理解,它也能模仿我們的語(yǔ)音說(shuō)話,因而很多人把跟機(jī)器對(duì)話看成一種人工智能的未來(lái)應(yīng)用場(chǎng)景。
尼葛洛龐帝在20多年前出版的《數(shù)字化生存》中,對(duì)人機(jī)界面有兩個(gè)預(yù)測(cè),一個(gè)是手指會(huì)成為“圖形輸入領(lǐng)域的一匹黑馬”,一個(gè)是聲音會(huì)成為交互界面。前者已經(jīng)是我們活在其中的現(xiàn)實(shí),我們現(xiàn)在用的智能手機(jī)的核心之一就是多點(diǎn)觸動(dòng)屏幕,當(dāng)年他很形象地說(shuō)這是“指上神功”,每個(gè)人現(xiàn)在都在手機(jī)屏幕上施展著。在我們開車時(shí)無(wú)法用手操作手機(jī)時(shí),在設(shè)備本身很小不能容納一個(gè)屏幕時(shí),用聲音來(lái)操控設(shè)備似乎是不錯(cuò)的選擇。但這一預(yù)言到現(xiàn)在都沒有實(shí)現(xiàn),固然有技術(shù)的障礙,使用場(chǎng)景的障礙亦是明確存在著。我們很難放棄已經(jīng)非常熟悉、體驗(yàn)更好、效率更高的屏幕。
有人會(huì)說(shuō),現(xiàn)在人們不就在跟手機(jī)說(shuō)話嗎?我們用微信跟人語(yǔ)音留言,智能手機(jī)看起來(lái)是很符合語(yǔ)音的場(chǎng)景。在手機(jī)上消費(fèi)音頻內(nèi)容,聽音樂、現(xiàn)在聽付費(fèi)知識(shí)產(chǎn)品都是自然而然的。但要注意的是,當(dāng)我們微信語(yǔ)音跟朋友聊天時(shí),我們不是在跟機(jī)器說(shuō)話,而是在跟另一臺(tái)機(jī)器背后的人說(shuō)話。
不想跟機(jī)器說(shuō)話,并不是它不能理解我們的話,而是因?yàn)槲覀兿胍氖潜划?dāng)成人對(duì)待。機(jī)器可能永遠(yuǎn)無(wú)法讓我們覺得,我們被像人一樣對(duì)待?,F(xiàn)在,人工智能的應(yīng)用場(chǎng)景中的兩個(gè)可能誤區(qū)是,一是把機(jī)器人按人的樣子造,也就是所謂的人形機(jī)器人,一是讓人跟機(jī)器說(shuō)話,也就是這些會(huì)說(shuō)話的人工智能助手。這兩種思路的問(wèn)題是,它們都沒有把人當(dāng)成人來(lái)看待。
我們不想跟機(jī)器聊天,而只想讓機(jī)器幫幫忙。我們知道,通過(guò)掌握大量的數(shù)據(jù),機(jī)器比我們還了解自己,機(jī)器可以幫我們個(gè)性化,可以讓工作生活更便利。我們需要的可能是藏在人性化界面的“智能助理”或“智能代理”。智能代理(agent)一直以來(lái)是研究者們?cè)O(shè)想的人工智能使用場(chǎng)景之一。
或許很快,人工智能技術(shù)的進(jìn)步可以做到,每個(gè)人手機(jī)里面可以有一個(gè)這樣熟悉我們的喜好、代表我們利益的智能代理。在過(guò)去,只有大公司老板才能雇傭精明能干又八面玲瓏的助理。未來(lái),每個(gè)人都可以有一個(gè)。但是,我們跟這個(gè)“助理”交流的方式,不一定是跟它說(shuō)話。我會(huì)更期待,我們每次回家打開音箱時(shí),它不是等我們說(shuō)“嘿”,而是直接就播放了,并且播放適合我們當(dāng)時(shí)心情的音樂。
已有0人發(fā)表了評(píng)論