當前位置 乒乓球拍雕塑 > 職場薪聞 > HR社區 > 企業文化 > 你的“聲音”為什么成為了巨頭們的戰???
你的“聲音”為什么成為了巨頭們的戰???
作者: 時間:2017-7-25 閱讀:6094次

這個場景你一定不陌生:一群人盯著手機,仿佛要被那小小的玻璃屏吸進去了。他們點啊,點啊,滑啊,等公交的時候是這樣,走路的時候是這樣,葛優癱的時候是這樣,甚至是熱熱鬧鬧的派對,也因為這樣而了無生趣。自從10年前iPhone帶著觸摸屏問世以來,人類的整個世界,從抬頭便成了低頭。

今天,分析師預計,全世界安卓設備超過20億臺,蘋果設備也有7億臺。一整代人——尤其是印度和中國等市場——都通過手機上網,敲鍵盤摁鼠標的時代呼嘯而過。從前我們敲、敲、摁,現在我們點、點、滑。

這種火箭般的發展速度讓設備制造商們不禁幻想,如果再出現什么爆款產品該多好啊。但眼下來看,似乎還沒有什么能取代觸摸屏手機。你看,谷歌眼鏡、Apple Watch、Oculus Rift,這些前前后后問世的產品,有哪個能讓大家把頭抬起來?我們仍然是:點、點、滑。

然而,當我們把注意力都放在手腕和面部產品時,另一重大科技轉變也在同時發生,并即將成為主流,這就是下一代計算界面——聲音。聲音也是世界上最古老的界面,我們通過它與他人交流,在文字和語言尚未誕生時,聲音卻早已存在。

起初,我們并不全然清楚手機能夠引起多大的風潮,因為它連鍵盤都沒有。而如今,它讓我們足不出戶,從一塊玻璃屏中審視著全世界的信息。這種手指控制的視覺系統,原來擁有如此強大的力量。

然而,聲音是自智能手機出現以來,人機交互歷史上最大的變革。當語音設備出現,大家都開始說,好像缺了點什么:屏幕。尤其是對于我們大多數人來說,第一次和語音界面互動,就是通過觸摸屏手機—— Siri。

不過,當鍵盤消失的時候,有趣的事情也就發生了:計算更加私人了。很快,我們下達的指令不會再有多復雜,可能只是一句話,可能是手指一點,或一個手勢,一個轉頭,甚至是臉上的表情。如果計算機能準確解讀這些信號,那么它們不僅能理解我們的表面意思,還能最終深入我們的大腦讀取思想。

在不久的未來,語音計算將無處不在——汽車里,家具中,攪拌器,地鐵票柜臺等等,它們傾聽我們的話語,解讀我們的要求。

先進的超級計算機將藏于日常物品中,你會問你的路由器:“哎WiFi,你出什么毛病了?”或者冰箱,“給我推薦一個菜譜,把冰箱里快壞的蔬菜都用上?!鄙踔聊慊箍梢暈史考?,“我要不要加件外套?”

最棒的是,大多數人都能承受得起這些設備,而不只是那些科技達人。語音設備和鍵盤、鼠標不同,不需要任何訓練和聯系。未來,你可以使用自然語言來操控語音設備,就好像跟你的孩子、同事對話一樣。

不過,不要以為觸摸屏就這樣消失了。我們將生活在一個遍布攝像頭、觸摸屏、麥克風和揚聲器的世界,一切都連接在云服務商,它們會伴隨我們去往各處,解讀我們的意圖,可能通過語言,可能通過手勢,或者觸摸鍵盤。

歡迎來到“無所不計算”的時代。

亞馬遜 —— 崛起于“無屏”時代

乒乓球拍雕塑 www.bkhzd.icu Dotsy住在佛羅里達州棕櫚灘,她不肯告訴我她的年紀?!澳憧梢怨雀璋?!”她大笑著說道,“說出這話其實讓我挺害怕的?!?

這位80幾歲的老人活得很酷,一個月前,她開始學敲鼓,還跑到朋友家秀了一番。她總是把日程安排得很滿,學習新東西。但在看東西上,Dotsy需要一點幫助。

Dotsy買了兩款亞馬遜產品,房間里的Dot(當作鬧鐘用),和門廊上搭載了Alexa語音助手的智能音箱Echo。Alexa在Dotsy的生活總起著非常重要的作用,可以在她看不清東西的時候幫她一把?!拔揖醯帽ㄊ憊δ芊淺J滌?!我視力不太好,看時間對我來說是件很討厭的事?!?

因為視力下降,Dotsy沒法用電腦,更別提手機。但她很喜歡問Alexa問題,或者讓Alexa給她讀書。

簡單來說,Dotsy說,“Alexa棒呆了!”有時候,當Alexa給出她滿意的答案時,Dotsy會說:“謝謝你?!盇lexa回答她說,“很榮幸為您服務?!?

我們看到,對于那些沒有移動設備或筆記本電腦的人來說,以人工智能為基礎的Echo是上網的好工具,而且它很強大。

當然,Alexa和Echo還有很大的提升空間。比方說,Dotsy還沒法自己更改設置,因為需要在Alexa的應用內完成。盡管如此,亞馬遜還是通過Echo表達了其對語音計算的定位:用戶的私人空間。

在Alexa出現之前,谷歌和蘋果就已經開發了語音助手,但都和手機綁定在一起。這也就意味著,想要使用語音助手,你就得把它從口袋里掏出來,手機沒電它也就用不了,如果手機落在別的地方,那就更別提了。Echo則完全不同,它鑲嵌在墻壁上,永遠處于使用狀態,永遠在關注你,永遠在傾聽。而且,也不是你說什么話它都會應答的,只有在聽到所謂“喚醒詞語”的時候——比方說“Alexa”或“電腦”——它才會啟動。當你手頭上忙著自己的事情時,它也僅支持幾個基本功能,比方說你切著蔬菜,疊衣服或早晨穿衣服的時候,Echo可以給你弄個播客聽聽,設置鬧鐘,開開燈或者預約出租車。

Alexa體驗與Echo設備副總裁Toni Reid Thomelin表示:“現在許多個人助手使用時都存在痛點。在我們設想的未來里,痛點是不存在的。只有在科技“隱身”之后,用戶才可以更多體會到生活的美好?!?

Alexa的出現,給了沉睡中的科技公司一記當頭棒喝。不過,亞馬遜從來不肯公開Echo的銷售數據(只說每天有百萬用戶對Alexa提出數百萬問題)。最近的一份調查顯示,自這款產品2014年上市以來,其銷售量已經增長了一倍,預計用戶達到1070萬,而這當中有許多人還購買了不止一個Echo。

雖然和Siri以及谷歌助手相比,Echo所能觸及的用戶范圍還比較小,但它正日益成為主流產品之一,并擁有一眾狂熱粉絲,這可是其他私人助手望塵莫及的。在亞馬遜上,Echo共獲得29000條評價,其中24000條對它予以肯定。

為了轉型成為電商巨頭,亞馬遜從最初的在線書店開始,多年默默攻關語音AI技術。跟隨公司近20年的Thomelin表示:“很長一段時間以內,我們會在亞馬遜內部使用機器學習算法。最初的時候,我們用它來開發推薦系統,后來推薦系統大獲成功之后,我們想,該怎樣將這項技術用在亞馬遜的其他方面呢?這時我們構思出Echo的重要一步?!?

云計算技術的突飛猛進在Echo的開發中也起了至關重要的作用。Thomelin說:“大約5年前,我們內部看到云計算技術伴隨AWS飛速發展,于是我們決定利用好它,并開發Echo這樣的產品系列?!?

不過,Echo的魔力并不在于它有多聰明,而是它非常善于傾聽。哪怕在房間對角,或者電視正在播著節目,它都能聽到用戶的指示,其他只會說“對不起,我沒聽清”的語音助手則顯得遜色得多。

Alexa機器學習副總裁Rohit Prasad表示,剛開始開發語音用戶界面時,團隊都認為這是一個遙不可及的想法?!按蠖嗍?,包括科技行業專家,都對語音識別充滿懷疑,認為它沒法獲得較高的準確率?!?

亞馬遜正在迅速推進語音助手技術的研發,僅Alexa一個部門就有數千人。與此同時,該公司還大筆投資那些有意將Alexa整合進其產品的公司,比方說智能恒溫器制造商Ecobee,此前亞馬遜領投了該公司的一輪3500萬美元融資。今年4月,Alexa語音服務副總裁Steve Rabuchin表示,團隊現在的工作重點是將Alexa與其他產品進行整合,包括可穿戴設備、汽車、家用電器,以及智能家居產品。

大規模推進語音助手的開發并不讓人驚訝。亞馬遜確實擁有了一款為人稱道的AI助手,但和谷歌、蘋果甚至微軟相比,亞馬遜的動作已經晚了。而且,Alexa還面對著一個強有力的競爭者,也就是我們無時無刻不帶在身邊的——手機。

蘋果 —— 優勢明顯

2016年末,蘋果打敗三星成為世界第一智能手機制造商,僅第四季度就賣出7830萬臺iPhone,同期三星產品銷售量為7750萬臺。對此感到心慌的不光是三星,還有其他所有巨頭。畢竟,每一臺iPhone上都搭載了Siri。

2010年,蘋果收購語音指令應用開發公司Siri,并在2011年的4S中得到整合。Siri首登市場,就成了使用人數最多的語音助手。

唯一的問題?Siri弱爆了。

雖然在這幾年里,它的識別能力已經得到大幅提升,但是因為犯錯率高,Siri從上線的第一天就被無情吐槽。

去年10月,Siri迎來5周年生日,該應用開發人Julian Lepinski指出,用戶之所以無法和Siri建立“深厚的友誼”,是因為他們本身就不信任它?!捌還揮鋅悸塹醬砦笪蝕鶇吹難現匭?,用戶對Siri的信心從這里就開始支離破碎了?!?

目前,Siri是使用最為廣泛的語音助手,支持34個國家的用戶使用,有21種語言可選。谷歌助手支持7種語言,Alexa僅支持2種。但是,Siri卻沒有達到自己的目標。蘋果透露,每周Siri會收到20億次提問,而全球iPhone活躍用戶達7億,也就是說,用戶每周只會問Siri兩次問題。

不僅如此,Siri還面臨著四面八方的競爭。現在,iPhone用戶可以選擇多款語音助手,各個紅著眼想成為用戶最心儀的對象。今年,亞馬遜在其iPhone應用中整合了Alexa,谷歌也發布了iOS版本的谷歌助手。當然,兩家公司的深入程度都還不及Siri。

與此同時,蘋果也在極力扭轉Siri的形象。在2016年8月的一次采訪中,CEO蒂姆·庫克被問到蘋果在人工智能上能否追趕Facebook、谷歌和亞馬遜,庫克回答說:“我不贊同你的問題,你似乎暗示我們在這方面落后于其他公司?!?

庫克宣傳說,Siri永遠都陪著你,而且能夠?;ひ?。

在今年1月的一次電話采訪中,庫克強調,在推出HomeKit平臺之后,Siri已經成為Echo想要成為的智能家居中心。他每天早上會對Siri說早安,讓Siri打開燈,然后開始煮咖啡。

但在某些方面,Siri與Alexa還有些距離,尤其是第三方整合。2015年,亞馬遜開始支持開發者定制Alexa語音功能,如今已經有超過12000項功能。蘋果也在謹慎、緩慢地向開發者開放資源,希望改變Siri在人們心中的形象。

谷歌 —— 學術“領袖”

在谷歌位于加州山景城的總部辦公室里,私人助手產品主管兼前Siri產品副總裁Gummi Hafsteinsson正揮舞著雙手,想要表達自己的觀點。

“交流不只是語音。如果我想交流,那用手就可以?!彼嫡?,把手在空中揮了揮,“或者指著什么東西。語音是一種你來我往的信息交換,也是我們正在嘗試打造的東西?!?

不久之前,在一年一度的I/O開發者大會上,谷歌宣布對其助手進行兩項更新,一是當你無法大聲說出某項請求時,可以打字實現;二是通過Google Lens讓谷歌助手“看到”這個世界。

谷歌采取的戰略和蘋果及亞馬遜完全不同,他們希望能維持對話的持續性,也就是讓用戶不斷和各類設備進行溝通。谷歌想做的不只是一款助手,雖然谷歌助手已經登陸1億多臺設備,但他們更想做的,是讓人工智能適應你所處的所有環境。

“關鍵問題在于,即便在家里和車里使用起來很便利,它還是要適應其他場合的。一旦離開汽車,谷歌助手的能力立馬下降,如果能全天候不分場合保證服務質量,那將是非常厲害的一件事?!?

谷歌從2012年起開始開發個人智能助手(當時叫做GoogleNow)和語音搜索系統,其中后者是Hafsteinsson于2008年推出的。去年秋天,谷歌推出智能音箱Google Home,功能類似Echo,通過“OK,谷歌”或“嗨,谷歌”這樣的話觸發系統。

看起來,亞馬遜和谷歌好像在玩一場貓捉老鼠的游戲,爭奪用戶起居室的控制權。今年2月,《時代》周刊報道稱,亞馬遜正在開發叫做“Voice ID”的語音識別功能,讓Alexa能夠識別不同的聲音。兩個月后,谷歌宣布Home將支持語音識別。本月早些時候,亞馬遜推出Alexa語音和視頻電話功能;一周后,谷歌緊接著也宣布Home將支持語音電話。

那么,Home和Echo之間最大的區別是什么呢?那就是,谷歌Home更智能。谷歌所掌握的海量數據和先進的機器學習技術,讓Home成了目前市面上最強大的人工智能設備,準確率達到95%?;魅四芄槐硐腫勻?,有人的特性,根本原因就在于人工智能技術,自2001年起,谷歌已經在這方面的研究成果已經有750篇論文。

Hafsteinsson表示:“谷歌在自然語言理解、深度學習、計算機視覺和用戶背景理解融合方面擁有豐富的經驗,因此我們認為自己能領先其他公司一大步。我們可以理解話語背后的意圖,從而更好地解決后續問題,完成復雜的多步驟任務?!?

和其他私人助手不同的是,谷歌助手能夠準確地理解上下文的關系。比方說如果你問,“印度總統是誰?”,然后你接著問“他的生日是哪一天?”。谷歌助手可以準確知道你說的“他”是誰,但Alexa還不知道。

還不止如此,在機器學習和神經網絡技術的支撐下,谷歌助手可以教你如何用越南語說“謝謝”,如何用意大利語說“火車站在哪兒?”;在有了Lens之后,你還可以掃描日文或漢字翻譯出來。這些功能Alexa和Siri都做不到。

當我們談論亞馬遜Echo,谷歌Home,蘋果AirPods,或來自三星、微軟、IBM、百度的機器人時,話鋒常?;嶙頻交魅吮澈蟮娜斯ぶ悄薌際?、麥克風陣列和云服務。這是必然的,因為正是這些技術讓語音計算成為現實。但從另一個角度來說,它們也只是速度和信息流的另一種形式。這些技術之所以能夠成為主流,在于它們相互結合的力量;而它們的進一步發展,也讓消費者能夠在自己家里享受到《星際迷航》中的無敵計算機。

未來,這些助手的功能會更多,會更智能,更易理解我們的需求。它們會越來越像人,這不僅意味著它們將學會我們的語言,更意味著最終會學習到如何取代我們。今天,語音助手能控制家里的電燈,預定洗發水,非常強大,實用!但在以后,它們還會更加智能,比方說學會調制咖啡,做賬、報道新聞,甚至推銷保險。

去年,在Code Conference上,亞馬遜CEO杰夫·貝佐斯是這樣評價語音人工智能技術的,“這項技術在未來20年內給社會帶來的影響,怎么形容都不為過?!?

人機互動的下一次風云轉變已經來臨,你或許看不到它,卻親耳聽到了它的影響。語音還只是第一步,更先進的技術正逐漸走來。

來源:
熱門推薦