一夜過後,載入世界足球史的奇蹟又多了一個。


在首回合客場0比3落後的情況下,利物浦昨晚以4比0擊敗巴塞羅那,創造了歐洲冠軍聯賽歷史上最偉大的逆轉之一,並以總比分4比3晉級歐冠決賽。賽後,利物浦主場球迷集體大合唱《你永不會獨行》,而因傷缺席的薩拉赫的衣服寫着:永遠別放棄。


利物浦的逆風翻盤不禁讓人想起足球解說員詹俊的名言——“苦不苦想想紅軍利物浦”,結果昨晚的苦澀屬於巴塞羅那,面對兩個賽季被對手逆轉出局的羞辱,梅西賽後拒絕了所有采訪……


昨晚,在地球的另一邊,谷歌如期召開了 2019 年 I/O 開發者大會。


3D化的搜索結果是一個讓人印象深刻的黑科技,這是谷歌最新的視覺技術,通過整合攝像頭和增強現實(AR)技術,在谷歌上搜索出的二維圖片,可以直接轉換成三維模型,並通過攝像頭放在真實環境中,強化了谷歌搜索結果的互動性和實用性。


想象一下,如果你想知道心臟長什麼樣子,除了看到實物,有什麼東西能比一個會跳動的、可以放大縮小和分解的立體模型更加形象的呢?尤其是它可以隨時隨地出現在任何地方,AR 技術的價值進一步得到了挖掘。


整體來說,今年的谷歌開發者大會顯得更爲平實,他們選擇了 “To Be Helpful”作爲主題。今年的 AI 技術展示,更多演示 AI 對於人類帶來正面效益的應用,塑造出一種“谷歌是你的好幫手”的感覺,例如幫助聽力或語言障礙人士更好地與世界溝通,在談論服務及硬件設備時,也不斷重申數據保護、攝像頭絕不會監視用戶等。


酷炫的黑科技固然令人爲之驚豔,但從商業前景以及更爲本源的“人們對技術的期望”來說,讓人類的生活工作更方便、更安全、更有效率纔是終極的“用戶需求”。


只知道炫技的 AI 公司走不遠。比如,曾登上過蘋果發佈會舞臺的玩具機器人公司 Anki,最近傳出了倒閉的消息。其倒閉的最主要原因是,Anki 的產品儘管可以說是“當下流行技術大全”,但高昂的研發投入使得他們對資本十分依賴;同時,隨着熱度降低,Anki 的消費機器人本質上並沒有真正命中消費者的需求,一個陪伴孩子卻又沒有教育意義的機器人很難激活市場。


谷歌這次推出的科技,應用場景都十分平實,雖然這些不完全是新的產品,但很多都是消費者切實需要的東西,也因此很有可能是市場喜歡的東西。


一項高科技,無論初見有多驚豔,最終只有成爲像空氣一般的存在,讓我們幾乎察覺不到它,卻又依賴於它,才能讓我們開始享受它的價值,進而真正地享受生活。


當然,谷歌也有它的問題。比如過於開源,導致它對開發商的控制很弱。未來,如果谷歌的系統更廣泛地被加以應用,可能面臨的最大問題就是開發商導致的安全和隱私問題。這些疊加在谷歌巨大的用戶體量和掌握的海量數據上,一旦爆發,將成爲不小的麻煩。因此,如何在開源和控制之間做好平衡是谷歌需要回答的問題。以下,Enjoy:




本文授權轉載自DeepTech(ID:deeptechchina)

本文原標題爲《谷歌發佈最新視覺“黑科技”:搜索3D化,代碼僅100KB,無需高端設備即可運行 》


美國時間 5 月 7 日,谷歌 2019 年 I/O 開發者大會在山景城總部開幕,爲期三天。


在開幕式上,谷歌宣佈了諸多亮點,比如更貼近用戶的搜索功能,更強大的 AI 與語音助手,內置在安卓系統中的語音轉文字功能,新款 Pixel 3a 和 3a XL 中端手機,Nest Hub Max 智能家居設備,還有安卓 Q 系統更新等等。


“To Be Helpful”是整場大會的主題之一。因此,無論是產品演示,還是演講者,幾乎全都從安全、隱私和實用的理念出發,透露出與往屆 I/O 大會不同的務實風格。


圖 | 谷歌AI領軍人 Jeff Dean: 爲每一個人打造一個更有幫助的谷歌


即使是最後登場的谷歌 AI 領軍人 Jeff Dean,也是以現有研究成果出發,強調了 BERT 模型在自然語言處理領域取得的建樹,以及 AI 技術在健康和環境領域的應用潛力,並未帶來令人眼前一亮的驚豔機器學習新成果。


不過從另一個角度來看,這或許纔是科技本身應有的樣子:一項高科技,無論初見有多驚豔,最終只有成爲像空氣一般的存在,讓我們幾乎察覺不到它,卻又依賴於它,才能讓我們開始享受它的價值,進而真正地享受生活。


這也是谷歌 2019 年 I/O 開發者大會帶給我們的啓示。


圖 | 谷歌I/O大會開場



“黑科技”開場,奠定務實風格


一開場,谷歌就遵循一貫風格,直接亮出了人們喜聞樂見的“黑科技”。


副總裁 Aparna Chennapragada 率先介紹了谷歌的最新視覺技術:巧妙地整合攝像頭和增強現實(AR)技術,強化谷歌搜索結果的互動性和實用性。


她在谷歌上搜索出的二維圖片,可以直接轉換成三維模型,並通過攝像頭放在真實環境中。


無論你搜索的是人體骨骼,一雙鞋,還是一條鯊魚,都沒問題,只要谷歌製作了 3D 模型,就可以通過攝像頭,展示在現實場景中,供用戶查看效果。它們不僅可以活動,還能夠接受放大、縮小、運動和轉移等操作指令。


可以肯定的是,3D 化的搜索結果不僅僅停留在有趣這一階段,它可以給用戶帶來更直觀的使用體驗和感受,加深對物體運作機制的理解程度。

 

想象一下,如果你想知道心臟長什麼樣子,除了看到實物,有什麼東西能比一個會跳動的、可以放大縮小和分解的立體模型更加形象的呢?尤其是它可以隨時隨地出現在任何地方,AR 技術的價值進一步得到了挖掘。


圖 | 搜索出的大白鯊以 AR 形式出現在演講臺上


除了強化搜索結果,谷歌還通過 Google Lens 程序,讓手機攝像頭變得更有價值。


如果你新到一家餐館,不知道有什麼特色菜,沒關係,只要拿出手機,打開 Google Lens 程序,對準菜單,它就可以根據已有點評,標註出大多數人推薦的特色菜。


如果你去法國旅遊,卻不會法語,看不懂路標,沒關係,只要拿出手機,打開 Google Lens 程序,對準路標,它就可以識別上面的法語,直接翻譯成中文和英語等十多種語言,還可以直接朗讀出來,讓語言不再成爲交流和旅遊的障礙。


如果你想看菜譜學做菜,沒問題,Google Lens 配合食譜製造商,錄製預先製作的烹飪視頻,只要將鏡頭對準菜譜文字,就會有實際演示視頻跳出來,爲你展示如何操作。


這些都是非常貼近日常生活的實用功能,如果實際操作效果與演示效果相符,那麼將極大地方便我們的生活。


圖 | Google Lens可以翻譯多種語言的不同標誌


谷歌在現場播放了一段視頻,講述了印度的試點項目。視頻中,一名不識字的印度母親依靠着 Google Lens 程序,終於可以以聽的方式理解書上的內容,孩子的作業,路上的標識,餐館的菜單等等,最後無需別人的幫助,單獨完成很多任務。


雖然在普通人看來,她完成的都是些瑣碎小事,比如去 ATM 取錢和預訂火車票,但對於她來說,這就像打開了生活的另一扇門。


由此可見,谷歌貫徹的“To Be Helpful”的理念,意味着技術應該能夠真正幫助有需要的人提高生活質量。


圖| 印度母親使用Google Lens 幫助自己看懂包裝盒上的字


谷歌最後強調,這種技術結合了自然語言處理、機器視覺、以及谷歌 20 多年來的搜索信息才能實現,但代碼只有 100 KB 左右,所以無需高端設備就可以運行。


這項功能將加入 Google Go 應用中。對視覺障礙者,以及不會外語的人來說,這無疑是獲取信息的新方式。目前,Google Go 已經能支持數十種語言,售價爲 35 美元。


不得不說,谷歌選擇用直觀的視覺技術作爲開場,非常機智。不僅契合主題,突出了實用性,還成功塑造出眼前一亮的感覺,調動了觀衆的積極性。但是稍顯可惜的是,這些演示或許是整場大會最有看點的部分了。



更強大、更懂你的AI語音助手


在去年的 I/O 大會上,谷歌的語音助理技術推出新功能 Google Duplex,讓 AI 打電話預訂餐廳,因其聲調語氣相當逼真,接電話的人沒察覺,該技術一鳴驚人,但引起了一些爭議。


在今年的 I/O 大會上,谷歌也演示了新功能,包括一句話開啓駕駛模式和更先進的 Duplex on the web,也就是“Duplex 可以幫忙執行網頁上的任務”。


例如用戶可以呼出語音助理,要求它上網幫你預訂一臺車,然後語音助理就會進入租車網站,幫你填寫姓名、住址,甚至是偏好車型等信息,並要求你確認。


圖 | 語音助手幫你租車


它還利用知識圖譜來進行個人推薦。根據用戶的使用習慣,AI 能更好地理解用戶的語音指令,可以通過語音瞬間打開 App,並且可以使用連續的語音指令,而不需要每次都說出喚醒詞。


比如, AI 可以追蹤一連串語音指令:打開地圖,播放音樂,打開相冊,搜索有動物的照片,發送給某人,它能根據一系列語音指令按順序完成相應動作。


谷歌認爲此功能擁有很大的應用前景,並強調隨着深度學習的進展,把 AI 模型放置到移動裝置將是一種範式的轉換。他們希望可以把 100GB 的語音識別模型縮小到 0.5GB,並放在終端設備上,讓用戶更方便使用。


不過谷歌表示,目前該功能還在完善階段,預計今年晚些時間纔會公佈更多細節,並透露在今年晚些會推出新的 Pixel 手機。



安卓內置語音轉文字功能



作爲一家以人性化爲核心的公司,谷歌這次格外考慮到了聽覺或語言障礙人士,推出了 Live Caption(實時字幕)技術。


圖 | 實時字幕技術演示


該技術由循環神經網絡支持,可以把手機中的視頻和音頻內容實時轉化成文字,類似於微信的語音信息轉文字。


不過更重要的是,Live Caption 是原生存在於安卓系統中的功能,意味着它能夠契合所有的應用,適用於視頻聊天、電話、錄像,甚至是遊戲中,而且使用全程可在設備端進行處理,不需要聯網,從而進一步保障用戶隱私。


對於普通人來說,如果不想外放語音,一副耳機就可以解決。但對於聽覺或語言障礙人士來說,這項功能可以發揮很大的作用,幫助他們更好地與人溝通。


在此基礎上,谷歌推出了 Project Euphonia,通過機器學習來了解語言障礙者的對話模式,來實現精準的語音轉寫。


安卓Q圍繞安全和隱私等優化


儘管谷歌有許多平臺,像是 Chrome,但安卓系統依舊是最重要、裝機量最大的那一個,目前全球已有超過 25 億檯安卓設備。


谷歌在今天也發佈了最新安卓 Q Beta 3 版本,圍繞安全和隱私等核心問題進行優化,12 家 OEM 廠商的 21 個手機機種都可以升級,包括華爲、小米、Vivo 等。


除了支持上述的 Live Caption 功能,安卓 Q Beta 3 還適配可摺疊屏幕,遊戲應用可以直接在兩種模式下無縫流暢轉換,並且加入了用戶期待已久的黑暗主題。


圖 | Q Beta 3 適配摺疊屏


此外,谷歌還推出了其它新功能,比如 Focus Mode 專注模式,可以讓用戶暫時停止使用一些容易打擾人的應用;Smart Reply 功能,可以預測和提供智能回覆建議,能夠通過任何應用快速發送回覆;以及針對小孩的父母管理機制。


值得一提的是,安卓 Q 已經增加了 5G 網絡支持,爲未來 OEM 廠商推出 5G 手機打下了基礎。



強調隱私保護,Nest Hub Max 誕生


智能家居一直是各家業者都想爭取的市場,Nest 是谷歌旗下專注智能家居的獨立團隊,已有家庭安全攝像頭和帶有顯示屏的 Home Hub 等智能家居產品。


圖 | 推出新版 Nest Hub Max


谷歌在大會上表示,智能家居必須非常重視用戶的隱私,並且宣佈,將 Home Hub 更名爲 Nest Hub,同時推出升級版 Nest Hub Max,裝有更大的 10 英寸顯示屏,直接與 Facebook Portal 和亞馬遜 Echo Show 等同類產品競爭。


谷歌強調,沒有用戶允許絕不會啓動攝像頭,另外拍下或錄下的數據只會存在終端上,並使用 FaceMatch 面部識別用戶,支持手勢操作。


屏幕較大的 Nest Hub Max 售價 229 元,現有的 Nest Hub 則降價 20 美元至 129 美元。



推出兩款Pixel,進軍中端智能手機市場


隨後谷歌帶來了兩款 Pixel 系列手機,Pixel 3a 與 Pixel 3a XL,售價分別是 399 美元和 479 美元,前者即日起開售,後者今年暑期上市。這也是谷歌首次推出中端智能手機。


圖 | 新款Pixel 3a售價399美元,即日發售


兩個機型在外觀上依然延續 Pixel 家族的特點,無劉海屏幕,後置單攝像頭,提升拍照質量主要靠搭載谷歌自研 Pixel Visual Core 圖像處理單元,還繼續使用後置指紋識別,保留有 3.5mm 耳機孔,一次充電可以支撐 30 小時,並且配有 Titan M 安全芯片,專門用來保護用戶隱私。


至於硬件配置,谷歌大會上並沒有給出詳細參數,但已有媒體爆出了比較可信的數據,其中 Pixel 3a 搭載高通驍龍 670 處理器,配備 4GB 內存+ 64GB 存儲,分辨率爲 1080×2160 ;Pixel 3a XL 搭載高通驍龍 710 處理器,配備 4GB 內存+128GB 存儲,分辨率爲 2220×1080。


相比 Pixel 3 的 799 美元售價,兩款中端手機的價格更加親民,這在一定程度上可以刺激目前較爲疲軟的 Pixel 銷量,但隨着全球整體智能手機市場逐漸飽和,再加上谷歌在大會上暗示今年晚些時候將推出新 Pixel 高端機,它們究竟能夠爲谷歌帶來多少收益還不得而知。


就像在剛剛過去的第一季度財報會議上,谷歌 CEO Pichai 表示的那樣,“在硬件之路上,谷歌還處於早期階段”。



Jeff Dean登場,壓軸的谷歌 AI


在大會的最後,谷歌 AI 領軍人物 Jeff Dean 壓軸登場,介紹了自己團隊一直以來的研究目標和方向。從推動計算機視覺的極限,到語音識別,他們研究的領域涵蓋生活中的方方面面。


圖 | Jeff 介紹谷歌AI 團隊的研究進展


在Jeff 看來,最讓他激動的AI技術進展是語言理解


遵循這一思想,谷歌 AI 一直在努力提高計算機對語言的理解能力,希望有朝一日能媲美人類的水平。最新的研究成果就是自然語言處理領域大名鼎鼎的 BERT 模型(Bidirectional Encoder Representation from Transformers)。


BERT 模型突破了傳統 RNN 模型的限制,不再侷限於單個關鍵詞詞義的理解,而是結合上下文分析語義,能夠在大段文字下更好地理解語境和整體內容。


該模型於 2018 年 11 月推出,直接刷新了自然語言處理任務的 11 項紀錄,同時啓發了多個研究團隊,後續衍生模型不斷刷新着新的紀錄。


谷歌團隊更是將其直接定義爲:BERT 模型開啓了自然語言處理的新時代!


隨後,谷歌 AI 介紹了 AI for Social Good 項目,旨在將 AI 技術推廣到各個領域。


圖 | 谷歌用AI 檢測肺癌


他們將 AI 運用於醫療保健,建立了 CT 掃描圖預測模型,可以幫助檢測肺癌。他們還將 AI 運用在自然災害預測領域,建立了一個洪水預測模型,預測洪水會出現在何時何地。該模型結合了深度學習、衛星影像與以現實爲基礎的情境模擬,並且會將信息共享給可能會受到影響的個人。


除此之外,谷歌的 AI for Social Good 項目還包括地震餘震預測、全球漁業活動預測等等,都突顯出 AI 技術的實用價值。


圖 - 用 AI 模型預測地震餘震



結語


最近一兩年,數據隱私和 AI 道德問題持續困擾着美國科技巨頭們,特別是用戶體量巨大、掌握海量數據的 Facebook 和谷歌。


上週的 Facebook F8 大會,扎克伯格三句話不離數據隱私保護,力求挽回形象,而在谷歌 I/O 大會開幕式上,我們似乎也感受到了谷歌的刻意“保守”。


去年,谷歌在大會上演示了 Google Duplex,讓 AI 打電話訂位,AI 模仿人類太成功,接聽電話的店員根本沒有察覺有異,不料卻引起外界憂心技術被用來欺騙人類。


隨後,谷歌遭人詬病的事一樁接着一樁,一下子員工聯名抗議用 AI 做軍事生意,導致雲計算部門高管的離職潮,一下子又反對 AI 道德委員會的某些外部成員,使得該組織才成立一週就被迫解散。這讓曾經確立“AI 優先”戰略的谷歌不得不重新思考技術的發展走向和展示策略。


所以,今年的 I/O 大會在展示 AI 技術時,更多演示 AI 對於人類帶來正面效益的應用,塑造出一種“谷歌是你的好幫手”的感覺,例如幫助聽力或語言障礙人士更好地與世界溝通,在談論服務及硬件設備時,也不斷重申數據保護、攝像頭絕不會監視用戶等,深怕又被外界抓了小辮子。


或許正是因爲如此,今年的大會才略顯平淡,少了曾經的驚豔。


但就像開頭所說,以創新力聞名的谷歌能帶來顛覆性技術突破固然令人興奮,可是相比於過分激進,轉型成爲這樣一種幫手型角色,對於普通用戶、谷歌自身和社會發展來說,未嘗不是一件好事。


科技之於人類,本就應該扮演這樣的角色。


也許你還想看 :

新氧美股上市,金星:創始人的進取心是公司的天花板

楊浩涌:你的公司安全嗎?

殺死繁忙,成爲沃倫巴菲特

Patagonia:小而美的公司是如何做到行業頂尖的?

合法的工業大麻爲什麼最近……這麼火?


相关文章