嵌入式AI簡報 (2019-05-30)

關注模型壓縮、低比特量化、移動端推理加速優化、部署

註:PC端微信鏈接打不開請用手機打開

業界新聞

  • 谷歌限制華為安卓合作,余承東透露華為欲布局自研操作系統 | 新智元摘要:谷歌宣布,將限制與華為在安卓方面的合作。在美國將華為列入「實體名單」後,任正非回應表示「華為沒問題,已做好準備」。此前華為消費者業務CEO余承東曾提及華為打造操作系統的核心能力,這意味著或許離華為自研的操作系統問世不遠了;
  • ARM發布全新架構CPU、GPU及AI內核,華為或將無緣 | 新智元摘要:全球領先半導體知識產權(IP)提供商ARM重磅發布了下一代架構設計方案,其中包括:Cortex-A77 CPU;Mali-G77 GPU;ARM ML處理器;
  • 瑞芯微發布面向RK3399Pro/RK1808晶元平台的全新三大開發套件 | cnBeta摘要:福州瑞芯微電子Rockchip宣布旗下AI平台重大升級,正式面向全球AI開發者發布三大開發套件:AI開發工具包RKNN-Toolkit、AI SDK軟體開發工具包Rock-X SDK,以及AI人工智慧計算棒RK1808 AI Compute Stick。

    RK3399Pro與RK1808 AI晶元平台為瑞芯微旗下最新旗艦芯,均帶有獨立硬體NPU加速器。RK3399Pro能為AI人工智慧開發者提供一站式Turnkey解決方案,片上NPU(神經網路處理器)運算性能達3.0TOPs,具有高性能、低功耗、開發易等優勢,已應廣泛應用於智能駕駛、圖像識別、安防監控、無人機、語音識別等AI應用領域;RK1808 AI晶元平台內置的NPU算力強大,可實現語音喚醒、語音識別、人臉檢測及屬性分析、人臉識別、姿態分析、目標檢測及識別、圖像處理等一系列功能,可廣泛應用於安防、教育、清掃、車載、穿戴、家電、存儲等各場景中;

  • 獲高通阿里投資後,耐能推出首顆為3D人臉識別定製的AI晶元 | 機器之能摘要:耐能——這是一家由前高通華人工程師組建的晶元團隊,成立於2015年,聚焦在終端 AI 晶元解決方案,主攻智能手機、智能安防、智能物聯網等領域。成立三年,推出兩代六款IP,基於和高通、知名家電廠商的合作經驗,兩代IP的開發實戰,耐能終於底氣十足地踏出了關鍵一步,基於第二代IP標準版本推出首顆自家品牌的系統級AI晶元,同時也是市面上首顆專為3D人臉識別進行優化的終端晶元。耐能發布AI晶元KL520,專為智能物聯網應用所設計,兼顧語音和圖像不同數據類型處理,支持2D、3D圖像識別,適用於結構光、ToF、雙目視覺等3D感測技術並計算不同神經網路模型,可應用於智能門鎖/門禁、掃地機器人等智能家居場景,無人機、智能玩具、機器人等智能硬體產品線。值得一提的是,該顆晶元目前已經量產,並且已經與中國大陸和台灣兩地的數家客戶達成合作。在深圳媒體溝通會現場,耐能宣布了與大唐半導體、奧比中光、驀然認知等廠商的合作計劃;
  • 平頭哥新動態:蓄勢待發,RISC-V必有一席之地 | EETOP摘要:今年,平頭哥半導體團隊將進一步發布更多面向不同應用的嵌入式CPU處理器,積极參与RISC-V開源生態建設,以及二十餘項技術標準小組的工作,推動RISC-V技術持續演進;
  • 英偉達首款邊緣計算AI平台EGX重磅發布!實時處理,高性能、可擴展 | 新智元

    摘要:英偉達最新發布首款面向邊緣設備的AI平台Nvidia EGX,將 AI 帶到了網路的邊緣。該平台可以實時感知、理解和處理數據,而無需先將數據發送到雲端或數據中心;

  • 0.5秒閃譯,12倍速轉寫,科大訊飛一口氣發布五款超強AI產品 | 量子位摘要:演算法無限接近極限,場景千樹萬樹梨花開,但如何真正讓AI之能觸達用戶?科大訊飛的答案:終端硬體,而且是演算法定義的硬體:訊飛翻譯機3.0內置了高通驍龍八核處理器,支持普通話與粵語、東北話、河南話、四川話等方言之間的翻譯,還新增了維漢、藏漢等民族語言翻譯,翻譯速度也再度提升,達到「0.5秒閃譯」,並提升了圖像拍照翻譯水平。此外還有訊飛轉寫機,訊飛智能錄音筆,訊飛智能辦公本,訊飛學習機等;

論文

  • 深度壓縮感知,新框架提升GAN性能 | 新智元摘要:DeepMind提出一種全新的「深度壓縮感知」框架,將壓縮感知與深度學習相結合,顯著提高了信號恢復的性能和速度,並提出一種改進GAN的新方法;
  • 速度提升17.5倍!百度提出語音合成新模型ParaNet,一個完全並行的神經TTS系統 | 量子位摘要:百度提出了一種非自回歸序列到序列的模型ParaNet,引入了一個完全並行的神經TTS系統,將文本轉換成光譜圖。和此前百度提出的實時語音合成系統Deep Voice 3相比,ParaNet可在保證準確率相當的情況下,將速度提升到17.5倍;
  • UIUC聯合IBM、Inspirit IoT推出最新DNN/FPGA協同設計方案,助力物聯網終端設備AI應用 | 機器之心

    摘要:UIUC、IBM 和 Inspirit IoT, Inc(英睿物聯網)的研究人員提出 DNN 和 FPGA 加速器的協同設計方案(DNN/FPGA co-design),通過首創的「Auto-DNN」網路搜索引擎 +「Auto-HLS」加速器生成技術,自動生成適用於終端設備的 DNN 模型及 FPGA 加速器設計。在使用相同的終端設備,由該協同設計自動生成的物體檢測方案在檢測精度、速度和效能方面均大幅領先現時最優的 DAC18 System Design Contest 冠軍方案。

開源項目

  • 登頂五大數據集!最強目標跟蹤演算法SiamRPN++開源了,商湯出品 | CVPR 2019 Oral | 量子位摘要:商湯SiamRPN++幾乎不受複雜場景的影響。不止如此,它已經在多個數據集上成為了State-of-the-Art。同時也成了商湯Siam家族的驕傲。現在,整個家族都開源了:· SiamMask (CVPR 2019)· SiamRPN++ (CVPR 2019 oral)

    · DaSiamRPN (ECCV 2018)

    · SiamRPN (CVPR 2018)· SiamFC (ECCV 2016)
  • XiaoMi/kaldi-onnx: Kaldi model converter to ONNX摘要:kaldi到onnx的轉換工具開源了,可以配合mace在設備端運行語音nnet模型推理,對語音領域感興趣可以關注;
  • TensorFlow官方發布剪枝優化工具:參數減少80%,精度幾乎不變 | 量子位摘要:去年TensorFlow官方推出了模型優化工具,最多能將模型尺寸減小4倍,運行速度提高3倍;最近現又有一款新工具加入模型優化「豪華套餐」,這就是基於Keras的剪枝優化工具:https://github.com/tensorflow/model-optimization;

博文

  • CPU體系結構之手排流水線專題(一) | 知乎摘要:arm底層彙編優化。關於流水線我打算分三個篇幅來講,盡量做到系統全面:第一篇講背景以及理論知識;第二篇是ARM具體的架構信息以及在手機上做的一些實驗;第三篇就是講如何花式操作流水線,舉例子;本文是第一篇;
  • CUDA 並行計算入門視頻 | 機器之心摘要:什麼是 CUDA?CUDA 並行計算包括哪些方面?CUDA 的線程層次有哪些?如何更加高效的調用線程來執行程序命令?如何在實際應用中利用 GPU 加速我們的應用程序?如何在深度學習中使用 CUDA?英偉達開發者社區經理暨高級講師何琨帶你入門 CUDA 並行計算;
  • 華為方舟編譯器做了些什麼,讓安卓有了「絲滑」的感覺 | 碼農翻身摘要:作者基於無虛擬機運行、多語言聯合優化、更搞笑的內存回收機制來分析方舟編譯器,不過作者也提到這些都是猜測,還是等方舟編譯器開源了,再一探究竟吧;
  • 模塊設計之 SKNet, GCNet, GloRe, Octave | 極市平台摘要:本文對SKNet, GCNet, GloRe, Octave4篇較新較火的網路模塊設計與優化相關文章進行了對比總結,含兩篇CVPR2019的工作;
  • 用代碼模擬CPU | 機器之心摘要:晶元的設計到底有多難?想要回答這個問題最好還是先自己實踐一下。最近,來自 BBC 的一名資深軟體工程師 Daniel Harper 使用 Go 語言成功模擬出了一個 CPU 的所有功能,並把自己的經歷寫成了博客,引起了人們的熱議。這篇文章也告訴我們:完整地了解計算機的工作原理是多麼重要;
  • 美國禁令與華為極限生存簡析 | 知乎

往期回顧

  • 2019-05-15
  • 2019-04-27
  • 2019-04-13
  • 2019-03-31

Wechat ID: NeuroMem

Editor: github.com/ysh329Project: github.com/ysh329/aweso

本作品採用知識共享署名-相同方式共享 2.0 通用許可協議進行許可。
推薦閱讀:
相关文章