讓AI簡單且強大：深度學習引擎OneFlow背後的技術實踐

本文內容節選自由msup主辦的第七屆TOP100summit，北京一流科技有限公司首席科學家袁進輝（老師木）分享的《讓AI簡單且強大：深度學習引擎OneFlow背後的技術實踐》實錄。

北京一流科技有限公司將自動編排並行模式、靜態調度、流式執行等創新性技術相融合，構建成一套自動支持數據並行、模型並行及流水並行等多種模式的分散式深度學習框架，降低了分散式訓練門檻、極大的提高了硬體使用率。該框架已經成功幫助眾多頭部互聯網公司及人工智慧企業提升了大模型訓練效率，節約了硬體運營和使用成本，達到了降本增效的效果。一流科技是一家為企業客戶提供面向大規模大計算大模型等深度學習框架的人工智慧領域科技創新公司。

分享者袁進輝是北京一流科技有限公司創始人，任首席科學家。2008年7月在清華大學計算機系獲得工學博士學位，獲得清華大學優秀博士學位論文獎。2013年加入微軟亞洲研究院從事大規模機器學習平臺的研發工作。2014年發明瞭當時世界上最快的主題模型訓練演算法和系統LightLDA，只用數十臺伺服器即可完成以前數千臺伺服器才能實現的大規模主題模型，該技術成功應用於微軟在線廣告系統，被當時主管研究的全球副總裁周以真稱為「年度最好成果」。2015年至2016年底，專註於搭建基於異構集羣的深度學習平臺，項目榮獲微軟亞洲研究院院長特別獎 (top 1%)。2017年創立北京一流科技有限公司，致力於打造分散式深度學習平臺的事實工業標準。

編者按：2018年11月30日-12月3日，第七屆全球軟體案例研究峯會在北京國家會議中心盛大開幕，現場解讀2018年「壹佰案例榜單」。本文為北京一流科技有限公司首席科學家袁進輝（老師木）分享的《讓AI簡單且強大：深度學習引擎OneFlow背後的技術實踐》案例實錄。

提綱：

研發OneFlow的動機
OneFlow技術突破
總結

01研發OneFlow的動機

軟體OneFlow簡介

業界有人工智慧浪潮的三駕馬車之說，即數據、演算法、算力。具體到算力，業界更多關注的是硬體，譬如GPU，甚至是TPU之類的AI專用晶元。但是，人們發現，有了更快的加速器之後，制約大規模分散式訓練算力的瓶頸是軟體。怎麼幫助數據科學家和研究員們更輕鬆的把各種演算法在底層硬體上跑起來，而且充分釋放底層硬體的潛力，正是軟體框架需要解決的問題。目前，已有的開源深度學習框架對數據並行場景解決的比較好，但遇到模型越來越大的場景就沒有好辦法。用戶或者束手無策，或者只能付出極大成本基於開源框架做深度定製開發來滿足需求。OneFlow團隊的目標是研發一個通用框架自動解決這些問題，讓那些沒有框架研發能力的團隊也能夠享受分散式GPU集羣帶來的效率，這是我們歷時兩年多研發一套全新深度學習框架的初衷。

背後的動機：計算力是深度學習發展的最重要的推動力。

案例：2015 Microsoft Resnet

2016 Baidu Deep Speech 2

2017 Google NMT