有人問我,用一個性能還不錯的 GPU 作為 tensorflow 的運算工具會比 CPU 快多少。這個的確具體看你的 CPU 和 GPU 性能到底如何,不過,通常意義上講,GPU 的運算時間會遠遠小於 CPU,我在學校裡面的深度學習作業,我用我的筆記本電腦 (Lenovo T470)的CPU,跑了10min,在 Google Compute Engine 上搭建的GPU虛擬機,跑了30s。這個差距是非常可怕的。

有人不知道為什麼 GPU 在這種快速矩陣運算的性能上會比 CPU 強這麼多,我的理解是這樣,GPU就是為了進行簡單的運算而設計出來的,它沒有能力執行複雜的指令集,而 CPU 恰好反之。CPU 就像一個科學家,但是科學家也不能在 1min 中算10000道小學數學題,GPU 是一群小學生,他們可以在短時間內快速地計算小學數學題,但是難以完成複雜的科學任務。

好了,不多說,我把如何搭建的過程按步驟順序擺在下面。

(1) 申請 Google 賬號。額。。。國內的朋友你們。。。

(2) 去往 Google Compute Engine 主頁搭建實例。

https://console.cloud.google.com/?

console.cloud.google.com

在這一步,你需要指定伺服器位置,申請GPU,選擇操作系統。。。詳細的教程請參見:

https://medium.com/@kstseng/%E5%9C%A8-google-cloud-platform-%E4%B8%8A%E4%BD%BF%E7%94%A8-gpu-%E5%92%8C%E5%AE%89%E8%A3%9D%E6%B7%B1%E5%BA%A6%E5%AD%B8%E7%BF%92%E7%9B%B8%E9%97%9C%E5%A5%97%E4%BB%B6-1b118e291015?

medium.com

(3) 下載 Google Cloud SDK

這個東西會讓你訪問 GCP 更加穩定。

下載鏈接:

https://cloud.google.com/sdk/?

cloud.google.com

注意,當你的 PC 安裝了 Google SDK 的時候,你甚至可以用普通 cmd 訪問雲端,因為你在安裝 GCSDK 的時候它已經幫你配置好了環境變數,但是,cmd 訪問雲端十分不穩定,經常出現連接異常中斷的現象,請注意。

(4) 在GCP上安裝cuda

4-7步詳見第2步教程

(5) 在GCP上安裝CUDNN

本步驟需要較繁瑣的 linux 命令

常用命令:

ls 顯示本文件夾下的文件,是的,linux 看文件也需要命令
cd 進入文件夾與退出文件夾
rm -r 移動文件夾
cuda 位置 /usr/local/cuda 可能有細微區別。(註:local文件夾的地位與 windows 裡面 c://programs file的地位差不多,請記住這個關鍵文件夾的位置)

(6) 在GCP上安裝 Anaconda 並激活深度學習環境

本步驟需要使用VIM,配置環境變數,請了解VIM的使用方法。

基本命令:

i 進入輸入模式
esc 退出輸入模式
:wq 保存退出

其實我覺得這三個基本夠了,對了,這個也常用:

整頁翻頁 ctrl-f ctrl-b

(7) 在GCP上安裝 linux 版本的tensorflow

本步驟很可能遇到版本不兼容之情況。根據實際經驗,tensorflow 1.5 與 cuda 9.0 配合使用是比較穩定的版本。

(8) 為 jupyter notebook 設置遠程訪問許可

設置 jupyter notebook 可遠程訪問?

blog.csdn.net
圖標

總體來說,還是有些複雜的,其中第5步需要用到許多繁瑣的 Linux 命令,沒有 linux 基礎的朋友一定會非常吃力。(因為我有一個 linux 基礎很強的同學他依然覺得有些吃力)第8步,配置 jupyter notebook 的時候需要你會使用 VIM。

看似簡簡單單搭建一個深度學習平台,其實還是非常考驗個人能力的,祝你成功。


推薦閱讀:
相关文章