直接開始,先檢查自身的電腦配置
看別人的教程
查看電腦配置
有些命令忘了,看這裡
Ubuntu18:裝GPU TensorFlow?blog.csdn.net
cuda 8.0
我的顯卡怎麼樣
我的顯卡信息
2.1的計算能力,只能用8.0
安裝顯卡驅動
打開終端:sudo apt-get update
1、cuda 8.0 下載地址:https://developer.nvidia.com/cuda-80-ga2-download-archive
下載
sudo apt-get remove --purge nvidia*
sudo snap install tree
創建一個文件夾
mkdir tensorflow_gpu
sudo gedit /etc/modprobe.d/blacklist.conf
打開了
在末尾加入
blacklist nouveau
這個較好
2.禁用nouveau驅動
在末尾添加:
然後執行:sudo update-initramfs -u
重啟後執行:lsmod | grep nouveau。如果沒有屏幕輸出,說明禁用nouveau成功。
執行
lsmod | grep nouveau
ubuntu-drivers devices
安裝390版本驅動:
sudo apt install nvidia-driver-390
安裝過程選擇yes
我發現下載太慢了,切換國內景象
打開終端(Open Terminal)
1 將系統自帶的該文件做個備份: sudo cp /etc/apt/sources.list /etc/apt/sources.list.backup
2 修改配置:sudo gedit /etc/apt/sources.list,打開後全選,刪除,替換成 清華大學開源鏡像站:Tsinghua Open Source Mirror 中的18.04LTS sources.list內容,
更新源 sudo apt-get update
即可使用 TUNA 的軟體源鏡像。
# 默認注釋了源碼鏡像以提高 apt update 速度,如有需要可自行取消注釋 deb https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ bionic main restricted universe multiverse # deb-src https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ bionic main restricted universe multiverse deb https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ bionic-updates main restricted universe multiverse # deb-src https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ bionic-updates main restricted universe multiverse deb https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ bionic-backports main restricted universe multiverse # deb-src https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ bionic-backports main restricted universe multiverse deb https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ bionic-security main restricted universe multiverse # deb-src https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ bionic-security main restricted universe multiverse
# 預發布軟體源,不建議啟用 # deb https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ bionic-proposed main restricted universe multiverse # deb-src https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ bionic-proposed main restricted universe multiverse
更換之後需要更新
更新過程等需要一段時間,所以查看顯卡的等級。
顯卡算力
Mobile Products
GPU Compute Capability
NVS 5400M 2.1
NVS 5200M 2.1
NVS 4200M 2.1
感覺速度快很多了
重啟之後,
檢查NVIDIA驅動是否安裝成功:
nvidia-smi
若顯示驅動版本等信息則安裝成功。
二、安裝CUDA8.0
18.04裡面不支持cuda8,最低也是10
三、安裝cuda 8.0(先看本章 4、驗證cuda8是否安裝成功)
我還是使用cuda9.0
二、安裝CUDA9.0
下載地址:
注意:tensorflow對CUDA的版本有要求,見https://github.com/mind/wheels
cd到所下載的run文件路徑,然後執行:
sudo sh cuda_9.0xxx.run --no-opengl-libs #根據自己的包名稱替換代碼
按照提示安裝即可,注意,不要安裝CUDA內的NVIDIA驅動!
安裝成功後添加下列語句
export PATH=/usr/local/cuda-9.0/bin${PATH:+:${PATH}} export LD_LIBRARY_PATH=/usr/local/cuda9.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
sudo chmod a+r /usr/local/cuda/include/cudnn.h
這樣可以用ssh遠程工具連接伺服器,這類工具很多。
sudo apt-get install openssh-server
下載連接
我已經下載好了
安裝教程如下
教程要點
輸入
sh ./pycharm.sh
彈出如下窗口,選擇第二個,點擊OK
點擊確認同意協議
選擇不發
下一步勾選創建文件夾
/usr/local/bin/charm
我安裝後面兩個
就會有下面的界面
輸入我的賬號密碼之後,這就成功了
我還沒有安裝anaconda,所以會
檢查我的anaconda,終於下載好了
我的磁碟提示空間不夠了,我不知道會怎麼樣。
ubuntu更換安裝源和pip鏡像源 - wssywh的博客 - CSDN博客?blog.csdn.net
sudo mkdir pip sudo touch pip.conf
進入文件加入景象
[global] index-url = https://pypi.tuna.tsinghua.edu.cn/simple
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/ conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/ conda config --set show_channel_urls yes
conda 更改源鏡像 - 儒雅的小Z.的博客 - CSDN博客?blog.csdn.net
我安裝了最新的anaconda,所以python版本是3.7,tensorflow不支持這個版本
conda create -n tensorflow pip python=3.6
安裝過程提示需要操作,需要等待一段時間。
還要等待,不過很快也安裝完成了
開始激活
conda activate tensorflow
# To activate this environment, use # # $ conda activate tensorflow # # To deactivate an active environment, use # # $ conda deactivate
應該更新一下鏡像
sudo apt-get update
pip install --ignore-installed --upgrade tensorflow-gpu==1.8
216M,可能要等個10來分鐘
我安裝過程中遇到了磁碟空間不足
Could not install packages due to an EnvironmentError: [Errno 28] 設備上沒有空間
然後我就把下載的東西,剪切到另一個磁碟。
然後重新執行命令,安裝成功
這時候,激動人心的時候到了。
輸入python
import tensorflow as tf hello = tf.constant(Hello, TensorFlow!) sess = tf.Session() print(sess.run(hello))
但是輸入到第二條就報錯了
ImportError: libcublas.so.9.0: cannot open shared object file: No such file or directory
這個連接說版本不匹配
則可能為安裝的CUDA版本與tensorflow不匹配或者環境變數未配置好。
我仔細分析,我記得我安裝的是cuda10,所以這個肯定是不對的,但是cuda10的環境變數怎麼改呢?我想這是最新的,網上教程也少,如果我作出教程教程,點擊量肯定很高。
用history 查看我的指令
export PATH=/usr/local/cuda-9.0/bin${PATH:+:${PATH}} export LD_LIBRARY_PATH=/usr/local/cuda9.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}} # added by Anaconda3 2018.12 installer # >>> conda init >>> # !! Contents within this block are managed by conda init !! __conda_setup="$(CONDA_REPORT_ERRORS=false /home/kindfa/anaconda3/bin/conda shell.bash hook 2> /dev/null)" if [ $? -eq 0 ]; then eval "$__conda_setup" else if [ -f "/home/kindfa/anaconda3/etc/profile.d/conda.sh" ]; then . "/home/kindfa/anaconda3/etc/profile.d/conda.sh" CONDA_CHANGEPS1=false conda activate base else export PATH="/home/kindfa/anaconda3/bin:$PATH" fi fi unset __conda_setup
從我的這幾個命令可以看出
sudo sh cuda_10.0.130_410.48_linux.run 78 tar -xzvf cudnn-9.0-linux-x64-v7.4.2.24.tgz 79 sudo cp cuda/include/cudnn.h /usr/local/cuda/include 80 sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64 81 sudo chmod a+r /usr/local/cuda/include/cudnn.h
ubuntu18.04+CUDA10+cuDNN9.0+anaconda+tensorflow-gpu==1.8
顯卡:nvs 5400m
內存:8G
CPU:
電源:
硬碟:
初步診斷是環境變數的配置不合理,先解決環境變數的問題,這裡我做一些修改。
為了編輯修復方便,配置vim
普遍的做法是
sudo apt-get remove vim-common sudo apt-get install vim
更詳細的修改
我已經按照這個詳細的教程做了修改,其實還有更複雜的,但是我沒有必要這麼去修改了。
這個比較專業,不過沒必要。
經過一番研究我發現我的gcc默認為7.3
(tensorflow) kindfa@kindfa-ThinkPad-T430:/usr/local/cuda/samples/0_Simple$ python Python 3.6.8 |Anaconda, Inc.| (default, Dec 30 2018, 01:22:34) [GCC 7.3.0] on linux Type "help", "copyright", "credits" or "license" for more information. >>>
這時候需要版本降級
版本安裝,這裡參考黃博士的教程
sudo apt-get install gcc-5
sudo apt-get install gcc-5 選擇y sudo apt-get install g++-5 y
完成了
- 通過命令替換之前的版本
sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-5 50 sudo update-alternatives --install /usr/bin/g++ g++ /usr/bin/g++-5 50
運行結果如下
kindfa@kindfa-ThinkPad-T430:~$ sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-5 50 update-alternatives: 使用 /usr/bin/gcc-5 來在自動模式中提供 /usr/bin/gcc (gcc) kindfa@kindfa-ThinkPad-T430:~$ sudo update-alternatives --install /usr/bin/g++ g++ /usr/bin/g++-5 50 update-alternatives: 使用 /usr/bin/g++-5 來在自動模式中提供 /usr/bin/g++ (g++)
然後,我就開始下載這個連接的
下載五個文件
linux--x86-64,Ubuntu--17.04,runfile(local),下載Base Installer和4個Patch