直接開始,先檢查自身的電腦配置

看別人的教程

深度學習應用系列(一)| 在Ubuntu 18.04安裝tensorflow 1.10 GPU版本?

www.cnblogs.com

查看電腦配置

https://jingyan.baidu.com/article/03b2f78c1095c95ea337ae50.html?

jingyan.baidu.com

有些命令忘了,看這裡

ubuntu下查看硬體配置 - chuanyu的專欄 - CSDN博客?

blog.csdn.net

Ubuntu18:裝GPU TensorFlow?

blog.csdn.net

cuda 8.0

Ubuntu16.04+Cuda8.0+cudnn6.0+Tensorflow-gpu==1.4 - 小亮Machine Learning - CSDN博客?

blog.csdn.net
圖標

我的顯卡怎麼樣

https://jingyan.baidu.com/article/ca41422f13ec761eae99ed00.html?

jingyan.baidu.com

我的顯卡信息

NVIDIA NVS for Notebooks|NVIDIA?

www.nvidia.com
圖標

2.1的計算能力,只能用8.0

安裝顯卡驅動

打開終端:sudo apt-get update

1、cuda 8.0 下載地址:developer.nvidia.com/cu

下載

CUDA Toolkit 10.0 Download?

developer.nvidia.com

sudo apt-get remove --purge nvidia*

sudo snap install tree

創建一個文件夾

mkdir tensorflow_gpu

sudo gedit /etc/modprobe.d/blacklist.conf

打開了

在末尾加入

blacklist nouveau

Ubuntu18.04使用Anaconda安裝Tensorflow-gpu - JOKER_Or的博客 - CSDN博客?

blog.csdn.net

這個較好

2.禁用nouveau驅動

sudo gedit /etc/modprobe.d/blacklist.conf

在末尾添加:

blacklist nouveau

然後執行:sudo update-initramfs -u

重啟後執行:lsmod | grep nouveau。如果沒有屏幕輸出,說明禁用nouveau成功。

執行

lsmod | grep nouveau

ubuntu-drivers devices

安裝390版本驅動:

sudo apt install nvidia-driver-390

安裝過程選擇yes

我發現下載太慢了,切換國內景象

Ubuntu 18.04 LTS 更新鏡像配置(替換為清華鏡像)?

blog.csdn.net

打開終端(Open Terminal)

1 將系統自帶的該文件做個備份: sudo cp /etc/apt/sources.list /etc/apt/sources.list.backup

2 修改配置:sudo gedit /etc/apt/sources.list,打開後全選,刪除,替換成 清華大學開源鏡像站:Tsinghua Open Source Mirror 中的18.04LTS sources.list內容,

更新源 sudo apt-get update

即可使用 TUNA 的軟體源鏡像。

# 默認注釋了源碼鏡像以提高 apt update 速度,如有需要可自行取消注釋
deb https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ bionic main restricted universe multiverse
# deb-src https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ bionic main restricted universe multiverse
deb https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ bionic-updates main restricted universe multiverse
# deb-src https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ bionic-updates main restricted universe multiverse
deb https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ bionic-backports main restricted universe multiverse
# deb-src https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ bionic-backports main restricted universe multiverse
deb https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ bionic-security main restricted universe multiverse
# deb-src https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ bionic-security main restricted universe multiverse

# 預發布軟體源,不建議啟用
# deb https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ bionic-proposed main restricted universe multiverse
# deb-src https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ bionic-proposed main restricted universe multiverse

Tsinghua Open Source Mirror?

mirrors.tuna.tsinghua.edu.cn
圖標

更換之後需要更新

更新過程等需要一段時間,所以查看顯卡的等級。

顯卡算力

英偉達GPU顯卡計算能力評估(深度學習) - haoji007的博客 - CSDN博客?

blog.csdn.net

Mobile Products

GPU Compute Capability

NVS 5400M 2.1

NVS 5200M 2.1

NVS 4200M 2.1

安裝390版本驅動:

sudo apt install nvidia-driver-390

感覺速度快很多了

重啟之後,

檢查NVIDIA驅動是否安裝成功:

nvidia-smi

若顯示驅動版本等信息則安裝成功。

二、安裝CUDA8.0

18.04裡面不支持cuda8,最低也是10

三、安裝cuda 8.0(先看本章 4、驗證cuda8是否安裝成功)

1、cuda 8.0 下載地址:developer.nvidia.com/cu

我還是使用cuda9.0

二、安裝CUDA9.0

下載地址:

CUDA Zone?

developer.nvidia.com
圖標

注意:tensorflow對CUDA的版本有要求,見github.com/mind/wheels

cd到所下載的run文件路徑,然後執行:

sudo sh cuda_9.0xxx.run --no-opengl-libs #根據自己的包名稱替換代碼

按照提示安裝即可,注意,不要安裝CUDA內的NVIDIA驅動!

安裝成功後添加下列語句

export PATH=/usr/local/cuda-9.0/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda9.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}

sudo chmod a+r /usr/local/cuda/include/cudnn.h

安裝ssh

這樣可以用ssh遠程工具連接伺服器,這類工具很多。

sudo apt-get install openssh-server

安裝pycharm

下載連接

謝謝您下載PyCharm!?

www.jetbrains.com
圖標

我已經下載好了

安裝教程如下

Ubuntu 18.04 安裝 PyCharm?

blog.csdn.net
圖標

教程要點

  1. 解壓之後,進入文件夾
    1. cd pycharm-professional-2018.3.3/
    2. ls
    3. cd pycharm-2018.3.3/
    4. ls
    5. cd bin/
    6. 這時候終於看到了sh文件

輸入

sh ./pycharm.sh

彈出如下窗口,選擇第二個,點擊OK

點擊確認同意協議

選擇不發

  1. 看到這界面

下一步勾選創建文件夾

/usr/local/bin/charm

我安裝後面兩個

我安裝後面兩個

就會有下面的界面

輸入我的賬號密碼之後,這就成功了

我還沒有安裝anaconda,所以會

接下來安裝anaconda

檢查我的anaconda,終於下載好了

  1. 進入下載的目錄
  2. ls
  3. bash Anaconda3-2018.12-Linux-x86_64.sh
  4. 輸入回車
  5. Do you accept the license terms? [yes|no] 選擇yes
  6. 輸入回車,然後在安裝過程中,等待
  7. Do you wish the installer to initialize Anaconda3
  8. in your /home/kindfa/.bashrc ? [yes|no] 選擇yes
  9. 後面的也選yes,按照提示
  10. 現在安裝完成了,執行source ~/.bashrc
  11. 輸入conda list,檢查是否安裝成功,結果發現安裝成功了

我的磁碟提示空間不夠了,我不知道會怎麼樣。

安裝python3.6的虛擬環境

  1. ubuntu18.04 更改pip源為阿里雲的

ubuntu更換安裝源和pip鏡像源 - wssywh的博客 - CSDN博客?

blog.csdn.net

sudo mkdir pip
sudo touch pip.conf

進入文件加入景象

[global]
index-url = https://pypi.tuna.tsinghua.edu.cn/simple

修改conda鏡像

conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
conda config --set show_channel_urls yes

conda 更改源鏡像 - 儒雅的小Z.的博客 - CSDN博客?

blog.csdn.net

在anaconda中安裝python3.6的虛擬環境

我安裝了最新的anaconda,所以python版本是3.7,tensorflow不支持這個版本

conda create -n tensorflow pip python=3.6

安裝過程提示需要操作,需要等待一段時間。

還要等待,不過很快也安裝完成了

開始激活

conda activate tensorflow

# To activate this environment, use
#
# $ conda activate tensorflow
#
# To deactivate an active environment, use
#
# $ conda deactivate

應該更新一下鏡像

sudo apt-get update

pip install --ignore-installed --upgrade tensorflow-gpu==1.8

216M,可能要等個10來分鐘

我安裝過程中遇到了磁碟空間不足

Could not install packages due to an EnvironmentError: [Errno 28] 設備上沒有空間

然後我就把下載的東西,剪切到另一個磁碟。

然後重新執行命令,安裝成功

這時候,激動人心的時候到了。

驗證安裝

輸入python

import tensorflow as tf
hello = tf.constant(Hello, TensorFlow!)
sess = tf.Session()
print(sess.run(hello))

但是輸入到第二條就報錯了

ImportError: libcublas.so.9.0: cannot open shared object file: No such file or directory

ImportError: libcublas.so.9.0: cannot open shared object file: No such file or directory

這個連接說版本不匹配

Ubuntu18.04使用Anaconda安裝Tensorflow-gpu - JOKER_Or的博客 - CSDN博客?

blog.csdn.net

則可能為安裝的CUDA版本與tensorflow不匹配或者環境變數未配置好。

我仔細分析,我記得我安裝的是cuda10,所以這個肯定是不對的,但是cuda10的環境變數怎麼改呢?我想這是最新的,網上教程也少,如果我作出教程教程,點擊量肯定很高。

用history 查看我的指令

export PATH=/usr/local/cuda-9.0/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda9.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
# added by Anaconda3 2018.12 installer
# >>> conda init >>>
# !! Contents within this block are managed by conda init !!
__conda_setup="$(CONDA_REPORT_ERRORS=false /home/kindfa/anaconda3/bin/conda shell.bash hook 2> /dev/null)"
if [ $? -eq 0 ]; then
eval "$__conda_setup"
else
if [ -f "/home/kindfa/anaconda3/etc/profile.d/conda.sh" ]; then
. "/home/kindfa/anaconda3/etc/profile.d/conda.sh"
CONDA_CHANGEPS1=false conda activate base
else
export PATH="/home/kindfa/anaconda3/bin:$PATH"
fi
fi
unset __conda_setup

從我的這幾個命令可以看出

sudo sh cuda_10.0.130_410.48_linux.run
78 tar -xzvf cudnn-9.0-linux-x64-v7.4.2.24.tgz
79 sudo cp cuda/include/cudnn.h /usr/local/cuda/include
80 sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
81 sudo chmod a+r /usr/local/cuda/include/cudnn.h

ubuntu18.04+CUDA10+cuDNN9.0+anaconda+tensorflow-gpu==1.8

顯卡:nvs 5400m

內存:8G

CPU:

電源:

硬碟:

初步診斷是環境變數的配置不合理,先解決環境變數的問題,這裡我做一些修改。

為了編輯修復方便,配置vim

普遍的做法是

sudo apt-get remove vim-common
sudo apt-get install vim

更詳細的修改

ubuntu16.04下vim的安裝與配置 - ColdCode - 博客園?

www.cnblogs.com

我已經按照這個詳細的教程做了修改,其實還有更複雜的,但是我沒有必要這麼去修改了。

Ubuntu18.04下VIM安裝及配置 - qq_42138566的博客 - CSDN博客?

blog.csdn.net
圖標

這個比較專業,不過沒必要。

回到診斷的問題

經過一番研究我發現我的gcc默認為7.3

(tensorflow) kindfa@kindfa-ThinkPad-T430:/usr/local/cuda/samples/0_Simple$ python
Python 3.6.8 |Anaconda, Inc.| (default, Dec 30 2018, 01:22:34)
[GCC 7.3.0] on linux
Type "help", "copyright", "credits" or "license" for more information.
>>>

這時候需要版本降級

版本安裝,這裡參考黃博士的教程

sudo apt-get install gcc-5

sudo apt-get install gcc-5
選擇y
sudo apt-get install g++-5
y

完成了

- 通過命令替換之前的版本

sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-5 50
sudo update-alternatives --install /usr/bin/g++ g++ /usr/bin/g++-5 50

運行結果如下

kindfa@kindfa-ThinkPad-T430:~$ sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-5 50
update-alternatives: 使用 /usr/bin/gcc-5 來在自動模式中提供 /usr/bin/gcc (gcc)
kindfa@kindfa-ThinkPad-T430:~$ sudo update-alternatives --install /usr/bin/g++ g++ /usr/bin/g++-5 50
update-alternatives: 使用 /usr/bin/g++-5 來在自動模式中提供 /usr/bin/g++ (g++)

然後,我就開始下載這個連接的

https://developer.nvidia.com/cuda-90-download-archive?target_os=Linux&target_arch=x86_64&target_distro=Ubuntu&target_version=1704&target_type=runfilelocal?

developer.nvidia.com

CUDA Toolkit 9.0 DownloadsCUDA Toolkit 9.0 Downloads?

developer.nvidia.com

下載五個文件

  • 版本選擇:

linux--x86-64Ubuntu--17.04runfile(local),下載Base Installer和4個Patch


推薦閱讀:
相关文章