|
声明
本教程不得用于任何形式的商业用途,如果需要转载请与作者SCP-173联系,如果发现未经允许复制转载,将保留追求其法律责任的权利。
这里需要说明一下,笔者不建议在Windows环境下进行深度学习的研究,一方面是因为Windows所对应的框架搭建的依赖过多,社区设定不完全;另一方面,Linux系统下对显卡支持、内存释放以及存储空间调整等硬件功能支持较好。如果您对Linux环境感到陌生,并且大多数开发环境在Windows下更方便操作的话,希望这篇文章对您会有帮助。
关于计算机的硬件配置说明
推荐配置
如果您是高校学生或者高级研究人员,并且实验室或者个人资金充沛,建议您采用如下配置:主板:X99型号或Z170型号
CPU: i7-5830K或i7-6700K 及其以上高级型号
内存:品牌内存,总容量32G以上,根据主板组成4通道或8通道
SSD: 品牌固态硬盘,容量256G以上
显卡:NVIDIA GTX 1080、NVIDIA GTX TITAN、NVIDIA GTX 1070、NVIDIA GTX 1060 (顺序为优先建议,并且建议同一显卡,可以根据主板插槽数量购买多块,例如X99型号主板最多可以采用×4的显卡)
电源:由主机机容量的确定,一般有显卡总容量后再加200W即可
最低配置
如果您是仅仅用于自学或代码调试,亦或是条件所限仅采用自己现有的设备进行开发,那么您的电脑至少满足以下几点:CPU:Intel第三代i5和i7以上系列产品或同性能AMD公司产品
内存:总容量4G以上
CPU说明大多数CPU目前支持多核多线程,那么如果您采用CPU加速,就可以使用多线程运算。这方面的优势对于服务器CPU集群和多核并行CPU尤为关键
显卡说明如果您的显卡是非NVIDIA公司的产品或是NVIDIA GTX系列中型号的第一个数字低于4或NVIDIA的GT系列,都不建议您采用此类显卡进行加速计算,例如NVIDIA GT 910、NVIDIA GTX 450 等等。
如果您的显卡为笔记本上的GTX移动显卡(型号后面带有标识M),那么请您慎重使用显卡加速,因为移动版GPU很容易发生过热烧毁现象。
如果您的显卡,显示的是诸如 HD5000,ATI 5650 等类型的显卡,那么您只能使用CPU加速
如果您的显卡为Pascal架构的显卡(NVIDIA GTX 1080,NVIDIA GTX 1070等),您只能在之后的配置中选择Visual Studio 2015和CUDA 8.0
基本开发环境搭建
1. Microsoft Windows 版本
关于Windows的版本选择,本人强烈建议对于部分高性能的新机器采用Windows 10作为基础环境,部分老旧笔记本或低性能机器采用Windows 7即可,本文环境将以Windows 10作为开发环境进行描述。对于Windows 10的发行版本选择,笔者建议采用Windows_10_enterprise_2016_ltsb_x64作为基础环境。
这里推荐到MSDN我告诉你下载,也感谢作者国内优秀作者雪龙狼前辈所做出的贡献。
直接贴出热链,复制粘贴迅雷下载:
cn_windows_10_enterprise_2016_ltsb_x64_dvd_9060409.iso (3.56 GB)
2. 编译环境Microsoft Visual Studio 2010 - 2015
(安装CPU版本非必须安装)
CUDA编译器为Microsoft Visual Studio,版本从2010-2015,其中cuda7.5仅支持2010、2012、2013,cuda8.0仅支持2015版本,本文采用Visual Studio 2015 Update 3。同样直接贴出迅雷热链:
cn_visual_studio_professional_2015_with_update_3_x86_x64_dvd_8923256.iso (7.21 GB)
3. Python环境
python环境建设推荐使用科学计算集成python发行版Anaconda,Anaconda是Python众多发行版中非常适用于科学计算的版本,里面已经集成了很多优秀的科学计算Python库。对于搞科学计算与深度学习的朋友们,建议安装Anconda2.7版本,如果您喜欢使用Anaconda3.5版本也没有太大问题,关于很多早期的python3.5不兼容问题现在已经全部解决,本文默认使用Anaconda2.7
4. GCC编译环境
gcc/g++是Windows环境与Linux环境非常大的一个差别点。不管是cpu版本还是gpu版本都需要安装GCC编译环境。本文提供两种解决方案:MinGW Minimalist GNU for Windows,安装好Anaconda之后在CMD或者Powershell中输入:
conda install mingw libpythonMSYS2 一部分读者自己本身已经具有了Python环境,再安装Anaconda会造成很大的不便,那么本文推荐安装MSYS2,网站上有详细的如何安装的说明,本文不再赘述。
5. CUDA
(仅使用CPU版本不必安装)CUDA Toolkit是NVIDIA公司面向GPU编程提供的基础工具包,也是驱动显卡计算的核心技术工具。直接安装CUDA8.0即可下载地址:https://developer.nvidia.com/cuda-downloads
在下载之后,按照步骤安装,不建议新手修改安装目录,同上,环境不需要配置,安装程序会自动配置好。
6. (可选)加速库CuDNN
从官网下载需要注册账号申请,两三天批准。网盘搜索一般也能找到最新版。 Windows目前就是cudnn-7.0-win-x64-v5.0-prod.zip。 下载解压出来是名为cuda的文件夹,里面有bin、include、lib,将三个文件夹复制到安装CUDA的地方覆盖对应文件夹,默认文件夹在:C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA
Keras 框架搭建
安装
Keras深度学习框架是基于Theano或Tensorflow框架安装的,所以首先要准备底层框架的搭建,然而目前Tensorflow不支持Windows版本,所以本文选用Theano安装即可在CMD命令行或者Powershell中输入:
pip install theano -U --prepip install keras -U --pre
或者想要加速开发版本,用(前提是已经git, conda install git)
pip install --upgrade --no-deps git+git://github.com/Theano/Theano.git
环境配置
在我的电脑上右键->属性->高级->环境变量->系统变量中的path,添加
C:\Anaconda2;C:\Anaconda2\Scripts;C:\Anaconda2\MinGW\bin;C:\Anaconda2\MinGW\x86_64-w64-mingw32\lib;
注意,本文将Anaconda安装至C盘根目录,根据自己的情况进行修改;另外在之前安装gcc/g++时采用MSYS2方式安装的,修改并重新定位MinGW文件夹,并做相应修改。
之后并新建变量PYTHONPATH,并添加
C:\Anaconda2\Lib\site-packages\theano;修改默认后端
打开C:\Users\当前用户名\.keras,修改文件夹内的keras.json文件如下:
{'image_dim_ordering':'th','epsilon':1e-07,'floatx':'float32','backend':'theano'}Theano加速配置在用户目录,也就是C:\Users\当前用户名\,新建.theanorc.txt。 这个路径可以通过修改Theano的configparser.py来改变。Theano装在Anaconda\Lib\site-packages里 .theanorc.txt的内容:
[global]openmp=False device = gpu optimizer_including=cudnn #不用cudnn的话就不要这句,实际上不用加,只要刚刚配置到位就行floatX = float32 allow_input_downcast=True [lib]cnmem = 0.8 #theano黑科技,初始化显存比例[blas]ldflags= #加速库[gcc]cxxflags=-IC:\Anaconda2\MinGW [nvcc]fastmath = True --flags=-LC:\Anaconda2\libs #改成自己装的目录--compiler_bindir=D:\Microsoft Visual Studio 12.0\VC\bin #改成自己装的目录#最后记得把汉字全删了
如果您的所安装的是CPU加速版本,那么.theanorc.txt文件配置如下:
[global]openmp=Truedevice = cpufloatX = float32allow_input_downcast=True[gcc]cxxflags=-IC:\Anaconda2\MinGW
之后可以验证keras是否安装成功,在命令行中输入Python命令进入Python变成命令行环境:
>>>import kerasUsing Theano(Tensorflow) backend.>>>
没有报错,那么Keras就已经成功安装了
加速测试
环境测试
在命令行中进入Python环境,输入:
import theano
会出现一系列信息,包括显卡型号、浮点数类型、是否采用CNmem和cuDNN(如果使用了的话)等等,那么恭喜你,环境彻底配置成功。如果使用了Windows系统的读者,电脑上可能会出现,debug的字样,这是第一次使用,在编译生成运行库,属于正常现象。
加速库测试
Python环境下输入:
import numpy id(numpy.dot) == id(numpy.core.multiarray.dot)
如果得到的结果为False,说明你的除了gpu加速还得到了数学库blas加速,按照教程顺序配置的Linux用户是一定可以得到False结果的;Windows用户得到True也没有关系,因为Anaconda中已经内置了MKL加速库,如果想使用Openblas可以按照文末的联系方式联系我。
速度测试
新建一个文件test.py,内容为:
from theano import function, config, shared, sandboximport theano.tensor as Timport numpyimport timevlen = 10 * 30 * 768 # 10 x #cores x # threads per core #这里可以加一两个0,多测试一下,记得去掉汉字iters = 1000rng = numpy.random.RandomState(22)x = shared(numpy.asarray(rng.rand(vlen), config.floatX))f = function([], T.exp(x))print(f.maker.fgraph.toposort())t0 = time.time()for i in xrange(iters): r = f()t1 = time.time()print('Looping %d times took %f seconds' % (iters, t1 - t0))print('Result is %s' % (r,))if numpy.any([isinstance(x.op, T.Elemwise) for x in f.maker.fgraph.toposort()]): print('Used the cpu')else: print('Used the gpu')
在GTX 970显卡下,输出结果大概是0.21秒,在一百倍运算量下19秒,可以进行对比。理论上,相比较主频为3.3GHz的CPU,加速比应该是75倍,但不同的ssd和内存限制了IO接口传输速度。
Keras中mnist数据集测试
下载Keras开发包
git clone https://github.com/fchollet/keras.gitcd keras/examples/python mnist_mlp.py
程序无错进行,至此,keras安装完成。
一个Anaconda3中配置遇到的异常解决方式
目前发现使用Anaconda3安装theano时可能会有一个冲突:
AttributeError:module ‘configparser’ has no attribute ‘SafeConfigParser’
暂时只有用以下方法处理:
对Anaconda3\Lib\site-packages\theano\configparser.py更改文件名,比如改为config_parser.py,在pycharm或其他IDE中随意运行一个cnn脚本,对遇到的每一个提示错误手动更改引用到的文件名为theano.config_parser,在将所有引用到这个文件的位置都改正后,应该就没有问题了。
声明与联系方式
由于作者水平和研究方向所限,无法对所有模块都非常精通,因此文档中不可避免的会出现各种错误、疏漏和不足之处。如果您在使用过程中有任何意见、建议和疑问,欢迎发送邮件到scp173.cool@gmail.com与中文文档作者取得联系.
本教程不得用于任何形式的商业用途,如果需要转载请与作者或中文文档作者联系,如果发现未经允许复制转载,将保留追求其法律责任的权利。
作者:SCP-173E-mail :scp173.cool@gmail.com如果您需要及时得到指导帮助,可以加微信:SCP173-cool,酌情打赏即可
|
|