因为自己在上Coursera的Advanced Machine Learning,里面第四周的Assignment要用到PYMC3,然后这个似乎是基于theano后端的。然而cpu版TMD太慢了,跑个马尔科夫蒙特卡洛要10个小时,简直不能忍了。所以妥妥换gpu版。

为了不把环境搞坏,我在Anaconda里面新建了一个环境。(关于Anaconda,可以看我之前翻译的文章)

Conda Create -n theano-gpu python=3.4

(theano GPU版貌似不支持最新版,保险起见装了旧版)

conda install theano pygpu

这里面会涉及很多依赖,应该conda会给你搞好,缺什么的话自己按官方文档去装。

然后至于Cuda和Cudnn的安装,可以看我写的关于TF安装的教程

和TF不同的是,Theano不分gpu和cpu版,用哪个看配置文件设置,这一点是翻博客了解到的:
配置好Theano环境之后,只要 C:Users你的用户名 的路径下添加 .theanorc.txt 文件。

.theanorc.txt 文件内容:

[global]

openmp=False

device = cuda

floatX = float32

base_compiler = C:\Program Files (x86)\Microsoft Visual Studio 12.0\VC\bin

allow_input_downcast=True 

[lib]

cnmem = 0.75

[blas]

ldflags=

[gcc]

cxxflags=-IC:\Users\lyh\Anaconda2\MinGW

[nvcc]

fastmath = True

flags = -LC:\Users\lyh\Anaconda2\libs

compiler_bindir = C:\Program Files (x86)\Microsoft Visual Studio 12.0\VC\bin

flags =  -arch=sm_30

注意在新版本中,声明用gpu从device=gpu改为device=cuda

然后测试是否成功:

from theano import function,config,shared,tensor
import numpy
import time

vlen = 10 * 30 * 768  # 10 x #cores x # threads per core
iters = 1000

rng = numpy.random.RandomState(22)
x = shared(numpy.asarray(rng.rand(vlen),config.floatX))
f = function([],tensor.exp(x))
print(f.maker.fgraph.toposort())
t0 = time.time()
for i in range(iters):
    r = f()
t1 = time.time()
print("Looping %d times took %f seconds" % (iters,t1 - t0))
print("Result is %s" % (r,))
if numpy.any([isinstance(x.op,tensor.Elemwise) and
              ('Gpu' not in type(x.op).__name__)
              for x in f.maker.fgraph.toposort()]):
    print('Used the cpu')
else:
    print('Used the gpu')

输出:

[GpuElemwise{exp,no_inplace}(<GpuArrayType<None>(float32,vector)>),HostFromGpu(gpuarray)(GpuElemwise{exp,no_inplace}.0)]
Looping 1000 times took 0.377000 seconds
Result is [ 1.23178029  1.61879349  1.52278066 ...,2.20771813  2.29967761
  1.62323296]
Used the gpu

到这里就算配好了

然后在作业里面,显示Quadro卡启用

但是还是有个warning

WARNING (theano.tensor.blas): Using NumPy C-API based implementation for BLAS functions.

这个真不知道怎么处理

然后后面运行到:

with pm.Model() as logistic_model:
    # Since it is unlikely that the dependency between the age and salary is linear,we will include age squared
    # into features so that we can model dependency that favors certain ages.
    # Train Bayesian logistic regression model on the following features: sex,age,age^2,educ,hours
    # Use pm.sample to run MCMC to train this model.
    # To specify the particular sampler method (Metropolis-Hastings) to pm.sample,# use `pm.Metropolis`.
    # Train your model for 400 samples.
    # Save the output of pm.sample to a variable: this is the trace of the sampling procedure and will be used
    # to estimate the statistics of the posterior distribution.
    
    #### YOUR CODE HERE ####
    
    pm.glm.GLM.from_formula('income_more_50K ~  sex+age + age_square + educ + hours',data,family=pm.glm.families.Binomial())
    with logistic_model:
        trace = pm.sample(400,step=[pm.Metropolis()]) #nchains=1 works for gpu model
        
    ### END OF YOUR CODE ###

这里出现的报错:

GpuArrayException: cuMemcpyDtoHAsync(dst,src->ptr + srcoff,sz,ctx->mem_s): CUDA_ERROR_INVALID_VALUE: invalid argument

这个问题最后github大神解决了:
So njobs will spawn multiple chains to run in parallel. If the model uses the GPU there will be a conflict. We recently added nchains where you can still run multiple chains. So I think running pm.sample(niter,nchains=4,njobs=1) should give you what you want.
我把:

trace = pm.sample(400,step=[pm.Metropolis()]) #nchains=1 works for gpu model

加上nchains就好了,应该是并行方面的问题

trace = pm.sample(400,step=[pm.Metropolis()],nchains=1,njobs=1) #nchains=1 works for gpu model

另外

plot_traces(trace,burnin=200)

出现pm.df_summary报错,把pm.df_summary 换成 pm.summary就好了,也是github搜出来的。

Windows Theano GPU 版配置的更多相关文章

  1. 为什么pymc3运行不好?

    让我们从头开始。我看到Theano-pymc与pymc3一起安装在我的基本环境中;见下文:看起来不错,因为我只需要使用pymc3。

  2. 在Windows 7上导入Theano时出现g错误

    根据thetheanoinstallationguide,我正在尝试使用正确的g安装进行设置.我之前已经让theano使用了python实现.我正在python3.4上使用他们的gitrepo中最新版本的theano.我尝试过使用theano建议的TDM-GCC-64方法以及MinGW,两者都会产生完全相同的错误.(尽可能复制)值得注意的是,在打印此错误之前,它会输出整个文件的代码,你可以在这里找

  3. 由于在Ubuntu下的NumPy Fortran mixup,Theano失败了

    apt-getbuild-dep…

  4. 深度学习_工具

    1.引入深度学习的工具有很多Tensorflow,Theano,Caffe,Keras,MXNet,Scikit-learn…

  5. Ubuntu14.04安装theano

    sudoapt-getinstallliblapack-dev#安装atlas,Ubuntu下对应的是libatlas-base-dev,和OS相关。sudoapt-getinstalllibatlas-base-dev2、安装pipsudoapt-getinstallpython-pip3、安装numpy#安装numpysudopipinstallnumpy#测试numpy#测试通过才能进行下一步~~python-c"importnumpy;numpy.test()"4、安装scipy#安装scipys

  6. [2]深度学习和Keras-----如何在Ubuntu上安装深度学习的框架:Keras

    Keras是深度学习的一个开源实现。Keras遵循减少认知困难的最佳实践:Keras提供一致而简洁的API,能够极大减少一般应用下用户的工作量,同时,Keras提供清晰和具有实践意义的bug反馈。创建新模块的便利性使得Keras更适合于先进的研究工作。工欲善其事,必先利其器,那么在学习和使用Keras之前,必须要先安装Keras。Keras可以安装在Window,Linux和Mac系统上;但是笔者比较喜欢Ubuntu的系统,而且在Linux上面安装Keras也非常的简单,所有笔者以在Ubuntu系统上的安

  7. centos 安装theano

    准备:anaconda2.安装3.测试安装成功否测试时报解决:4.配置参考:theano安装一般集成到了ANACONDA中,所以要添加环境变量:查看:5.因为theano是装在默认python下的,所以在idea中调用的时候建项目时要选默认的python环境测试例子及结果

  8. Theano 中文文档 0.9 - 5.4 CentOS 6安装说明

    要求注意我们只支持通过conda安装要求的软件包。**Theano可以回退基于NumPy的Python执行模型,但C编译器允许更快的执行。nose>=1.3.0推荐,用于运行Theano的测试套件。Sphinx>=0.5.1,pygments用于构建文档。LaTeX和dvipng也是必需的,用于将数学符号显示为图像。注意正确性检查:bin子文件夹应包含nvcc程序。设置Theano的配置标志要使用GPU,你需要定义cudaroot。安装Miniconda按照此链接安装Miniconda。当你不想通过pip

  9. Theano安装及配置基于ubuntu16.04 LTS参考官网

    可进行测试是否安装成功在终端输入python后,会在下面出现>>>,此时继续输入importtheano,如在下行出现>>>,祝贺你,安装Theano成功!!!如需继续配置caffe学习框架,需要注意:该操作选择系统默认的gcc,g++(注:theano要求版本4.9.caffe要求版本5.0,否则会出现未定义的函数等一堆报错信息。makeall时务必用以下命令切换到5.0版本。sudoupdate-alternatives--configg++输入后可进行g++版本的选择,如需安装caffe,选择5.0

  10. Ubuntu 14.04.3 深度学习环境配置

    机器型号:LenovoM5400显卡:NVIDIAGT740Mcpu:Intel酷睿i54200M内存:8G(一)安装Ubuntu14.04.3参考(二)卸载系统自带的显卡驱动nouveau必须彻底卸载nouveau之后才能安装NVIDIA驱动!参考:Ubuntu15.04onvmware开机登录界面无限循环的解决办法。ma@ma-M5400:~$nvcc-Vnvcc:NVIDIACudacompilerdrivercopyright2005-2016NVIDIACorporationBuiltonSun

随机推荐

  1. static – 在页面之间共享数据的最佳实践

    我想知道在UWP的页面之间发送像’selectedItem’等变量的最佳做法是什么?创建一个每个页面都知道的静态全局变量类是一个好主意吗?

  2. .net – 为Windows窗体控件提供百分比宽度/高度

    WindowsForm开发的新手,但在Web开发方面经验丰富.有没有办法为Windows窗体控件指定百分比宽度/高度,以便在用户调整窗口大小时扩展/缩小?当窗口调整大小时,可以编写代码来改变控件的宽度/高度,但我希望有更好的方法,比如在HTML/CSS中.在那儿?

  3. 使用Windows Azure查询表存储数据

    我需要使用特定帐户吗?>将应用程序部署到Azure服务后,如何查询数据?GoogleAppEngine有一个数据查看器/查询工具,Azure有类似的东西吗?>您可以看到的sqlExpressintance仅在开发结构中,并且一旦您表示没有等效,所以请小心使用它.>您可以尝试使用Linqpad查询表格.看看JamieThomson的thispost.

  4. windows – SetupDiGetClassDevs是否与文档中的设备实例ID一起使用?

    有没有更好的方法可以使用DBT_DEVICEARRIVAL事件中的数据获取设备的更多信息?您似乎必须指定DIGCF_ALLCLASSES标志以查找与给定设备实例ID匹配的所有类,或者指定ClassGuid并使用DIGCF_DEFAULT标志.这对我有用:带输出:

  5. Windows Live ID是OpenID提供商吗?

    不,WindowsLiveID不是OpenID提供商.他们使用专有协议.自从他们的“测试版”期结束以来,他们从未宣布计划继续它.

  6. 如果我在代码中进行了更改,是否需要重新安装Windows服务?

    我写了一个Windows服务并安装它.现在我对代码进行了一些更改并重新构建了解决方案.我还应该重新安装服务吗?不,只需停止它,替换文件,然后重新启动它.

  7. 带有双引号的字符串回显使用Windows批处理输出文件

    我正在尝试使用Windows批处理文件重写配置文件.我循环遍历文件的行并查找我想要用指定的新行替换的行.我有一个’函数’将行写入文件问题是%Text%是一个嵌入双引号的字符串.然后失败了.可能还有其他角色也会导致失败.如何才能使用配置文件中的所有文本?尝试将所有“在文本中替换为^”.^是转义字符,因此“将被视为常规字符你可以尝试以下方法:其他可能导致错误的字符是:

  8. .net – 将控制台应用程序转换为服务?

    我正在寻找不同的优势/劣势,将我们长期使用的控制台应用程序转换为Windows服务.我们为ActiveMQ使用了一个叫做java服务包装器的东西,我相信人们告诉我你可以用它包装任何东西.这并不是说你应该用它包装任何东西;我们遇到了这个问题.控制台应用程序是一个.NET控制台应用程序,默认情况下会将大量信息记录到控制台,尽管这是可配置的.任何推荐?我们应该在VisualStudio中将其重建为服务吗?我使用“-install”/“-uninstall”开关执行此操作.例如,seehere.

  9. windows – 捕获外部程序的STDOUT和STDERR *同时*它正在执行(Ruby)

    哦,我在Windows上:-(实际上,它比我想象的要简单,这看起来很完美:…是的,它适用于Windows!

  10. windows – 当我试图批量打印变量时,为什么我得到“Echo is on”

    我想要执行一个简单的批处理文件脚本:当我在XP中运行时,它给了我预期的输出,但是当我在Vista或Windows7中运行它时,我在尝试打印值时得到“EchoisOn”.以下是程序的输出:摆脱集合表达式中的空格.等号(=)的两侧可以并且应该没有空格BTW:我通常在@echo关闭的情况下启动所有批处理文件,并以@echo结束它们,所以我可以避免将代码与批处理文件的输出混合.它只是使您的批处理文件输出更好,更清洁.

返回
顶部