由于此系统是去年安装的,环境是ubuntu14.04。之前在Windows环境下已经安装好了python的环境,而且安装好了各种包,包括nltk,numpy,matplotlib等。打算将工作环境彻底换到ubuntu环境中,遂开始折腾安装环境,新手,有不对的还麻烦帮忙指出以便于改正。

1. 安装python3.5.2

在官网上面下载好了python3.5.2的包,然后解压安装,我安装到/usr/local/Python/Python-3.5.2/目录下,并且在/usr/bin下面删除了原有的python符号链接文件,为新安装的python3.5.2在/usr/bin/下面创建了python符号链接。测试,python3.5.2安装完毕。然后准备安装nltk,首先需要安装pip。结果在这里安装pip时候,遇到了很多错误,最后连系统都出现一点儿问题了。遇到的问题实在太多了,后来才发现ubuntu中已有的python2.7,是不能删除的,于是乎又使得/usr/bin下面的python符号链接文件,重新指向/usr/bin/python2.7。打算另辟新径。

看了一下python3.5的新特性(https://docs.python.org/3/whatsnew/3.5.html),然后nltk的要求是python2.7或者python3.2及以上版本(http://www.nltk.org/install.html)
最终决定还是使用系统自带的python3.4.3,而且3.5.2的环境也是没有删除的,也留着用。

2. 安装setuptools

tar -zxvf setuptools-32.1.2.zip
cd setuptools-32.1.2
python3 setup.py build
sudo python3 setup.py install

3. 安装pip

tar -zxvf pip-9.0.1.tar.gz
cd pip-9.0.1
python3 setup.py build
sudo python3 setup.py install

4.安装nltk

sudo pip install -U nltk
测试刚刚的安装
输入python3,进入到python3.4环境中,然后输入import nltk

5.安装软件包

安装Numpy
sudo pip install -U numpy
安装scipy
sudo pip install -U scipy
安装matplotlib
sudo pip install -U matplotlib

注意这里需要用sudo获取权限进行安装,否则会因为权限不足而报权限类错误

备注:有时候下载matplotlib这样的软件包,实在是速度太慢了,可以先下载好软件包之后,然后再使用pip形式进行本地安装。
首先安装wheel
sudo pip install wheel
matplotlib地址https://pypi.python.org/pypi/matplotlib/
scipy地址https://pypi.python.org/pypi/scipy/
下载时候,注意选择对应于自己python版本的软件包,比如我用python3.4,就下载matplotlib-2.0.0rc2-cp34-cp34m-manylinux1_x86_64.whl,注意“cp34”
然后就可以使用命令pip install XXX.whl来安装.whl的文件了

6.nltk_data

按照官方推荐的方式去下载安装,实在是太慢了。从百度云https://pan.baidu.com/s/1hq7UUFU 上面下载,解压。放在哪个目录下面呢?
输入python3之后,输入from nltk.book import *之后,会有一段错误提示

*** Introductory Examples for the NLTK Book ***
Loading text1,...,text9 and sent1,sent9
Type the name of the text or sentence to view it.
Type: 'texts()' or 'sents()' to list the materials.
Traceback (most recent call last):
  File "/usr/local/lib/python3.4/dist-packages/nltk/corpus/util.py",line 63,in __load
    try: root = nltk.data.find('corpora/%s' % zip_name)
  File "/usr/local/lib/python3.4/dist-packages/nltk/data.py",line 641,in find
    raise LookupError(resource_not_found)
LookupError: 
**********************************************************************
  Resource 'corpora/gutenberg.zip/gutenberg/' not found.  Please
  use the NLTK Downloader to obtain the resource:  >>>
  nltk.download()
  Searched in:
    - '/home/×××yourName/nltk_data'
    - '/usr/share/nltk_data'
    - '/usr/local/share/nltk_data'
    - '/usr/lib/nltk_data'
    - '/usr/local/lib/nltk_data'
**********************************************************************

During handling of the above exception,another exception occurred:

Traceback (most recent call last):
  File "<stdin>",line 1,in <module>
  File "/usr/local/lib/python3.4/dist-packages/nltk/book.py",line 20,in <module>
    text1 = Text(gutenberg.words('melville-moby_dick.txt'))
  File "/usr/local/lib/python3.4/dist-packages/nltk/corpus/util.py",line 99,in __getattr__
    self.__load()
  File "/usr/local/lib/python3.4/dist-packages/nltk/corpus/util.py",line 64,in __load
    except LookupError: raise e
  File "/usr/local/lib/python3.4/dist-packages/nltk/corpus/util.py",line 61,in __load
    root = nltk.data.find('corpora/%s' % self.__name)
  File "/usr/local/lib/python3.4/dist-packages/nltk/data.py",in find
    raise LookupError(resource_not_found)
LookupError: 
**********************************************************************
  Resource 'corpora/gutenberg' not found.  Please use the NLTK
  Downloader to obtain the resource:  >>> nltk.download()
  Searched in:
    - '/home/***yourName/nltk_data'
    - '/usr/share/nltk_data'
    - '/usr/local/share/nltk_data'
    - '/usr/lib/nltk_data'
    - '/usr/local/lib/nltk_data'
**********************************************************************

将下载的zip文件解压后,放置于上面五个目录中任意一个即可。

遇到的问题:

在Windows环境下,可以使用将需要下载的安装包链接复制到迅雷,让迅雷下载更快;但是我的ubuntu中没有安装wine,于是使用uget,aria2,并且在Firefox中安装flashgot插件,这样下载安装包会快一点儿。

参考网页

http://www.cnblogs.com/liujian001/p/5160869.html
http://www.nltk.org/install.html

其他可供参考网页

在 Ubuntu 14.04.3 上安装 Python 3.5
http://www.linuxidc.com/Linux/2016-07/132875.htm
ubuntu安装python3.5并改默认python为3.5
http://blog.csdn.net/qq_27657429/article/details/53482595

ubuntu14.04中开始Python NLP之旅(一)的更多相关文章

  1. ios中的.dylib和.a lib有什么区别?

    我知道Objectivec中的编译和运行时是什么,但是我想知道是什么画了这两个库之间的界限?他们的目的是什么,除了陈述一个是静态的而另一个是动态的?我们何时需要一个而不是另一个?

  2. xamarin.ios – ShareKit与MonoTouch如何?

    有人可以验证ShareKit实际上是否可用于MonoTouch并指导我完成使其工作所需的步骤?解决方法您首先从getsharekit.com下载还是使用ShareKit2.0?

  3. ios – iPhone崩溃日志不能正确地符号化并且是双重间隔的

    任何建议超过欢迎.谢谢.解决方法当这件事发生在我身上时,它只是我通过电子邮件收到的日志.如果我记得,至少有一些是在.msg文件中,我不得不把它们拿出来.它可能是Exchange编码更改.如果你显示不可见的字符,你可能会看到每个字符之间的东西.您可以找到并替换它们以删除它们或更改编辑器中的编码.

  4. XCode 3.2 Ruby和Python模板

    在xcode3.2下,我的ObjectiveCPython/Ruby项目仍然可以打开更新和编译,但是你无法创建新项目.鉴于xcode3.2中缺少ruby和python的所有痕迹(即创建项目并添加新的ruby/python文件),是否有一种简单的方法可以再次安装模板?我发现了一些关于将它们复制到某个文件夹的信息,但我似乎无法让它工作,我怀疑文件夹的位置已经改变为3.2.解决方法3.2中的应用程序模板

  5. ios – 使用开放耳朵进行语音识别时的精度非常低

    我的应用程序中使用耳朵进行语音识别.主要关注的是准确性.在一个安静的环境中,精确度约为50%,但在嘈杂的环境中情况会变得更糟.几乎没有任何东西被正确识别.目前我正在使用约300字的字典文件.我应该寻找哪些方面来提高准确度?

  6. ios – Xcode 7 beta 2:LaunchScreen.storyboard无法打开文档

    我在两个不同的Mac(iMac和MacBookpro)上收到这个错误.不知道为什么人们不能再现它,但我需要一些帮助.在运行XX优胜美地10.10.4的Mac上运行Xcode7beta2(15六月’15).甚至无法编译和运行我的项目..我从创建菜单创建了一个视图应用程序项目,就是这样.编辑:我试图删除并重新添加storyboard文件(也可以打开Main.storyboard插件),我仍然得到相同的

  7. ios – 如何使用NSDateFormatter获取字符串“昨天”?

    我想格式化NSDate,以便昨天发生的日期会显示为“昨天”,可以使用NSDateFormatter来完成吗?

  8. ios – 为具有多个目标和不同平台的项目编写Podfile

    如何让CocoaPods成功整合到我的项目和iOS/Mac目标?我已经阅读了Podfile文档,但发现它在这方面缺乏.解决方法得到它了!从我的每个目标和运行的pod安装中删除libPods-xxxx.a文件,再次执行了我的目标集成.

  9. iOS中的CocoaPods是什么?

    任何人都可以详细说明iOS开发中的CocoaPods.我似乎无法理解它们是什么.提前致谢.解决方法CocoaPods是我在最近的iOS应用程序开发中发现的最好的东西之一.我用它来获取最新的Github开源项目作为框架和lib到我的项目中.最好的部分是它将自动管理依赖lib,因此无需拖放文件并下载文件夹blaablaaa只需一个简单的代码’podinstall即可!

  10. Swift基本使用-函数和闭包(三)

    声明函数和其他脚本语言有相似的地方,比较明显的地方是声明函数的关键字swift也出现了Python中的组元,可以通过一个组元返回多个值。传递可变参数,函数以数组的形式获取参数swift中函数可以嵌套,被嵌套的函数可以访问外部函数的变量。可以通过函数的潜逃来重构过长或者太复杂的函数。

随机推荐

  1. 正则表达式 – 如何用OpenNLP和stringi检测句子边界?

    我想打破下一个字符串的句子:我想演示两种不同的方法.一个来自packageopenNLP:第二个来自packagestringi:在第二种方式之后,我需要准备句子以删除多余的空格,或者再次将一个新的字符串分割成句子.我可以调整字符串功能来提高结果的质量吗?当它是一个大数据时,openNLP(非常)慢,然后是字符串.有没有办法组合stringi和openNLP?

  2. coursera NLP学习笔记之week1课程介绍&amp;基础的文本处理

    |[0-9]{3}[\-\u00A0.])[0-9]{3}[\-\u00A0.][0-9]{4}+1-650-723-0293723-0293650-723-02933、单词正则化和词干化1、normalization需要正则化的项目有:信息提取indexedtext&querytermsmusthavesameform我们隐含的定义等价类的术语Weimplicitlydefineequivalenceclassesofterms一个替代方案:非对称扩张Alternative:asymmetricexpa

  3. ubuntu14.04中开始Python NLP之旅(一)

    由于此系统是去年安装的,环境是ubuntu14.04。打算将工作环境彻底换到ubuntu环境中,遂开始折腾安装环境,新手,有不对的还麻烦帮忙指出以便于改正。测试,python3.5.2安装完毕。遇到的问题实在太多了,后来才发现ubuntu中已有的python2.7,是不能删除的,于是乎又使得/usr/bin下面的python符号链接文件,重新指向/usr/bin/python2.7。

  4. 如何将jnlp与OSX停靠图标捆绑在一起;这在java首选项中似乎不再可能

    将JNLP打包为应用程序的选项似乎不存在于Oracle的JDK7Java首选项页面中,就像它在苹果中所做的那样,如here所述OSXdesktopintegrationwithJavaWebStartletsuserscreatealocalapplicationbundlefromanyJavaWebStartapplication.TheShortcutCreationsettinginJav

  5. java – JNLP,Webstart和Maven

    我创建了一个简单的HelloWorldSwing应用程序,它可以在Eclipse中编译和运行.我现在正在尝试将此应用程序转移到Maven包结构并将其作为JavaWeb-Start应用程序运行,这让我感到非常痛苦.运行“mvncleaninstall”后,javaws似乎加载了几秒钟然后退出.以下是一些可供参考的内容.我(非常简单)的项目应该是完全可重现的:包结构(来自树):主要pom.xml:Sw

  6. java – 如何使用Open nlp的分块解析器提取名词短语

    我是自然语言处理的新手,我需要从文本中提取出名词短语.我远在我使用opennlp的分块解析器来解析我的文本以获取Tree结构.但是我无法从树结构,在开放nlp中是否有任何正则表达式模式,以便我可以使用它来提取名词短语.以下是我正在使用的代码在这里我得到的输出))有些人可以帮我取得名词短语,如NP,NNP,NN等.有些人可以告诉我,我需要使用任何其他的NPChunker来获得名词短语吗?

  7. 使用JWS JNLP为JavaFX应用程序创建桌面图标

    我正在尝试为我的应用程序显示一个自定义destop图标,但由于某些原因,无论我做什么,都会显示相同的默认java图标.我已经尝试了所有我能想到的东西,并将我的jnlp文件与其图标似乎正常工作的其他人进行了比较.根据我读过的所有内容,以下内容应该可以正常工作.但当然,它没有:任何想法将不胜感激.解决方法我会按顺序尝试以下方法:>创建一个32×32大小的图标,并将其添加为附加

  8. Java jnlp应用程序被安全设置阻止

    我有一个企业级的Java应用程序,它有大量的jars,通过jnlp文件下载到客户端的jvm缓存中.当我启动应用程序时,我在Java控制台上得到以下堆栈跟踪:我的JNLP文件像以下一些审查描述:还要注意,我在更多的信息面板上获得了一些不同的例外细节:我对java控制面板的安全性没有任何安全限制.中等水平如下:感谢任何帮助新编辑:当我尝试从jvm1.6机器运行这个jnlp时,我得到了更多的说明stac

  9. JNLP应使用特定的Java版本,但会出现错误结果

    我在这里面临一个问题.我想使用特殊版本来运行我们的javawebstart应用程序,但只需要一个jnlp.(“经过测试,…blabla我们不能使用新版本…blabla”随机风袋)所以我试着像这样配置我们的JNLP:当我开始这个jnlp时,即使安装了正确的Java,我也会得到以下错误:Error:TheapplicationhasrequestedaversionoftheJRE(version1.

返回
顶部