python – NLTK：如何遍历名词短语以返回字符串列表？

2019-04-26 原文

在NLTK中,如何遍历已解析的句子以返回名词短语字符串列表？

我有两个目标：
(1)创建名词短语列表,而不是使用’traverse()’方法打印它们.我目前使用StringIO来记录现有traverse()方法的输出.这不是一个可接受的解决方案.
(2)解析名词短语字符串,以便：'(NP Michael / NNP Jackson / NNP)成为’Michael Jackson’.在NLTK中有解除解析的方法吗？

NLTK文档建议使用traverse()来查看名词短语,但是如何在这个递归方法中捕获’t’,以便生成一个字符串名词短语列表？

from nltk.tag import pos_tag

def traverse(t):
  try:
      t.label()
  except AttributeError:
      return
  else:
      if t.label() == 'NP': print(t)  # or do something else
      else:
          for child in t: 
              traverse(child)

def nounPhrase(tagged_sent):
    # Tag sentence for part of speech
    tagged_sent = pos_tag(sentence.split())  # List of tuples with [(Word,PartOfSpeech)]
    # Define several tag patterns
    grammar = r"""
      NP: {<DT|PP\$>?<JJ>*<NN>}   # chunk determiner/possessive,adjectives and noun
      {<NNP>+}                # chunk sequences of proper nouns
      {<NN>+}                 # chunk consecutive nouns
      """
    cp = nltk.RegexpParser(grammar)  # Define Parser
    SentenceTree = cp.parse(tagged_sent)
    NounPhrases = traverse(SentenceTree)   # collect Noun Phrase
    return(NounPhrases)

sentence = "Michael Jackson likes to eat at McDonalds"
tagged_sent = pos_tag(sentence.split())  
NP = nounPhrase(tagged_sent)  
print(NP)

目前打印：
(NP Michael / NNP Jackson / NNP)
(NP麦当劳/ NNP)
并将’无’存储到NP

解决方法

def extract_np(psent):
  for subtree in psent.subtrees():
    if subtree.label() == 'NP':
      yield ' '.join(word for word,tag in subtree.leaves())


cp = nltk.RegexpParser(grammar)
parsed_sent = cp.parse(tagged_sent)
for npstr in extract_np(parsed_sent):
    print (npstr)

python – NLTK：如何遍历名词短语以返回字符串列表？的更多相关文章

ios – 使用开放耳朵进行语音识别时的精度非常低

我的应用程序中使用耳朵进行语音识别.主要关注的是准确性.在一个安静的环境中,精确度约为50％,但在嘈杂的环境中情况会变得更糟.几乎没有任何东西被正确识别.目前我正在使用约300字的字典文件.我应该寻找哪些方面来提高准确度？
ios – 如何使用NSDateFormatter获取字符串“昨天”？

我想格式化NSDate,以便昨天发生的日期会显示为“昨天”,可以使用NSDateFormatter来完成吗？
可点击 @、# 标记文本实现

在社交类APP中@、#符号构成的标记文本已经形成了某种通用的意义：前者表示通知某位好友，而后者表示为某个话题或者分类。开始上码的代码首先声明了一个wordType的枚举类型，该类用用于对标示文本进行类型标记。这里之所以使用.character而不是后面的.word的原因是：后者会将@、#这些标示符丢弃，导致一只类似点击到无效区域的情形。当上诉检查通过也就是点击区域有效的时候，我们使用.word，获取点击区域的单词。
android – 使用离子框架的语音识别

我正在寻找一种使用离子框架进行语音识别的方法.我想在ios和android设备上运行一个应用程序.目前我在ios和android中都提供了一个Web视图,并且有一个共同的代码库.我想在其中包含语音识别功能并获取语音输出.解决方法如果您在Google上搜索“cordova语音识别”并且在Apache的Cordova网站上查看插件回购,看起来您至少有几个选项.这是我发现的两个快速的.>https://
Android中的自然语言处理API

我正在尝试制作类似于thiswebsite的Android应用程序.问题是我对自然语言处理领域很陌生.我不希望实现太多,只是提供用户与应用程序的一些交互,给他一种感觉,他确实在与某人聊天.基本上,我只是捕获用户输入的文本并将其发送到API并显示从API检索的结果.我遇到了http://opennlp.apache.org/和http://gate.ac.uk/,但不知道如何在我的Android应用
Android语音识别API离线

有人可以帮帮我吗？我正在通过RecognizerIntent开发具有语音识别功能的应用程序.>哪个Android版本通过API正式提供了对应用的离线识别？>通过我读到的知识,如果通过在线服务或离线字典完成语音识别,那么开发者就不会选择它.我对吗？或者有没有记录的API设置离线？谢谢解决方法现在有离线语音识别是可能的android4.1.检查这篇文章article并检查pochetsphinx
HTML5为输入框添加语音输入功能的实现方法

本文给大家介绍如何使用html5为输入框添加语音输入功能，实现方法很简单，需要的朋友参考下本文
我的模型精度只有百分之一

我想为聊天机器人创建一个模型。但是，200个时期的训练导致模型的准确率只有百分之一点五：（。我至少有百分之七十。我给出了下面的代码：`importnltk打印我认为这是因为庞大的培训数据库。当我在数据库中有大约30个训练短语时，预测值为90-100%。但当我将数据库增加到400-450个短语时，结果是百分之一点五的预测。但也许教学方法不好？很可能是一个数据库。
php – 以编程方式从域名中提取关键字

编辑：我想用PHP编写.好吧,我运行了我为thisSOquestion编写的脚本,进行了一些小的更改–使用日志概率来避免下溢,并修改它以读取多个文件作为语料库.对于我的语料库,我从项目Gutenberg下载了一堆文件–没有真正的方法,只需从etext00,etext01和etext02中获取所有英语文件.以下是结果,我保存了每个组合的前三名.
正则表达式太慢？这里有一个提速100倍的方案附代码

“当遇到一个文本处理问题时，如果你在第一时间想到了正则表达式，那么恭喜你，你的问题从一个变成了俩！“如果你曾参与过文本数据分析，正则表达式（Regex）对你来说一定不陌生。词库索引、关键词替换……正则表达式的强大功能使其成为了文本处理的必备工具。然而，在处理大文本的情境下，正则表达式的低效率却常常让人抓耳挠腮。今天，文摘菌将为你介绍一款比正则表达式快数百倍的Python库——FlashText。让

随机推荐

10 个Python中Pip的使用技巧分享

众所周知，pip 可以安装、更新、卸载 Python 的第三方库，非常方便。本文小编为大家总结了Python中Pip的使用技巧，需要的可以参考一下
python数学建模之三大模型与十大常用算法详情

这篇文章主要介绍了python数学建模之三大模型与十大常用算法详情，文章围绕主题展开详细的内容介绍，具有一定的参考价值，感想取得小伙伴可以参考一下
Python爬取奶茶店数据分析哪家最好喝以及性价比

这篇文章主要介绍了用Python告诉你奶茶哪家最好喝性价比最高，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习吧
使用pyinstaller打包.exe文件的详细教程

PyInstaller是一个跨平台的Python应用打包工具，能够把 Python 脚本及其所在的 Python 解释器打包成可执行文件,下面这篇文章主要给大家介绍了关于使用pyinstaller打包.exe文件的相关资料,需要的朋友可以参考下
基于Python实现射击小游戏的制作

这篇文章主要介绍了如何利用Python制作一个自己专属的第一人称射击小游戏，文中的示例代码讲解详细，感兴趣的小伙伴可以跟随小编一起动手试一试
Python list append方法之给列表追加元素

这篇文章主要介绍了Python list append方法如何给列表追加元素，具有很好的参考价值，希望对大家有所帮助。如有错误或未考虑完全的地方，望不吝赐教
Pytest+Request+Allure+Jenkins实现接口自动化

这篇文章介绍了Pytest+Request+Allure+Jenkins实现接口自动化的方法，文中通过示例代码介绍的非常详细。对大家的学习或工作具有一定的参考借鉴价值，需要的朋友可以参考下
利用python实现简单的情感分析实例教程

商品评论挖掘、电影推荐、股市预测……情感分析大有用武之地,下面这篇文章主要给大家介绍了关于利用python实现简单的情感分析的相关资料,文中通过示例代码介绍的非常详细,需要的朋友可以参考下
利用Python上传日志并监控告警的方法详解

这篇文章将详细为大家介绍如何通过阿里云日志服务搭建一套通过Python上传日志、配置日志告警的监控服务，感兴趣的小伙伴可以了解一下
Pycharm中运行程序在Python console中执行,不是直接Run问题

这篇文章主要介绍了Pycharm中运行程序在Python console中执行,不是直接Run问题，具有很好的参考价值，希望对大家有所帮助。如有错误或未考虑完全的地方，望不吝赐教