假设我有一个我想分析的域名列表.除非域名是连字符,否则我看不到一种特别简单的方法来“提取”域中使用的关键字.但我看到它在DomainTools.com,Estibot.com等网站上完成.例如:
ilikecheese.com becomes "i like cheese"
sanfranciscohotels.com becomes "san francisco hotels"
...

有效和有效地实现这一目标的任何建议?

编辑:我想用PHP编写.

好吧,我运行了我为 this SO question编写的脚本,进行了一些小的更改 – 使用日志概率来避免下溢,并修改它以读取多个文件作为语料库.

对于我的语料库,我从项目Gutenberg下载了一堆文件 – 没有真正的方法,只需从etext00,etext01和etext02中获取所有英语文件.

以下是结果,我保存了每个组合的前三名.

expertsexchange: 97 possibilities
 -  experts exchange -23.71
 -  expert sex change -31.46
 -  experts ex change -33.86

penisland: 11 possibilities
 -  pen island -20.54
 -  penis land -22.64
 -  pen is land -25.06

choosespain: 28 possibilities
 -  choose spain -21.17
 -  chooses pain -23.06
 -  choose spa in -29.41

kidsexpress: 15 possibilities
 -  kids express -23.56
 -  kid sex press -32.65
 -  kids ex press -34.98

childrenswear: 34 possibilities
 -  children swear -19.85
 -  childrens wear -25.26
 -  child ren swear -32.70

dicksonweb: 8 possibilities
 -  dickson web -27.09
 -  dick son web -30.51
 -  dicks on web -33.63

php – 以编程方式从域名中提取关键字的更多相关文章

  1. ios – 使用开放耳朵进行语音识别时的精度非常低

    我的应用程序中使用耳朵进行语音识别.主要关注的是准确性.在一个安静的环境中,精确度约为50%,但在嘈杂的环境中情况会变得更糟.几乎没有任何东西被正确识别.目前我正在使用约300字的字典文件.我应该寻找哪些方面来提高准确度?

  2. ios – 如何使用NSDateFormatter获取字符串“昨天”?

    我想格式化NSDate,以便昨天发生的日期会显示为“昨天”,可以使用NSDateFormatter来完成吗?

  3. 可点击 @、# 标记文本实现

    在社交类APP中@、#符号构成的标记文本已经形成了某种通用的意义:前者表示通知某位好友,而后者表示为某个话题或者分类。开始上码的代码首先声明了一个wordType的枚举类型,该类用用于对标示文本进行类型标记。这里之所以使用.character而不是后面的.word的原因是:后者会将@、#这些标示符丢弃,导致一只类似点击到无效区域的情形。当上诉检查通过也就是点击区域有效的时候,我们使用.word,获取点击区域的单词。

  4. android – 使用离子框架的语音识别

    我正在寻找一种使用离子框架进行语音识别的方法.我想在ios和android设备上运行一个应用程序.目前我在ios和android中都提供了一个Web视图,并且有一个共同的代码库.我想在其中包含语音识别功能并获取语音输出.解决方法如果您在Google上搜索“cordova语音识别”并且在Apache的Cordova网站上查看插件回购,看起来您至少有几个选项.这是我发现的两个快速的.>https://

  5. Android谷歌分析显示俄罗斯访问,甚至没有在任何设备上安装应用程序

    Android谷歌分析显示俄罗斯访问,甚至没有在任何设备上安装应用程序我试图创建一个Android应用程序,并在几天前添加了分析,然后我根本没有使用该应用程序,奇怪的是它显示来自俄罗斯的所有来自同一地区的一些访问和相同的服务提供商是垃圾邮件还是其他任何东西服务提供商解决方法引荐垃圾邮件是一种常见的事情,人们会将引荐来源设置为其网站,从而为您的GoogleAnalytics媒体资源产生虚假流量.对于

  6. Android中的自然语言处理API

    我正在尝试制作类似于thiswebsite的Android应用程序.问题是我对自然语言处理领域很陌生.我不希望实现太多,只是提供用户与应用程序的一些交互,给他一种感觉,他确实在与某人聊天.基本上,我只是捕获用户输入的文本并将其发送到API并显示从API检索的结果.我遇到了http://opennlp.apache.org/和http://gate.ac.uk/,但不知道如何在我的Android应用

  7. Android语音识别API离线

    有人可以帮帮我吗?我正在通过RecognizerIntent开发具有语音识别功能的应用程序.>哪个Android版本通过API正式提供了对应用的离线识别?>通过我读到的知识,如果通过在线服务或离线字典完成语音识别,那么开发者就不会选择它.我对吗?或者有没有记录的API设置离线?谢谢解决方法现在有离线语音识别是可能的android4.1.检查这篇文章article并检查pochetsphinx

  8. Android实现清除单个域名的cookie

    这篇文章主要介绍了Android实现清除单个域名的cookie,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧

  9. PHP如何获取当前主机、域名、网址、路径、端口等参数

    本篇文章主要介绍了PHP如何获取当前主机、域名、网址、路径、端口等参数,具有一定的参考价值,有兴趣的可以了解下

  10. 基于 Python实现云服务器的CDN域名远程鉴权配置

    这篇文章主要介绍了基于 Python实现云服务器的CDN域名远程鉴权配置,文章内容技术详细,具有一定的参考价值,需要的小伙伴可以参考一下

随机推荐

  1. PHP个人网站架设连环讲(一)

    先下一个OmnihttpdProffesinalV2.06,装上就有PHP4beta3可以用了。PHP4给我们带来一个简单的方法,就是使用SESSION(会话)级变量。但是如果不是PHP4又该怎么办?我们可以假设某人在15分钟以内对你的网页的请求都不属于一个新的人次,这样你可以做个计数的过程存在INC里,在每一个页面引用,访客第一次进入时将访问时间送到cookie里。以后每个页面被访问时都检查cookie上次访问时间值。

  2. PHP函数学习之PHP函数点评

    PHP函数使用说明,应用举例,精简点评,希望对您学习php有所帮助

  3. ecshop2.7.3 在php5.4下的各种错误问题处理

    将方法内的函数,分拆为2个部分。这个和gd库没有一点关系,是ecshop程序的问题。会出现这种问题,不外乎就是当前会员的session或者程序对cookie的处理存在漏洞。进过本地测试,includes\modules\integrates\ecshop.php这个整合自身会员的类中没有重写integrate.php中的check_cookie()方法导致,验证cookie时返回的username为空,丢失了登录状态,在ecshop.php中重写了此方法就可以了。把他加到ecshop.php的最后面去就可

  4. NT IIS下用ODBC连接数据库

    $connection=intodbc_connect建立数据库连接,$query_string="查询记录的条件"如:$query_string="select*fromtable"用$cur=intodbc_exec检索数据库,将记录集放入$cur变量中。再用while{$var1=odbc_result;$var2=odbc_result;...}读取odbc_exec()返回的数据集$cur。最后是odbc_close关闭数据库的连接。odbc_result()函数是取当前记录的指定字段值。

  5. PHP使用JpGraph绘制折线图操作示例【附源码下载】

    这篇文章主要介绍了PHP使用JpGraph绘制折线图操作,结合实例形式分析了php使用JpGraph的相关操作技巧与注意事项,并附带源码供读者下载参考,需要的朋友可以参考下

  6. zen_cart实现支付前生成订单的方法

    这篇文章主要介绍了zen_cart实现支付前生成订单的方法,结合实例形式详细分析了zen_cart支付前生成订单的具体步骤与相关实现技巧,需要的朋友可以参考下

  7. Thinkphp5框架实现获取数据库数据到视图的方法

    这篇文章主要介绍了Thinkphp5框架实现获取数据库数据到视图的方法,涉及thinkPHP5数据库配置、读取、模型操作及视图调用相关操作技巧,需要的朋友可以参考下

  8. PHP+jquery+CSS制作头像登录窗(仿QQ登陆)

    本篇文章介绍了PHP结合jQ和CSS制作头像登录窗(仿QQ登陆),实现了类似QQ的登陆界面,很有参考价值,有需要的朋友可以了解一下。

  9. 基于win2003虚拟机中apache服务器的访问

    下面小编就为大家带来一篇基于win2003虚拟机中apache服务器的访问。小编觉得挺不错的,现在就分享给大家,也给大家做个参考。一起跟随小编过来看看吧

  10. Yii2中组件的注册与创建方法

    这篇文章主要介绍了Yii2之组件的注册与创建的实现方法,非常不错,具有参考借鉴价值,需要的朋友可以参考下

返回
顶部