我有一个非常大的1d numpy数组Xold与给定的值.这些值应该是
根据2d numpy数组Y指定的规则替换:
一个例子是
Xold=np.array([0,1,2,3,4])
Y=np.array([[0,0],[1,100],[3,300],[4,400],[2,200]])

每当Xold中的值与Y [:,0]中的值相同时,Xnew中的新值应该是Y [:,1]中的对应值.这是通过两个嵌套的for循环实现的:

Xnew=np.zeros(len(Xold))
for i in range(len(Xold)):
for j in range(len(Y)):
    if Xold[i]==Y[j,0]:
        Xnew[i]=Y[j,1]

在给定的示例中,这产生Xnew = [0,100,200,300,400].
但是,对于大型数据集,此过程非常缓慢.什么是更快,更优雅的方式来完成这项任务?

解决方法

选择最快的方法

这个问题的答案提供了一种很好的方法来替换numpy数组中的元素.让我们检查,哪一个是最快的.

TL; DR:Numpy索引是赢家

def meth1(): # suggested by @Slam
    for old,new in Y:  
        Xold[Xold == old] = new

 def meth2(): # suggested by myself,convert y_dict = dict(Y) first
     [y_dict[i] if i in y_dict.keys() else i for i in Xold]

 def meth3(): # suggested by @Eelco Hoogendoom,import numpy_index as npi first
     npi.remap(Xold,keys=Y[:,values=Y[:,1])

 def meth4(): # suggested by @Brad Solomon,import pandas as pd first 
     pd.Series(Xold).map(pd.Series(Y[:,1],index=Y[:,0])).values

  # suggested by @jdehesa. create Xnew = Xold.copy() and index
  # idx = np.searchsorted(Xold,Y[:,0]) first
  def meth5():             
     Xnew[idx] = Y[:,1]

结果并不那么令人惊讶

In [39]: timeit.timeit(meth1,number=1000000)                                                                      
 Out[39]: 12.08

 In [40]: timeit.timeit(meth2,number=1000000)                                                                      
 Out[40]: 2.87

 In [38]: timeit.timeit(meth3,number=1000000)                                                                      
 Out[38]: 55.39

 In [12]: timeit.timeit(meth4,number=1000000)                                                                                      
 Out[12]: 256.84

 In [50]: timeit.timeit(meth5,number=1000000)                                                                                      
 Out[50]: 1.12

因此,良好的旧列表理解是第二快的,并且获胜的方法是结合searchsorted()的numpy索引.

python – 替换numpy数组中的元素,避免循环的更多相关文章

  1. XCode 3.2 Ruby和Python模板

    在xcode3.2下,我的ObjectiveCPython/Ruby项目仍然可以打开更新和编译,但是你无法创建新项目.鉴于xcode3.2中缺少ruby和python的所有痕迹(即创建项目并添加新的ruby/python文件),是否有一种简单的方法可以再次安装模板?我发现了一些关于将它们复制到某个文件夹的信息,但我似乎无法让它工作,我怀疑文件夹的位置已经改变为3.2.解决方法3.2中的应用程序模板

  2. ios – 从现有的NSArray创建新的NSArray的标准惯例是什么?

    假设我有一个NS元素的NSArray,长度为10个元素.我想创建第二个NSArray,其中包含每个字典上单个键的值.我能想到的最好方法是:但理论上,我应该能够不使用可变数组并将计数器与[nameArrayaddobjectAtIndex:count]结合使用,因为新列表应该与旧列表完全一样长.请注意,我不是要尝试过滤原始数组的子集,而是创建一个具有完全相同数量的元素的新数组,只需要从数组中每个元素

  3. Swift基本使用-函数和闭包(三)

    声明函数和其他脚本语言有相似的地方,比较明显的地方是声明函数的关键字swift也出现了Python中的组元,可以通过一个组元返回多个值。传递可变参数,函数以数组的形式获取参数swift中函数可以嵌套,被嵌套的函数可以访问外部函数的变量。可以通过函数的潜逃来重构过长或者太复杂的函数。

  4. 10 个Python中Pip的使用技巧分享

    众所周知,pip 可以安装、更新、卸载 Python 的第三方库,非常方便。本文小编为大家总结了Python中Pip的使用技巧,需要的可以参考一下

  5. Swift快速入门五集合

    相关文章Swift快速入门(一)第一个Swift程序Swift快速入门(二)基本数据类型Swift快速入门(三)运算符Swift快速入门(四)流程控制前言Swift提供了数组和字典两种集合类型来存储数据,Swift的数组用来存储顺序相同类型相同的类型,字典则采用kay-value的形式存储数据。修改字典字典提供了updataValue()方法来修改字典的value值,该方法会返回一个Sting?

  6. 理解Swift中map 和 flatMap对集合的作用

    map和flatMap是函数式编程中常见的概念,python等语言中都有。借助于map和flapMap函数能够很轻易地将数组转换成另外一个新数组。map函数能够被数组调用,它接受一个闭包作为参数,作用于数组中的每个元素。简单的说,map就是映射函数,把一个集合映射成另一个集合。Swift的flatMap不容易理解,flatMap很像map函数,但是它摒弃了那些值为nil的元素。为了处理可选类型,flatMap被重载过。

  7. Swift、Go、Julia与R能否挑战 Python 的王者地位

    本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请发送邮件至dio@foxmail.com举报,一经查实,本站将立刻删除。

  8. 数组 – 如何在Swift中查找列表项的索引?

    我试图通过搜索列表找到项索引。有人知道如何做到吗?使用Swift2.0,Array获得使用在CollectionType的扩展中定义的函数来查找元素的索引的能力:此外,在CollectionType的另一个扩展中支持查找数组中满足谓词的第一个元素:注意,这两个函数返回可选值,如前所述。Swift3.0的更新:注意indexOf的语法已更改。

  9. 数组 – swift for循环:对于索引,数组中的元素?

    从Swift3.0开始,如果您需要每个元素的索引及其值,您可以使用enumerated()method遍历数组。它返回一个由索引和数组中每个项的值组成的元组。例如:在Swift3.0之前和Swift2.0之后,该函数被称为enumerate():在Swift2.0之前,枚举是一个全局函数。

  10. 红薯因 Swift 重写开源中国失败,貌似欲改用 Python

    本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请发送邮件至dio@foxmail.com举报,一经查实,本站将立刻删除。

随机推荐

  1. 10 个Python中Pip的使用技巧分享

    众所周知,pip 可以安装、更新、卸载 Python 的第三方库,非常方便。本文小编为大家总结了Python中Pip的使用技巧,需要的可以参考一下

  2. python数学建模之三大模型与十大常用算法详情

    这篇文章主要介绍了python数学建模之三大模型与十大常用算法详情,文章围绕主题展开详细的内容介绍,具有一定的参考价值,感想取得小伙伴可以参考一下

  3. Python爬取奶茶店数据分析哪家最好喝以及性价比

    这篇文章主要介绍了用Python告诉你奶茶哪家最好喝性价比最高,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习吧

  4. 使用pyinstaller打包.exe文件的详细教程

    PyInstaller是一个跨平台的Python应用打包工具,能够把 Python 脚本及其所在的 Python 解释器打包成可执行文件,下面这篇文章主要给大家介绍了关于使用pyinstaller打包.exe文件的相关资料,需要的朋友可以参考下

  5. 基于Python实现射击小游戏的制作

    这篇文章主要介绍了如何利用Python制作一个自己专属的第一人称射击小游戏,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起动手试一试

  6. Python list append方法之给列表追加元素

    这篇文章主要介绍了Python list append方法如何给列表追加元素,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教

  7. Pytest+Request+Allure+Jenkins实现接口自动化

    这篇文章介绍了Pytest+Request+Allure+Jenkins实现接口自动化的方法,文中通过示例代码介绍的非常详细。对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下

  8. 利用python实现简单的情感分析实例教程

    商品评论挖掘、电影推荐、股市预测……情感分析大有用武之地,下面这篇文章主要给大家介绍了关于利用python实现简单的情感分析的相关资料,文中通过示例代码介绍的非常详细,需要的朋友可以参考下

  9. 利用Python上传日志并监控告警的方法详解

    这篇文章将详细为大家介绍如何通过阿里云日志服务搭建一套通过Python上传日志、配置日志告警的监控服务,感兴趣的小伙伴可以了解一下

  10. Pycharm中运行程序在Python console中执行,不是直接Run问题

    这篇文章主要介绍了Pycharm中运行程序在Python console中执行,不是直接Run问题,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教

返回
顶部