让我们假设我们有固定数量的计算工作,没有阻塞,睡眠,i / o等待.这项工作可以很好地并行化 – 它包含100M小型和独立的计算任务.

4核cpu的速度更快 – 运行4个线程还是……让我们说50?为什么第二种变体应该是摇摆不定的?

我假设:当你在4核cpu上运行4个重线程而没有另外占用cpu的进程/线程时,调度程序不允许在核心之间移动线程;在这种情况下,它没有理由这样做. Core0(主cpu)将负责执行硬件计时器的中断处理程序每​​秒250次(基本Linux配置)和其他硬件中断处理程序,但另一个核心可能不会感到任何担心.

上下文切换的成本是多少?存储和恢复cpu寄存器的时间是否适用于不同的上下文? cpu内部的缓存,管道和各种代码预测事项怎么样?我们可以说每次切换上下文时,都会损害cpu中的缓存,管道和一些代码解码功能吗?因此,在单个内核上执行更多线程,与串行执行相比,它们可以一起完成更少的工作?

关于多线程环境中的缓存和其他硬件优化的问题现在对我来说是个有趣的问题.

解决方法

正如@Baile在评论中提到的,这是高度应用,系统,环境特定的.

因此,我不打算采用强硬的方法为每个核心提及1个线程. (或超线程情况下的2个线程/核心)

作为一名经验丰富的共享内存程序员,我从我的经验中看到,最佳的线程数(对于4核机器)可以在1到64之间.

现在我将列举可能导致此范围的情况:

最佳线程<核心数量 在某些非常细粒度并行的任务(例如小FFT)中,线程的开销是主要的性能因素.在某些情况下,完全并行化并没有帮助.在某些情况下,您可以通过2个线程获得加速,但是在4个线程处向后扩展. 另一个问题是资源争用.即使您具有可以轻松分割为4个内核/线程的高度可并行化的任务,您也可能会遇到内存带宽和缓存效应的瓶颈.通常,您会发现2个线程与4个线程一样快. (好像经常出现非常大的FFT) 最佳线程=核心数 这是最佳情况.这里不需要解释 – 每个核心一个线程.大多数令人尴尬的并行应用程序都不适合内存或I / O绑定. <最佳线程>核心数量 这是它变得有趣的地方……非常有趣.你听说过负载不平衡吗?如何过度分解和偷工作? 许多可并行化的应用程序是不规则的 – 这意味着任务不会分成相同大小的子任务.因此,如果您最终可能将大型任务拆分为4个不相等的大小,请将它们分配给4个线程并在4个核心上运行…结果?并行性能差,因为1个线程的工作量比其他线程多10倍. 这里的常见解决方案是将任务过度分解为许多子任务.您可以为每个线程创建线程(现在您可以获得线程>>核心).或者您可以使用某种具有固定线程数的任务调度程序.并非所有任务都适用于两者,因此通常,将任务过度分解为4核机器的8或16个线程的方法可以获得最佳结果.

虽然产生更多线程可以带来更好的负载平衡,但是开销会增加.所以通常在某处有一个最佳点.我在4个核心上看到高达64个线程.但如上所述,它具有高度的应用特性.你需要进行实验.

编辑:扩大答案更直接回答问题…

What is the cost of context switching? The time for store and restore
cpu registers for different context?

这非常依赖于环境 – 并且有点难以直接测量.简答:非常昂贵的This might be a good read.

What about caches,pipelines and varIoUs code-prediction things inside
cpu? Can we say that each time we switch context,we hurt caches,
pipelines and some code-decoding facilities in cpu?

简短回答:是当您关闭上下文时,您可能会清空管道并弄乱所有预测变量.与缓存相同.新线程可能会用新数据替换缓存.

虽然有一个问题.在线程共享相同数据的某些应用程序中,一个线程可能会为另一个传入线程或另一个共享同一缓存的核心上的另一个线程“加热”缓存. (虽然很少见,我之前在我的一台NUMA机器上看到过这种情况 – 超线性加速:16个核心的17.6倍!?!?!)

So more threads executing on a single core,less work they can do
together in comparison to their serial execution?

取决于,取决于…除了超线程,肯定会有开销.但我读过一篇论文,其中有人使用第二个线程来预取主线程…是的,它很疯狂……

多线程 – 如何在4核CPU上更快地完成相同的计算:4个线程或50个线程?的更多相关文章

  1. iOS:核心图像和多线程应用程序

    我试图以最有效的方式运行一些核心图像过滤器.试图避免内存警告和崩溃,这是我在渲染大图像时得到的.我正在看Apple的核心图像编程指南.关于多线程,它说:“每个线程必须创建自己的CIFilter对象.否则,你的应用程序可能会出现意外行为.”这是什么意思?我实际上是试图在后台线程上运行我的过滤器,所以我可以在主线程上运行HUD(见下文).这在coreImage的上下文中是否有意义?

  2. ios – 多个NSPersistentStoreCoordinator实例可以连接到同一个底层SQLite持久性存储吗?

    我读过的关于在多个线程上使用CoreData的所有内容都讨论了使用共享单个NSPersistentStoreCoordinator的多个NSManagedobjectContext实例.这是理解的,我已经使它在一个应用程序中工作,该应用程序在主线程上使用CoreData来支持UI,并且具有可能需要一段时间才能运行的后台获取操作.问题是NSPersistentStoreCoordinator会对基础

  3. ios – XCode断点应该只挂起当前线程

    我需要调试多线程错误.因此,为了获得生成崩溃的条件,我需要在代码中的特定点停止一个线程,并等待另一个线程到达第二个断点.我现在遇到的问题是,如果一个线程遇到断点,则所有其他线程都被挂起.有没有办法只停止一个线程,让其他线程运行,直到它们到达第二个断点?)其他更有趣的选择:当你点击第一个断点时,你可以进入控制台并写入这应该在该断点处暂停当前上下文中的线程一小时.然后在Xcode中恢复执行.

  4. ios – 在后台线程中写入Realm后,主线程看不到更新的数据

    >清除数据库.>进行API调用以获取新数据.>将从API检索到的数据写入后台线程中的数据库中.>从主线程上的数据库中读取数据并渲染UI.在步骤4中,数据应该是最新数据,但我们没有看到任何数据.解决方法具有runloops的线程上的Realm实例,例如主线程,updatetothelatestversionofthedataintheRealmfile,因为通知被发布到其线程的runloop.在后台

  5. ios – NSURLConnectionLoader线程中的奇怪崩溃

    我们开始看到我们的应用启动时发生的崩溃.我无法重现它,它只发生在少数用户身上.例外情况是:异常类型:EXC_BAD_ACCESS代码:KERN_INVALID_ADDRESS位于0x3250974659崩溃发生在名为com.apple.NSURLConnectionLoader的线程中在调用时–[NSBlockOperationmain]这是该线程的堆栈跟踪:非常感谢任何帮助,以了解可能导致这种崩

  6. ios – 合并子上下文时的NSObjectInaccessbileExceptions

    我尝试手动重现,但失败了.是否有其他可能发生这种情况的情况,是否有处理此类问题的提示?解决方法在创建子上下文时,您可以尝试使用以下行:

  7. ios – 从后台线程调用UIKit时发出警告

    你如何处理项目中的这个问题?

  8. ios – 在SpriteKit中,touchesBegan在与SKScene更新方法相同的线程中运行吗?

    在这里的Apple文档AdvancedSceneProcessing中,它描述了更新方法以及场景的呈现方式,但没有提到何时处理输入.目前尚不清楚它是否与渲染循环位于同一个线程中,或者它是否与它并发.如果我有一个对象,我从SKScene更新方法和touchesBegan方法(在这种情况下是SKSpriteNode)更新,我是否要担心同步对我的对象的两次访问?解决方法所以几天后没有回答我设置了一些实验

  9. ios – 在后台获取中加载UIWebView

    )那么,有一种方法可以在后台加载UIWebView吗?解决方法如果要从用户界面更新元素,则必须在应用程序的主队列(或线程)中访问它们.我建议您在后台继续获取所需的数据,但是当需要更新UIWebView时,请在主线程中进行.你可以这样做:或者您可以创建一个方法来更新UIWebView上的数据,并使用以下方法从后台线程调用它:这将确保您从正确的线程访问UIWebView.希望这可以帮助.

  10. ios – 何时使用Semaphore而不是Dispatch Group?

    我会假设我知道如何使用DispatchGroup,为了解问题,我尝试过:结果–预期–是:为了使用信号量,我实现了:并在viewDidLoad方法中调用它.结果是:从概念上讲,dispachGroup和Semaphore都有同样的目的.老实说,我不熟悉:什么时候使用信号量,尤其是在与dispachGroup合作时–可能–处理问题.我错过了什么部分?

随机推荐

  1. 基于EJB技术的商务预订系统的开发

    用EJB结构开发的应用程序是可伸缩的、事务型的、多用户安全的。总的来说,EJB是一个组件事务监控的标准服务器端的组件模型。基于EJB技术的系统结构模型EJB结构是一个服务端组件结构,是一个层次性结构,其结构模型如图1所示。图2:商务预订系统的构架EntityBean是为了现实世界的对象建造的模型,这些对象通常是数据库的一些持久记录。

  2. Java利用POI实现导入导出Excel表格

    这篇文章主要为大家详细介绍了Java利用POI实现导入导出Excel表格,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下

  3. Mybatis分页插件PageHelper手写实现示例

    这篇文章主要为大家介绍了Mybatis分页插件PageHelper手写实现示例,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪

  4. (jsp/html)网页上嵌入播放器(常用播放器代码整理)

    网页上嵌入播放器,只要在HTML上添加以上代码就OK了,下面整理了一些常用的播放器代码,总有一款适合你,感兴趣的朋友可以参考下哈,希望对你有所帮助

  5. Java 阻塞队列BlockingQueue详解

    本文详细介绍了BlockingQueue家庭中的所有成员,包括他们各自的功能以及常见使用场景,通过实例代码介绍了Java 阻塞队列BlockingQueue的相关知识,需要的朋友可以参考下

  6. Java异常Exception详细讲解

    异常就是不正常,比如当我们身体出现了异常我们会根据身体情况选择喝开水、吃药、看病、等 异常处理方法。 java异常处理机制是我们java语言使用异常处理机制为程序提供了错误处理的能力,程序出现的错误,程序可以安全的退出,以保证程序正常的运行等

  7. Java Bean 作用域及它的几种类型介绍

    这篇文章主要介绍了Java Bean作用域及它的几种类型介绍,Spring框架作为一个管理Bean的IoC容器,那么Bean自然是Spring中的重要资源了,那Bean的作用域又是什么,接下来我们一起进入文章详细学习吧

  8. 面试突击之跨域问题的解决方案详解

    跨域问题本质是浏览器的一种保护机制,它的初衷是为了保证用户的安全,防止恶意网站窃取数据。那怎么解决这个问题呢?接下来我们一起来看

  9. Mybatis-Plus接口BaseMapper与Services使用详解

    这篇文章主要为大家介绍了Mybatis-Plus接口BaseMapper与Services使用详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪

  10. mybatis-plus雪花算法增强idworker的实现

    今天聊聊在mybatis-plus中引入分布式ID生成框架idworker,进一步增强实现生成分布式唯一ID,具有一定的参考价值,感兴趣的小伙伴们可以参考一下

返回
顶部