我正在尝试编写一个执行以下操作的拓扑:

>订阅一个twitter Feed(基于关键字)
>一个聚合螺栓,用于聚合收集中的一些tweets(例如N),并将它们发送给打印机螺栓
>一个简单的螺栓,将集合一次打印到控制台.

在现实中,我想对收藏进行一些更多的处理.

我在本地测试,看起来像是在工作.但是,我不知道我是否正确设置了螺栓上的分组,并且在部署在实际的风暴集群上时可以正常工作.如果有人可以帮助您查看此拓扑并提出任何错误,更改或改进,我将不胜感激.

谢谢.

这是我的拓扑结构.

builder.setspout("spout",new TwitterFilterspout("pittsburgh"));
   builder.setBolt("sampleaggregate",new SampleAggregatorBolt())
                .shuffleGrouping("spout");
   builder.setBolt("printaggreator",new PrinterBolt()).shuffleGrouping("sampleaggregate");

聚合螺栓

public class SampleAggregatorBolt implements IRichBolt {

    protected OutputCollector collector;
    protected Tuple currentTuple;
    protected Logger log;
    /**
     * Holds the messages in the bolt till you are ready to send them out
     */
    protected List<Status> statusCache;

    @Override
    public void prepare(Map stormConf,TopologyContext context,OutputCollector collector) {
        this.collector = collector;

        log = Logger.getLogger(getClass().getName());
        statusCache = new ArrayList<Status>();
    }

    @Override
    public void execute(Tuple tuple) {
        currentTuple = tuple;

        Status currentStatus = null;
        try {
            currentStatus = (Status) tuple.getValue(0);
        } catch (ClassCastException e) {
        }
        if (currentStatus != null) {

            //add it to the status cache
            statusCache.add(currentStatus);
            collector.ack(tuple);


            //check the size of the status cache and pass it to the next stage if you have enough messages to emit
            if (statusCache.size() > 10) {
                collector.emit(new Values(statusCache));
            }

        }
    }

    @Override
    public void cleanup() {


    }

    @Override
    public void declareOutputFields(OutputFieldsDeclarer declarer) {
        declarer.declare(new Fields("tweets"));

    }

    @Override
    public Map<String,Object> getComponentConfiguration() {
        return null;  //To change body of implemented methods use File | Settings | File Templates.
    }


    protected void setupNonSerializableAttributes() {

    }

}

打印机螺栓

public class PrinterBolt extends BaseBasicBolt {

    @Override
    public void execute(Tuple tuple,BasicOutputCollector collector) {
        System.out.println(tuple.size() + " "  + tuple);
    }

    @Override
    public void declareOutputFields(OutputFieldsDeclarer ofd) {
    }

}

解决方法

从我可以看到它看起来不错.魔鬼的细节虽然如此.我不知道你的聚合器螺栓是什么,但是如果对传递给它的值做出任何假设,那么你应该考虑一个适当的字段分组.当您使用默认的并行性提示1时,这可能不会有太大的差异,但是如果您决定使用多个聚合螺栓实例进行缩放隐式逻辑假设,则可能需要非随机分组.

java – 在一个简单的聚合风暴拓扑中进行分组的更多相关文章

  1. xcode – 解析和Facebook SDK“螺栓”框架错误

    我有一个应用程序,同时安装了Parse和Facebook框架.通过将文件拖动到项目的“Frameworks”文件夹并选择“需要复制”来安装解析,而通过拖动而不是选择复制选项安装了FacebookSDK.两者都显示在链接二进制列表下.这个问题似乎是两个SDK都包含螺栓.我尝试使用Facebook,产生以下Link-O错误:我删除了一个Facebook的链接,并尝试拖动解析器,但是错误仍然存在.我也得到了警告即使我从FacebookSDK中删除了该文件.我应该如何清理项目并链接到Parse版本的螺栓?

  2. Java实现拓扑排序算法的示例代码

    在图论中,拓扑排序(Topological Sorting)是一个有向无环图(DAG, Directed Acyclic Graph)的所有顶点的线性序列。本文将为大家讲讲拓扑排序算法的原理及实现,需要的可以参考一下

  3. windows-server-2003 – 如何更改站点间拓扑生成器

    我打算在接下来的几周内更换服务器,我正在检查我们的ActiveDirectory站点和服务,我注意到我要替换的服务器被列为“站点间拓扑生成器”.如果我更换服务器而不改变它,会发生什么?是否可以将此条目更改为我们当前的域命名操作主机?

  4. java – 在本地模式下运行storm-starter拓扑时出现ClassNotFound错误(Win10,OS X)

    当我尝试使用maven-exec插件在配置中使用以下命令行在Intellij中运行调试时,会出现问题:来自目录,拓扑的POM文件所在的位置.UPD:问题是由于初始化时工作线程的任何类不可用而导致的..拓扑的POM-s中具有“风暴核心”依赖性和intellij轮廓范围的播放没有给出任何结果.解决方法我一直在使用sbtrun运行我的LocalCluster,如果我使用java-jar运行它fatjar.jar一切正常.现在我要用Intellij运行整理类路径,不知道为什么sbt在解析类路径时表现得很奇怪.任何

  5. javascript – Mongolab nodejs拓扑被破坏

    我已经使用nodejs与twitter进行了接口.我正在mongolabmongodb数据库中记录一些重要的公共用户数据.由于某种原因,我不断得到一个“拓扑销毁错误”我不太清楚为什么这是.您可以看到程序建立与数据库的连接.定义集合,然后遍历一些twitter帐户并记录相关信息.叽叽twitter的请求是成功的,mongodb的工作与简单的请求.如果您有任何想法,为什么我得到这个回应,请回答.解决方

  6. HTML5拓扑3D机房

    总结以上是DEVMAX为你收集整理的HTML5拓扑3D机房全部内容。如果觉得DEVMAX网站内容还不错,欢迎将DEVMAX网站推荐给好友。

  7. 基于HTML5快速搭建TP-LINK电信拓扑设备面板

    总结以上是DEVMAX为你收集整理的基于HTML5快速搭建TP-LINK电信拓扑设备面板全部内容。如果觉得DEVMAX网站内容还不错,欢迎将DEVMAX网站推荐给好友。

  8. java – 在一个简单的聚合风暴拓扑中进行分组

    我正在尝试编写一个执行以下操作的拓扑:>订阅一个twitterFeed(基于关键字)>一个聚合螺栓,用于聚合收集中的一些tweets(例如N),并将它们发送给打印机螺栓>一个简单的螺栓,将集合一次打印到控制台.在现实中,我想对收藏进行一些更多的处理.我在本地测试,看起来像是在工作.但是,我不知道我是否正确设置了螺栓上的分组,并且在部署在实际的风暴集群上时可以正常工作.如果有人可以帮助您查看此拓扑并

随机推荐

  1. 基于EJB技术的商务预订系统的开发

    用EJB结构开发的应用程序是可伸缩的、事务型的、多用户安全的。总的来说,EJB是一个组件事务监控的标准服务器端的组件模型。基于EJB技术的系统结构模型EJB结构是一个服务端组件结构,是一个层次性结构,其结构模型如图1所示。图2:商务预订系统的构架EntityBean是为了现实世界的对象建造的模型,这些对象通常是数据库的一些持久记录。

  2. Java利用POI实现导入导出Excel表格

    这篇文章主要为大家详细介绍了Java利用POI实现导入导出Excel表格,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下

  3. Mybatis分页插件PageHelper手写实现示例

    这篇文章主要为大家介绍了Mybatis分页插件PageHelper手写实现示例,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪

  4. (jsp/html)网页上嵌入播放器(常用播放器代码整理)

    网页上嵌入播放器,只要在HTML上添加以上代码就OK了,下面整理了一些常用的播放器代码,总有一款适合你,感兴趣的朋友可以参考下哈,希望对你有所帮助

  5. Java 阻塞队列BlockingQueue详解

    本文详细介绍了BlockingQueue家庭中的所有成员,包括他们各自的功能以及常见使用场景,通过实例代码介绍了Java 阻塞队列BlockingQueue的相关知识,需要的朋友可以参考下

  6. Java异常Exception详细讲解

    异常就是不正常,比如当我们身体出现了异常我们会根据身体情况选择喝开水、吃药、看病、等 异常处理方法。 java异常处理机制是我们java语言使用异常处理机制为程序提供了错误处理的能力,程序出现的错误,程序可以安全的退出,以保证程序正常的运行等

  7. Java Bean 作用域及它的几种类型介绍

    这篇文章主要介绍了Java Bean作用域及它的几种类型介绍,Spring框架作为一个管理Bean的IoC容器,那么Bean自然是Spring中的重要资源了,那Bean的作用域又是什么,接下来我们一起进入文章详细学习吧

  8. 面试突击之跨域问题的解决方案详解

    跨域问题本质是浏览器的一种保护机制,它的初衷是为了保证用户的安全,防止恶意网站窃取数据。那怎么解决这个问题呢?接下来我们一起来看

  9. Mybatis-Plus接口BaseMapper与Services使用详解

    这篇文章主要为大家介绍了Mybatis-Plus接口BaseMapper与Services使用详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪

  10. mybatis-plus雪花算法增强idworker的实现

    今天聊聊在mybatis-plus中引入分布式ID生成框架idworker,进一步增强实现生成分布式唯一ID,具有一定的参考价值,感兴趣的小伙伴们可以参考一下

返回
顶部