我的代码基本上是这样的:
class FoodTrainer(images: S3Path) { // data is >100GB file living in S3
  def train(): FoodClassifier       // Very expensive - takes ~5 hours!
}

class FoodClassifier {          // Light-weight API class
  def isHotDog(input: Image): Boolean
}

我想在JAR-assembly(sbt assembly)时,调用val classifier = new FoodTrainer(s3Dir).train()并发布具有分类器实例的JAR,该实例可立即供下游库用户使用.

最简单的方法是什么?对此有哪些既定的范例?我知道它在ML项目中是一个相当普遍的习惯用法,可以发布训练有素的模型http://nlp.stanford.edu/software/stanford-corenlp-models-current.jar

如何使用sbt程序集执行此操作,而不必将大型模型类或数据文件签入到我的版本控制中?

解决方法

您应该将训练产生的数据序列化到自己的文件中.然后,您可以将此数据文件打包到JAR中.您的生产代码打开文件并读取它而不是运行训练算法.

java – SBT:如何将类的实例打包为JAR?的更多相关文章

  1. 如何修复特性中的方法ScopingSetting已弃用SBT中的警告

    我在SBT中收到一条警告,要迁移到下面的新斜杠语法。我尝试了以下方法,但没有成功。

  2. CentOS手动安装sbt过程

    地址:http://blog.csdn.net/lizhitao/article/details/46846343参见官网配置说明http://www.scala-sbt.org/release/tutorial/Manual-Installation.html1、下载sbt通用平台压缩包:sbt-0.13.5.tgzhttp://www.scala-sbt.org/download.html2、

  3. ubuntu16.04安装sbt

    1、进入http://www.scala-sbt.org/download.html2、echo"debhttps://dl.bintray.com/sbt/debian/"|sudotee-a/etc/apt/sources.list.d/sbt.listsudoapt-keyadv--keyserverhkp://keyserver.ubuntu.com:80--recv2EE0EA64E40

  4. Ubuntu16 安装SBT

    安装SBT##测试

  5. centos sbt 安装

    1.随便新建一个目录vimsbt2.在文件里编辑如下内容:BT_OPTS="-xms512M-Xmx1536M-Xss1M-XX:+CMSClassUnloadingEnabled-XX:MaxPermSize=256M"java$SBT_OPTS-jar/home/spark/sbt-launcher-packaging-0.13.13/bin/sbt-launch.jar"$@"3.chmod

  6. sbt安装

    系统:ubuntu14.04官网地址:http://www.scala-sbt.org/download.html根据官网说明,执行下列命令这期间会下载很多jar包,等待下载完成输入sbtsbt-version测试安装是否成功然后任意新建一个目录,新建一个文件,如hello.scala文件命令提示行下进入到目录中,输入sbt,然后输入run,就可以看到helloworld了。

  7. ubuntu SBTSpark安装

    sbt将会在target/scala-2.11/目录下生成repox-assembly-$VERSION.jar运行repox监听所有网络接口上的8078端口。以下假设repox部署在192.168.0.120这台服务器上。配置repox使用akka-persistence来保存配置信息。从浏览器连接http://192.168.0.120:8078/admin/admin.html通过web界面对repox进行配置。从这里开始登录密码Repoxwebadmin默认密码为zhimakaimen.sbt配置

  8. ubuntu14 手动安装sbt

    参见官网配置说明http://www.scala-sbt.org/release/tutorial/Manual-Installation.html1、下载sbt通用平台压缩包:sbt-0.13.5.tgz2、建立目录,解压文件到所建立目录3、建立启动sbt的脚本文件4、配置PATH环境变量,保证在控制台中可以使用sbt命令5、测试sbt是否安装成功参见官网配置说明http://www.scala

  9. win10 spark+scala+eclipse+sbt 安装配置

    转载请务必注明原创地址为:http://dongkelun.com/2018/03/...1、首先安装配置jdk1.8以上,建议全部的安装路径不要有空格2、安装spark2.1下载下载地址:http://spark.apache.org/downloads.html,我下载的是spark-2.2.1-bin-hadoop2.7.tgz2.2安装解压到指定路径下即可,比如D:Companybigda

  10. SBT Scaladoc配置

    我正在尝试在SBT中配置Scaladoc,特别是标题,输出目录和类路径.我设法通过在build.sbt中添加以下内容来定义标题:我无法弄清楚如何更改doc输出目录.我也不知道如何添加jar到classpath.我想编辑类路径的原因是因为当我引用它的类时,标准的Scala库似乎没有被scaladoc所接受,即[[scala.Option]]导致警告“找不到任何连接成员为“scala.Option”.

随机推荐

  1. 基于EJB技术的商务预订系统的开发

    用EJB结构开发的应用程序是可伸缩的、事务型的、多用户安全的。总的来说,EJB是一个组件事务监控的标准服务器端的组件模型。基于EJB技术的系统结构模型EJB结构是一个服务端组件结构,是一个层次性结构,其结构模型如图1所示。图2:商务预订系统的构架EntityBean是为了现实世界的对象建造的模型,这些对象通常是数据库的一些持久记录。

  2. Java利用POI实现导入导出Excel表格

    这篇文章主要为大家详细介绍了Java利用POI实现导入导出Excel表格,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下

  3. Mybatis分页插件PageHelper手写实现示例

    这篇文章主要为大家介绍了Mybatis分页插件PageHelper手写实现示例,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪

  4. (jsp/html)网页上嵌入播放器(常用播放器代码整理)

    网页上嵌入播放器,只要在HTML上添加以上代码就OK了,下面整理了一些常用的播放器代码,总有一款适合你,感兴趣的朋友可以参考下哈,希望对你有所帮助

  5. Java 阻塞队列BlockingQueue详解

    本文详细介绍了BlockingQueue家庭中的所有成员,包括他们各自的功能以及常见使用场景,通过实例代码介绍了Java 阻塞队列BlockingQueue的相关知识,需要的朋友可以参考下

  6. Java异常Exception详细讲解

    异常就是不正常,比如当我们身体出现了异常我们会根据身体情况选择喝开水、吃药、看病、等 异常处理方法。 java异常处理机制是我们java语言使用异常处理机制为程序提供了错误处理的能力,程序出现的错误,程序可以安全的退出,以保证程序正常的运行等

  7. Java Bean 作用域及它的几种类型介绍

    这篇文章主要介绍了Java Bean作用域及它的几种类型介绍,Spring框架作为一个管理Bean的IoC容器,那么Bean自然是Spring中的重要资源了,那Bean的作用域又是什么,接下来我们一起进入文章详细学习吧

  8. 面试突击之跨域问题的解决方案详解

    跨域问题本质是浏览器的一种保护机制,它的初衷是为了保证用户的安全,防止恶意网站窃取数据。那怎么解决这个问题呢?接下来我们一起来看

  9. Mybatis-Plus接口BaseMapper与Services使用详解

    这篇文章主要为大家介绍了Mybatis-Plus接口BaseMapper与Services使用详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪

  10. mybatis-plus雪花算法增强idworker的实现

    今天聊聊在mybatis-plus中引入分布式ID生成框架idworker,进一步增强实现生成分布式唯一ID,具有一定的参考价值,感兴趣的小伙伴们可以参考一下

返回
顶部