Java 嵌入数据引擎从 SQLite 到 SPL详解

2023-04-29 原文

可以在Java应用中嵌入的数据引擎看起来比较丰富，但其实并不容易选择。Redis计算能力很差，只适合简单查询的场景。Spark架构复杂沉重，部署维护很是麻烦。H2\HSQLDB\Derby等内嵌数据库倒是架构简单，但计算能力又不足，连基本的窗口函数都不支持。

相比之下，SQLite在架构性和计算能力上取得了较好的平衡，是应用较广的Java嵌入数据引擎。

SQLite适应常规基本应用场景

SQLite架构简单，其核心虽然是C语言开发的，但封装得比较好，对外呈现为一个小巧的Jar包，能方便地集成在Java应用中。SQLite提供了JDBC接口，可以被Java调用：

Connection connection = DriverManager.getConnection("jdbc:sqlite::memory:");
Statement st = connection.createStatement();
st.execute("restore from d:/ex1");
ResultSet rs = st.executeQuery("SELECT * FROM orders");

SQLite提供了标准的SQL语法，常规的数据处理和计算都没有问题。特别地，SQLite已经能支持窗口函数，可以方便地实现很多组内运算，计算能力比其他内嵌数据库更强。

SELECT x, y, row_number() OVER (ORDER BY y) AS row_number FROM t0 ORDER BY x;
SELECT a, b, group_concat(b, '.') OVER ( ORDER BY a ROWS BETWEEN 1 PRECEDING AND 1 FOLLOWING) AS group_concat FROM t1;

SQLite面对复杂场景尚有不足

SQLite的优点亮眼，但对于复杂应用场景时还是有些缺点。

Java应用可能处理的数据源多种多样，比如csv文件、RDB、Excel、Restful，但SQLite只处理了简单情况，即对csv等文本文件提供了直接可用的命令行加载程序：

.import --csv --skip 1 --schema temp /Users/scudata/somedata.csv tab1

对于其他大部分数据源，SQLite都没有提供方便的接口，只能硬写代码加载数据，需要多次调用命令行，整个过程很繁琐，时效性也差。

以加载RDB数据源为例，一般的做法是先用Java执行命令行，把RDB库表转为csv；再用JDBC访问SQLite，创建表结构；之后用Java执行命令行，将csv文件导入SQLite；最后为新表建索引，以提高性能。这个方法比较死板，如果想灵活定义表结构和表名，或通过计算确定加载的数据，代码就更难写了。

类似地，对于其他数据源，SQLite也不能直接加载，同样要通过繁琐地转换过程才可以。

SQL接近自然语言，学习门槛低，容易实现简单的计算，但不擅长复杂的计算，比如复杂的集合计算、有序计算、关联计算、多步骤计算。SQLite采用SQL语句做计算，SQL优点和缺点都会继承下来，勉强实现这些复杂计算的话，代码会显得繁琐难懂。

比如，某只股票最长的上涨天数，SQL要这样写：

select max(continuousDays)-1
from (select count(*) continuousDays
from (select sum(changeSign) over(order by tradeDate) unRiseDays
from (select tradeDate,
case when price>lag(price) over(order by tradeDate) then 0 else 1 end changeSign from AAPL) )
group by unRiseDays)

这也不单是SQLite的难题，事实上，由于集合化不彻底、缺乏序号、缺乏对象引用等原因，其他SQL数据库也不擅长这些运算。

业务逻辑由结构化数据计算和流程控制组成，SQLite支持SQL，具有结构化数据计算能力，但SQLite没有提供存储过程，不具备独立的流程控制能力，也就不能实现一般的业务逻辑，通常要利用Java主程序的判断和循环语句。由于Java没有专业的结构化数据对象来承载SQLite数据表和记录，转换过程麻烦，处理过程不畅，开发效率不高。

前面提过，SQLite内核是C程序，虽然可以被集成到Java应用中，但并不能和Java无缝集成，和Java主程序交换数据时要经过耗时的转换才能完成，在涉及数据量较大或交互频繁时性能就会明显不足。同样因为内核是C程序，SQLite会在一定程度上破坏Java架构的一致性和健壮性。

对于Java应用来讲，原生在JVM上的esProc SPL是更好的选择。

SPL全面支持各种数据源

esProc SPL是JVM下开源的嵌入数据引擎，架构简单，可直接加载数据源，可以通过JDBC接口被Java集成调用，并方便地进行后续计算。

SPL架构简单，无须独立服务，只要引入SPL的Jar包，就可以部署在Java环境中。

直接加载数据源，代码简短，过程简单，时效性强。比如加载Oracle：

A
1	=connect("orcl")
2	=A1.query@x("select OrderID,Client,SellerID,OrderDate,Amount from orders order by OrderID")
3	>env(orders,A2)

对于SQLite擅长加载的csv文件，SPL也可以直接加载，使用内置函数而不是外部命令行，稳定且效率高，代码更简短：

=T("/Users/scudata/somedata.csv")

多种外部数据源。除了RDB和csv，SPL还直接支持txt\xls等文件，MongoDB、Hadoop、redis、ElasticSearch、Kafka、Cassandra等NoSQL，以及WebService XML、Restful Json等多层数据。比如，将HDSF里的文件加载到内存：

A
1	=hdfs_open(;"hdfs://192.168.0.8:9000")
2	=hdfs_file(A1,"/user/Orders.csv":"GBK")
3	=A2.cursor@t()
4	=hdfs_close(A1)
5	>env(orders,A4)

JDBC接口可以方便地集成。加载的数据量一般比较大，通常在应用的初始阶段运行一次，只须将上面的加载过程存为SPL脚本文件，在Java中以存储过程的形式引用脚本文件名：

Class.forName("com.esproc.jdbc.InternalDriver");
Connection conn =DriverManager.getConnection("jdbc:esproc:local://");
CallableStatement statement = conn.prepareCall("{call init()}");
statement.execute();

SPL的计算能力更强大

SPL提供了丰富的计算函数，可以轻松实现日常计算。SPL支持多种高级语法，大量的日期函数和字符串函数，很多用SQL难以表达的计算，用SPL都可以轻松实现，包括复杂的有序计算、集合计算、分步计算、关联计算，以及带流程控制的业务逻辑。

丰富的计算函数。SPL可以轻松实现各类日常计算：

	A	B
1	=Orders.find(arg_OrderIDList)	//多键值查找
2	=Orders.select(Amount>1000 && like(Client,\"S\"))	//模糊查询
3	= Orders.sort(Client,-Amount)	//排序
4	= Orders.id(Client)	//去重
5	=join(Orders:O,SellerId; Employees:E,EId).new(O.OrderID, O.Client,O.Amount,E.Name,E.Gender,E.Dept)	//关联

标准SQL语法。SPL也提供了SQL-92标准的语法，比如分组汇总：

$select year(OrderDate) y,month(OrderDate) m, sum(Amount) s,count(1) c
from {Orders}
Where Amount&gt;=? and Amount&lt;? ;arg1,arg2

函数选项、层次参数等方便的语法。功能相似的函数可以共用一个函数名，只用函数选项区分差别，比SQL更加灵活方便。比如select函数的基本功能是过滤，如果只过滤出符合条件的第1条记录，可使用选项@1：

T.select@1(Amount>1000)

二分法排序，即对有序数据用二分法进行快速过滤，使用@b：

T.select@b(Amount>1000)

有序分组，即对分组字段有序的数据，将相邻且字段值相同的记录分为一组，使用@b：

T.groups@b(Client;sum(Amount))

函数选项还可以组合搭配，比如：

Orders.select@1b(Amount>1000)

结构化运算函数的参数有些很复杂，比如SQL就需要用各种关键字把一条语句的参数分隔成多个组，但这会动用很多关键字，也使语句结构不统一。SPL使用层次参数简化了复杂参数的表达，即通过分号、逗号、冒号自高而低将参数分为三层：

join(Orders:o,SellerId ; Employees:e,EId)

更丰富的日期和字符串函数。除了常见函数，比如日期增减、截取字符串，SPL还提供了更丰富的日期和字符串函数，在数量和功能上远远超过了SQL，同样运算时代码更短。比如：

季度增减：elapse@q(“2020-02-27”,-3) //返回2019-05-27

N个工作日之后的日期：workday(date(“2022-01-01”),25) //返回2022-02-04

字符串类函数，判断是否全为数字：isdigit(“12345”) //返回true

取子串前面的字符串：substr@l(“abCDcdef”,“cd”) //返回abCD

按竖线拆成字符串数组：“aa|bb|cc”.split(“|”) //返回[“aa”,“bb”,“cc”]

SPL还支持年份增减、求季度、按正则表达式拆分字符串、拆出SQL的where或select部分、拆出单词、按标记拆HTML等大量函数。

简化有序运算。涉及跨行的有序运算，通常都有一定的难度，比如比上期和同期比。SPL使用"字段[相对位置]"引用跨行的数据，可显著简化代码，还可以自动处理数组越界等特殊情况，比SQL窗口函数更加方便。比如，追加一个计算列rate，计算每条订单的金额增长率：

=T.derive(AMOUNT/AMOUNT[-1]-1: rate)

综合运用位置表达式和有序函数，很多SQL难以实现的有序运算，都可以用SPL轻松解决。比如，根据考勤表，找出连续 4 周每天均出勤达 7 小时的学生：

	A
1	=Student.select(DURATION>=7).derive(pdate@w(ATTDATE):w)
2	=A1.group@o(SID;~.groups@o(W;count(~):CNT).select(CNT==7).group@i(W-W[-1]!=7).max(~.len()):weeks)
3	=A2.select(weeks>=4).(SID)

简化集合运算，SPL的集合化更加彻底，配合灵活的语法和强大的集合函数，可大幅简化复杂的集合计算。比如，在各部门找出比本部门平均年龄小的员工：

A
1	=Employees.group(DEPT; (a=~.avg(age(BIRTHDAY)),~.select(age(BIRTHDAY)<a)):YOUNG)
2	=A1.conj(YOUNG)

计算某支股票最长的连续上涨天数：

	A
1	=a=0,AAPL.max(a=if(price>price[-1],a 1,0))

简化关联计算。SPL支持对象引用的形式表达关联，可以通过点号直观地访问关联表，避免使用JOIN导致的混乱繁琐，尤其适合复杂的多层关联和自关联。比如，根据员工表计算女经理的男员工：

=employees.select(gender:"male",dept.manager.gender:"female")

方便的分步计算，SPL集合化更加彻底，可以用变量方便地表达集合，适合多步骤计算，SQL要用嵌套表达的运算，用SPL可以更轻松实现。比如，找出销售额累计占到一半的前n个大客户，并按销售额从大到小排序：

A	B
2	=sales.sort(amount:-1)	/销售额逆序排序，可在SQL中完成
3	=A2.cumulate(amount)	/计算累计序列
4	=A3.m(-1)/2	/最后的累计即总额
5	=A3.pselect(~>=A4)	/超过一半的位置
6	=A2(to(A5))	/按位置取值

流程控制语法。SPL提供了流程控制语句，配合内置的结构化数据对象，可以方便地实现各类业务逻辑。

分支判断语句：

	A	B
2	…
3	if T.AMOUNT>10000	=T.BONUS=T.AMOUNT*0.05
4	else if T.AMOUNT>=5000 && T.AMOUNT<10000	=T.BONUS=T.AMOUNT*0.03
5	else if T.AMOUNT>=2000 && T.AMOUNT<5000	=T.BONUS=T.AMOUNT*0.02

循环语句：

	A	B
1	=db=connect("db")
2	=T=db.query@x("select * from sales where SellerID=? order by OrderDate",9)
3	for T	=A3.BONUS=A3.BONUS A3.AMOUNT*0.01
4		=A3.CLIENT=CONCAT(LEFT(A3.CLIENT,4), " co.,ltd.")
5		…

与Java的循环类似，SPL还可用break关键字跳出（中断）当前循环体，或用next关键字跳过（忽略）本轮循环，不展开说了。

计算性能更好。在内存计算方面，除了常规的主键和索引外，SPL还提供了很多高性能的数据结构和算法支持，比大多数使用SQL的内存数据库性能好得多，且占用内存更少，比如预关联技术、并行计算、指针式复用。

优化体系结构

SPL支持JDBC接口，代码可外置于Java，耦合性更低，也可内置于Java，调用更简单。SPL支持解释执行和热切换，代码方便移植和管理运营，支持内外存混合计算。

外置代码耦合性低。SPL代码可外置于Java，通过文件名被调用，既不依赖数据库，也不依赖Java，业务逻辑和前端代码天然解耦。

对于较短的计算，也可以像SQLite那样合并成一句，写在Java代码中：

Class.forName("com.esproc.jdbc.InternalDriver");
Connection conn =DriverManager.getConnection("jdbc:esproc:local://");
Statement statement = conn.createStatement();
String arg1="1000";
String arg2="2000"
ResultSet result = statement.executeQuery(=Orders.select(Amount>=" arg1 " && Amount<" arg2 "). groups(year(OrderDate):y,month(OrderDate):m; sum(Amount):s,count(1):c)");

解释执行和热切换。业务逻辑数量多，复杂度高，变化是常态。良好的系统构架，应该有能力应对变化的业务逻辑。SPL是基于Java的解释型语言，无须编译就能执行，脚本修改后立即生效，支持不停机的热切换，适合应对变化的业务逻辑。

方便代码移植。SPL通过数据源名从数据库取数，如果需要移植，只要改动配置文件中的数据源配置信息，而不必修改SPL代码。SPL支持动态数据源，可通过参数或宏切换不同的数据库，从而进行更方便的移植。为了进一步增强可移植性，SPL还提供了与具体数据库无关的标准SQL语法，使用sqltranslate函数可将标准SQL转为主流方言SQL，仍然通过query函数执行。

方便管理运营。由于支持库外计算，代码可被第三方工具管理，方便团队协作；SPL脚本可以按文件目录进行存放，方便灵活，管理成本低；SPL对数据库的权限要求类似Java，不影响数据安全。

内外存混合计算。有些数据太大，无法放入内存，但又要与内存表共同计算，这种情况可利用SPL实现内外存混合计算。比如，主表orders已加载到内存，大明细表orderdetail是文本文件，下面进行主表和明细表的关联计算：

	A
1	=file("orderdetail.txt").cursor@t()
2	=orders.cursor()
3	=join(A1:detail,orderid ; A2:main,orderid)
4	=A3.groups(year(main.orderdate):y; sum(detail.amount):s)

SQLite使用简单方便，但数据源加载繁琐，计算能力不足。SPL架构也非常简单，并直接支持更多数据源。SPL计算能力强大，提供了丰富的计算函数，可以轻松实现SQL不擅长的复杂计算。SPL还提供多种优化体系结构的手段，代码既可外置也可内置于Java，支持解释执行和热切换，方便移植和管理运营，并支持内外存混合计算。

SPL资料

SPL官网

SPL下载

SPL源代码

到此这篇关于Java 嵌入数据引擎从 SQLite 到 SPL的文章就介绍到这了,更多相关Java 嵌入数据引擎内容请搜索Devmax以前的文章或继续浏览下面的相关文章希望大家以后多多支持Devmax！

Java 嵌入数据引擎从 SQLite 到 SPL详解的更多相关文章

PhoneGap / iOS上的SQLite数据库 – 超过5mb可能

我误解了什么吗？Phonegap中的sqlitedbs真的有5mb的限制吗？我正在使用Phonegap1.2和iOS5.解决方法您可以使用带有phonegap插件的原生sqliteDB,您将没有任何限制.在iOS5.1中,Websql被认为是可以随时删除的临时数据…
ios – 备份.sqlite(核心数据)

我有一个基于核心数据的应用程序,它使用DropBox备份和恢复数据.我备份的方式非常简单.我复制用户的保管箱上的.sqlite文件.现在我的备份和恢复功能正常.问题出在.sqlite文件本身.看来.sqlite文件不完整.我在我的应用程序中输入了大约125个条目并进行了备份.备份出现在我的DropBox中但是当我使用.sqlite资源管理器工具查看内容时,我只看到第117个记录的记录.我尝试更新第
ios – 多个NSPersistentStoreCoordinator实例可以连接到同一个底层SQLite持久性存储吗？

我读过的关于在多个线程上使用CoreData的所有内容都讨论了使用共享单个NSPersistentStoreCoordinator的多个NSManagedobjectContext实例.这是理解的,我已经使它在一个应用程序中工作,该应用程序在主线程上使用CoreData来支持UI,并且具有可能需要一段时间才能运行的后台获取操作.问题是NSPersistentStoreCoordinator会对基础
ios – 设置DataBase的加密密钥(Sybase Unwired Platform)

目前,我可以通过执行以下操作为本地数据库设置加密密钥：因此,当我的用户成功登录时,我收到以下错误：我认为正在发生的是,虽然数据库已成功创建,但仍然是加密的.我该如何解密？解决方法实际上这很简单,我每次开始会话时都需要这样做：
ios – 使用SQLite和CoreData进行批量插入

我有一个使用sqlite作为持久性存储的CoreData模型.在对每条记录进行一些处理之后,我需要插入大量的行.有没有办法将这些命令发送到sqlite我需要加快处理时间,因为它需要几个小时才能完成.任何提示将不胜感激.谢谢解决方法将商店添加到商店协调员时,可以指定编译指示：(改编自PersistentStoreFeatures)我强烈建议您阅读“有效导入数据”.相关文档：NSSQLitePragm
ios – 升级到Xcode 7时的SQLITE：Segmentation Fault 11

我已更新到Xcode7.当我尝试构建时,构建失败并显示“由于信号命令失败：分段错误：11”.我删除了sqlite框架,然后重新加载sqlite(清理项目)并发生同样的错误.同时删除foder/library/developer/xcode在Xcode6上完美运行.有些人可以帮忙错误：0：错误：无法执行命令：分段错误：11：0：错误：swift前端命令因信号失败(使用-v查看调用)解决方法>从以下位
ios – 访问文件属性与访问sqlite记录

>看到上述结果后,我决定选择attributesOfItemAtPath方法.还有什么我不是考虑传递sqlite？
ios – UITableView reloadData什么都不做(UITableView不是nil)

如果您需要查看更多我的代码,请告诉我.我也看了一下beginUpdates和endUpdates的方法,但在我看来,他们一度关注一些变化和用户交互性.我想根据用户选择重新加载整个表.或者还有另一种更好的方法吗？如果没有,请仔细检查并验证myTableView委托是否设置正确.如果您已正确地将表连接到笔尖并且您有一个插座,您也可以在代码中设置它,即在viewDidLoad方法中,通过设置：
iOS：如何从文档目录中删除具有特定扩展名的所有现有文件？

当我更新我的iOS应用程序时,我想删除Documents目录中的任何现有sqlite数据库.现在,在应用程序更新时,我将数据库从软件包复制到文档目录,并通过附加软件包版本来命名它.因此,在更新时,我还想删除可能存在的任何旧版本.我只是希望能够删除所有sqlite文件,而无需循环浏览并查找以前版本的文件.是否有任何方法可以对removeFileAtPath：方法进行通配符？解决方法那么,你想要删除所有*.sqlite文件？
ios – UIWebView中的WebSQL / SQLite数据库的最大大小(phonegap)

我知道一般来说,Web应用程序的本地存储空间有5MB的限制.本地网页浏览应用程式是否也有这个限制？

随机推荐

基于EJB技术的商务预订系统的开发

用EJB结构开发的应用程序是可伸缩的、事务型的、多用户安全的。总的来说，EJB是一个组件事务监控的标准服务器端的组件模型。基于EJB技术的系统结构模型EJB结构是一个服务端组件结构，是一个层次性结构，其结构模型如图1所示。图2：商务预订系统的构架EntityBean是为了现实世界的对象建造的模型，这些对象通常是数据库的一些持久记录。
Java利用POI实现导入导出Excel表格

这篇文章主要为大家详细介绍了Java利用POI实现导入导出Excel表格，文中示例代码介绍的非常详细，具有一定的参考价值，感兴趣的小伙伴们可以参考一下
Mybatis分页插件PageHelper手写实现示例

这篇文章主要为大家介绍了Mybatis分页插件PageHelper手写实现示例，有需要的朋友可以借鉴参考下，希望能够有所帮助，祝大家多多进步，早日升职加薪
(jsp/html)网页上嵌入播放器(常用播放器代码整理)

网页上嵌入播放器，只要在HTML上添加以上代码就OK了，下面整理了一些常用的播放器代码，总有一款适合你，感兴趣的朋友可以参考下哈，希望对你有所帮助
Java 阻塞队列BlockingQueue详解

本文详细介绍了BlockingQueue家庭中的所有成员，包括他们各自的功能以及常见使用场景,通过实例代码介绍了Java 阻塞队列BlockingQueue的相关知识，需要的朋友可以参考下
Java异常Exception详细讲解

异常就是不正常，比如当我们身体出现了异常我们会根据身体情况选择喝开水、吃药、看病、等异常处理方法。 java异常处理机制是我们java语言使用异常处理机制为程序提供了错误处理的能力，程序出现的错误，程序可以安全的退出，以保证程序正常的运行等
Java Bean 作用域及它的几种类型介绍

这篇文章主要介绍了Java Bean作用域及它的几种类型介绍，Spring框架作为一个管理Bean的IoC容器，那么Bean自然是Spring中的重要资源了，那Bean的作用域又是什么，接下来我们一起进入文章详细学习吧
面试突击之跨域问题的解决方案详解

跨域问题本质是浏览器的一种保护机制，它的初衷是为了保证用户的安全，防止恶意网站窃取数据。那怎么解决这个问题呢？接下来我们一起来看
Mybatis-Plus接口BaseMapper与Services使用详解

这篇文章主要为大家介绍了Mybatis-Plus接口BaseMapper与Services使用详解，有需要的朋友可以借鉴参考下，希望能够有所帮助，祝大家多多进步，早日升职加薪
mybatis-plus雪花算法增强idworker的实现

今天聊聊在mybatis-plus中引入分布式ID生成框架idworker，进一步增强实现生成分布式唯一ID,具有一定的参考价值，感兴趣的小伙伴们可以参考一下