性能超越 Clickhouse - 物联网场景中的毫秒级查询案例

1 物联网应用场景简介

物联网（Internet of Things，简称 IoT）是指通过各种信息传感、通信和 IT 技术来实时连接、采集、监管海量的传感设备，从而实现对现实世界的精确感知和快速响应，继而实现自动化、智能化管理。在查询 IoT 设备状态的场景下，吞吐量和时延是两个重要的性能指标。

在工业物联网中，常见有以下几种设备时序数据的查询需求：

案例1：查询某个设备最近的记录
案例2：查询某个租户所有设备的最近一条记录
案例3：查询某个设备最近5分钟的统计信息
案例4：查询某个设备最近一天的秒级数据

本教程通过一个工业物联网的案例，来演示 DolphinDB 的序列查询性能，并对比测试了 DolphinDB TSDB 引擎、OLAP 引擎，以及 ClickHouse MergeTree 引擎在上述查询案例上的时延指标。总体来说，DolphinDB TSDB 引擎的性能（时延）对比 DolphinDB OLAP 引擎和 ClickHouse MergeTree 引擎有显著优势。

2 案例数据准备

2.1 数据集说明

本教程参考了某工业物联网 SaaS 平台服务商的数据集，模拟并使用一份高度仿真的数据。该SaaS服务商的主要业务是监控各个地区的噪声情况。表结构如下：

序号	字段名称	字段类型	注释
1	tenantId	INT	租户ID
2	deviceId	INT	设备ID
3	soundPressureLevel	DOUBLE	声音分贝
4	soundPowerLevel	DOUBLE	声音功率值
5	ts	TIMESTAMP	数据采集时间戳
6	date	DATE	日期

一行数据包含租户 ID、设备 ID、声压、噪声功率、采集时间戳和日期共计 6 列数据。每行记录占用 36 字节。该案例数据包含100 个租户，每个租户管理 100 个噪声监控设备，记录了从 2022-01-01 至 2022-01-12，12亿的噪声数据，共计 40G。

2.2 库表设计及数据模拟

使用 DolphinDB TSDB 引擎，创建一个名为 NoiseDB 的数据库，存储噪声数据。TSDB 引擎是 DolphinDB 自 2.00 版本起，专门为物联网场景设计研发的数据存储引擎，具备优秀的写入和序列查询性能。

在噪声监控的 SaaS 服务中，较为频繁的查询场景是以租户为维度，查询某一天某个设备的状态信息。因此设计 noise 表按日期、租户 ID 进行分区，可以有效利用分区剪枝。同时使用区分度较高的设备 ID 和数据采集时间戳作为排序键（查询索引），使查询时能够快速定位对应设备的数据，提升查询性能。具体实现脚本如下。

db1 = database(,VALUE,1000..2000) 
db2  = database(, VALUE, 2022.01.01..2022.12.30) 

// TSDB for iot 
dbNoise = database("dfs://NoiseDB",COMPO,[db1,db2], engine="TSDB") 

create table "dfs://NoiseDB"."noise"(
    tenantId INT,
    deviceId INT,
    soundPressureLevel INT,
    soundPowerLevel DOUBLE,
    ts TIMESTAMP,
    date DATE
)
partitioned by tenantId, date
sortColumns=[`deviceId,`ts]

库表创建完成后，模拟 2022-01-01 至 2022-01-12 的数据，具体代码详见附录 DolphinDB 脚本。

可以通过 SQL 查询验证下数据集大小：

select count(*) from  loadTable(database("dfs://NoiseDB"),"noise") where date between 2022.01.01:2022.01.102> 1260010000

导入完成后，每个分区下生成3个level 0 file，未满足自动合并条件（大于等于10个 levelFile），需要进行手动合并。

chunkIds = exec chunkId from getChunksMeta() where type=1
for (x in chunkIds) {
  triggerTSDBCompaction(x)
}

完成后将案例数据导出数据至 csv 文件，以便后续导入 OLAP 引擎、ClickHouse。在 ClickHouse 中使用OPTIMIZE TABLE noise 合并下 mergeTree。具体过程参照附录 ClickHouse 脚本。

3 SQL 查询

在 DolphinDB 中，可以使用 SQL 快速实现4个设备状态查询需求，并且代码十分简洁。

案例1：查询某个设备最近的100条记录:

noise = loadTable(database("dfs://NoiseDB"),"noise")
select * from noise 
where date=2022.01.01 and tenantId=1055 and deviceId=10067
order by ts desc
limit 100

# timer(10) select ...
Time elapsed: 24.33 ms

脚本的 where 条件语句中指定了分区列 date 和 tenantId 进行过滤，便于 DolphinDB 系统通过分区剪枝快读定位到对应的分区。同时指定了数据库的 sort key (deviceId) 作为过滤字段，利用 TSDB 的索引机制，可以快速定位到数据块，并按时间顺序取回最新的100条记录。平均一次查询耗时 2ms，未命中缓存的首次查询耗时 14ms。

案例2：查询某个租户所有设备最新状态

noise = loadTable(database("dfs://NoiseDB"),"noise")
select * from noise 
where date=2022.01.01 and tenantId=1055
context by deviceId
csort ts desc
limit 1

# timer(10) select ...
Time elapsed: 246.619 ms

该脚本在 where 条件语句中同样指定了分区列以快速定位到对应的数据分区。通过 context by 子句来根据设备 ID 将数据进行分组，每组数据通过 csort 子句按时间倒序排列（考虑到物联网存在消息乱序的情况，必须使用csort将数据按采集时间排序）。使用 limit 1 获取每个窗口内的最新的一条记录，从而获取该租户当日所有设备的最新状态。平均一次查询耗时 25ms，首次查询耗时 121ms。

案例3：查询某个设备5分钟内的噪声统计值

noise = loadTable(database("dfs://NoiseDB"),"noise")
select
     min(ts) as startTs
    ,max(ts) as endTs
    ,max(soundPressureLevel)
    ,avg(soundPressureLevel)
    ,max(soundPowerLevel) 
    ,avg(soundPowerLevel) 
from noise
where date=2022.01.01 and tenantId=1055 and deviceId=10067 and ts between 2022.01.01T00:50:15.518:2022.01.01T00:55:15.518
group by tenantId, deviceId

# timer(10) select ...
Time elapsed: 22.168 ms

该脚本首先根据 where 指定的过滤条件定位并扫描数据块，取出对应时间段的数据，并按 tenantId, deviceId 进行聚合计算，以获取声音分贝、功率的统计值。平均一次查询耗时 2ms，首次查询耗时 13ms。

案例4：查询某个设备最近一天的明细数据

noise = loadTable(database("dfs://NoiseDB"),"noise")
select *
from noise
where date=2022.01.01 and tenantId=1055 and deviceId=10067
order by ts

# timer(10) select ...
Time elapsed: 23.261 ms

该脚本首先根据 where 指定的过滤条件定位并扫描数据块，取出对应时间段的明细数据，并按采集时间排序。平均一次查询耗时 2ms，首次查询耗时 16ms。

注：首次查询指未命中数据库缓存及操作系统缓存的查询。

4 对比测试

进一步测试 DolphinDB TSDB 引擎与 OLAP 引擎，以及 ClickHouse MergeTree 引擎在上述数据集的时序查询性能。测试过程中尽可能地保持环境变量相同，以保证科学有效。具体测试脚本详见附录。

4.1 测试环境

测试机器配置

操作系统：CentOS 7

CPU: 2 cores

内存：10 G

磁盘：SSD

核心测试参数

对测试中影响性能的关键参数，保持对等一致。

软件信息	核心参数	库表设计
DolphinDB：2.00.6 单节点	memSize=8G TSDB引擎 / OLAP引擎	partitioned by tenantId, datesortColumns = [deviceId,ts]
ClickHouse：22.6.1 单节点	max_server_memory_usage=8GMergeTree引擎	partition by tenantId, dateorder by deviceId, ts

测试时，DolphinDB 和 ClickHouse 均采用单节点，并分配 8G 最大内存。在引擎方面，DolphinDB TSDB 引擎，ClickHouse MergeTree 引擎的内部实现都采用了 LSM-tree。并保持库表设计完全一致。

时间衡量标准

由于端到端的时间，容易受到网络抖动和客户端实现性能的影响，因此本次测试的测量时间设定为从查询引擎接收到请求至计算出结果为止。

4.2 测试结果

三者的具体测试结果为下表，表中数值为平均耗时/首次查询耗时（单位 ms），平均耗时的计算逻辑为：

平均耗时 = （首次耗时 + 9次缓存命中耗时）/ 10

测试用例	场景	DolphinDB TSDB	DolphinDB OLAP	ClickHouse
case1	查询某个设备最新100 条记录	2 / 14	34 / 51	14 / 150
case2	查询某个租户所有设备的最新状态	25 /121	62 / 170	73 / 400
case3	查询某个设备 5min的噪声统计值	2 / 13	15 / 136	12 / 82
case4	查询某个设备最近一天的明细数据	2 / 16	24 / 220	22 / 200

可以看出，OLAP 引擎和 ClickHouse 在不同的查询场景下性能各有其优势和劣势。

而 TSDB 引擎性能均优于 ClickHouse，在相对复杂的点查场景性能差距更大。在场景4下，DolphinDB TSDB 引擎比 ClickHouse 的性能高 12.5 倍，首次查询高13倍。在该场景中，TSDB 引擎需要读取对应设备的10000条记录，压缩后的存储大小约为90K。存储在6个连续的Block中，读取效率非常高效。而 ClickHouse 则是 scan 了该分区下1000000条记录的数据块，因此两者的首次查询性能差距较大，而缓存后的性能差距主要取决于两者在计算性能上的差别。

5 总结

DolphinDB TSDB 引擎在物联网场景有着卓越的点查性能，可以以毫秒级延时迅速响应设备的状态信息，其性能更优于 ClickHouse 的 MergeTree 引擎。

6 附录

跳转中...
跳转中...

展开阅读全文

页面更新：2024-03-20

标签：性能案例租户噪声分区脚本引擎测试数据设备

1 2 3 4 5

性能超越 Clickhouse - 物联网场景中的毫秒级查询案例

1 物联网应用场景简介

2 案例数据准备

2.1 数据集说明

2.2 库表设计及数据模拟

3 SQL 查询

4 对比测试

4.1 测试环境

4.2 测试结果

5 总结

6 附录

为打压中国芯，美国手中的3张王牌，已打出了2张

扫地机器人哪个牌子好？六大品牌扫地机器人，谁更值得入手

开网约车需要哪些条件你知道吗？

台企HTC跌落神坛：专利侵权、资本围剿，曾歧视大陆买不起高端机

一发布就引发热议的ColorOS 13，这5个功能用起来尤其加分

为什么有男女之分？生物为什么分雌雄？人类追求多样性而免于灭绝

广汽本田的新车，带小彩电+声浪，1公里3分钱，带你看e:NP1 极湃1

小米MIUI系统特色功能推荐，提高工作效率，一个月节省上百会员费

京沪高铁也绷不住了

美联储持续放鹰金银连续第5个月下跌！铜创下2008年以来最惨连跌纪录

美国将在三年内灭亡，2023年金融危机，2027年世界末日？

9月8日A股猛料：昨晚传出多条重要消息！5板块进入爆发式增长期

大陆反制效果显著，台湾外资流出量创历史新高，岛内人士依旧嘴硬

人民币汇率5天跌897个点！时隔3年，人民币将重返7元时代？

黄金存于美国无法运回，德国还想与中国经济脱钩？

小米12 Pro天玑版评测：换芯后的高性能「次旗舰」

真香！登贝莱数据：2次助攻，9.7分全场第二高分仅次于莱万

可移动储存设备软盘，你使用过吗？日本将彻底淘汰软盘和光

2022中国生活服务业消费趋势报告（消费者画像、行为分析

“晒娃”，请当心！数字时代不要忽略孩子的数据安全

这3款手机目前公认“无差评”，性能强悍体验出色，很值得

厂家为什么要放弃单反相机改推无反微单？未必是为了性能

Android性能测试（内存、cpu、fps、流量、GPU、电量）-adb

如何使用函数实现拆分与提取数据？

回顾，飞掠金星发送数据的过程，真的很艰难