Influxdb Cluster集成

tryao

2022-09-01 2025-10-16 约 1200 字预计阅读 3 分钟

本文记录在golang项目中集成influxdb-cluster需要的知识储备。

术语

database

和MySQL中一致

batch

\n分割的多行数据，用来批量写入。

influxDB推荐5000~10000个点批量写入以提高性能。

bucket

database+retain policy（保留策略，简称RP）

CQ

连续查询，可以理解为一个物化视图，当数据更新时自动执行的select语句。不过这里要求必须带上GROUP BY time()

duration

数据保存时间，自动滚动删除

field

没加索引的额外字段，kv pair

data point

即点位，可以理解为表中的一行数据。

line protocol

写入数据时，数据的格式：

1
2
3
4
5
6
7
weather,location=us-midwest temperature=82 1465839830100400200
 |    -------------------- --------------  |
 |             |             |             |
 |             |             |             |
+-----------+--------+-+---------+-+---------+
|measurement|,tag_set| |field_set| |timestamp|
+-----------+--------+-+---------+-+---------+

注意分隔符，时间戳在最后，默认时间精确到纳秒

tag和field的key是字符串，value默认为float，其他的的格式约定如下：

整数，在数字后面加i;
字符串，加双引号""；
t, T, true,True和TRUE，都是真；相对应的false也存在；
以下需要使用\转义：
- 逗号,
- 等于号=
- 空格
- 双引号""

如果measurement、tag_set和timestamp都相同，则视为同一个点位。此时field_set会尝试合并，如果新的key与旧的重复，则使用新的覆盖旧的。

collections

即同一个measurement+tag_set

数据结构

shard是influxdb存储引擎TSM的具体实现。TSM TREE是专门为influxdb构建的数据存储格式。与现有的B+ tree或LSM tree实现相比，TSM tree具有更好的压缩和更高的读写吞吐量。

shard group是存储shard的逻辑容器，每一个shard group都有一个不重叠的时间跨度，可根据保留策略retention policy的duration换算而得。数据根据不同的时间跨度存储在不同的shard group中。

查询语言(InfluxQL)

influxdb 2.0引入了Flux，采用类似JavaScript的查询语法。1.0中主要还是用SQL来查询，这里主要还是介绍SQL的用法。

大部分查询语法和MySQL保持一致，有一些特殊的记录如下：

time默认是UTC时间，需要自行转换成需要的时区；
默认按time升序排列；
默认time为ns精度，可以写入时自行指认精度；
不支持用OR+绝对时间查询；
支持SLIMIT和LIMIT两种限制语句，对应SOFFSET和OFFSET，前者表示对Series的限制；
GROUP BY可以接time(1m)，后者的参数可以是各种时间尺度，并且可以用fill()填充缺口；

使用

httpie语法：

1
http -f -a root:123456 http://localhost:8086/query pretty==true db=videodb epoch=s q="select * from record where sip_id='34020000001310000003@42100000462007000103' and time>1667750400s limit 10"

curl语法：

1
curl -GET http://localhost:7076/query?pretty=true -u 'root:123456' --data-urlencode "db=videodb_test" --data-urlencode "q=SELECT * from record WHERE sip_id='34020000001310000008@42100000462007000145' AND time>=1667266200000ms"

epoch表示返回time的精度，不设置的话默认返回的是人类友好的字符串格式。