文章列表

监控平台调研报告

广义的监控又称为Application Performance Monitoring(APM),即应用性能监控。其数据类型主要包括:指标数据(Metrics),日志文本(Logs),分布式追踪(Traces),这又称为可观测性三支柱。
2022-10-18
13分钟阅读时长

Elastic Observability系统搭建

随着ES v8.4的发布,es对于可观测性三支柱(Metric/Trace/Log)都具有较为完备的支持,Alert功能也能满足一般需求,kibana的看板功能经过这么多年的迭代,可用性也比较好了。最重要的是,兼容OpenTelemetry的标准也保证如果用的不爽也可以用其他开源组件替换,所以项目组目前搭建监控平台,经过评估还是决定优先用这一套。
2022-10-12
28分钟阅读时长

SRE读书笔记

SRE相关的书籍,截止目前google出了2本,分别是2016年的的《Site Reliability Engineering: How Google Runs Production Systems》和2020年的《The Site Reliability Workbook》。这两本书是互补关系,需要先阅读第一本,然后再看第二本。
2022-09-22
11分钟阅读时长

Ginkgo使用笔记

go自带的单元测试比较适合测一个小函数,如果要做一系列的流程测试,则显得较为繁琐。 推荐使用ginkgo来做流程测试,BDD风格写出来的测试代码非常容易读懂和维护。
2022-09-05
2分钟阅读时长

Influxdb Cluster集成

本文记录在golang项目中集成influxdb-cluster需要的知识储备。 术语 database 和MySQL中一致 batch \n分割的多行数据,用来批量写入。 influxDB推荐5000~10000个点批量写入以提高性能。
2022-09-01
3分钟阅读时长