Go: ElasticSearch客户端学习

选择程序包来消费ElasticSearch是进行项目的第一步。 如果ElasticSearch是工作流的重要组成部分,则此选择可能会影响应用程序的性能。 但是,对于Go的选择很少:最著名的是olivere/elastic ,而官方的则是elastic/go-elasticsearch 。 让我们回顾一下每个程序包的优缺点。

设计

两个程序包的设计截然不同,让我们通过一个query来观察它们的不同之处。

olivere/elastic 提供了完整的查询DSL,可以完全抽象真实的查询。 这是内置的查询:

这是官方包的内置查询方式:

这种查询更加详细明确。用Go中的map方式转化原始的json查询语句。

这两种设计都可以满足不同的开发者。不关心具体查询的开发者倾向于第一种,同时希望知道明确查询细节的更愿意选择第二种。现在让我们回顾下这两种方式的性能表现。

基准测试

在样例中,我们构建一个简单结构来存储和索引查询。这是一个示例文档:

使用的查询是上一节介绍的查询。 基准测试将涵盖:

  • 查询的建立
  • 结果解码

这是结果:

官方包更加高效分配的内存更少,给应用程序带来更好性能的同时也能降低gc的频率。

优化

优化的第一步是分析。让我们在 olivere/elastic 基准测试中运行pprof。这里是内存分配对象top5的方法:

encoding/json解码阶段占据了超过80%的分配。

第一个可行的优化方法是替换json解码器为easyjson

再次运行基准测试将稍微改善分配数量(-12%):

现在这部分已经优化了,我们可以再次运行pprof来看看是否还有更多低挂的水果。 pprof让我们使用以下命令删除已经检查过的路径:go tool pprof -alloc_objects  -hide =” decodeState | .UnmarshalJSON | Unmarshal | Decode”  mem.out:

现在查询的创建占据最多的分配。olivere/elastic提供了Source()方法允许直接以字符串的方式发送查询。这是优化后的结果:

至此我们可以通过优化得到一些改善,但仍然和官方包相较甚远。

编译自:https://medium.com/a-journey-with-go/go-elasticsearch-clients-study-case-dbaee1e02c7


欢迎订阅我的公众号,文章更新早知道
张贴在Go标签:

版权声明: 本文为【陈思敏捷】的原创文章。
原文链接:【https://www.chenjie.info/2592】。原文标题:【Go: ElasticSearch客户端学习】。文章转载请联系作者。


发表评论

电子邮件地址不会被公开。 必填项已用*标注

此站点使用Akismet来减少垃圾评论。了解我们如何处理您的评论数据