分享一个Go开发的搜索引擎-Go-Found

GoFound 是一个golang实现的全文检索引擎 基于平衡二叉树+正排索引、倒排索引实现 可支持亿级数据,毫秒级查询。 使用简单,使用http接口,任何系统都可以使用。

GoFound 一个golang实现的全文检索引擎,支持持久化和单机亿级数据毫秒级查找。

接口可以通过http调用。

详见 API文档


示例

编译好的下载地址: https://github.com/newpanjing/gofound/releases

将编译后的gofound文件复制到/usr/local/bin目录下,然后在命令行中运行gofound命令即可。

gofound --addr=:5678 --data=./data

启动成后,就可以调用API来进行索引和查询了。


在线体验

Simple社区使用的GoFound,可以直接模糊搜索相关帖子

在线体验

GoFound在线管理后台Demo

http://119.29.69.50:5678/admin

QQ交流群

556102631

二进制文件下载

支持Windows、Linux、macOS、(amd64和arm64)和苹果M1 处理器

点击下载

技术栈

  • 二分法查找
  • 快速排序法
  • 倒排索引
  • 正排索引
  • 文件分片
  • golang-jieba分词
  • leveldb

为何要用golang实现一个全文检索引擎?

  • 正如其名,GoFound去探索全文检索的世界,一个小巧精悍的全文检索引擎,支持持久化和单机亿级数据毫秒级查找。
  • 传统的项目大多数会采用ElasticSearch来做全文检索,因为ElasticSearch够成熟,社区活跃、资料完善。缺点就是配置繁琐、基于JVM对内存消耗比较大。
  • 所以我们需要一个更高效的搜索引擎,而又不会消耗太多的内存。 以最低的内存达到全文检索的目的,相比ElasticSearchgofound是原生编译,会减少系统资源的消耗。而且对外无任何依赖。

安装和启动

下载好源码之后,进入到源码目录,执行下列两个命令

  • 编译

直接下载 可执行文件 可以不用编译,省去这一步。

go get && go build
  • 启动
./gofound --addr=:8080 --data=./data
  • docker部署
docker build -t gofound .
docker run -d --name gofound -p 5678:5678 -v /mnt/data/gofound:/usr/local/go_found/data gofound:latest

多语言SDK

使用gofound的多语言SDK,可以在不同语言中使用gofound。但是请注意,版本号与gofound需要一致。主版本和子版本号,修订版不一致不影响。

Java

Python

Node.js

其他语言的SDK,正在陆续完善中。也可以直接通过API文档用HTTP请求实现。

和ES比较

ESGoFound
支持持久化支持持久化
基于内存索引基于磁盘+内存缓存
需要安装JDK原生二进制,无外部依赖
需要安装第三方分词插件自带中文分词和词库
默认没有可视化管理界面自带可视化管理界面
内存占用大基于Golang原生可执行文件,内存非常小
配置复杂默认可以不加任何参数启动,并且提供少量配置

待办

TODO

发布日志