ElasticSearch简介
ElasticSearch 是一个分布式、高扩展、高实时的搜索与数据分析引擎。它能很方便的使大量数据具有搜索、分析和探索的能力。
来自百度百科
Elasticsearch不仅仅是Lucene和全文搜索引擎
分布式的实时文件存储,每个字段都被索引并可被搜索实时分析的分布式搜索引擎可以扩展到上百台服务器,处理PB级结构化或非结构化数据
而且,所有的这些功能被集成到一台服务器,你的应用可以通过简单的RESTful API、各种语言的客户端甚至命令行与之交互。上手Elasticsearch非常简单,它提供了许多合理的缺省值,并对初学者隐藏了复杂的搜索引擎理论。它开箱即用(安装即可使用),只需很少的学习既可在生产环境中使用。Elasticsearch在Apache 2 license下许可使用,可以免费下载、使用和修改。 随着知识的积累,你可以根据不同的问题领域定制Elasticsearch的高级特性,这一切都是可配置的,并且配置非常灵活。
ElasticSearch的优势
其实数据库服务也支持全文搜索,为什么要用全文搜索引擎?solr和elasticsearch都是基于Lucene为什么要使用elasticsearch?
数据有几个类型:
结构化数据:用表和字段表示的数据
半结构化数据:xml,html
非结构化数据:文本,文档,音频,视频等
传统的数据库对结构化数据处理的能力非常好,甚至在数据量很大时也能够通过建索引,集群,分库分表等手段来保持较好的数据处理能力,但碰到需要像like "