0

0

PHP和Elasticsearch集成实现全文检索功能详解

王林

王林

发布时间:2023-06-25 10:14:07

|

1241人浏览过

|

来源于php中文网

原创

随着互联网的发展,企业面对的文本数据越来越庞大。如何快速、准确地检索出相关内容,成为企业在信息化领域的重要课题之一。elasticsearch作为一个基于lucene的开源搜索引擎,具有高可用性、高可扩展性和快速检索的特点,成为企业全文检索的首选方案之一。而php作为一门流行的服务器端编程语言,也能够快速进行web开发和api开发,成为与elasticsearch集成的常用语言之一。

本篇文章主要讲解PHP和Elasticsearch集成,实现全文检索功能的详细步骤。

一、Elasticsearch简介

Elasticsearch是一款基于Lucene的开源搜索引擎,可用于快速、准确地检索大量文本数据。Elasticsearch采用分布式存储架构,支持水平扩展,能够适应海量数据存储和快速检索的需求。

Elasticsearch提供了RESTful API接口,支持JSON格式的数据交互,与常用的编程语言都可以进行集成。在Elasticsearch中,数据按照文档存储,每个文档包含多个字段,每个字段又可以嵌套包含其他字段,使得数据结构更加灵活。同时,Elasticsearch支持对文档进行全文检索、精确匹配、聚合、分析等操作。

立即学习PHP免费学习笔记(深入)”;

二、PHP与Elasticsearch集成

  1. 安装Elasticsearch-PHP库

Elasticsearch-PHP是官方提供的PHP客户端库,封装了Elasticsearch的RESTful API接口,可以方便地在PHP应用中进行Elasticsearch的操作。我们可以通过Composer安装该库,执行以下命令:

composer require elasticsearch/elasticsearch
  1. 连接Elasticsearch

连接Elasticsearch之前,需要先启动Elasticsearch服务。在PHP中使用Elasticsearch-PHP库连接Elasticsearch,需先实例化ElasticsearchClient对象,并设置连接的Elasticsearch服务器ip和端口:

require 'vendor/autoload.php';

$client = ElasticsearchClientBuilder::create()->setHosts(['http://127.0.0.1:9200'])->build();

其中,setHosts()方法传入一个数组参数,每个元素表示一个Elasticsearch服务器,可以设置多个服务器,实现高可用性和负载均衡。

  1. 创建索引

在Elasticsearch中,索引是用于存储和检索相似数据的数据结构,类似于数据库中的表。可以通过以下代码创建一个名为“my_index”的索引:

$params = [
    'index' => 'my_index',
    'body' => [
        'settings' => [
            'number_of_shards' => 5, // 分片数
            'number_of_replicas' => 1, // 副本数
        ],
    ],
];

$response = $client->indices()->create($params);

其中,$params数组参数中,'settings'表示索引的设置,包含分片数和副本数等信息。'body'表示索引的映射,可以在该参数中设置索引的字段和类型等。

  1. 添加文档

在Elasticsearch中添加文档,可以通过以下代码实现:

$params = [
    'index' => 'my_index',
    'id' => '1',
    'body' => [
        'title' => 'Elasticsearch PHP集成',
        'content' => 'Elasticsearch是一款基于Lucene的开源搜索引擎...'
    ]
];

$response = $client->index($params);

其中,$params数组参数中,'index'表示要添加文档的索引名称;'id'表示文档的唯一标识,可选参数;'body'表示文档的内容,可以设置多个字段和值。

Cliclic AI
Cliclic AI

Cliclic商品背景图编辑器是一款功能强大的AI工具,帮助用户快速生成具有吸引力的商品图背景。

下载
  1. 搜索文档

在Elasticsearch中搜索文档,可以通过以下代码实现:

$params = [
    'index' => 'my_index',
    'body'  => [
        'query' => [
            'match' => [
                'title' => 'Elasticsearch PHP'
            ]
         ]
    ]
];

$response = $client->search($params);

其中,$params数组参数中,'index'表示要搜索文档的索引名称;'body'表示查询条件,可以设置多个查询条件和排序规则。

三、PHP+Elasticsearch实现全文检索

  1. 建立索引

在使用Elasticsearch实现全文检索之前,需要先将要检索的数据建立索引。建立索引时,可以将要检索的字段设置成text类型,这样就可以进行全文索引。

在本例中,假设要检索的数据为学生表,包含字段id、name、age和score。我们可以通过以下代码创建一个名为“student”的索引:

$params = [
    'index' => 'student',
    'body' => [
        'settings' => [
            'number_of_shards' => 5,
            'number_of_replicas' => 1,
        ],
        'mappings' => [
            'properties' => [
                'id' => ['type' => 'integer'],
                'name' => ['type' => 'text', 'analyzer' => 'ik_max_word'],
                'age' => ['type' => 'integer'],
                'score' => ['type' => 'double']
            ]
        ]
    ]
];

$response = $client->indices()->create($params);

其中,'name'字段的类型设置为text,同时指定了分词器,这里使用了中文分词插件ik_max_word,可以将中文文本按照最大化分词的方式进行处理。

  1. 添加文档

在建立索引后,可以向索引中添加文档。假设要添加一个学生信息,可以通过以下代码实现:

$params = [
    'index' => 'student',
    'body' => [
        'id' => 1,
        'name' => '张三',
        'age' => 18,
        'score' => 90.5
    ]
];

$response = $client->index($params);

可以通过循环添加的方式,向索引中添加多个文档。

  1. 搜索文档

在建立索引并添加文档后,可以进行全文检索。在本例中,使用了match查询实现全文检索,可以通过输入关键字进行检索。可以通过以下代码实现:

$params = [
    'index' => 'student',
    'body'  => [
        'query' => [
            'match' => [
                'name' => '张三'
            ]
         ]
    ]
];

$response = $client->search($params);

其中,'name'字段用于匹配,可以更换为其他需要进行全文检索的字段。搜索结果返回的信息在$response中,可以获取查询结果并进行展示。

四、总结

本篇文章介绍了PHP与Elasticsearch集成实现全文检索功能的详细步骤。通过连接Elasticsearch、建立索引、添加文档和搜索文档等步骤,可以实现快速、准确地检索大量文本数据的功能。在进行全文检索时,建议使用分词器对中文进行切分,以提高搜索的准确性和效率。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
composer是什么插件
composer是什么插件

Composer是一个PHP的依赖管理工具,它可以帮助开发者在PHP项目中管理和安装依赖的库文件。Composer通过一个中央化的存储库来管理所有的依赖库文件,这个存储库包含了各种可用的依赖库的信息和版本信息。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

162

2023.12.25

PHP API接口开发与RESTful实践
PHP API接口开发与RESTful实践

本专题聚焦 PHP在API接口开发中的应用,系统讲解 RESTful 架构设计原则、路由处理、请求参数解析、JSON数据返回、身份验证(Token/JWT)、跨域处理以及接口调试与异常处理。通过实战案例(如用户管理系统、商品信息接口服务),帮助开发者掌握 PHP构建高效、可维护的RESTful API服务能力。

179

2025.11.26

什么是分布式
什么是分布式

分布式是一种计算和数据处理的方式,将计算任务或数据分散到多个计算机或节点中进行处理。本专题为大家提供分布式相关的文章、下载、课程内容,供大家免费下载体验。

409

2023.08.11

分布式和微服务的区别
分布式和微服务的区别

分布式和微服务的区别在定义和概念、设计思想、粒度和复杂性、服务边界和自治性、技术栈和部署方式等。本专题为大家提供分布式和微服务相关的文章、下载、课程内容,供大家免费下载体验。

251

2023.10.07

json数据格式
json数据格式

JSON是一种轻量级的数据交换格式。本专题为大家带来json数据格式相关文章,帮助大家解决问题。

457

2023.08.07

json是什么
json是什么

JSON是一种轻量级的数据交换格式,具有简洁、易读、跨平台和语言的特点,JSON数据是通过键值对的方式进行组织,其中键是字符串,值可以是字符串、数值、布尔值、数组、对象或者null,在Web开发、数据交换和配置文件等方面得到广泛应用。本专题为大家提供json相关的文章、下载、课程内容,供大家免费下载体验。

549

2023.08.23

jquery怎么操作json
jquery怎么操作json

操作的方法有:1、“$.parseJSON(jsonString)”2、“$.getJSON(url, data, success)”;3、“$.each(obj, callback)”;4、“$.ajax()”。更多jquery怎么操作json的详细内容,可以访问本专题下面的文章。

337

2023.10.13

go语言处理json数据方法
go语言处理json数据方法

本专题整合了go语言中处理json数据方法,阅读专题下面的文章了解更多详细内容。

82

2025.09.10

TypeScript类型系统进阶与大型前端项目实践
TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开,深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析,帮助开发者构建类型安全、结构清晰、易维护的前端工程体系,提高团队协作效率与代码质量。

26

2026.03.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PHP课程
PHP课程

共137课时 | 13.5万人学习

JavaScript ES5基础线上课程教学
JavaScript ES5基础线上课程教学

共6课时 | 11.3万人学习

PHP新手语法线上课程教学
PHP新手语法线上课程教学

共13课时 | 1.0万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号