
本文档旨在指导开发者如何在 MarkLogic 数据库中使用 Java 客户端 API 创建有效的通配符查询,以检索 JSON 文档中特定字段以指定字符串开头的记录。我们将探讨使用 `cts:json-property-value-query()` 和 `cts:field-value-query()` 的方法,并讨论数据库配置选项,例如启用“两个字符搜索”和创建具有特定索引设置的字段,以便优化通配符查询的性能。
使用 cts:json-property-value-query() 进行通配符查询
当需要对 JSON 文档中的特定属性值执行通配符查询时,可以使用 cts:json-property-value-query()。这种方法将属性值视为短语,并应用与 cts:word-query 相同的通配符和词干规则。
以下 Java 代码展示了如何使用 StructuredQueryBuilder 创建一个 cts:json-property-value-query():
StructuredQueryBuilder sqb = new StructuredQueryBuilder();
String[] options = {"wildcarded"};
StructuredQueryDefinition queryDefinitionIcs = sqb.value(sqb.jsonProperty("icsList"),
null, options, 1, searchText + "*");在这个例子中,sqb.jsonProperty("icsList") 指定了要查询的 JSON 属性,searchText + "*" 构建了带有通配符的查询字符串。 需要注意的是,cts:json-property-value-query 将属性值视为短语,因此通配符必须跨越单词边界才能匹配。例如,如果属性值为 "hello friend",则 "he*" 将不会匹配,但 "hello *" 将会匹配。
立即学习“Java免费学习笔记(深入)”;
使用 cts:field-value-query() 进行通配符查询
另一种方法是创建一个field,并配置必要的索引设置以支持所需的通配符查询。这通常涉及启用“两个字符搜索”、“三个字符搜索”或“尾部通配符搜索”。
以下 Java 代码展示了如何使用 StructuredQueryBuilder 创建一个 cts:field-value-query():
StructuredQueryDefinition queryDefinitionIcs = sqb.value(sqb.field("icsList"),
null, options, 1, searchText + "* *");在这个例子中,sqb.field("icsList") 指定了要查询的 field,searchText + "* *" 构建了带有通配符的查询字符串。
数据库配置选项
为了使通配符查询能够正常工作并获得最佳性能,可能需要调整 MarkLogic 数据库的配置。
启用“两个字符搜索”
默认情况下,MarkLogic 不会对少于三个字符的单词进行索引。如果需要查询以两个字符开头的字符串,则需要在数据库上启用“两个字符搜索”。但是,这可能会显著增加索引的大小并影响摄取性能。
启用“三个字符搜索”或“尾部通配符搜索”
对于较短的通配符值,可能需要启用“三个字符搜索”或“尾部通配符搜索”才能有效地进行搜索。
创建具有特定索引设置的字段
可以创建一个具有特定索引设置的字段,以优化特定属性的通配符查询。例如,可以创建一个启用了“两个字符搜索”和“尾部通配符搜索”的字段,然后使用 cts:field-value-query() 查询该字段。
注意事项
- 在生产环境中启用“两个字符搜索”之前,请仔细评估其对索引大小和摄取性能的影响。
- 使用 cts:json-property-value-query() 时,请注意通配符必须跨越单词边界才能匹配。
- 创建具有特定索引设置的字段可以提高特定属性的通配符查询性能。
总结
本文档介绍了在 MarkLogic 数据库中使用 Java 客户端 API 创建通配符查询的两种主要方法:使用 cts:json-property-value-query() 和 cts:field-value-query()。我们还讨论了数据库配置选项,例如启用“两个字符搜索”和创建具有特定索引设置的字段。通过理解这些概念并应用本文档中提供的示例代码,开发者可以创建有效的通配符查询,以满足其特定的业务需求。










