配置SOLR如果多个在文档中使用,并在搜索文本奇异找到文件?

我使用Solr的,设立在本地主机:8983我基本上使用开箱的例子。 我已经进入了名为“汽车”一个文档,另有一个名字“汽车总动员”。

如果我访问之一:

http://localhost:8983/solr/select?q=Car

要么

http://localhost:8983/solr/select?q=Cars

我希望得到这两份文件。 此刻,我不知道。

在“schema.xml中”领域的标记,“名”的条目是:

“text_general”具有以下“分析仪”(不词干):

<analyzer type="index"> <tokenizer class="solr.StandardTokenizerFactory"/> <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" enablePositionIncrements="true" /> <filter class="solr.LowerCaseFilterFactory"/> </analyzer> <analyzer type="query"> <tokenizer class="solr.StandardTokenizerFactory"/> <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" enablePositionIncrements="true" /> <filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true"/> <filter class="solr.LowerCaseFilterFactory"/> </analyzer>

我想一个词干添加到每个分析仪。 我试过了:

<filter class="solr.PorterStemFilterFactory"/> <filter class="solr.KStemFilterFactory"/> <filter class="solr.EnglishMinimalStemFilterFactory"/>

这样做使得它使得搜索“汽车”能找到“汽车”,但我永远无法找到“汽车总动员”。

它应该是可能找到“汽车总动员”?

任何帮助将不胜感激。 谢谢。

--------------解决方案-------------

这是可能的,只是在(后LowerCaseFilterFactory)末尾添加搬运工过滤器:

<filter class="solr.SnowballPorterFilterFactory" language="English" />

阅读更多:

  1. 雪球文档与示例分析仪的使用
  2. Solr的LanguageAnalysis
  3. 英语(Porter2)词干算法

如果没有特别的需要,我也不会分裂分析器来索引和查询时间。 您的查询时间测定仪看起来完美的在这两种情况下使用它。

我发现,从text_general改变的shema.xml领域text_en把这个问题多照顾

分类:Solr的 时间:2015-03-15 人气:0
本文关键词: Solr的
分享到:

相关文章

Copyright (C) 55228885.com, All Rights Reserved.

55228885 版权所有 京ICP备15002868号

processed in 0.231 (s). 10 q(s)