JDONREFv3ES synonymes
Le fichier de synonymes fournis avec le plugin JDONREFv3ES permet d'indexer vos adresses en tenant compte des probables abbréviations qui pourraient être utiles de connaître durant la recherche.
Il est nécessaire de connaître ces abbréviations durant l'indexation car c'est ainsi que les moteurs de recherche par indexation permettent une recherche efficace. Pour simplifier, toutes les variantes de l'adresse (avec ou sans abbréviations) seront stockées et pourront être recherchées.
Utiliser le fichier
Le fichier d'abbréviation peut être utilisé avec le tokenfilter synonyme.
Il suffit de le définir à la création de votre index :
curl -XPUT 'http://localhost:9200/jdonref/' -d '{ "analysis" : { "analyzer" : { "synonym": { "tokenizer": "whitespace", "filter": ["synonym"] } }, "filter": { "synonym" : { "type" : "synonym", "synonyms_path" : "jdonrev3es_synonym.fr.txt" } } } }'
La recherche pourra ainsi par exemple être effectuée avec le type de voie "BD" plutôt que "BOULEVARD".
Syntaxe
Vous pouvez bien sûr modifier ce fichier ou en créer de nouveaux (pour d'autres langues ?).
Le format du fichier est décrit ici.
Utiliser des abbréviations différentes suivant l'adresse
Le filtre fourni par JDONREF permet de disposer d'un fichier de synonyme différent en fonction de l'adresse.
Utilisez le lors de la création de l'index, en spécifiant :
- les fichiers de synonymes utilisés
- le champ de l'adresse qui permet de déterminer le fichier à utiliser
curl -XPUT 'http://localhost:9200/jdonref/' -d '{
"analysis" : { "analyzer" : { "synonym": { "tokenizer": "whitespace", "filter": ["jdonrefv3es"] } }, "filter": { "jdonrefv3es" : { "type" : "jdonrefv3es", "attribute" : "pays", "files" : [ "fr_FR" : {"type" : "synonym", "synonyms_path" : "analysis/jdonrev3es_synonym.fr_FR.txt"} ] } } } }'
Les options du SynonymFilter peuvent aussi être utilisées pour chaque filtre de synonyme déclaré.