Elasticsearch : tout ce que vous devez savoir sur Elasticsearch

Qu'est-ce que la recherche élastique ?

Elasticsearch est un moteur de recherche basé sur apache lucene. Il est open source et est développé en Java. Il s'agit d'un moteur de recherche en temps réel distribué et analytique qui permet d'effectuer différents types de recherches. Vous pouvez obtenir des réponses de recherche rapides car au lieu de rechercher directement le texte, vous recherchez un index. En outre, il prend en charge la recherche en texte intégral entièrement basée sur des documents plutôt que sur des tableaux ou des diagrammes. Trouvez plus d'informations ici.

Pourquoi Elasticsearch?

– Il est possible d'effectuer et de combiner différents types de recherche, quel que soit le type de données, qu'il s'agisse de données structurées, non structurées, géographiques ou métriques. – La recherche peut être effectuée sur n'importe quelle forme de données. – Capacité d'analyser des milliards d'enregistrements en quelques secondes. – Il fournit également des agrégations qui vous permettent d'explorer les tendances et les modèles de données.

Avantages d'Elasticsearch

1. Évolutivité

Elasticsearch est conçu pour évoluer. Cela fonctionne très bien sur n'importe quelle machine ou sur un cluster avec des centaines de nœuds et l'expérience est presque identique. Passer d'un petit groupe à un grand groupe est presque entièrement automatique et indolore. Passer d'un grand cluster à un très grand cluster nécessite un peu plus de planification et de conception, mais cela reste relativement facile. L'évolutivité est prise en compte dans les dimensions suivantes.

Taille d'index : être capable de gérer des index énormes (de l'ordre de centaines de gigaoctets ou de pétaoctets) Débit : être capable de gérer un nombre variable de recherches simultanées dans un temps de réponse donné. Taille du cluster – Le nombre de nœuds dans le système

deux. vitesse d'exécution

À l'aide d'index inverses distribués, Elasticsearch trouve rapidement les meilleures correspondances pour vos recherches en texte intégral, même à partir de très grands ensembles de données.

3. Multilingue

Le plugin ICU est utilisé pour indexer et symboliser le contenu multilingue. Il s'agit d'un plugin de recherche élastique basé sur l'implémentation Lucid de la norme de segmentation de texte Unicode. En fonction des plages de caractères, il décide de casser un espace ou un caractère. Par conséquent, le contenu multilingue est pris en charge par Elasticsearch.

4. Orienté document (JSON)

Elasticsearch utilise JavaScript Object Notation, ou JSON, comme format de sérialisation de documents. La sérialisation JSON est prise en charge par divers langages de programmation et est devenue le format standard utilisé par le mouvement NoSQL. Il est simple, concis et facile à lire.

5. Autocomplétion et recherche d'instance

L'outil de suggestions de saisie semi-automatique offre des fonctionnalités de saisie semi-automatique et de recherche à la volée. Il s'agit d'une fonctionnalité de navigation qui guide les utilisateurs vers des résultats pertinents au fur et à mesure de leur saisie, améliorant ainsi la précision de la recherche. Il n'est pas destiné à la vérification orthographique ou vouliez-vous dire des fonctionnalités telles que la suggestion de mots ou de phrases.

6. Pas de schéma

Elasticsearch ne nécessite pas certaines définitions telles que l'index, le type et le type de champ avant le processus d'indexation, et lorsqu'un objet est indexé ultérieurement avec une nouvelle propriété, il sera automatiquement ajouté aux définitions de mappage.

Concepts de base

Temps quasi réel – Elasticsearch est une plateforme de recherche en temps quasi réel qui effectue des recherches aussi rapidement qu'elle indexe un document. Cluster : Un cluster est une collection d'un ou plusieurs nœuds qui contiennent ensemble toutes les données. Il offre des fonctionnalités de recherche et d'indexation fédérées sur tous les nœuds et est identifié par un nom unique (par défaut, il s'agit de "elasticsearch"). Nœud – Un nœud est un serveur unique qui fait partie d'un cluster, stocke des données et participe aux fonctions d'indexation et de recherche du cluster. Index : Un index est une collection de documents ayant des caractéristiques similaires et est identifié par son nom. Ce nom est utilisé pour faire référence à l'index lors de l'indexation, de la recherche, de la mise à jour et de la suppression des documents qu'il contient. Type : Un type est un type logique d'un index dont la sémantique est complète. Il est défini pour les documents qui ont un ensemble commun de champs. Vous pouvez définir plusieurs types dans votre index. Document : Un document est une unité d'information de base qui peut être indexée. Il est démontré dans JSON, qui est un format d'échange de données sur Internet à l'échelle mondiale. Shards – Elasticsearch vous permet de diviser l'index en plusieurs parties appelées shards. Chaque shard est lui-même un "index" entièrement fonctionnel et indépendant qui peut être hébergé sur n'importe quel nœud du cluster Replicas – Elasticsearch vous permet de faire une ou plusieurs copies des shards de votre index qui sont appelées répliques shards ou répliques.

Installations

– Installez la dernière version de Java ou vérifiez votre version actuelle à l'aide de la commande "java -version" sur la ligne de commande (la version de Java doit être 7 ou supérieure) – Définissez la variable d'environnement sur JAVA – Téléchargez le fichier zip élastique à partir de "https : //www.elastic.co/downloads/elasticsearch". – Décompressez le fichier – Allez dans le dossier bin – Double-cliquez sur le fichier "elasticsearch.bat". – Ouvrez un navigateur, tapez "localhost:9200" et il vous montrera le nom, le nom du groupe de recherche élastique et d'autres informations au format JSON.

Exemple

1. Ajouter un document

Les documents dans Elasticsearch sont rendus au format JSON (et ne sont pas convertis grâce à I love PDF!). De plus, les documents sont ajoutés aux index et les documents ont un type (voir aussi : convertir ODT en PDF?). Ici, "information_technology", "person" et "1" sont respectivement index, type et id. Comme l'index n'existe pas encore, Elasticsearch le créera pour vous.

POST localhost : 9200/technologie_information/personne/1

"nom": "Paul",

"nom de famille": "Smith",

"job_description": "Analyste d'entreprise"

deux. Obtenir un document

Maintenant que le document existe – à lire : convertir Epub to PDF – nous pouvons le récupérer en utilisant l'API ci-dessous. Maintenant que le document existe – à lire : convertir Epub en PDF – nous pouvons le récupérer en utilisant l'API ci-dessous. Maintaining that the document exists – here: convert Epub to PDF – we can recover it using the desired API. En maintenant que le document existe – ici : convertir Epub en PDF – nous pouvons le récupérer en utilisant l'API souhaitée.Ahora que el documento existe , lea: convertir Epub a PDF , podemos recuperarlo usando la API a continuación. Ahora que el documento existe , lea: convert Epub a PDF , podemos recuperarlo usando la API a continueación. Now that the document exists , please read: Convert Epub to PDF , we can retrieve it using the API below. Maintenant que le document existe , veuillez lire : Convertir Epub en PDF , nous pouvons le récupérer en utilisant l'API ci-dessous.

GET localhost : 9200/information_technology/person/1

3. Mettre à jour le document

Nous pouvons le mettre à jour en utilisant l'API ci-dessous.

POST localhost:9200/technology_information/person/1/_update

{

"doc":{

"job_description": "Analyste de données"

}

4. Supprimer le document

Nous pouvons le supprimer en utilisant l'API ci-dessous.

SUPPRIMER l'hôte local : 9200/information_technology/person/1

Archives

Catégories

Méta