Administrer et exploiter Elasticsearch

Formation créée le 29/11/2021. Dernière mise à jour le 07/08/2025.
Version du programme : 1

Type de formation

Formation mixte

Durée de formation

(3 jours)

Accessibilité

Oui
Cette formation est gratuite.
S'inscrire
Cette formation est gratuite.
S'inscrire
Cette formation est gratuite.
S'inscrire
Besoin d’adapter cette formation à vos besoins ? N’hésitez pas à nous contacter afin d’obtenir un devis sur mesure ! Nous contacter

Administrer et exploiter Elasticsearch


Elasticsearch est une base de données NoSQL capable d'indexer des listes de documents fortement orientés textes. Sa particularité est de permettre des recherches efficaces par mots-clés. Cette formation cours vous apprendra à installer/configurer et Monitorer Elasticsearch.

Objectifs de la formation

  • Découvrir les enjeux de l’utilisation d’Elasticsearch
  • Décrire le fonctionnement et les apports d’Elasticsearch dans le traitement de données
  • Mettre en œuvre Elasticsearch pour analyser les données

Profil des bénéficiaires

Pour qui
  • Administrateurs techniques
  • Développeurs
  • Architectes
Prérequis
  • Maitrise un langage de programmation structuré
  • Une première connaissance du fonctionnement et des apports d'Elastic Stack et de ses composants (Elasticsearch, Logstash, Kibana, Beats) dans le traitement des données
  • Avoir des connaissances générales des systèmes d'information et des systèmes d'exploitation (Linux ou Windows)

Contenu de la formation

Présentation d’elasticsearch
  • Historique
  • License
  • Moteur Lucene
  • API Rest comme wrappeur de lucene
  • Clustering de Lucene
Installation
  • Installation depuis deb et rpm
  • Fichiers de configuration
  • Chemin de stockage des fichiers
  • Nom du cluster, nom de la node
  • Paramètres de nœud
Indexation de documents
  • Ajout
  • Mise à jour
  • Suppression
  • GET
Format des données
  • Json
  • Notions de types et de mapping
  • Mise a jour des types ou re-indexation
  • Recherche de données
  • Requête simple par query string en get
  • Composants d’une requête
  • Les différentes requêtes du query DSL
  • Savoir utiliser la requête adaptée
  • Combiner des requêtes
  • Les filtres
Analyse de données pour le stockage
  • Fonctionnement de Lucene under the hood: comment les données sont effectivement stockées
  • Inverted index
  • Analyze API
  • Caracter filter
  • Tokenizer
  • Token filter
  • Shingles
  • Ngrams, edge ngrams
  • Stemming
Recherche et pertinence des résultats
  • Le scoring dans lucene
  • TF et IDF
  • Boost
  • API explain
  • Re-scoring
  • Function_score query
  • Scripting et score
Agrégations
  • Facets
  • Filtres et agrégations
  • Métrics
  • Statistics
  • Approximate statistics
  • Multi bucket aggregations
  • Nesting aggregations
Relations entre les documents
  • Nested document
  • Parent child
  • Dénormalisation
  • Search et agrégations sur les nested documents
Clustering et fonctionnement distribué
  • Notion de master et rôle des nœuds
  • Découverte des noeuds et maintien / sortie du cluster
  • Notion de shard primaire et replica
  • Allocation des shards, répartition dans le cluster
  • Perte de noeud
Administration et tâches courantes
  • Refresh, flush, force_merge
  • Split brains
  • Gestion des caches
  • Index lifecycle management: close / open / freeze / delete
  • Déplacement de shard forcé
  • Désactivation / activation de l’allocation des shards
  • Rolling restart
  • Full cluster restart
  • Backup /restore
  • Curator
  • Administrer depuis kibana
  • Les alias, avec filtre et routing
  • Task management api
Dimensionnement
  • Taille de shard, d’index et choix hardware
  • Retour bonne pratiques et métriques repères / standards
Architecture typiques et possibilités
  • Cas d’usage: log/ iot time series ou moteur de recherche
  • Architecture hot warm
  • Rôle des nœuds et cluster cas d’école
  • Multi région ou cross cluster réplication
Tuning des performances
  • Performance APIS
  • Refresh, flush, merge/optimize
  • Different type de Caches
  • Query warmers
Monitoring
  • Cluster health
  • CAT api
  • Node stats
  • Cluster state
  • Garbage collector et heap
  • Throttle
  • Taille des indices
  • Performances de base
  • Cache
  • Nombre de nœuds
  • Thread pools
  • Pending tasks
  • Missing / 404
  • Les logs: slow logs, déprécation logs et activation
  • Panorama des outils et systèmes de monitoring d’Elasticsearch
  • Hot threads

Équipe pédagogique

La formation est animée par un formateur expert d’Elasticsearch, disposant d’une solide expérience dans l’administration et l’exploitation de clusters en production, ainsi que dans l’accompagnement d’équipes techniques sur des projets data à fort volume.

Suivi de l'exécution et évaluation des résultats

  • Feuilles de présence.
  • Questions orales ou écrites
  • Etude de cas, exposés théoriques, puis échanges.
  • Mises en situation.
  • Formulaires d'évaluation de la formation.
  • Certificat de réalisation de l’action de formation.

Ressources techniques et pédagogiques

  • Accueil des stagiaires dans une salle Virtuelle (Zoom, Teams ou autres) si distanciel
  • Documents supports de formation projetés.
  • Exposés théoriques
  • Etude de cas concrets
  • Quiz en salle
  • Mise à disposition en ligne de documents supports à la suite de la formation.
  • Le stagiaire doit avoir un Micro et Webcam et avoir une bonne connexion Internet (pour une meilleure expérience) si distanciel.
  • Le stagiaire doit avoir un PC pour faire les questionnaires.

Capacité d'accueil

Entre 1 et 10 apprenants

Délai d'accès

4 semaines

Accessibilité

Nos formations sont accessibles à tous, y compris aux personnes en situation de handicap. Merci de nous contacter avant le début de la formation pour discuter des aménagements nécessaires : contact@kampus-training.com.