Accueil Le blog ebiznext

Objet

Chaque application produit des logs qui sont souvent peu ou pas exploités en tant que sources d’informations potentielles. Pourtant, il est possible avec peu d’effort de construire une plateforme de collecte et d’analyse de logs permettant d’extraire des informations importantes comme des indicateurs sur la santé de l’application, mais aussi sur le comportement des utilisateurs, ou encore des données métiers.

Cet article a pour objectif d’expliquer comment mettre en place une infrastructure permettant de collecter, analyser, stocker et restituer les informations contenues dans les logs. Cette infrastructure s’appuie sur la suite ELK proposée par ElasticSearch BV:
En savoir plus >>

Contexte

L’objet de cette note est un retour d’expérience sur l’optimisation des performances d’un cluster elasticsearch dans le cadre de la mise en œuvre d’une solution de recommandation en ligne qui s’appuie sur MLLib / Spark / elasticsearch. Le diagramme ci-dessous illustre le découpage logique :

 

es1

 

elasticsearch est une solution de search distribuée et permet donc de répartir les données sur plusieurs serveurs. L’objet de cette note est de décrire les paramétrages réalisés sur chacun des nœuds pour obtenir une performance optimale.
En savoir plus >>

Introduction

ElasticSearch est un moteur de recherche Open Source (Apache 2). Il est basé sur la librairie Apache Lucene et masque la complexité de celle-ci. Les données sont indexées sous forme de documents. Il possède des avantages indéniables dont :

En savoir plus >>

 

mogobiz-elastic

 

Dans cette note je décris la mise en oeuvre d’une architecture générique de traitement des données dans le cadre d’analyse offline.

Analyse Offline Objectifs : Sur la base de référentiels et de logs d’accès au serveurs Web, le marketing/l’exploitant/… doit pouvoir effecuter des traitements qui lui permettent de comprendre le comportement des visiteurs sur son site et revoir le site afin d’améliorer l’expérience utilisateur.
En savoir plus >>