Brizawen Lab© : une plate-forme d’analyse des données du Web

La société Brizawen s’est inscrite dès sa création dans une démarche d’innovation par la création de Brizawen Lab©. Avec une expertise unique sur le marché de l’analyse de données du Web, notre démarche s’appuie sur l’utilisation des outils d’intelligence artificielle et de statistiques. Les solutions développées exploitent les données pour construire des modèles d’enrichissement et d’amélioration des performances d’un site.

Brizawen, Jeune Entreprise Innovante

Le statut de Jeune Entreprise Innovante (JEI), créé par la loi de finances de 2004, s’adresse aux PME de moins de 8 ans qui engagent des dépenses de recherche-développement représentant au moins 15 % de leurs charges.

Brizawen : Jeune Entreprise Innovante
La société Brizawen obtient le statut de JEI

La société Brizawen est Jeune Entreprise innovante (JEI) depuis le 15 février 2021.

La visibilité d’un site Web

L’objectif d’un site Web est d’être vu par le plus grand nombre pour informer, défendre des idées, vendre des produits ou des services. Nous considérons qu’un site sans visibilité n’a pas de réel intérêt tant d’un point de vue économique que sociétal.
La plate-forme Brizawen Lab© a été constituée dans un objectif de recherche & développement :

  • Constituer un environnement pour recenser les données Web,
  • Comprendre les mécanismes des moteurs de recherche,
  • Décrypter les algorithmes,
  • Établir des modèles pour améliorer la qualité et les performances de visibilité des sites.
Améliorer la visibilité d'un site avec Brizawen
Comment améliorer la visibilité d’un site ?
Analyser les sources de données du web
Allez aux sources des données du Web pour bien analyser

Les sources de données

Pour analyser, il faut des données. Il existe de très nombreuses sources de données Web disponibles auprès de fournisseurs privés ou en Open Data :

  • Liste des URLs des sitemaps,
  • Statistiques de fréquentations internes (analytique de Google ou Matomo (anciennement Piwik),
  • Positions des moteurs de recherche (clics, vues, positions, etc.) via les outils Webmasters de Google et de Bing,
  • Données qualitatives et quantitatives issues de l’analyse de la base de données du site ou du HTML généré,
  • Données enrichies, métadonnées, etc.
  • Analyse de logs de pare-feux (Cloudflare),
  • Statistiques publicitaires (Adsense).

Nous intégrons l’ensemble de ces données pour la construction de modèles de performance.

Un cadre technologique construit sur des serveurs privés et sécurisés

Les supports de travail et d’informations sont des bases de données au format MySQL sur un serveur dédié (MariaDB 10.0 et PHP 7.4), l’utilisation du langage d’interrogation SQL pour le traitement des requêtes et les logiciels statistiques pour les analyses des données et la restitution.
Les données sont conservées sur nos serveurs, en toute sécurité et en toute confidentialité derrière nos pare-feux. Brizawen Lab© permet d’accéder à des volumes de données importants et de réaliser des traitements rapides : ce qui en fait un meilleur environnement pour la recherche et l’amélioration des performances des sites Web.
L’approche standard actuelle consiste à centraliser les données d’un site au sein d’une seule et même base. Cette base est interrogée pour les besoins d’analyse par plusieurs applications via le protocole ODBC.

Nos serveurs sont privés et sécurisés
Des serveurs privés et sécurisés
L'originalité de notre démarche
Une démarche originale

Notre originalité

Notre approche est fondamentalement différente des autres acteurs du Web : nous ciblons davantage. Nous nous appuyons sur nos travaux de recherche, qui comprennent l’analyse des données statistiques via des techniques de régression multiples afin de dégager les modélisations, les métadonnées, les médias et les résultats de recherche. Ces ensembles de données sont créées et conservées sur nos propres serveurs.

Nous mettons en évidence des corrélations entre les flux de données mais aussi les biais, les lacunes dans les données et les sources d’hétérogénéité. La qualité des données et notre expertise font toute la différence dans la performance d’une modélisation.

« Comment la pensée innovante survient ? Je pense que c’est vraiment un état d’esprit. Vous devez décider. »

– Elon Musk

Modèles de performance

Brizawen Lab© possède une expérience forte dans la construction de modèles prédictifs via l’enrichissement des données et la sélection de critères de performances.
Pour être robustes et performants, les modèles prédictifs doivent être formés à partir de données homogènes. Ils peuvent être enrichis de données propriétaires selon les besoins du client.
Le catalogue Brizawen comprend quatre modèles d’analyses et de prédictions, validés et conditionnés et trois autres sont en cours de réalisation. Ces modèles peuvent faire l’objet d’une licence. Brizawen Lab© collabore également avec ses clients pour personnaliser son approche et réaliser un développement spécifique.

Modèle d’enrichissement des données

Ce modèle permet de constituer des ensembles des données au sein d’une même base et à partir de différentes sources :

  • Sitemap,
  • Positions de recherche quotidienne issues des bases de Google,
  • URL ciblées,
  • Positions SEO,
  • Tables de la base de données du site.

L’objectif est à cette étape pour faciliter le suivi d’établir un ciblage selon les objectifs de la société par la mise en place de requêtes préprogrammées. Quelques exemples :

  • URL de langues anglaises pour un développement du site à l’international,
  • Catégorie de publications que le client souhaite développer,
  • Développement d’une présence sur l’actualité.

Modèle de performance globale

Il s’agit d’un modèle qualitatif construit autour de 50 points de contrôle technique d’un site Web. Exemples de points de contrôles :

  • Niveau de sécurisation du site,
  • Vitesse du site web,
  • Pertinence des balises de titre et de description du site,
  • Présence de fichiers sitemap (articles, images et flux RSS),
  • Titres des images,
  • Nombre d’erreurs 404,
  • Notation Alexa,
  • Liens internes,
  • Présence d’un fichier robots.txt à la racine du site avec l’URL du sitemap.

Le résultat est une note de 1 à 50 avec une liste des points positifs, d’amélioration et des problèmes critiques à traiter en urgence.

Modèles de performance d’URL

La première étape consiste à identifier les URLs à cibler avec le plus fort potentiel d’augmentation de trafic selon les objectifs stratégiques de l’entreprise.
Une fois cette identification réalisée, il convient de mettre en place via l’analyse issue du logiciel @Seo Circles et des données enregistrées, toutes les mesures d’amélioration se rapportant à l’URL.
Le logiciel permet un suivi dans le temps afin de vérifier l’effet des actions correctrices et d’analyser les causes de l’évolution du trafic.

Modèle d’identification d’anomalies

Dans ce modèle, il s’agit d’identifier et de proposer de corriger dans la base de données du site des anomalies « types ». Ce modèle s’appuie sur de nombreuses requêtes prédéfinies.

A l’issue de l’analyse, il est proposé des requêtes SQL correctives à exécuter sur le serveur du site.

Photo of author

Pascal

De formation universitaire économique et statistiques à l’Université de Rennes, j'ai dirigé un centre de formation en informatique à Rennes durant 10 ans, puis exercé comme Directeur Financier au sein groupe EURIS à Boulogne-Billancourt (92), leadeur dans les technologies d’hébergement de données de santé.