Réputation en Termes d'Intelligence Web

Les services utilitaires fournis par internet aux utilisateurs et plus particulièrement aux entreprises sont incontestables: le web permet de diffuser des informations de nature commerciale et donc de promouvoir des produits et services et de les vendre. De plus, sachant qu'internet fournit une perception fidèle de la réalité, chaque entreprise, à travers une analyse des nouvelles publiées, est alors en mesure d'évaluer comment le marché la perçoit, et cela se traduit par un fort avantage en termes de compétitivité. En effet, grâce à une recherche sur le web, la société pourra intervenir sur son image marketing ou tout simplement améliorer la qualité et les caractéristiques de ses produits.

Une Nouvelle Méthode pour l'Analyse des Données

L'ordinateur est une machine dotée d'intelligence artificielle, et est donc en mesure d'exécuter des fonctions et des raisonnements typiques de l'esprit humain. Afin de faciliter l'analyse des textes, il est souhaitable que la capacité d'étude et d'interprétation développée par chaque individu durant son parcours scolaire soit donc transférée à un ordinateur.

Le processus de compréhension des données est effectué à travers quatre niveaux différents d'analyse du texte:

  1. analyse grammaticale: cette analyse permet d'associer une connotation grammaticale à chaque morceau de texte (verbe, adjectif, nom, article...), permettant ainsi d'éliminer l'ambiguïté lexicale;
  2. analyse logique: cette analyse reconnaît le rôle des groupes de mots au sein du texte et répond aux questions où, comment, quand, qui...;
  3. analyse sémantique: cette analyse attribue un sens à la structure syntaxique et correcte, et par conséquent, à l'expression linguistique, éliminant ainsi les ambiguïtés sémantiques;
  4. analyse de sentiment: cette analyse permet de déterminer la polarité d'un contenu sur un sujet, un produit, une marque (positive, neutre, négative).

Par la suite, et par le biais de techniques de clustering ou regroupement, il sera possible de classer les différents commentaires par groupes (par exemple plaintes ou suggestions), créant ainsi de nouvelles clés d'interprétation des données.

Exploration des Connaissances : Une Nouvelle Approche Méthodologique

Cette nouvelle approche d'interprétation des données se compose de deux phases :

  1. phase d'exploration: il s'agit de tenir compte des textes comme s'ils étaient une mine à explorer;
  2. phase de connaissance: il s'agit ici d'identifier les informations véritablement importantes et les relations initialement occultées parmi les nombreuses à disposition.

L'approche prévoit l'utilisation d'un crawler, soit un logiciel d'analyse des contenus du réseau de manière méthodique et automatisée, en leur appliquant un ratio : il procède donc à l'analyse de toutes les données recueillies et, afin d'en comprendre le sens, les classe par degré de pertinence et d'importance. L'importance d'une information par rapport à une autre n'est pas déterminée en fonction de la présence ou non d'un certain mot-clé : tout dépend du contexte de l'information et de sa compréhension automatique.

Le processus d'extraction des connaissances, permettant de mettre la main sur des informations disponibles sur internet et de les interpréter en termes de qualité, quantité et sentiment de réputation, pourrait se résumer ainsi:

  • Étude du contexte, dans le but de sélectionner les données présentent sur le web en relation avec l'objet de la recherche;
  • Exploration du web, par le biais d'un logiciel de type crawler: étude des contenus, séparation et classification des contenus pertinents;
  • Interprétation des contenus en termes de quantité et de qualité;
  • Décodage de la polarisation: évaluation des informations recueillies du point de vue qualitatif, grâce à la reconnaissance des résultats attendus et inattendus.

Notes sur la Nature Confidentielle des Informations

Toutes les informations figurant dans le rapport, issues du traitement d'informations postées sur des blogs, dans des forums, au sein des réseaux de socialisation ou dans d'articles de journaux, relèvent du domaine public et sont donc accessibles à tous.

Report SMALL

Sources consultées:
sources ouvertes (internet, principaux moteurs de recherche, réseaux de socialisation)

Résultat:
  • Négatif: "aucune information d'intérêt concernant le sujet n'a été relevée."
  • Positif: des éléments au format graphique avec liens à la source ont été rapidement détectés.
Délai d'Exécution: 3/5 jours

Report MEDIUM

Sources consultées:
  • sources ouvertes (internet, principaux moteurs de recherche, réseaux de socialisation)
  • revue de presse sur plus de 4.000 journaux nationaux et locaux publiés dans un arc de temps allant jusqu'à dix ans (par exemple 2004-2014)
Résultat:
  • Négatif: "aucune information d'intérêt concernant le sujet n'a été relevée."
  • Positif:
    • des éléments au format graphique avec liens à la source ont été détectés.
    • copie d'article(s) et informations sur le journal de référence.
Délai d'Exécution: 5/7 jours

Report LARGE

Sources consultées:
  • sources ouvertes (internet, principaux moteurs de recherche, réseaux de socialisation)
  • revue de presse sur plus de 4.000 journaux nationaux et locaux publiés dans un arc de temps allant jusqu'à dix ans (par exemple 2004-2014)
  • éléments préjudiciables de nature confidentielle issus d'activités de renseignements (appuyés par d'éventuelles interviews de journalistes)
Résultat:
  • Négatif: "aucune information d'intérêt concernant le sujet n'a été relevée."
  • Positif:
    • des éléments au format graphique avec liens à la source ont été détectés.
    • copie d'article(s) et informations sur le journal de référence.
    • signes ponctuels relatifs au type d'acte préjudiciable détecté.
Délai d'Exécution: 8/12 jours