Web Intelligence Reputation: Percezione del Web

Indubbie sono le utilità che il web offre agli utenti ed in particolar modo alle aziende: è possibile diffondere informazioni di tipo commerciale e quindi promuovere prodotti e servizi ovvero venderli. Peraltro poiché internet è una percezione fedele della realtà, ogni impresa, attraverso una analisi delle notizie pubblicate, sarà in grado di valutare come è vista dal mercato, e ciò si traduce in un forte vantaggio dal punto di vista competitivo: attraverso la ricerca in rete, l'azienda potrà infatti intervenire sulla propria immagine in termini di marketing ovvero più semplicemente di miglioramento della qualità e delle caratteristiche dei suoi prodotti.

Un Nuovo Metodo nell'Analisi dei Dati

Il computer è una macchina dotata di intelligenza artificiale, quindi in grado di svolgere funzioni e ragionamenti tipici della mente umana; per rendere più agevole l'analisi dei testi è auspicabile che venga spostata sul pc quella capacità di studio ed interpretazione che ogni individuo sviluppa nel corso della vita scolastica.

Il processo di comprensione dei dati avviene attraverso quattro livelli differenti di analisi del testo:

  1. analisi grammaticale: consente di associare ad ogni parte di testo la sua connotazione grammaticale (verbo, aggettivo, sostantivo, articolo...), rimuovendo le ambiguità lessicali;
  2. analisi logica: riconosce il ruolo che gruppi di parole hanno all'interno del testo e risponde alle domande dove, come, quando, chi...;
  3. analisi semantica: consente di assegnare un significato alla struttura sintattica corretta e, di conseguenza, all'espressione linguistica, eliminando le ambiguità semantiche;
  4. analisi di sentiment: consente di determinare la polarità di un contenuto riguardante un soggetto, un prodotto, un brand (positiva, neutra, negativa).

Successivamente, attraverso le tecniche di clustering, sarà possibile classificare i differenti commenti per gruppi (ad esempio lamentele o suggerimenti), creando in tal modo nuove chiavi di interpretazione dei dati.

Knowledge Mining: un nuovo Approccio Metodologico

Questo nuovo approccio all'interpretazione dei dati consta di due fasi:

  1. fase mining: prendere in considerazione i testi di interesse come fossero una miniera da esplorare;
  2. fase knowledge: individuare, tra le tante, le informazioni realmente di rilievo e le relazioni rimaste inizialmente occultate.

L'approccio prevede l'utilizzo di un crawler, un software che analizza i contenuti della rete in maniera metodica e automatizzata, inserendoli in un indice: analizza quindi tutti i dati reperiti e, al fine di comprenderne il significato, li suddivide per pertinenza e rilevanza. L'importanza di un'informazione rispetto ad un'altra non è individuata sulla base della presenza o meno di una certa parola chiave: tutto dipende dalla contestualizzazione di una notizia e dalla sua comprensione automatica.

Il procedimento del knowledge mining, che consente di reperire i dati presenti in rete e interpretarli dal punto di vista qualitativo, quantitativo e di sentiment reputazionale, è così riassumibile:

  • Studio del contesto, allo scopo di selezionare i dati presenti sul web in linea rispetto all'oggetto della ricerca;
  • Esplorazione del web, mediante un crawler: studio dei contenuti, separazione e catalogazione di quelli pertinenti;
  • Interpretazione dei contenuti sotto il profilo quantitativo e qualitativo;
  • Decodificazione della polarizzazione: valutazione dal punto di vista della qualità dei dati raccolti, attraverso il riconoscimento delle risultanze attese e inaspettate.

Note sulla Riservatezza delle Informazioni

Tutte le informazioni raccolte all'interno del presente report, frutto dell'elaborazione di post in blog, in forum, su social network o articoli giornalistici, hanno provenienza pubblica, ed in quanto tali sono a chiunque accessibili.

Report SMALL

Fonti Interrogate:
fonti aperte (internet, principali motori di ricerca, social networks)

Output:
  • Negativo: "non si rilevano notizie di interesse riferite al soggetto"
  • Positivo: breve raccolta delle evidenze rinvenute in formato grafico con link alla fonte.
Tempi di Evasione: 3/5 gg.

Report MEDIUM

Fonti Interrogate:
  • fonti aperte (internet, principali motori di ricerca, social networks)
  • rassegna stampa su oltre 4.000 testate nazionali e locali pubblicate in un arco temporale fino a dieci anni (es. 2004-2014)
Output:
  • Negativo: "non si rilevano notizie di interesse riferite al soggetto"
  • Positivo:
    • raccolta delle evidenze rinvenute in formato grafico con link alla fonte.
    • copia dell'articolo/i e dettaglio della testata giornalistica di riferimento.
Tempi di Evasione: 5/7 gg.

Report LARGE

Fonti Interrogate:
  • fonti aperte (internet, principali motori di ricerca, social networks)
  • rassegna stampa su oltre 4.000 testate nazionali e locali pubblicate in un arco temporale fino a dieci anni (es. 2004-2014)
  • elementi pregiudizievoli di carattere riservato provenienti da attività di intelligence (corredate di eventuali interviste di taglio giornalistico)
Output:
  • Negativo: "non si rilevano notizie di interesse riferite al soggetto"
  • Positivo:
    • raccolta delle evidenze rinvenute in formato grafico con link alla fonte.
    • copia dell'articolo/i e dettaglio della testata giornalistica di riferimento.
    • cenni puntuali alla tipologia di pregiudizievoli emerse.
Tempi di Evasione: 8/12 gg.