Successivo » « Precedente

L’informazione generata dagli utenti è Liquida

La blogosfera produce una quantità enorme di contenuti: centinaia di milioni di articoli, fotografie e video sono continuamente caricati da milioni di persone in tutto il mondo. Solo in Italia sono emersi su Internet circa due milioni di blog,  circa un quarto di questi sono attivi.

Ogni anno i blogger Italiani caricano sul web circa 30 milioni di testi, immagini e video.  Liquida stima che circa il 3% di questi sono di qualità: ben un milione l’anno.

Un mare di informazione di qualità che però per essere realmente fruibile dai consumatori e monetizzabile con la pubblicità e l'ecommerce, deve essere prima identificata, organizzata e resa disponibile in modo strutturato.

Questo è la missione di RGB, azienda del gruppo Banzai, di cui mi pregio di essere stato tra i fondatori. E questo è lo scopo di Liquida: applicazione ideata e realizzata da un team di eccellenza: Andrea Santagata, Fabio Cabula e Paolo Ruscitti.

Ho conversato con Andrea Santagata, per fornirci qualche anticipazione sugli sviluppi futuri di Liquida: 

"in questi mesi ci siamo accorti come il valore dei contenuti dei post pubblicati dai blogger, non fosse solo nella qualità e infinita varietà dei temi trattati in ogni singolo post. Analizzando questa multiforme massa di dati, ci siamo resi conto di come si potessero estrarre importanti informazioni considerando non il singolo post ma l'insieme del contenuto prodotto. 

Mi spiego meglio, le nostre tecnologie semantiche statistiche, ci consentiranno a breve di decodificare la blogosfera come se avessimo in mano un grande termometro della società italiana sempre accesso, 24 ore su 24.

Potremmo non solo capire i temi più discussi (i così detti hot tags), ma anche il loro trend nel tempo, e analizzare il sentiment intorno a questi tag, quindi se c'è un sentito positivo o negativo intorno all'argomento. Potremo anche capire non solo di cosa "scrivono" i blogger, ma anche cosa linkano, notizie, ma anche libri, persone o siti.

Potremmo capire poi quali temi incontrano interesse in un pubblico, confrontando i tag con le parole più cercate o i post più visitati.

Tutto questo lo vogliamo rendere disponibile a breve in una apposita sezione di Liquida.

Inoltre per rendere Liquida e i contenuti in essa valorizzati, sempre più fruibili al grande pubblico della Rete, presto Liquida sarà navigabile a matrice, sia per categorie editoriali (sport, cinema etc..), sia per aree geografiche (città, regioni, stati). Tutti questo è reso possibile dall'utilizzo della semantica. Il lavoro è ancora lungo ma l'entusiasmo non ci manca."

Liquida è un termometro del nostro pensiero e un valorizzatore dei nostri contenuti. Un 'filtro' che funziona come una lente di ingrandimento sul pensiero collettivo del mezzo milione di blogger attivi oggi in Italia. 

Filtra e poi fa emergere i loro pensieri e la loro espressione organizzandola per temi, argomenti, tag e related.

Liquida si colloca in uno spazio competitivo in cui operano molti altri aggregatori di contenuti, Digg, Technorati, Delic.io.us e Wikio, ma con un focus e un metodo diversi.

Mentre Technorati definisce la qualità dei blog automaticamente in base a dati quantitativi (il numero dei cross link), Liquida opera in modo analogo a Digg. La selezione delle notizie è effettuata dando un voto (aka karma) da parte di un essere umano. Nel caso di Digg sono gli utenti stessi a decidere il karma, per Liquida è la sua redazione a fare lo screening ed assegnare un giudizio di valore sul contenuto.

La selezione delle fonti blog è effettuata dando più voti, che compongono un primo "karma" da parte di un essere umano ad ogni singola fonte. E’ un po’ come dire usare un ‘umano’ come primo decoder del valore di un’informazione che da input alla macchina semantica e assegnando un valore ‘qualitativo’ – un rating di ingresso. Un umano non solo la fa passare dal filtro, ma anche assegna al post che in questo momento sto scrivendo, una sorta di giudizio di valore e un senso leggibile dalle macchine.

Superato questo filtro i post giungono al sistema dove i computer li tritano con un motore semantico e statistico allo scopo di arricchire le informazioni in possesso per ogni post (ad esempio: categorie, entity, tag, lingua, tipologia etc..) e di attribuirne uno o più parametri di qualità.

Questo parametro di qualità è quello che, a regime,  dovrebbe garantire al visitatore un elevato grado di soddisfazione rispetto ai risultati che gli vengono proposti.

Lanciato a Luglio del 2008, nel giro di un semestre Liquida ha categorizzato 20.000 blog e 3 milioni di articoli, ma la cosa più impressionante è il successo di utenti dell’applicazione: 1,5 milioni di visitatori unici in base ai dati Nielsen, che vengono mediamente circa 3 volte al mese sul sito.   

Una delle informazioni ‘di contorno’ più interessanti che emergono da Liquida è la comprensione di quali sono i temi più popolari e discussi dai blogger. Dalle statistiche di Liquida infatti emerge una sorta di sintesi del pensiero collettivo.

Nel 2008 i temi più discussi sulla blogosfera Italiana sono stati quelli di politica interna e attualità (30%), tecnologia e web (20%), politica internazionale (10%) e sport (8%).

I due personaggi più citati sono stati Berlusconi  e Obama.

Sarà interessante quando la tecnologia semantica di Liquida comincerà ad agganciare a queste informazioni puramente quantitative, anche un dato qualitativo.

Non dovrebbe essere particolarmente complicato ad esempio collegare un giudizio positivo e negativo a tutti i post, commenti e tag che contengono la parola Berlusconi o la parola Obama: basterebbe un’analisi semantica degli aggettivi di tutti i contenuti che contengono le due parole.

Questo piccolo ‘add-on’ consentirebbe di misurare e conoscere continuamente ed in tempo reale il vero giudizio della gente sul loro operato e non quello di sondaggi e sondaggisti, troppo spesso discutibili in termini di metodologia e risultati.

Analizzando i dati attuali, e in particolare le prime dieci parole più citate del 2008 emerge che Berlusconi risulta 2,5 volte più discusso di Veltroni, che viene superato anche dal Ministro Gelmini. Seguono poi i ministri: Tremonti, Brunetta e Carfagna. Il secondo politico più ricorrente del centro sinistra rimane ancora Prodi. Sarei molto curioso di conoscere gli aggettivi collegati a ognuno di questi personaggi. Nel complesso il centro sinistra si prende la rivincita tra i partiti, con il Pd molto più citato del Pdl e  seguito dall’UDC.

Negli ultimi mesi dell’anno i temi di attualità più discussi sono stati: la riforma Gelmini, la crisi economica, la sicurezza e la criminalità, le guerre e il terrorismo. Molto spazio è riservato ai temi legati al Vaticano dove ricorrono termini come: Chiesa, il Papa, il Vaticano e la Bibbia.

Per quanto riguarda il web il nuovo  leader è Facebook, seguito da Youtube e da Google e nella tecnologia la sfida è fra Apple, il vero protagonista della Rete, e Microsoft.  Apple è molto presente sia come brand che con tutti i sui prodotti, in particolare l’iPhone, l’iPod e il Macbook. La sua leadership è combattuta con Microsoft e in particolare con i prodotti della famiglia Windows.

La classifica dei brand aziendali vede in cima Apple, seguito da Google, Alitalia per le ben note vicende, Microsoft e la Ferrari.

Lo sport è dominato dal Calcio. La parola di sport in assoluto più frequente è Milan, seguita, quasi a pari merito, da Inter. La vera star è Mourinho che supera in fama anche i calciatori. Il Milan può vantare anche il primato del giocatore in assoluto più citato Ronaldinho, mentre il calciatore italiano più citato è Totti, seguito dal Del Piero. Fuori dall’ambito calcistico la leadership spetta a Valentino Rossi.

Fra i personaggi dello spettacolo la più famosa è una donna, Maria de Filippi, che supera di poco l’altra grande presentatrice Simona Ventura. Citatissimi anche Roberto Saviano, Beppe Grillo, Vladimir Luxuria, Britney Spears e Marco Travaglio.

L’informazione oggi è Liquida, ma soprattutto il pensiero collettivo degli Italiani è sempre più visibile e accessibile. Può essere misurato, contato. Si può capire come il ‘mood’ collettivo del blogger si sta direzionando. 

Questo oggi è il pensiero dei blogger italiani. Milioni di persone. Come sarà domani?

Nelle ultime due settimane ho incontrato  altre due startup che lavorano su temi del tutto analoghi ma con angoli diversi. 

Usare la grande macchina interattiva che ci collega oggi digitalmente per conoscere e comprendere i mood delle folle. Di nazioni, di gruppi di persone, di social networks.  

Strumenti per prevedere il verificarsi di determinati eventi in base all’andamento delle comunicazioni nel loro network sociale. In Italia Human Highway ha lanciato Vedrete.

Commenti

Iniziativa davvero interessante. Riusciremo mai a liberarci dai media che ci filtrano e ci presentano le informazioni già "indirizzate"?
A mio avviso però prima di riuscire a utilizzare strumenti di web semantico per capire a 360 gradi l'opinione della gente ci mancano ancora un po' di passi:
- per quanto parecchi milioni, i blogger sono un sottoinsieme molto particolare della popolazione... difficile quindi da utilizzare come campione. C'è da dire però che questo sicuramente andrà ad attenuarsi negli anni con l'estendersi dell'uso della rete...
- Liquida: il fatto di centralizzare uno step del processo, ovvero il ranking della qualità, non è un po' contro la filosofia del "dare potere agli utenti"?
- Sarebbe interessante confrontare queste percentuali con quelle dei media tradizionali. Quello che però mi verrebbe da dire è che oggi i media tradizionali oggi hanno un potere ancora così forte in confronto ai blog, che le informazioni presenti nei blog spesso sono lo specchio di quello che dicono giornali e TV

In ogni caso, idea veramente interessante... non vedo l'ora di vederne l'evoluzione!

Ciao,
Gianluca

Davvero trovi? Secondo me i media tradizionali hanno impatto, ma sempre meno e prevalentemente su certe fasce di popolazione (diciamo over 50). Ultimamente sono usciti i dati di PEW sui media, che parlano chiaro:

http://pewresearch.org/pubs/1066/internet-overtakes-newspapers-as-news-source

Se si chiede alla nuova generazione di digital natives, un media non manipolabile è per loro un non-sense, noioso e decisamente poco comprensibile:

http://gianlucadettori.nova100.ilsole24ore.com/2008/12/interviste-a-na.html

Ho visto il video... però poi alla fine ammette "We are only at the very beginning of a revolution in the telecom and media space".
Siamo tutti d'accordo che c'è una trasformazione in atto, ma a che punto siamo?
E per il primo articolo che dice che internet ha superato i giornali: cosa hanno messo dentro la categoria internet? Perchè se c'è anche l'equivalente americano di corriere.it, mi sembra più una questione di mezzo che di new media (anche se quando c'erano le manifestazioni studentesche corriere.it doveva mettere i link a youtube per fare vedere cosa stava realmente accadendo!!)

Scrivi un commento