You are on page 1of 2

026-027 1-02-2008 9:52 Pagina 26

Diario
di Rete Il commento dell’esperto
Davide Bennato, studioso di sociologia della
tecnologia, insegna all'Università "La Sapienza"

Li, dove nasce la notizia...


Dove bisogna re anni di lavoro, 45.000 blog una notizia mediante il tam-tam nologica. I primi studi sul diffu-

posizionare i sensori
di sicurezza
T indicizzati, 100 blog influen-
ti identificati, due problemi,
una metafora. Sono questi i nu-
dei blog, e capire così quali sono
le fonti da tenere sotto controllo per
avere una notizia nel minor tem-
sionismo risalgono agli Anni ’80
quando Everett Rogers (http://en.
wikipedia.org/wiki/Everett_Rogers),
meri che definiscono una delle ri- po possibile e in anteprima asso- usando la metafora del contagio,
in una rete idrica? cerche più interessanti per chiun- luta. La metafora adottata per im- capì che le idee si diffondono se-
que si occupi di marketing virale, portare questa ricerca è stata quel- guendo un percorso simile a quel-
Quali blog dobbiamo relazioni pubbliche on line, diffu- la dalla cascata, per cercare di vi- lo della propagazione una malat-
sione delle notizie, propagazione sualizzare con una immagine il tia. In questo caso l’innovatore è
leggere per non il primo “ammalato” il quale at-
perdere le notizie Le idee si diffondono seguendo


traverso lo scambio di informa-
un percorso simile a quello zioni (contagio) con altri suoi pa-
più importanti? della propagazione di una malattia ri, contribuisce alla massima cir-
Problemi diversi, ” colazione possibile delle innova-
delle idee, o semplicemente per modo con cui le informazioni cir- zioni (idee, tecnologie). Quindi, la
ma con la stessa chiunque voglia capire quali so- colano da un blog all’altro. Da qui diffusione delle novità non è sem-
no i processi alla base della cir- il nome dell’algoritmo che è stato plicemente un processo mecca-
soluzione… colazione delle notizie all’interno messo a punto dal team di Guestrin: nico, invece è un modo con cui le
della blogosfera (ma non solo). Cascades. Quello delle metafore persone rendono possibile che
Questa ricerca, dal nome Casca- usate per la rappresentazione del una idea abbia la massima diffu-
des Project ( www.blogcasca- problema, non sembri semplice- sione: è un processo sociale.
des.org), è stata sviluppata da un mente un vezzo, in quanto è la
team della Carnegie Mellon Uni- metafora adottata che consente di “Essere sulla notizia”
versity coordinato dal prof. Car- costruire un modello teorico e di Riflessioni simili hanno portato il
los Guestrin e dal suo gruppo na- conseguenza il software per cer- gruppo di CASCADES, a isolare due
to nel 2004 (in particolare Jure Le- care di verificare se l’ipotesi è cor- elementi chiave del loro problema.
skovec e Andreas Krause) e che retta (Figura 1). La tradizione di Da una parte minimizzare il tempo di
vede fra i suoi finanziatori, perso-
La diffusione delle novità


Figura 1 naggi del calibro di Intel, Micro-
Ogni layer (piano orizzontale)
rappresenta una “cascata di
soft, Hewlett-Packard, IBM. non è un processo meccanico…
è un processo sociale
informazioni”. L’algoritmo
Cascades individua Le vere fonti ”
i blog presenti in più cascate: dell’informazione studi che cerca di spiegare i pro- identificazione della notizia: in ter-
quelli che occorre consultare Lo scopo della ricerca è stato quel- cessi alla base della diffusione del- mini di teoria dell’informazione se
per controllare il maggior lo di identificare quali fossero i le idee è ben radicata nel settore si è in grado di arrivare prima su una
numero di informazioni processi attraverso cui si diffonde che si occupa di innovazione tec- notizia, si è in grado di dare un’infor-
mazione dal valore molto alto. Dal-
l’altro ridurre i costi, per esempio,
che comporta leggere molti blog o
blog con un numero molto alto di
post. La soluzione dell’algoritmo è
stata quella di ottimizzare congiun-
tamente entrambi i vincoli, ovvero
cercare di far sì che le nuove infor-
mazioni possono essere raccolte
leggendo il minor numero di blog e
il minor numero di post. Per verifi-
care sperimentalmente questa ipo-
tesi, l’algoritmo ha monitorato ben

Pagina:// 26
Marzo 2008
026-027 1-02-2008 9:52 Pagina 27

Blog&informazione Diario di Rete


45.000 blog (la cui lista completa informazioni di ben 45.000 di-
è disponibile al seguente indirizzo: versi blog. Non è questa la prima
www.cs.cmu.edu/~jure/blogs/all_blogs.ht ricerca che prova a rispondere ai
ml) per un totale di oltre 10 milio- quesiti relativi al ciclo di vita delle
ni i post e 350.000 notizie trac- notizie on line. Un altro studio al-
ciate. Così facendo hanno identifi- trettanto interessante è stato quel-
cato i blog più influenti, ovvero i blog lo condotto dal Albert Laszlo Barabasi
che se letti in modo sistematico pos- e dal suo team dell’University of No-
sono diventare delle ottime fonti per tre Dame Indiana, pubblicato nel

Bisogna far sì che le informazioni

“ possano essere raccolte leggendo


il minor numero di blog e di post
avere notizie su scoop, gossip e tut-
to quanto può essere utile non solo
per intercettare una notizia interes-
sante, ma anche per contribuire a

2006 sul Physical Review ( http://
pra.aps.org) portato all’attenzione del
grande pubblico da parte del New
York Times la scorsa estate. Bara-
diffondere una notizia importante. basi è un nome molto noto fra gli Classificazione cascade
Classificazione per numero di link provenienti da altri blog
Questi 100 blog influenti (qui la clas- studiosi della network theory (http:// Classificazione per numero di link collegati ad altri blog
sifica di CASCADES: www.cs.cmu.edu/ en.wikipedia.org/wiki/Network_theory), Classificazione per numero di post
~jure/blogs/ blogs-uc-pa.html) sono sta- ovvero la teoria che cerca di descri- Classificazione per numero di link che conducono ad altre risorse Web

Con circa 100 blog chiave si possono


Figura 2 – I primi 100 blog individuati con l’algoritmo Cascades
controllare i flussi di informazioni catturano più informazione rispetto ai primi 100 blog individuati
di ben 45.000 diversi blog con i canonici algoritmi di classificazione

ti classificati usando una metrica vere i fenomeni che avvengono in zi di comunicazione di massa. Si di- lità delle acque nelle condutture
molto particolare che prevede ca- ambienti organizzati in Rete (Inter- ceva sopra che la ricerca della Car- idriche, ma bisogna ricordare che en-
ratteristiche come: numero dei po- net, ma non solo) e autore del con- negie Mellon University è stata ap- trambi sono processi dinamici in
st pubblicati in un anno, il numero cetto di rete a invarianza di scala. plicata a due problemi. ambienti la cui struttura (topologia,
di link provenienti da altri blog, il nu-
L’acqua scorre perché deve,


mero di link collegati ad altri blog, il Effetto novità:
quanto dura? l’informazione circola perché vuole
numero di link che conducono ad
altre risorse web non-blog. Queste In maniera controintuitiva rispetto

informazioni servono per valutare all’idea che ci possiamo fare come Informazioni direbbe un matematico) è quella di
attraverso l’algoritmo le strategie di utenti di notizia on line, lo studio mo- come acqua una rete. C’è un però. È vero che
diffusione delle notizie, cercando di stra come 36 ore sia il tempo che Infatti il secondo problema a cui questi studi possono darci una ma-
identificare il percorso che porta il impiega una notizia su Internet l’algoritmo Cascades è stato appli- no per comprendere alcune dina-
più vicino possibile alla fonte della per invecchiare, ovvero il tempo cato per poterne testare la robu- miche sottese alla propagazione
notizia stessa (Figura 2). che impiega la metà dei lettori di un stezza è quello del controllo delle re- delle informazioni, ma bisogna ri-
articolo on line per leggere il testo ti di distribuzione dell’acqua. Ov- cordare che mentre l’acqua circo-
La submodularità nella sua interezza (calcolando il tem- vero la domanda a cui si è provato la nei tubi per forza di gravità, le
della Rete po intercorso tra il clic del primo a rispondere è stata: qual è il nu- informazioni circolano nei blog per
Una domanda sorge spontanea: co- utente di una notizia e il clic dell’utente mero minimo di sensori da installare “forza” della libertà (d’informazione,
me si fa con soli 100 blog ad avere la che rappresenta il 50% del totale dei in una rete di distribuzione dell’ac- per esempio), perché qualcuno ha
stessa ricchezza informativa di 45.000 lettori). Il motivo di questo tempo qua per evitare la propagazione di letto di una notizia, l’ha considera-
blog? La risposta è nel particolare piuttosto lungo di permanenza del- veleni? Come si vede dal quesito ta interessante e l’ha voluta diffon-
comportamento delle reti che pren- la notizia on line è attribuibile al fat- così formulato, ci sono delle evi- dere. Quindi, volendolo dire con
de il nome di submodularità. Con to che le persone danno molta rile- denti somiglianze con il problema una immagine, l’acqua scorre per-
questo termine si vuole dire che le re- vanza ai titoli delle news, ma solo in dell’intercettazione degli scoop nel- ché deve, l’informazione circola
ti molto ampie sono organizzate in ma- un secondo tempo dedicano alle no- la rete dei blog. E anche in questo perché vuole. È una differenza non
niera autonoma in sottoreti più pic- da poco che rende i due fenomeni
Le informazioni circolano nei blog


cole (secondo il principio detto di in- formalmente similari, ma profon-
varianza di scala: http://en.wikipe- per “forza” della libertà ” damente diversi. Ed è una cosa che
dia.org/wiki/Scale-free_network). Per- chi produce informazione non può
ciò in queste sottoreti solo pochi so- tizie di loro interesse l’attenzione caso l’algoritmo ha dato prova del- dimenticare.
no i blog che danno vita a un flusso che meritano. Perciò Internet diventa la sua efficienza. Potrebbe sem-
nuovo di notizie (ovvero le cosid- così un mondo attraverso cui acce- brare strano che un modello de- Davide Bennato
dette cascate di informazioni). Per- dere all’informazione secondo i pro- scriva in maniera soddisfacente al-
ciò con circa 100 blog chiave si pri tempi, senza essere schiavi dei lo stesso modo sia le l’informazio- Per i vostri commenti:
possono controllare i flussi di tempi a cui ci hanno abituati i mez- ni che circolano nei blog che la qua- diariodirete@edmaster.it

Pagina:// 27
Marzo 2008