You are on page 1of 5

See

discussions, stats, and author profiles for this publication at: https://www.researchgate.net/publication/280491337

Big data e jornalismo: datasets, APIs,


algoritmos e sensores
Article July 2015

READS

29

1 author:
Walter Teixeira Lima Junior
University of So Paulo
35 PUBLICATIONS 7 CITATIONS
SEE PROFILE

Available from: Walter Teixeira Lima Junior


Retrieved on: 11 April 2016

27/07/2015

ComCinciaSBPC/Labjor

REVISTAELETRNICADEJORNALISMOCIENTFICO

Dossi

Anteriores

Notcias

HumorComCincia

Dossi

QuemSomos

Faleconosco

Editorial

Artigo

Parboladocodigital
CarlosVogt

Bigdataejornalismo:datasets,APIs,algoritmose
sensores

Reportagens
Computaocognitiva:
capturandocoraes,
mentesepaladares
RobertoTakata
Memriaartificial:
sobredados,vigilantes
evigiados
KtiaKishi
BigDatatraz
demandasgrandes
sade
PatrciaSantos
Aartequetrafegaem
dados
JananaQuitrio

Artigos
Cinciadedados:
desafioparaacincia,
indstriaegoverno
ArturZiviani,FbioPorto
eEduardoOgasawara
Bigdataejornalismo:
datasets,APIs,
algoritmosesensores
WalterTeixeiraLima
Junior
Bigdataeas
capacidadesdegesto
dainformao
AntnioCarlosGastaud
Maada,RafaelAlfonso
Brinkhues,JosCarlos
FreitasJnior
Representaoe
anlisededados
espaotemporais
KarineReisFerreira
Ocudosrobs
AnaPaulaZaguetto

Resenha
Decifrandocdigos
FabianaMicaeleSilva

Entrevista
DaniloDoneda
EntrevistadoporSarah
Schmidt

Poema
Campeo
CarlosVogt

PorWalterTeixeiraLimaJunior
10/07/2015
O crescimento do uso de dados digitais, nos processos de produo de jornalismo,
coincide com o barateamento das tecnologias digitais conectadas, com o aumento da
capacidade de processamento de dados por mquinas computacionais (servidores, PC
s, notebooks, celulares, tablets, ebooks etc) e com a criao de sistemas
tecnologicamente amigveis para acesso, manipulao, visualizao e distribuio de
dados.
Em tempos de conexes infinitas entre tecnologias digitais emergentes e prticas
jornalsticas,onmerodeexperimentosnareatemaumentadodeformaexponencial,
estruturando um novo ecossistema informacional. Nesse ambiente, misturamse
apostas oriundas de grandes empresas tradicionais de mdia e incontveis criaes
produzidas por startups, formando campos de batalha para conquistar a ateno e
consumoinformativodaaudincia.
O big data representa nova oportunidade para os profissionais da informao de
relevncia social e para empresas de mdia. Novos modelos de negcio so e sero
originados, abrindo novas oportunidades para o trabalho de jornalistas que lidam com
dados.
Nesse sentido, preciso redesenhar o escopo profissional do produtor de informao
derelevnciasocial,ojornalista.Poisnosetratadesomentedecolocarnovasformas
deseproduziremanipulardadosemvelhosprocessoseprticasjornalsticas,mesmo
quesejamvencedoras ao longo do tempo. A prtica repetida de se encaixar frmulas
de sucesso (analgico > digital) acontece desde o surgimento das redes
computacionais, como a web, e escamoteada, na atualidade, em virtude da grande
profusodeinovaestecnolgicasdigitaisconectadas,quetrazemumardenovidade,
mas na estrutura carregam as mesmas caractersticas do velho e bom jornalismo
tradicional.
Depois de anos metaforizando prticas jornalsticas consolidadas nos veculos
impressos e eletrnicos em ambientes digitais, como a web, empresas e profissionais
de jornalismo comeam a experimentar a fora do uso de dados digitais. Bancos de
dados so utilizados para formatar sistemas comunicacionais embarcados em
interfaces adaptadas, visualizadas e acessadas por intermdio de inmeros tipos de
dispositivos de conexo. Novas plataformas so criadas e interessantes narrativas
jornalsticassurgem,tendocomobaseousoeinterligaescomsistemasdedados.
Entretanto, a cultura do uso de dados no jornalismo ainda est bastante alinhada ao
queconhecemoscomoComputerAsssitedReporting(CAR),tcnicasurgidanofinaldos
anos 1960, nos EUA, quando o jornalista Philip Meyer, do Detroit Free Press, acessou
um computador mainframe para descobrir relaes entre dados nele contidos e
produziramatriasobredistrbiosemDetroit.Desde ento, os jornalistas pensam na
utilizao de dados digitais para elaborao de material jornalstico, sejam matrias,
infogrficosouservios.
Essetipodeabordagemfoie,realmente,grandesaltoemrelaoaosprocedimentos
clssicosdeobtenoeanlisedeinformaesparaproduodecontedoinformativo
de relevncia social. No incio era o CAR, hoje em dia, o jornalismo de dados (data
journalism). No importa a nomenclatura, o ataque aos dados uma tima maneira
de encontrar relaes noaparentes e embasar com dados os contedos jornalsticos,
fortalecendoacredibilidadedamatria.NoBrasil,porexemplo,quemusaessetipode
tcnica muitas vezes relacionado ao trabalho realizado pelo denominado jornalismo
investigativo, no qual Phillp Meyer um dos precursores no uso de dados digitais na
composiodassuasmatrias.

http://www.comciencia.br/comciencia/?section=8&edicao=115&id=1385

1/4

27/07/2015

ComCinciaSBPC/Labjor

Autilizaodedadosdigitais,deferramentas,deserviosconectadosparaacaptao,
anlise e visualizao de dados com o objetivo da elaborao de matrias para
publicaoemmdiasditas tradicionais, portais e/ou blogs, uma postura profissional
que coaduna com as exigncias informativas da sociedade contempornea, que
tambm emissora de informaes e composta por indivduos capazes de se
apropriarem das tecnologias digitais conectadas em nveis mais profundos e
sofisticados.
Prticatardia no Brasil, pois, como visto, desde o final dos anos 1960 profissionais do
jornalismo, principalmente nos EUA, j comeavam a utilizar a tcnica do CAR para
enriquecer suas matrias. O jornalismo de dados possui ligaes com o mundo dos
dados digitais, mas tem como objetivo, na maioria dos casos, produzir narrativas
tradicionaisdojornalismo.
Temos aqui, ento, a conexo entre o universo dos dados digitais e as prticas
tradicionais, mencionadas por Jack Fuller, no livro What is happening to news: the
informationexplosionandthecrisisinjournalism,enquadradasnoqueeledenominade
modelo padro de jornalismo tradicional. Para o pesquisador, o modelo foi
consolidadoemprticasquetiverambasetecnolgicaanteriorstecnologiasdigitais.
Dessaforma,asnarrativasobtidasestointrinsicamenteligadassbasestecnolgicas
em que elas so formatadas. Durante anos, e at hoje, se observam crticas sobre a
metaforizao de modelos de negcios e contedos contidos em plataformas
impressaseeletrnicasparaasmdiasdigitais.
Entretanto, o universo tecnolgico apresentado pelo surgimento da era denominada de
big data mais do que essas apropriaes do jornalismo tradicional em funo da
disponibilidadedebasesdigitais.
Big data referese ao conjunto de dados (dataset) cujo o tamanho est alm da
habilidade de ferramentas tpicas de banco de dados capturar, gerenciar e analisar. A
definiointencionalmentesubjetivaeincorporaumadefinioquesemovedecomo
umgrandeconjuntodedadosnecessitaserparaserconsideradobigdata.
Adefiniomaisstrictosensudescrevebigdatacomograndevolume,altavelocidade,
e/ou alta variedade de ativos de informao que requerem novas maneira de
processamentoparapossibilitarumamelhortomadadedeciso,descobertadeinsights
e processos de otimizao. Adicionalmente, veracidade e valor so adicionados por
algumasorganizaesparadescrevla.
Maisqueumconjuntodedados,bigdataumconjuntodetcnicasetecnologias para
"atacar" grande quantidade de dados sem precisar processar bases de dados
completamente.
Portanto, quando se menciona o conceito de big data, se aponta para o conjunto de
tcnicas e tecnologias de ataque grande quantidade de dados, objetivando encontrar
padres notriviais informativos, criar transparncia, habilitar descobertas
experimentais, originar segmentaes informativas, substituir e auxiliar processos de
decisoeinovarpormeiodenovosmodelosdenegcios.
Ou seja, anlise de redes sociais pode ser considerada como uso de big data ou no.
Isso depender de como feita a captao, o processamento, a anlise dos dados e
comoelesseroutilizadosemrelaoaoutrossistemas.Ouseja,seusarmossoftware
que se conecta Application Programming Interface (API) disponibilizada pelo Twitter,
comobjetivo,porexemplo,desaberquaishastagse/oupalavrasforammaisutilizadas
ou quantos tweets foram mais retutados, essa ao no pode ser considerada como
big data, apesar de utilizar milhares de dados digitais. Entretanto, por exemplo, se
pegarmos esses mesmos dados e cruzarmos com outros datasets oriundos do
Instagram e Facebook, para conhecer um determinado padro de consumo, que ser
utilizadoparatomadadedecisodeumadeterminadaempresa,essaoperaomuito
mais complexa, pois sero utilizadas algumas tcnicas e tecnologias para tentar obter
umresultadonotrivial.
Paraqueissoacontea,deveroserutilizadasalgumastcnicasetecnologiasdeforma
combinada, que constituiro um toolkit, em funo dos objetivos a serem alcanados.
Assim, quando se confunde os processos de big data como somente o uso de grande
quantidade de dados digitais, perdese a noo das enormes possibilidades abertas
paraojornalismonessanovaeranocampodainformao.
Nesse sentido, os profissionais do jornalismo deveriam compreender que no basta
utilizardadosdigitaisemgrandequantidadeemanterasmesmasprticas contidas no
padrotradicionaldejornalismoparasaborearaspossibilidadesimpetradaspelaera
do big data. Para perceber as oportunidades e permitir a construo de sistemas que
http://www.comciencia.br/comciencia/?section=8&edicao=115&id=1385

2/4

27/07/2015

ComCinciaSBPC/Labjor

possam ser inovadores na rea, premente, primeiro, que os profissionais que


desejam lidar com informao de relevncia social e tcnicas e tecnologias utilizadas
no big data tenham entendimento que a Cincia da Computao considerada,
atualmente,umdomniocientficohumano.Ouseja,almdasCinciasExatas,Cincias
Biolgicas, Cincias Humanas e outras categorizaes cientficas, a Cincia da
Computao atingiu o status de campo devido a sua importncia para os avanos em
outros campos cientficos. Podese citar o Projeto Genoma, nas Cincias Biolgicas, e
anlise de comportamento coletivo nas redes sociais, nas Cincias Humanas. Nas
Exatas,aCinciadaComputaotornouse uma parceira inseparvel, pois se originou
ali.
Na rea do jornalismo, a Cincia da Computao no pode ser entendida apenas
como produtora de programas que facilitam a vida do jornalista para a obteno de
dadosparaproduodematriasinvestigativasou/evisualizaodasmesmas.Afora
das Cincias da Computao, com certa razo, sentida na eficincia dos seus
dispositivos, mas a fora mesmo est nas lgicas computacionais embarcadas nos
sistemasproduzidos.
Assim,entendercomofuncionam,quaisosseuspropsitosiniciais,deondesurgiram e
quais as tecnologias que esto estruturando a era do big data, deve ser um caminho
paraqueoprofissionaldejornalismopossaextrairvalordela.
Dotar o profissional de jornalismo de competncias para que possua pensamento
computacional, ou seja, entendimento das lgicas contidas nas tecnologias digitais,
ajudar na construo de contedos e sistemas jornalsticos de forma diferenciada do
propostopelomodelopadrodejornalismotradicional.
Nessepropsito,oprofissionalnecessitaformalizarcomputacionalmenteasabstraes,
ajudando o pessoal das Cincias da Computao a formalizar os objetivos a partir do
entendimentodastecnologiasqueformamobigdata.
Para Jannete Wing, pensamento computacional usar a abstrao e decomposio
quando se ataca uma grande tarefa complexa ou se desenha um grande sistema
complexo. Para a pesquisadora, a separao de preocupaes (interesses),
escolhendo uma apropriada representao do problema, ou seja, modelar os aspectos
relevantes de um problema e fazlos tratveis. Assim, entender as lgicas
computacionais das tecnologias digitais conectadas para elaborar design thinking
(moldagem)passaaserumatributoessencialparaaprticajornalsticarelacionadaao
trabalhocomdadosdigitais.
Entretanto, se o profissional de jornalismo desejar obter conhecimento aprofundado
sobre programao, seu nvel de interao lgica com os profissionais da Cincia da
Computaoaumentareproporcionarotimizaodetempoedeprojetos.
Alm das lgicas de programao, aconselhvel entender o funcionamento e acesso
de datasets. Dataset denominado como uma coleo de dados que contm unidades
de dados individuais, organizada (formatada) numa forma especfica e acessados por
ummtodoespecifico,baseadonaorganizaodoconjuntodedados.
importante conhecer como acessar APIs pblicas e negociar com os proprietrios de
datasets que disponibilizam suas APIs privadas. As APIs fornecem a possibilidade de
mquinassecomunicaremcommquinas(interoperabilidadetecnolgica),criarformas
de obteno de consumidores de contedo jornalstico, criar valor (monetrio),
interligar seus datasets com outros dataset (parceiros ou open) e, principalmente,
fornecer contedo modelado individualmente (tailored), permitindo ao usurio uma
experincianicaemrelaoaocontedorecebido.OusodeAPIspermitemaconexo
informativa entre vrios servios digitais, funcionando por meio de pontes
interconectadasdemetadados.Ouseja,possibilitaquedatasets"conversem"entresi.
J para compreender como utilizar algoritmos em datasets para a descoberta de
padres notriviais informativos ou extrapolar para outros eventos relacionados
compreenso de certos fenmenos encontrados, necessrio que o profissional de
jornalismo entenda que o algoritmo, como tecnologia, possui como propsito o uso de
umasequncia de bem definidos passos e instrues para gerar categorias para filtrar
informaobaseadaemcombinaesdemotivossobreumresultadodesejvel.
Contudo,almdearmazenardadoseanalislos,oprofissionaldejornalismopossui a
chance de extrair dados por meio de sensores, possibilitando que se criem datasets
comdadosfornecidoseles.Porexemplo,conectadosaquestesqueenvolvemomeio
ambiente,comoparaamediodenveisdepoluiodoaroudagua.
Nesse mesmo campo, de extrao de dados do ambiente, podemse usar as
tecnologias criadas a partir de tecnologias derivadas do Geolocation Information
http://www.comciencia.br/comciencia/?section=8&edicao=115&id=1385

3/4

27/07/2015

ComCinciaSBPC/Labjor

System(GIS)paraobtenodedadosgeolocalizadosoudadosoriundosdedrones.
Portanto, a era do big data mais do que o senso comum de que somente uma
grande quantidade de dados. A era do big data uma estrutura de obteno de
informaes com muitas possibilidades de armazenamento, conexo, anlise,
distribuio e visualizao, e para retirar valor devese se aprofundar sobre as
tcnicasetecnologiasqueemergememtornodessanovaerainformativa.
WalterTeixeiraLimaJunior docente do Programa de Psgraduao Universidade
Metodista de So Paulo. Psdoutorando do Departamento de Engenharia Mecatrnica
daUSP.PesquisadorcolaboradordoCentrodeMatemtica,ComputaoeCognio da
UFABC.www.walterlima.net

http://www.comciencia.br/comciencia/?section=8&edicao=115&id=1385

4/4

You might also like