You are on page 1of 20

Gerao de textos jornalsticos por software:

a estrutura de organizao do lead traduzida em cdigo 1

Mrcio Carneiro dos Santos2

Resumo: Descreve-se o experimento de construo de um software capaz de gerar leads e


ttulos jornalsticos de forma automatizada a partir de informaes obtidas na internet. A
possibilidade terica j prevista por Lage no final do sculo passado baseia-se na estrutura
simples e relativamente rgida desse tipo de construo narrativa, o que facilita a
representao ou traduo da sua sintaxe em termos de instrues que os computadores
possam executar. Discutem-se tambm as relaes entre sociedade, tcnica e tecnologia,
fazendo um breve histrico sobre a introduo das solues digitais nas redaes
jornalsticas e seus impactos. O desenvolvimento foi feito com a linguagem de programao
Python e a biblioteca NLTK- Natural Language Toolkit e usou os resultados do Campeonato
Brasileiro de Futebol de 2013 publicados em portal da internet como fonte de dados.

Palavras-chave: Narrativas Automatizadas. Jornalismo online. Python. Inteligncia artificial.


NLTK.

1
Artigo enviado na modalidade Comunicao Oral
2
Professor Adjunto do Departamento de Comunicao Social da UFMA na rea de Jornalismo em Redes
Digitais. Doutor pela PUC-SP do programa de Tecnologias da Inteligncia e Design Digital TIDD, Mestre em
Comunicao pela UAM-SP, Especialista em Marketing pelo ISAN-FGV-Rio. Coordenador do LABCOM
(www.labcomufma.com). Email: mcszen@gmail.com.

1
1 INTRODUO O MEDO E O FASCNIO DAS MQUINAS

Apesar de simplificadora, a verso dualista das relaes entre homens e tecnologia


ainda hoje utilizada. Problematizando a neutralidade da tcnica no mundo, que existiria
apenas como instrumento impessoal, moldado pelas mos de seu utilizador, fica difcil no
pensar nas complexas imbricaes entre os aspectos culturais, econmicos, sociais e
tecnolgicos, em dado momento histrico e lugar. Tal situao nos leva a um amplo
espectro de possibilidades com perspectivas naturalsticas, humansticas, crticas e
tecnicistas, incluindo ai as posies mais extremadas dos que temem ou defendem as
solues tecnolgicas.

Sejam prometeicos ou fusticos (RDIGER, 2007), apocalpticos ou integrados (ECO,


2006), ciberiluministas ou neoluditas3, muito esforo tem sido dedicado por reas como a
da Filosofia da Tecnologia e afins para discutir a questo, que se inicia com o conceito de
tcnica.

importante ressaltar as diferenas entre tcnica e tecnologia. Enquanto a


primeira j fazia parte das discusses dos filsofos gregos, a ltima efetivamente comea a
constituir-se, ainda que de forma embrionria, no Renascimento, a partir da juno da
cincia aplicada e do objetivo, naquele momento, cada vez mais claro, de dominar a
natureza a partir da razo.

Para entender a diferena preciso voltar cerca de cinco sculos antes do incio
da era crist. A tekhn dos gregos segundo Lemos (2002) estava intimamente ligada s
aes prticas cobrindo uma ampla faixa de atividades que iam dos ofcios mais simples
baseados em trabalhos manuais at s artes e medicina. Era tekhn, portanto, tudo
aquilo produzido pela ao do homem num contraponto ao que era gerado pela natureza.

3
A ideia do ciberiluminismo est relacionada viso extremamente positiva e s vezes at ingnua sobre a
relao entre tecnologia e seres humanos, representada normalmente por suas caractersticas inovadoras,
gerando transformaes capazes de criar um mundo melhor e mais justo. J o ludismo vem de Ned Ludd,
supostamente, operrio que liderou um movimento que pregava a destruio das mquinas nas tecelagens
inglesas porque essas reduziam os postos de trabalho. Alguns autores citam Ludd como um personagem
criado pelo movimento operrio da poca para facilitar a propagao da campanha contra a automatizao
do processo fabril no incio da Revoluo Industrial.

2
Essa primeira dicotomia na Grcia de Plato e Aristteles trazia um julgamento de
valor bem definido: o fazer da natureza era superior porque permitia a possibilidade de
gerar a si mesmo, de atravessar a fronteira entre a ausncia e a presena, de forma
independente. A herana divina e, por isso mais pura, fazia da phusis, o princpio da
gerao das coisas naturais, superior tekhn, sempre algo inferior, sem a capacidade da
auto-poises, ou seja, da auto-reproduo.

Se as origens da tcnica repousam na antiguidade, o conceito de tecnologia veio


bem depois. Ensina-nos Lemos (2002) que a tecnologia a tcnica moderna, muito
distante do imaginrio da antiguidade e liberta dos seus laos com o divino. Pelo contrrio,
a tcnica que, baseada na razo e no desenvolvimento cientfico, na fsica newtoniana,
na matemtica cartesiana e no empirismo, transforma a natureza em objeto de livre
conquista (LEMOS, 2002, p. 45).

Para Rdiger (2007, p. 175) a tcnica , em essncia, uma mediao do processo


de formao da vida humana em condies sociais determinadas. J a tecnologia

o conhecimento operacional que designamos pelo termo tcnica


enquanto se articula com a forma de saber que chamamos cincia,
atravs da mediao da mquina e, potencialmente, em todas as reas
passveis de automatizao, conforme define o tempo que a criou, a
Modernidade (RDIGER, 2007, p. 186).

Se para Heidegger, a tcnica um modo de existncia do homem no mundo, a


partir da modernidade, esse existir tomar um rumo direto de agresso natureza, agora
sujeita ao conhecimento humano e ideia de um progresso linear, constante e que no
podia ser parado. Para muitos, como Sennett (2009), abre-se aqui a caixa de Pandora, a
deusa da inveno enviada por Zeus terra e que para os gregos representava tambm a
cultura das coisas produzidas pelo homem, atravs das quais este poderia causar danos a
si mesmo.

Os grandes conflitos mundiais da primeira metade do sculo XX, o nazismo e o


pesadelo da guerra fria e da ameaa nuclear materializaram os piores sonhos dos gregos

3
num mundo que, em tese, deveria ser mais evoludo justamente pela existncia da
tecnologia.

Nos ltimos trs sculos a Filosofia da Cincia ocupou muitos pensadores, mas s
no sculo XX, a partir de eventos como a bomba atmica em Hiroshima e Nagasaki e
posteriormente as preocupaes com as mudanas climticas, a poluio gerada pelo
desenvolvimento industrial e a manipulao gentica com a possibilidade, mesmo que
terica, da clonagem de seres humanos que esse cenrio comeou a mudar e a produo
sobre uma Filosofia da Tecnologia passou a tomar corpo.

A intensidade e a velocidade das mudanas econmicas e sociais nas ltimas


dcadas, de alguma forma, ligadas ao desenvolvimento tecnolgico, deram a esse campo
um interesse com crescimento exponencial e uma diversidade de correntes e enfoques.

Em 1976 foi fundada a Sociedade para a Filosofia e a Tecnologia (SPT), segundo


sua prpria pgina pblica na internet (THE SOCIETY FOR PHILOSOPHY AND TECHNOLOGY,
2014), uma organizao internacional independente que estimula, d suporte e intermedia
discusses filosficas relevantes sobre tecnologia.

As possibilidades de pensar as relaes entre sociedade e tecnologia deram


origem a novos campos como o que hoje conhecemos como Science and Technology
Studies (STS). Nele pensadores como Castells (1999) e Feenberg (2002) tm se dedicado a
formular um cenrio compatvel com os desafios de estudar uma relao obviamente
multifacetada e complexa.

Em sua crtica a vises simplistas sobre o papel da tecnologia no mundo de hoje,


Feenberg nos prope inicialmente uma espcie de mapeamento das posies
normalmente apresentadas e a partir delas tenta incorporar questes como democracia,
poder e liberdade, como fatores tambm importantes a considerar nas discusses dos STS.

Na cartografia de Feenberg (2002) das sociedades modernas a tecnologia ocupa


um lugar de destaque entre as fontes de poder que se articulam no meio social. Para ele,
as decises polticas que definem muitos dos aspectos da nossa vida cotidiana so
direcionadas pela influncia dos controladores dos sistemas tcnicos, sejam eles das

4
grandes corporaes, militares ou de associaes profissionais de grupos como fsicos,
engenheiros e mais recentemente, poderamos sugerir tambm, desenvolvedores de
software.

Ao fazer tal constatao o autor se remete ao pensamento de Marx que j no


sculo XIX criticava a ideia de que a economia pudesse ser apenas regida por fatores extra
polticos, atravs de leis com a da oferta e da procura. Do mesmo modo, imaginar o papel
da tecnologia sem avaliar as diversas relaes que ela estabelece com a sociedade pode
implicar numa viso reduzida do problema.

Num caminho semelhante crtica marxista de uma economia regulada por uma
ordem natural e inexorvel, Feenberg (2010) relativiza a racionalidade da tecnologia a
partir da constatao de que sua gnese e desenvolvimento acontecem no mundo dos
homens e, por isso, tambm so influenciadas por ele.

Criao tcnica envolve interao entre razo e experincia.


Conhecimento da natureza necessrio para fazer um equipamento que
funcione. Este o elemento da atividade tcnica que consideramos como
racional. Mas o equipamento deve funcionar num mundo social e as lies
da experincia nesse mundo influenciam o design (FEENBERG, 2010, p.
17)4.

Se no campo da Filosofia amplo o debate, o cinema ao longo de dcadas tem


traduzido esse imaginrio de medo e fascnio em diversos filmes onde as solues
tecnolgicas so representadas por robs, autmatos, mquinas e at sofisticados
programas de computador. Naves controladas por entidades automatizadas que se
rebelam contra os humanos, como o computador HALL 9000 em 2001 Odisseia no
Espao de Kubrick (1968); que decretam sua extino como em Exterminador do Futuro
de James Cameron (1984) ou ainda que os escravizam, num mundo digitalmente criado, a
Matrix, para utilizao da humanidade como simples fonte de energia, dos irmos
Wachowski (1999), so apenas alguns dos inmeros exemplos que poderamos citar.

4
Technical creation involves interaction between reason and experience. Knowledge of nature is required to
make a working device. This is the element of technical activity we think of as rational. But the device must
function in a social world, and the lessons of experience in that world influence design. Traduo nossa.

5
Na srie de TV Star Trek: The next generation , que tambm ganhou os cinemas (Star
Trek - First Contact, Jonathan Frakes, 1996), uma das piores ameaas aliengenas j
enfrentadas foi a dos Borgs, raa de seres hbridos, biolgicos e maqunicos, que
rapidamente assumiam o controle das reas que invadiam, a partir da converso dos seres
que encontravam em sua prpria espcie, atravs da insero de implantes que faziam as
vtimas completamente integradas ao comando central, agindo como uma colnia de
insetos, num exrcito cada vez maior.

Por outro lado, o fascnio pelas mquinas muito anterior quase inevitvel
dependncia contempornea que estabelecemos com celulares, smartphones, tablets e
tantos outros gadgets tecnolgicos dos quais no queremos mais nos separar.

Se na antiguidade e na idade mdia os relatos sobre autmatos eram restritos, o


sculo XVIII considerado sua poca urea. No trecho de Devaux (1964) descrita a
apresentao de uma dessas peas que ainda hoje podem ser vistas em Paris, a Tocadora
de Xilofone de Roentgen, uma boneca musicista que se supe tenha sido inspirada na
figura de Maria Antonieta5.

Numa sala do Palcio de Versalhes, entre as saias de balo e os vestidos


da corte, o exmio automatista Roentgen, apresenta a Lus XVI outra obra-
prima. Aquela Tocadora de xilofone, de corpete decotado e vestido de
seda bordada, provoca a curiosidade geral; fala-se do corpo da boneca
divinamente modelado debaixo do vestido, pasma-se com a preciso e a
sua altiva graciosidade. Uma pequena ria muito viva saltita desperta pela
saraivada dos martelos de marfim; todo um sculo se desprende dessa
msica elegante e seca; e quando a jovem, debaixo dos anis do seu
penteado alto, volta a cabea para saudar, a semelhana levanta um
sussurro em toda a sala... Mais tocante e mais perfeita no mecanismo que
o Escrivo ou a Musicienne, dos Jaquet-Droz, ou o Pato, de Vaucanson, e
os seus Flautistas, a Tocadora de xilofone evoca fielmente, quanto a ns, a
Primeira Idade do Automatismo (DEVAUX, 1964, p. 7).

Figura 1- Tocadora de Xilofone de Roentgen, restaurada em 1864 por Robert


Houdain.

5
A histria da boneca pode ser conhecida no documentrio L'Androde de Marie-Antoinette, disponvel em:
http://www.youtube.com/watch?v=pSxWmJLAaEg .

6
Fonte: Lutice Crations ([200-]).

2 JORNALISMO E TECNOLOGIA

Desde os primrdios, o jornalismo esteve ligado a algum tipo de tecnologia,


sendo o processo de impresso de Gutemberg e seu desenvolvimento um dos principais
fatores que alavancou a expanso dessa atividade.

Muito tempo depois, j no final do sculo XX, a chegada das redes, da


internet e dos computadores s redaes iniciou um ciclo de profundas mudanas que at
hoje est em andamento e que alguns como Soria (2014) descrevem simplesmente como
um tsunami, traduzindo o impacto devastador que positiva e negativamente a digitalizao
de grande parte do processo de produo jornalstica tem causado.

Machado (2003), ao descrever o incio da mudana, nos ensina que duas


posies se estabeleceram para compreender o que estava acontecendo. A primeira, que
poderamos chamar de instrumentalista, entendia que computadores eram apenas mais
uma ferramenta a disposio dos jornalistas, artefatos adicionais a serem utilizados na
execuo do seu trabalho, como antes haviam tambm sido as inovaes do telgrafo, da
mquina de escrever e do telex, entre outras.

J na segunda forma de entender a transformao, a chegada do digital


representava uma alterao muito mais extensa, capaz de impactar todas as etapas do
processo de produo como tambm as habilidades necessrias para exercer a funo de
jornalista, os modelos de negcio dessa cadeia produtiva e os prprios papeis
desempenhados tradicionalmente por emissores e receptores em relao aos veculos de
massa.

7
A falta de clareza sobre as consequncias para o jornalismo da
disseminao do suporte digital dificulta a compreenso plena das
particularidades da prtica jornalstica nas redes, das mudanas no perfil
do profissional, na estrutura organizacional das empresas jornalsticas e
das funes que o usurio passa a ocupar no sistema de produo de
contedos (MACHADO, 2003, p. 2).

Bradshaw e Rohumaa (2011), no histrico que traam sobre o incio do


jornalismo online no ocidente, indicam os britnicos Today de 1986 como o precursor na
produo de contedo usando tecnologia digital e o Daily Telgraph como um dos primeiros
jornais impressos a ter sua verso transposta6 na ainda pouco conhecida internet de 1994.
Era o Eletronic Telegraph. Em 1993 o primeiro browser7, o Mosaic, havia sido lanado. BBC
Online em 1997 e Guardian Unlimited em 1999 so destaques numa lista de iniciativas
ligadas ideia de levar a atividade jornalstica para o ciberespao.

Na poca havia uma grande confiana entre as empresas de mdia de que a


internet seria apenas mais um veculo, mais um espao a conquistar, uma nova fronteira,
onde vendendo publicidade e utilizando os modelos de negcio tradicionais todos
poderiam prosperar. Tal certeza atraiu muitos investimentos e novas empresas dot.com
surgiram rapidamente, mas em 2001, com a crise que ficou conhecida como o estouro da
bolha da internet, percebeu-se que no era to simples assim lucrar com as iniciativas
digitais e que, pelo contrrio, o que estava comeando era uma corrida pela sobrevivncia,
onde apenas os que se adaptassem ao novo cenrio de forma mais eficiente poderiam
continuar.

Passaram-se os anos e novas tecnologias foram continuamente sendo


incorporadas ao fazer jornalstico. As bases de dados, a integrao de mltiplas mdias
para contar uma nica histria, a capacidade de customizar e segmentar o contedo em
funo dos interesses de usurios cada vez mais exigentes e difceis de atrair. Surgiram os
sistemas de CMS (Content Management Systems) que permitiram aos jornalistas publicar

6
Mielnickzuk (2001) nos fala das fases de jornalismo digital, chamando a primeira de fase transpositiva,
justamente porque o contedo do impresso era apenas copiado para a internet sem grandes alteraes.
7
Um browser um software cliente de internet que solicita ao servidor as pginas que o usurio assinala
atravs do endereo.

8
diretamente seu contedo sem a intermediao de um programador ou especialista em
HTML, a linguagem que organiza os elementos de qualquer pgina na web e que os
browsers utilizam para construir o que os leitores veem em seus computadores.

Chamar os tradicionais consumidores de notcias de leitores tambm no


mais to preciso. A digitalizao, o barateamento dos equipamentos para produzir
imagens e som, a expanso da infraestrutura da internet e a ubiquidade dos dispositivos
mveis fizeram dos cidados produtores de contedo, dando a eles um espao crescente
no processo de produo jornalstica e constituindo o que alguns chamam de user
generated content (UGC), contedo gerado por usurios e tambm de jornalismo
participativo, termo que traduz uma srie de iniciativas com escopo e dimenso diversos8,
indo do jornalismo produzido por ou para pequenas comunidades at grandes iniciativas
que, via internet, ganham alcance internacional.

O impacto da tecnologia no jornalismo tambm obrigou a reviso de alguns


conceitos clssicos como o da pirmide invertida e do lead. A necessidade da atualizao
constante e a presso do tempo criaram novas formas narrativas onde a notcia
construda em camadas, a partir das unidades de informao que vo se tornando
disponveis, sendo conectadas pelos hiperlinks e cuja estrutura pode ir de materiais
praticamente brutos, sem qualquer edio, a pacotes completos do jornalismo tradicional
incluindo anlises, desdobramentos e contextualizao. O conceito de resoluo semntica
de Fidalgo (2003) descreve o processo, fazendo uma analogia com as imagens digitais que,
a partir do aumento do nmero de pixels9 que as formam, permitem gradualmente melhor
visualizao e compreenso. Na redao digital as partculas de informao chegam em
fluxo contnuo e com elas construmos nossas histrias, iniciando as vezes apenas com
poucas palavras na rea de ltimas notcias e, quando merecem, chegando s grandes
reportagens contadas no ambiente digital como a premiada Snow Fall (BRANCH, ([200-]))
do New York Times.

8
Ver em Knight e Cook (2013) a distino entre os dois conceitos.
9
O conceito de pixel parte da ideia de que as imagens digitais so formadas por matrizes de pontos que
definem a resoluo da tela e traduz a menor unidade constituinte da representao das imagens quando so
gerenciadas por computadores.

9
3 NARRATIVAS AUTOMATIZADAS - NARRATIVE SCIENCE E AUTOMATED INSIGTHS

Morozov (2012) utilizando um sugestivo ttulo, Um rob roubou o meu Pulitzer!


relata os primeiros movimentos de empresas de inteligncia artificial, entre elas a
Narrative Science10, no negcio de gerar notcias. O produto da empresa: contedo
jornalstico automatizado vendido como servio para portais de notcias, principalmente
da rea de esportes e finanas, onde uma boa parte da informao utilizada advm de
nmeros e relaes entre grandezas mensurveis como a cotao do dlar ou o resultado
de uma partida de futebol.

Figura 2 - Print de matria sobre jornalismo automtico

Fonte: Morozov (2012).

Narrative Science (NS) nasceu de um projeto de pesquisa chamado Stats Monkey


desenvolvido por alunos e professores de cincia da computao e jornalismo da
Northwestern University a partir do InfoLab e que basicamente escrevia resumos sobre
resultados de jogos do baseball americano. Em 2010 a empresa mudou de nome e logo em
seguida patenteou uma plataforma de autoria baseada em inteligncia artificial chamada
Quill.

10
http://narrativescience.com/

10
Figura 3 - Portal Big Ten Network especializado em notcias do esporte e cliente da
NS

Fonte: Big Ten Network (2014).

Automated Insights (AI) outra companhia que j fornece contedo jornalstico


automatizado para diversos clientes. Nascida com o nome de StatSheet, em 2008, a
empresa recebeu financiamento de uma entidade de apoio inovao no estado da
Carolina do Norte nos EUA e iniciou um percurso de desenvolvimento que em 2014
contabilizou, segundo seu site oficial (AUTOMATED INSIGHTS, 2013), mais de 300 milhes
de textos escritos automaticamente, entre relatrios empresariais e notcias jornalsticas.

Figura 4 - Exemplos de contedo publicado por AI em plataformas mveis

Fonte: Automated Insights (2013).

11
Arce (2009) j havia feito uma avaliao da possibilidade de automatizao dos
discursos incluindo ai as ideias de Lage (1997) sobre o tema, ambos, entretanto, em
carter terico e no experimental.

Coppin (2010, p. 24) esclarece que, no campo da inteligncia artificial, uma das
principais questes est relacionada representao da realidade que ser utilizada pelo
programa de computador, j que para um computador poder solucionar um problema
relacionado ao mundo real, ele primeiro precisa de um meio para representar o mundo
real internamente. Ao lidar com aquela representao interna, o computador torna-se
capaz de solucionar problemas.

Figura 5 - Processo de transformao de dados brutos em narrativas utilizado pela


NS

Fonte: Narrative Science (2010).

Na questo especfica do contedo jornalstico, as empresas citadas comearam a


produzir leads basicamente por ser uma forma que apresenta uma estrutura interna
bastante definida e por isso traduzvel de modo mais fcil para uma sequencia de
instrues a ser realizadas por uma mquina.

4 MODELAGEM DE EXPERIMENTO COM RESULTADOS DO FUTEBOL

Para construir nosso experimento de narrativa automatizada nos propomos a


desenvolver um cdigo de programao capaz de escrever pequenos textos sobre os
resultados do campeonato brasileiro de futebol de 2013. Utilizamos a linguagem de

12
programao Python11 por considera-la de mais fcil aprendizagem para no especialistas
em programao como jornalistas e profissionais da comunicao12.

A linguagem Python permite a utilizao de diversos mdulos de programao j


desenvolvidos previamente e com finalidades especficas, facilitando a construo das
solues a partir da combinao de funes cujo cdigo j existe. A biblioteca NLTK13
Natural Language Toolkit que utilizamos nesse projeto um desses exemplos e
incorpora um grande nmero de recursos para o processamento de textos.

A modelagem do problema foi feita a partir da seguinte sequencia: obter resultados


dos jogos e informaes complementares tais como local da partida e nmero da rodada;
registrar essas informaes em alguma estrutura simples de arquivo que pudesse
posteriormente ser consultada para a construo do material; traduzir as prprias regras
do torneio em termos de variveis e relaes para que a sintaxe do regulamento pudesse
orientar a concatenao dos elementos do texto; gerar as frases a partir dos resultados das
operaes realizadas com os dados coletados nas partidas.

Assim partimos para uma soluo que, a partir de um endereo especfico na


internet onde esses dados fossem disponibilizados, conseguia ler todas as informaes
iniciais de forma automtica e mais rpida. Para os testes selecionamos a pgina do portal
Terra dedicada rea de esportes que publicava a cada rodada os resultados e a tabela
atualizada do campeonato (PORTAL TERRA, 2014)14. A tabela foi usada como instrumento
de validao dos clculos do software j que ela tambm totalizava as mtricas que as
regras do torneio geravam tais como nmero de jogos, pontos ganhos, gols feitos, gols
sofridos, saldo de gols e ndice de aproveitamento.

Definida a estratgia de coleta dos dados fizemos a parte do cdigo que salvava
esses elementos associando-os a cada time, numa estrutura que na linguagem Python

11
<www.python.org>.
12
Projetos envolvendo programao e jornalismo tm sido desenvolvidos, com exemplos na rea do Jornalismo
Investigativo, no intuito de extrair e processar dados em grandes quantidades e utilizar essas informaes
para a construo de infogrficos e narrativas no jornalismo digital. <http://gijn.org/>.
13
<www.nltk.org>.
14
Atualmente o endereo da tabela <http://esportes.terra.com.br/futebol/brasileiro-serie-a/tabela>.

13
conhecida por dicionrio, onde a cada elemento, chamado de chave, so associados
valores diversos, cada um representando alguma informao gerada a partir dos
resultados dos jogos.

Figura 6 Parte do cdigo que mostra o endereo de extrao dos dados e os times
na estrutura de chaves do dicionrio, inicialmente com todos os campos zerados

Fonte: Elaborado pelo autor.

Ao iniciar o cdigo o usurio demandado apenas a escolher o nmero da rodada


que deseja explorar. O software coleta os resultados de todas as rodadas at chegar
selecionada e assim vai registrando os resultados e acumulando-os na estrutura do
dicionrio. interessante observar que o que retirado do portal da internet so apenas
os resultados dos jogos. Com eles o software aplica as regras do torneio para calcular os
outros valores associados ao time. Por exemplo, ao coletar o resultado de determinada
partida, o software compara o nmero de gols dos dois times envolvidos, se um deles
maior do que o outro, o de valor maior ganhou a partida e, por isso, no registro referente a
pontos ganhos so acrescidas trs unidades. O perdedor no soma nada no registro e no
caso de saldo de gols iguais, uma unidade acrescentada a cada um dos times indicando
os pontos por um empate.

Figura 7 - Tela que compara a pgina do portal com os resultados e a tela gerada pelo
programa onde podem ser vistos primeiro os dados registrados e depois as sugestes de
ttulo baseadas nos resultados

14
Fonte: Elaborado pelo autor.

medida que o software registra os jogos das rodadas ele vai atualizando todos os
parmetros adicionais j listados, que so representaes definidas pelas prprias regras
do torneio, incluindo na estrutura de dicionrio que foi criada um conjunto de dados que
ser utilizado para inferir vrias outras informaes como a prpria posio do time na
tabela, o nmero de pontos que cada um tem e seu aproveitamento, calculado dividindo o
total de pontos conseguidos pelo total de pontos disputados.

Como exemplo, se um time disputou 10 jogos, ou seja, 30 pontos, valor que teria se
vencesse todas as partidas e de fato tem apenas 3, uma vitria e um empate ou trs
empates, seu rendimento seria de apenas 10%, ou seja, bastante baixo.

Esses nmeros permitem ao software escrever textos com mais informaes.

Figura 8 - Tela do software que demonstra a estrutura do dicionrio atualizada e um


pequeno texto de resumo da situao do time no campeonato a partir dos elementos
registrados

15
Fonte: Elaborado pelo autor.

Num nvel com um pouco mais de complexidade escrito ento um lead com
informaes gerais sobre a situao do campeonato naquela rodada. Basicamente a partir
do resumo que inferido com a situao individual de cada time, o software faz o texto
indicando os lderes com seus nmeros e os lanternas do torneio, aspectos que
normalmente so enfatizados em noticirio desse tipo. A construo desse contedo,
apesar de um pouco mais complicada, tambm parte da ideia de concatenar unidades
menores de informao a partir de listas de palavras e expresses comuns nesse tipo de
texto.

A ttulo de ilustrao seria como definir uma estrutura prvia onde alguns elementos,
no caso o nome dos times e suas mtricas, podem ser imaginados como lacunas a ser
preenchidas por quem estiver naquelas posies em uma determinada rodada. A ideia de
arquivos dinmicos, ou seja, que se alteram ao longo do tempo, pode ser utilizada aqui.

Figura 9 - Tela do software com o que seria o lead construdo a partir das
informaes lidas sobre o campeonato em determinada rodada

16
Fonte: Elaborado pelo autor.

5 CONCLUSES

Apesar de ter sido conduzido apenas em carter exploratrio, o experimento indica a


possibilidade real e no apenas terica de produzir alguns tipos de estruturas jornalsticas
de forma automatizada.

Ficou claro que contedos baseados em informaes numricas e relaes que


podem ser reduzidas mais facilmente a expresses matemticas, baseadas numa sintaxe
mais restrita, como a que pode ser extrada das regras de um torneio esportivo, por
exemplo, so mais fceis de reproduzir.

Da mesma forma que fizemos com os resultados do Campeonato Brasileiro, no seria


difcil construir algo semelhante para gerar pequenos textos informando as variaes do
cmbio ou de aes em bolsas de valores, a previso do tempo para cidades ou regies e
outros contedos que, se observarmos, so construdos com uma estrutura que se repete
com pequenas variaes.

17
A capacidade de coletar e processar informaes com grande quantidade e
variedade parece indicar o potencial de uso desse tipo de soluo, principalmente no
jornalismo online e nos grandes portais da internet que precisam atualizar seus contedos
com mais agilidade.

Os desdobramentos desse tipo de tecnologia no mercado ainda no podem ser


avaliados. importante ressaltar tambm que mesmo as solues mais complexas de
inteligncia artificial ainda esto distantes de replicar as sutilezas e complexidades de um
bom texto jornalstico, principalmente numa lngua como a portuguesa, que at hoje
apresenta dificuldades para outras categorias de software como os de reconhecimento de
voz e traduo para conseguirem nveis altos de acerto.

Por outro lado, a precarizao do trabalho e a replicao indiscriminada de releases e


contedos gerados por fontes, justificados de forma simplista pela presso do tempo e
pela necessidade de atualizao constante, so um risco para esses profissionais j que,
como foi demonstrado, as operaes simples e baseadas em estruturas comuns tm muito
mais chances de serem replicadas automaticamente.

O aprofundamento no trabalho de apurao, o jornalismo investigativo, a extrao


de relaes complexas a partir de dados inter-relacionados e a criao de infogrficos e
formas alternativas de visualizao de informaes nos parecem bons exemplos de como a
atividade humana pode continuar sendo essencial no que se considera um jornalismo de
qualidade. A melhoria dos currculos e dos programas de formao na rea tambm ter
papel importante nos impactos dessas novas tecnologias.

Se resistir intil15 parece ser uma afirmao intimamente ligada s relaes entre
homens e tcnica na histria das sociedades, no campo do jornalismo, um texto criativo e
bem elaborado poder nos garantir a convivncia pacfica com as solues automatizadas
que tem seu valor em processos repetitivos e de baixo nvel de execuo.

15
Resistance is futile, frase repetida pelos Borgs da sria Star Trek para suas vtimas (traduo nossa).

18
6 REFERNCIAS

ARCE, Tacyana. O lead automatizado: uma possibilidade de tratamento da informao para


o jornalismo impresso dirio. Revista Exacta, Belo Horizonte, v. 2, n. 3, 2009.

AUTOMATED INSIGHTS. 2013. Disponvel em: <www.automatedinsights.com>. Acesso em:


10 jan. 2013.

BIG TEN NETWORK. 2014. Disponvel em: <www.btn.com>. Acesso em: 12 abr. 2014.

BRADSHAW, Paul; ROHUMAA, Liisa. The online journalism handbook: skills to survive and
thrive in the digital age. Essex: Pearson Education, 2011.

BRANCH, John. Snow Fall: the avalanche at Tunnel Creeak. The New York Times, New York,
(200-]). Disponvel em: <http://www.nytimes.com/projects/2012/snow-
fall/?forceredirect=yes#/?part=tunnel-creek>. Acesso em: 2 jun. 2014.

CASTELLS, Manuel. A sociedade em rede. So Paulo: Paz e Terra, 1999.

COPPIN, Ben. Inteligncia artificial. Rio de Janeiro: LTC, 2010.

DEVAUX, Pierre. Autmatos, automatismo e automatizao. Traduo Luis Borges Coelho.


Lisboa: Editorial Gleba, 1964. (Coleo Horizonte, n.3).

ECO, Humberto. Apocalpticos e integrados. So Paulo: Perspectiva, 2006.

ELLUL, Jacques. A tcnica e o desafio do sculo. Rio de Janeiro: Paz e Terra, 1968.

FEENBERG, Andrew. E-book. Transforming technology: a critical theory revisited. New


York: Oxford University Press, 2002.

______. E-book. Between reason and experience. Essays in technology and modernity.
Cambridge, MA: Mit Press, 2010.

FIDALGO,Antonio. Sintaxe e semntica das notcias on-line. Para um jornalismo assente em


base de dados. In: FIDALGO, Antnio SERRA, Paulo (Org.). Informao e Comunicao
Online. Jornalismo Online. v. 1.Covilh: Universidade da Beira Interior/Portugal, 2003.

LAGE, Nilson. O lead clssico como base para a automao do discurso informativo. In:
CONGRESSO BRASILEIRO DE PESQUISADORES DA COMUNICAO INTERCOM, 20., 1997,
Santos. Anais... Santos, SP. 1997.

LEMOS, Andr. Cibercultura: tecnologia e vida social na cultura contempornea. 4. ed.


Porto Alegre: Sulina, 2002.

LUTICE CRATIONS. Paris, [2000-]. Disponvel em: <http://www.automates-boites-


musique.com/>. Acesso em: 7 abr. 2014.

19
KNIGHT, Megan; COOK, Clare. Social media for journalists: principles e practice. Londres:
Sage, 2013.

MACHADO, Elias. O ciberespao como fonte para os jornalistas. Salvador: Calandra, 2003.

MIELNICZUK, Luciana. Caractersticas e implicaes do jornalismo na web. 2001.


Disponvel em: <http://200.18.45.42/professores/chmoraes/comunicacao-digital/13-
2001_mielniczuk_caracteristicasimplicacoes.pdf>. Acesso em: 8 set. 2010.

MOROZOV, Evgeny. A robot stoled my Pulitzer!: future tense. 2012. Disponvel em:
<http://www.slate.com/articles/technology/future_tense/2012/03/narrative_science_rob
ot_journalists_customized_news_and_the_danger_to_civil_discourse_.html>. Acesso em:
11 abr. 2014.

NARRATIVE SCIENCE. 2010. Disponvel em: <www.narrativescience.com>. Acesso em: 10


jan. 2013.

PORTAL TERRA. Esporte. 2014. Disponvel em:


<http://esportes.terra.com.br/futebol/brasileiro-serie-a>. Acesso em: 31 maio 2014.

RDIGER, Francisco. Introduo s teorias da cibercultura: tecnocracia, humanismo e


crtica no pensamento contemporneo. 2. ed. Porto Alegre: Sulina, 2007.

SENNETT, R. O artfice. Rio de Janeiro: Record, 2009.

SORIA, Carlos. Convergncia de mdias. 2014. Palestra apresentada ao Seminrio sobre


Integrao Multimdia, So Lus, 2014.

THE SOCIETY FOR PHILOSOPHY AND TECHNOLOGY. 2014. Disponvel em:


<http://www.spt.org/>. Acesso em: 2 jun. 2014

20