Breve história da Inteligência Artificial

Guilherme Bittencourt Departamento de Automação e Controle Universidade Federal de Santa Catarina 88040-900 Florianópolis SC Brasil Fone: +55 (48) 331 9202 Fax: +55 (48) 331 9770 E-mail: gb@lcmi.ufsc.br Internet: http://www.lcmi.ufsc.br/~gb

Introdução
As correntes de pensamento que se cristalizaram em torno da IA já estavam em gestação desde os anos 30 [BF81]. No entanto, oficialmente, a IA nasceu em 1956 com uma conferência de verão em Dartmouth College, NH, USA. Na proposta dessa conferência, escrita por John McCarthy (Dartmouth), Marvin Minsky (Hardward), Nathaniel Rochester (IBM) e Claude Shannon (Bell Laboratories) e submetida à fundação Rockfeller, consta a intenção dos autores de realizar ``um estudo durante dois meses, por dez homens, sobre o tópico inteligência artificial''. Ao que tudo indica, esta parece ser a primeira menção oficial à expressão ``Inteligência Artificial'' [McC79]. Desde seus primórdios, a IA gerou polêmica, a começar pelo seu próprio nome, considerado presunçoso por alguns, até a definição de seus objetivos e metodologias. O desconhecimento dos princípios que fundamentam a inteligência, por um lado, e dos limites práticos da capacidade de processamento dos computadores, por outro, levou periodicamente a promessas exageradas e às correspondentes decepções. Dada a impossibilidade de uma definição formal precisa para IA, visto que para tanto seria necessário definir, primeiramente, a própria inteligência, foram propostas algumas definições operacionais: ``uma máquina é inteligente se ela é capaz de solucionar uma classe de problemas que requerem inteligência para serem solucionados por seres humanos'' [MH69]; ``Inteligência Artificial é a parte da ciência da computação que compreende o projeto de sistemas computacionais que exibam características associadas, quando presentes no comportamento humano, à inteligência'' [BF81]; ou ainda ``Inteligência Artificial é o estudo das faculdades mentais através do uso de modelos computacionais'' [CM85]. Outros se recusam a propor uma definição para o termo e preferem estabelecer os objetivos da IA: ``tornar os computadores mais úteis e compreender os princípios que tornam a inteligência possível'' [Win84].

História
Existem duas linhas principais de pesquisa para a construção de sistemas inteligentes: a linha conexionista e a linha simbólica . A linha conexionista visa à modelagem da inteligência humana através da simulação dos componentes do cérebro, isto é, de seus neurônios, e de suas interligações. Esta proposta foi formalizada inicialmente em 1943, quando o neuropsicólogo McCulloch e o lógico Pitts propuseram um primeiro modelo matemático para um neurônio. Um primeiro modelo de rede neuronal , isto é, um conjunto de neurônios interligados, foi

Os princípios dessa linha de pesquisa são apresentados no artigo Physical symbol systems de Newell [New80]. pequenos e baratos. Este modelo. Métodos: formalismos de representação de conhecimento adaptados ao tipo de problema. Estes esforços iniciais ajudaram a estabelecer os fundamentos teóricos dos sistemas de símbolos e forneceram à área da IA uma série de técnicas de programação voltadas à manipulação simbólica. Motivo do fracasso: subestimação da quantidade de conhecimento necessária para tratar mesmo o mais banal problema de senso comum. . conexionismo. por vezes até impressionantes. Clássica Inicialmente. ``expert system''). as técnicas de busca heurística. Para facilitar a apresentação. vamos dividir a história da IA simbólica em ``épocas''. representação da incerteza.proposto por Rosenblatt. A linha simbólica segue a tradição lógica e teve em McCarthy e Newell seus principais defensores. aliado à solução de alguns problemas teóricos importantes. Durante um longo período essa linha de pesquisa não foi muito ativa. conforme proposto em relatórios internos do MIT (Massachusetts Institute of Technology): Clássica (1956-1970) • • • Objetivo: simular a inteligência humana Métodos: solucionadores gerais de problemas e lógica Motivo do fracasso: subestimação da complexidade computacional dos problemas Romântica (1970-1980) • • • Objetivo: simular a inteligência humana em situações pré-determinadas. Os sistemas gerais desenvolvidos nesta época obtiveram resultados interessantes. chamado Perceptron . tornou praticável a implementação de máquinas de conexão compostas de milhares de microprocessadores. General Problem Solver. mas o advento dos microprocessadores. a partir da década de setenta. O sistema GPS. O modelo conexionista deu origem à área de redes neuronais artificiais. deu um novo impulso às pesquisas na área. O sucesso dos sistemas especialistas (SE) (do inglês. a pesquisa em manipulação de símbolos se concentrou no desenvolvimento de formalismos gerais capazes de resolver qualquer tipo de problemas. por exemplo. é um exemplo deste tipo de pesquisa. Moderna (1980-1990) • • • Objetivo: simular o comportamento de um especialista humano ao resolver problemas em um domínio específico. teve suas limitações demonstradas por Minsky e Papert [MP69] em livro onde as propriedades matemáticas de redes artificiais de neurônios são analisadas. Métodos: Sistemas de regras. Motivo do fracasso: subestimação da complexidade do problema de aquisição de conhecimento. mecanismos de ligação procedural visando maior eficiência computacional. o que. estabeleceu a manipulação simbólica de um grande número de fatos especializados sobre um domínio restrito como o paradigma corrente para a construção de sistemas inteligentes do tipo simbólico. projetado por Ernst e Newell [EN69].

isto é. nos sistemas gerais. A segunda razão está associada ao fato de que. Este problema. por exemplo.mas apenas em domínios simplificados. a tecnologia de IA passou a permitir o desenvolvimento de sistemas com desempenho . e não a solução de um problema real. O programa em si passou a ser a parte menos importante. Uma mudança importante ocorreu ao longo da década de setenta em relação aos critérios acadêmicos de julgamento de trabalhos em IA: houve uma crescente exigência de formalização matemática. passou a ser o ponto fundamental [Hay77]. [McD78]. ambientes de desenvolvimento de ``software''. lógicas multivalores [PS85]. etc. isto não acontecia mais em 1980. mesmo tratando de alguns poucos exemplos de um problema até então não tratado. e que por vezes a única forma de solução conhecida para determinados problemas reais consiste em uma série de regras práticas não fundamentadas por nenhum tipo de teoria geral do domínio que pudesse ser usada para orientar a solução. lógica modal [HM85]. lógica de exceções [Rei80] e lógica nebulosa [Zad79]. Os objetivos da pesquisa eram. independentemente das técnicas de programação utilizadas. por exemplo. onde o objetivo era principalmente a demonstração da técnica utilizada. a construção de teorias e o desenvolvimento de programas que verificassem estas teorias para alguns poucos exemplos. A década de setenta marcou também a passagem da IA para a ``vida adulta'': com o aparecimento dos primeiros SE's. Isto se deveu a duas razões. Se no início dos anos setenta. completude e complexidade. foi a inspiração desses ``hackers'' que levou a conceitos hoje integrados à ciência da computação. a análise formal da metodologia. orientação objeto. A razão teórica é conseqüência do uso. além de uma semântica bem fundada. É interessante notar que o fato de que não havia interesse em construir programas de IA ``de verdade''. incoerências e incompletudes. e outra associada à natureza do conhecimento do mundo real. (ii) Desenvolveram-se métodos heurísticos e lógicas não convencionais para permitir a representação de crenças. principalmente. já era considerado IA. O problema com os sistemas gerais é que a sua extensão a domínios de problemas reais se mostrou inviável. descrito por Cook em seu artigo The complexity of theorem proving procedures [Coo71]. A utilização desses modelos leva à chamada explosão combinatória : a memória e o tempo necessários para resolver um determinado problema cresce exponencialmente com o tamanho do problema. uma relacionada com características teóricas dos métodos utilizados. como: tempo compartilhado. é inerente aos métodos baseados em lógica. um programa. Esta situação levou a dois tipos diferentes de solução: (i) uso de métodos formais de inferência mais fracos do que a lógica de primeira ordem que garantissem uma certa eficiência aos programas. de modelos baseados em lógica de primeira ordem como formalismo básico. Pelo contrário. com aplicações práticas. freqüentemente. além da mudança da relação usuário-computador ao eliminar a intermediação de um operador e colocar cada usuário diante de sua estação de trabalho. [Bel77] e linguagens terminológicas [BW77].. o conhecimento disponível sobre o mundo real é incompleto e parcialmente incoerente. não se deve a uma eventual incompetência em programação dos pesquisadores em IA. a IA estava praticamente restrita ao ambiente acadêmico. Romântica Durante a década de setenta. incluindo decidibilidade. processamento simbólico de listas.

etc.). [HRWL83] e [Wat86]). sendo objeto de diversas conferências internacionais e submetida a avaliações rigorosas de desempenho (por exemplo. As principais áreas de pesquisa em IA simbólica são atualmente: sistemas especialistas. Além das linhas conexionista e simbólica. Com isso foram colocadas no mercado uma grande quantidade de ASE's que prometiam solucionar o problema de construção de SE's. observa-se hoje o . Entre os diversos benefícios associados ao desenvolvimento de SE's podem-se citar: distribuição de conhecimento especializado. uma ferramenta para a construção de sistemas especialistas (ASE) . controle inteligente. certamente a parte mais difícil do desenvolvimento de um SE. então em algum lugar deveria haver IA.intelectual equivalente ao de um ser humano adulto. na visão dos empresários.000 unidades. tratamento de informação imperfeita. apesar de uma ferramenta de programação adequada ajudar muito a construir um sistema complexo. não deveria ser um sistema específico para um dado problema. No entanto. mas algo que fosse implementado uma única vez e vendido em 100. bancos de dados e processamento de imagens vem crescendo constantemente. onde a IA sempre esteve: na tentativa de entender o comportamento inteligente a ser modelado. arquiteturas para sistemas inteligentes. por exemplo. A conseqüência foi uma grande insatisfação por parte dos usuários. robótica. no caso o comportamento do especialista ao resolver um problema. como engenharia de ``software''. existem milhares de SE's em operação nos mais variados domínios. enquanto que a verdade é que a IA em um SE está basicamente na forma como é representado o conhecimento sobre o domínio. maior confiabilidade de operação. memória institucional. e a influência da IA em outros campos da computação. entre outros. aprendizagem. treinamento. abrindo perspectivas de aplicações comerciais e industriais. por certo houve também trabalhos descrevendo com fidelidade o potencial e as limitações da nova tecnologia (por exemplo. saber o que programar continua sendo o ponto mais importante. jurídicas. visão computacional. representação de conhecimento. Moderna A tecnologia de SE disseminou-se rapidamente e foi responsável por mais um dos episódios ligados a promessas não cumpridas pela IA: o sucesso dos primeiros SE's chamou a atenção dos empresários. isto é. linguagem natural e interfaces inteligentes. Uma outra conseqüência desta visão distorcida dos ASE's foi a pouca ênfase dada inicialmente à aquisição de conhecimento . [SMS92]). um SE não era um produto: um produto. flexibilidade no fornecimento de serviços (consultas médicas. facilidade na operação de equipamentos. Isto levou à ilusão de que para construir um SE bastaria comprar um ASE. aquisição de conhecimento. modelagem cognitiva. e o lugar escolhido foi o motor de inferência . os ASE's são considerados como parte de uma tecnologia de desenvolvimento de ``software'' estabelecida. Atualmente. possibilidade de tratar situações a partir de conhecimentos incompletos ou incertos. inteligência artificial distribuída. pois. Se exageros existiram na publicidade dos ASE's. que partiram em busca de um produto comercializável que utilizasse esta tecnologia. [DK77]. que passou a ser considerado como sinônimo de IA. técnicas. Atualmente. Se os ASE's deveriam ser vendidos como produtos de IA.

The Handbook of Artificial Intelligence. Charniak and D.A. Esta nova perspectiva coloca os programas de IA como produtos intelectuais no mesmo nível dos demais. ACM.crescimento de uma nova linha de pesquisa em IA. Coo71 S. e como as propriedades das representações utilizadas auxiliam e moldam o desenvolvimento de produtos intelectuais? Bibliography Bar75 A. editors. 1977. Belnap. Feigenbaum. In J.G. 1981.. a computação em geral e a IA em particular são o ponto culminante de um longo processo de criação de representações de conhecimento. seja através de outros meios [Hil89]. An overview of KRL. como expressar as características individuais e sociais da inteligência utilizando computadores de maneira a permitir uma maior produtividade. William Kaufmann Inc. The University of Michigan. Cook. 1985. 1977. 1975. os modelos mais conhecidos são os algoritmos genéticos e os autômatos celulares [Bar75].M. Los Altos. Reidel Pub. [Hol75] e [Hol86]. Addison-Wesley Publishing Company. Nesta linha. Introduction to Artificial Intelligence. Cellular Automata as Models of Natural Systems. iniciado com as primeiras pinturas rupestres.. Reading. New York. volume I-II. por exemplo.G. MA. 1971. Cognitive Science. Dunn and G. Epstein. 1(1):3-46. tais como a auto-organização e o comportamento adaptativo. seja na forma de linguagem. pages 151-158. desde o sonho de construir uma inteligência artificial de caráter geral comparável à do ser humano até os bem mais modestos objetivos atuais de tornar os computadores mais úteis através de ferramentas que auxiliam as atividades intelectuais de seres humanos. California. Bel77 N.D. Barto. Winograd. editors. BW77 D. DK77 . The complexity of theorem-proving procedures. [FTW83]. coloca a IA na perspectiva de uma atividade que praticamente caracteriza a espécie humana: a capacidade de utilizar representações externas. A useful four-valued logic. D. ressaltando questões cuja importância é central para os interesses atuais da IA. Co. [GH88]. baseada na observação de mecanismos evolutivos encontrados na natureza. Modern Uses of Multiple-Valued Logics. a knowledge representation language. CM85 E. Deste ponto de vista. Barr and E. Bobrow and T. A gradativa mudança de metas da IA. In Proceedings of the 3rd Annual ACM Symposium on Theory of Computing.A. McDermott. BF81 A.

England. 1985. Addison-Wesley Publishing Company. Summer 1989. J. Hol86 J. Halpern and Y. 1969. Carbonell. Michie.H. 3. 1986. Mishalski. A guide to the modal logics of knowledge and belief.B.Y. Farmer.A. pages 300-332. Building Expert System. Newell. pages 480-490.J. HRWL83 F. 1988. Kaufman. Hayes.S. King. Amsterdam. Machine Intelligence. HM85 J. Genetic algorithms and machine learning: Introduction to the special issue on genetic algorithms. 1977. Ernst and A. In Proceedings of IJCAI 5. Davis and J. Lenat. editors. New Mexico.G. 1979. Machine Learning. In Proceedings of IJCAI 9. Moses. North-Holland. Academy Press. In defense of logic. Wolfram. 1977. Adaptation in Natural and Artificial Systems. GPS: A Case Study in Generality and Problem Solving. and T. Machine Learning 2. volume 8. New York.E. Hol75 J. Mitchell. Elcock and D. University of Michigan Press. 1983. pages 29-41.H. EN69 G. and S. pages 593-623. Hill. Toffoli. Ann Arbor. Hay77 P. Hayes-Roth.J. McCorduck.M. In R. pages 559-565.O. The AI Magazine. GH88 D.D. Ellis Horwood.H. Machines Who Think. Hil89 W. and D. Holland. An overview of productions systems. Escaping brittleness: The possibilities of general purpose learning algorithms applied to parallel rule-based systems. Waterman. Holland. Goldberg and J. McC79 P. editors. Holland. San Francisco. MA. The mind at ai: Horseless carriage to clock. Freeman. March 7-11 1983. Cellular Automata: Proceedings of an Interdisciplinary Workshop at Los Alamos. FTW83 J. T. Reading.R. D. McD78 . Chichester.C. 1975. In E.

Edinburgh University Press. 35(10):32-48. 1985.I. Win84 P. Madey. Wat86 D. SMS92 A. Perceptrons: An Introduction to Computational Geometry. Hayes and L. editors. 13(1-2):81-132. Selection criteria for expert system shells: A socio-technical framework. Cognitive Science. A Guide to Expert Systems. Meltzer. 1986. Reading. Machine Intelligence 4. Patel-Schneider. and R. A logic for default reasoning.E.A. Papert.A. In Proceedings of IJCAI 9. October 1992. Artificial Intelligence (2nd Edition). Hayes. editors. 1980. Schlumberger Palo Alto Research. Physical symbol systems. Zad79 L. Waterman.C.F. 1969. Mikulich. Smith. A theory of approximate reasoning. Zadeh. 1979. Press.R. A decidable first-order logic for knowledge representation. July-September 1978. MP69 M. New York. MA. New80 A. Also AI Technical Report Number 45. Tarskian semantics. GB. Stylianou. M. Addison-Wesley Publishing Company. . McDermott. 2(3):277-282.J.D. Some philosophical problems from the standpoint of artificial intelligence. PS85 P. Newell. Rei80 R. MA. Communications of the ACM. pages 463-502. 1969. Wiley Masson. G. pages 455-458. McCarthy and P. Mitchie J. Machine Intelligence 9. Reiter. Winston. Michie and B. MH69 J.H. 4:135-183. Edinburgh. In D. In D. or no notation without denotation. Reading.I. Addison-Wesley Publishing Company.J.L.A. Cognitive Science. Minsky and S.T. Artificial Intelligence. April 1980. 1984.