You are on page 1of 8

Motores de bsqueda y lgebra Booleana

Por: Bernie Dodge y Biblioteca de la Universidad de Albany

Internet es una inmensa base de datos. Como tal, sus contenidos deben buscarse de acuerdo con las reglas establecidas para realizar bsquedas en bases de datos. Gran parte de la bsqueda en las bases de datos, se apoya en los principios de la lgica Booleana. Estos principios hacen referencia a las relaciones lgicas existentes entre los trminos de bsqueda a las cuales se les dio el nombre del matemtico britnico George Boole. En los motores de bsqueda por Internet, las opciones para construir relaciones lgicas entre los trminos de bsqueda se extienden ms all de la prctica tradicional de la bsqueda Booleana. Est ltimo se cubrir en este mismo documento en la seccin llamada "Bsqueda Booleana por Internet". La lgica Booleana consiste en tres operadores lgicos: O (or) Y (and) NO (not) Cada uno de estos operadores se puede describir visualmente usando un diagrama de Venn, como se muestra a continuacin

PREGUNTA: Deseo Informacin sobre colegios.

En esta bsqueda, vamos a recuperar registros en los cules POR LO MENOS UNO de los trminos de bsqueda est presente. Estamos buscando los trminos Colegio y tambin Universidad porque los documentos que contienen una de estas dos palabras pueden ser relevantes. Esto se ilustra por:

o o o

El crculo sombreado con la palabra colegio representa todos los registros que contienen la palabra "colegio". El crculo sombreado con la palabra universidad representa todos los registros que tiene la palabra "universidad". El rea sombreada en la que se entrelazan los dos crculos representa todos los registros que contienen las dos palabras "colegio" y "universidad"

El operador lgico O (OR) se usa ms comnmente para buscar trminos sinnimos o conceptos. A continuacin presentamos un ejemplo de cmo funciona el operador lgico O (OR) TERMINO BUSCADO Colegio Universidad Colegio OR Universidad ALTAVISTA 378.678 1.140.371 1.220.917 GOOGLE 289.000 3.250.000 425.000

El operador lgico O (OR) ayuda a tamizar los resultados para recuperar todos los registros nicos que contienen uno de los trminos, el otro o ambos. En la medida en que se combinen ms trminos o conceptos en una bsqueda con el operador lgico O, mayor ser la cantidad de registros que se van a encontrar. TERMINO BUSCADO Colegio Universidad ALTAVISTA 378.678 1.140.371 GOOGLE 289.000 3.250.000 1

Colegio OR Universidad Colegio OR Universidad OR (Ciudad AND Universitaria)

1.220.917 1.245.846

425.000 155.000

PREGUNTA: Qu relacin existe entre Crimen y Pobreza?

En esta bsqueda se recuperan registros en los cules AMBOS trminos estn presentes. Lo anterior se ilustra por el rea sombreada en la que se entrelazan los dos crculos que representan a todos los registros que contienen tanto la palabra "Pobreza" como la palabra "Crimen" Es necesario anotar que no se recuper ningn registro que contuviera nicamente la palabra "Pobreza" o nicamente la palabra "Crimen"

A continuacin presentamos un ejemplo de cmo funciona el operador lgico Y (AND) TERMINO BUSCADO Pobreza Crimen Pobreza AND Crimen ALTAVISTA 178.387 179.369 120 GOOGLE 584.000 73.400 21.100

En la medida en que se combinen una mayor cantidad de trminos y conceptos con el operador lgico Y (AND), se van a recuperar una menor cantidad de registros. Por ejemplo: TERMINO BUSCADO Pobreza Crimen Pobreza AND Crimen Pobreza AND Crimen AND Genero ALTAVISTA 178.387 179.369 120 14 GOOGLE 584.000 73.400 21.100 4.770

Solamente algunos de los motores de bsqueda hacen uso del operador de Proximidad (cercania) en temas relacionados CERCA (Near). El operador de proximidad determina la cercana en la que estn situados los trminos al interior de un documento fuente. Cerca (Near) es un Y (AND) restrictivo. La proximidad de los trminos de bsqueda se determina de manera particular para cada uno de los motores de bsqueda. Por ejemplo Cerca en Alta Vista (Bsqueda Poderosa) es 10 palabras. Google tiene esta funcin en forma predeterminada.

Perros NOT gatos PREGUNTA: Se requiere informacin sobre gatos pero se desea evitar cualquier informacin sobre perros.

En esta bsqueda, se recuperan registros en los cules SOLAMENTE UNA de estas palabras est presente. Lo anterior est ilustrado por el rea sombreada con la palabra Gatos que representa todos los registros que contienen la palabra "gatos" No se recuperan registros en los que aparece la palabra "perros" an cuando la palabra "gatos" aparezca en ellos tambin.

A continuacin presentamos un ejemplo del funcionamiento del operador lgico NO (NOT). TERMINO BUSCADO Gato Perro Gato NOT Perro ALTAVISTA 132.806 184.674 10.605 GOOGLE 370.000 307.000 1.610 2

El operador lgico NO (NOT) excluye registros o registros de los resultados de bsqueda. Tenga cuidado al usar NO, ya que el trmino que se quiere buscar puede estar presente de manera importante en documentos que tambin contienen el trmino que se desea excluir. N. del T: la mayora de los motores de bsqueda requieren que se ingresen los trminos lgicos en ingles (AND, OR, NOT), as est buscando con palabras claves en espaol.

BSQUEDA BOOLEANA EN INTERNET


Cuando se utiliza un motor de bsqueda en Internet, el uso de la lgica booleana puede manifestarse de tres maneras diferentes: 1. Lgica booleana completa con el uso de los operadores lgicos. 2. Lgica booleana implcita con la bsqueda por palabras claves. 3. Lenguaje predeterminado en una plantilla que llena el usuario. LGICA BOOLEANA COMPLETA CON EL USO DE LOS OPERADORES LGICOS Muchos de los motores de bsqueda ofrecen la opcin de hacer una bsqueda Booleana completa que requiere la utilizacin de los operadores Bolanos lgicos. PREGUNTA Necesito informacin sobre gatos Estoy interesado en Dislexia en Adultos Estoy interesado en radiacin pero no en radiacin nuclear Deseo aprender sobre el comportamiento de los gatos OPERADOR O (OR) Y (AND) NO (NOT) O (OR), Y (AND) TRMINOS DE BSQUEDA gatos OR felinos dislexia AND adultos radiacin NOT nuclear (gatos OR felinos) AND comportamiento

Nota: El uso de los parntesis en la bsqueda se conoce como forzar el orden de procesamiento. En este caso incluimos la palabra OR en el parntesis para que el motor de bsqueda proceda primero a realizar sta parte de la bsqueda. Seguidamente el motor de bsqueda combinar este resultado con la ltima parte de la bsqueda. Haciendo uso de ste mtodo nos podemos asegurar de que los trminos que estn con OR se mantienen unidos como una unidad lgica. LGICA BOOLEANA IMPLCITA CON LA BSQUEDA POR PALABRAS CLAVES La bsqueda por palabras claves se refiere al tipo de bsqueda en la cul se ingresan los trminos que representan el concepto que se quiere recuperar o buscar. En sta no se utilizan operadores Bolanos. La lgica Booleana implcita se refiere a la bsqueda en la que se utilizan smbolos, que representan los operadores Bolanos lgicos. En este tipo de bsqueda por Internet , la ausencia de un smbolo tambin es significativa, por ejemplo el espacio entre las palabras claves predeterminadas (default), tanto para el operador lgico OR (O) como para el operador lgico AND (Y). Muchos de las motores de bsqueda bien conocidos tradicionalmente aplican por defecto (default) el operador lgico O (OR), pero como regla general se estn alejando de sta prctica y utilizando por defecto (default) el operador lgico Y (AND). La lgica Booleana implcita se ha vuelto tan comn en la bsqueda por la Red que pude considerarse actualmente como una prctica estndar. PREGUNTA Necesito informacin sobre gatos Estoy interesado en Dislexia en Adultos Estoy interesado en radiacin pero no en radiacin nuclear Deseo aprender sobre el comportamiento de los gatos OPERADOR O (OR) Y (AND) NO (NOT) O(OR), Y (AND) TRMINOS DE BSQUEDA gatos felinos (1) +dislexia +adultos radiacin -nuclear gatos felinos) +comportamiento

(1) Este ejemplo es cierto para los motores de bsqueda que interpretan el espacio entre las palabras claves como el operador lgico Booleano O. Para poder saber que lgica tiene predeterminada (default) un motor de bsqueda, consulte los archivos de Ayuda que ofrece el motor. LENGUAJE PREDETERMINADO EN UNA PLANTILLA QUE LLENA EL USUARIO Algunos motores ofrecen una plantilla de bsqueda que le permite al usuario escoger el operador Booleano de un men. Con frecuencia el operador lgico se encuentra expresado en lenguaje sustituto en lugar de estar presentado como en el operador mismo. PREGUNTA Necesito informacin sobre gatos Estoy interesado en Dislexia en Adultos Estoy interesado en radiacin pero no en radiacin nuclear Deseo aprender sobre el comportamiento de los gatos OPERADOR TRMINOS DE BSQUEDA Cualquiera de stas palabras. O(OR) Puede contener las palabras. Debe contener las palabras. Todas estas palabras. Y (AND) Debe contener las palabras. No debe contener las palabras. NO (NOT) Sin las palabras. Combine las opciones como se ha hecho en las O(OR), preguntas anteriores, si la plantilla permite la inclusin Y (AND) de varias ordenes de bsqueda. 4

Cuadro de Comparacin Rpida


Lgica Booleana completa versus Lgica Booleana Implcita versus Plantillas Booleana Completa O (OR) Y (AND) NO (NOT) CERCA, etc (NEAR) colegio OR universidad pobreza AND crimen gatos NOT perros gatos NEAR perros (*) Booleana Implcita colegio universidad (* ver nota abajo) +pobreza +crimen gatos -perros N/A (*) Terminos en Plantilla Cualquiera de stos trminos. Puede contener los trminos. Debe contener los trminos. Todas estas palabras. Debe contener las palabras. Puede no contener las palabras. Debe no contener las palabras. Cerca, Prximo.

* Esta afirmacin de bsqueda se resolver como Y lgico en los motores de bsqueda que utilicen Y por defecto (default). Ejemplos de estos incluyen AOL.com Search, Google y Lycos. Se debe consultar el archivo de ayuda en el sitio de cada motor para averiguar que lgica utilizan en forma predeterminada.

Donde Buscar: Un Listado Selectivo


CARACTERSTICA Operadores Bolanos Bsqueda Booleana Completa con parntesis, eje:comportamiento y (gatos o felinos) Booleana Implcita + / Lgica Booleana por terminologa en plantilla MOTOR DE BSQUEDA AltaVista Advanced Search;Dogpile;HotBot;Ixquick Metasearch;ProFusion AltaVista Advanced Search;HotBot;Ixquick Metasearch;MSN Search Advanced Search La mayora de los motores ofrecen esta opcin. AllTheWeb Advanced Search;AOL.COM Search Options ;Google Advanced Search ;HotBot ;Lycos Pro ;MSN Search Advanced Search ;ProFusion Advanced ;Snoopa Advanced Search(*) AltaVista Advanced Search ;Google[by default] ;Ixquick Metasearch

Operadores de Proximidad, Cercana

Se puede encontrar una lista ms completa en esta direccin : Cmo Escoger un Motor de Bsqueda o Directorio (http://library.albany.edu/internet/choose.html)

CUATRO CLAVES PARA UNA MEJOR BSQUEDA ESTRECHAR - PRECISAR - RECORTAR - ASEMEJAR
La pgina perfecta con seguridad est en alguna parte. Es la pgina que tiene la informacin precisa que usted est necesitando y para usted es deseable e inalcanzable como una estrella lejana. Si solamente contar usted con una malla (Red) inmensa que le permitiera capturarla. La mayora de la gente hace uso de los motores de bsqueda simplemente escribiendo unos pocos trminos en el campo de palabras claves del motor para dedicarse luego a mirar con detenimiento los resultados obtenidos. En algunos casos las palabras que se escogen dan por resultado una reduccin indebida de la bsqueda que impide encontrar lo que se estn buscando. Con mayor frecuencia el resultado es una pila de pginas web que no tienen mucha relacin con lo que se busca y que deben ser filtradas por el usuario para encontrar algo. Pero la situacin antes descrita puede mejorar y esa es la razn de ser de este documento. El motor de bsqueda ms comprehensivo que existe en el momento es Google y en este nos vamos a enfocar. El primer paso para convertirse en "hbil pescador" de pginas de Internet consiste en dominar la opcin de Bsqueda Avanzada que ofrece Google, informacin que se encuentra en http://www.google.com/advanced_search?hl=es Le sugerimos adicionar esta direccin a sus sitios Favoritos.

Si usted convierte en hbito el uso de las cuatro claves que a continuacin describimos, usted se volver mejor investigador que el 90% de los usuarios que utilizan Internet. Se trata solamente de recordar cuatro elementos, cada uno de los cules le suministrar una mejor "Red" para capturar informacin. PRIMERA CLAVE : Comience a ESTRECHAR Tal vez el mayor problema que tiene la gente con los motores de bsqueda es que son muy buenos! Usted puede escribir una palabra y en una fraccin de segundo puede tener 20.000 pginas para revisar. Pero la mayora de ellas no correspondern exactamente a lo que est buscando y usted tendr que gastar un montn de tiempo " buceando" entre ellas, para desechar las 19.993 respuestas inadecuadas. Si usted sabe lo que necesita, por que no empieza por preguntar con la mayor precisin posible? Piense en todas las palabras que deben aparecer siempre en la pgina "precisa". Pngalas en la casilla que indica: CON TODAS LAS PALABRAS. (With All the Words). Piense tambin en todas las pginas distractoras que pueden aparecer porque uno o ms de los trminos utilizados en la bsqueda, tiene varios significados. En que palabras puede usted pensar que le ayuden a eliminar esas pginas? Escrbalas en la casilla que indica SIN LAS PALABRAS (Without the words). Si existen sinnimos del trmino que est buscando y estos pueden aparecer en la pgina que se desea encontrar, escrbalos en la casilla que indica: CON ALGUNA DE LAS PALABRAS (With Any of the Words). Imagine que usted est interesado en conocer acerca del legendario continente perdido de Atlntida. Hay varias pelculas con la palabra Atlntida en el ttulo, pero usted no desea esa informacin. Adems, usted no est interesado en agencias de viajes que se llamen Atlntida. Escriba en nmero de aciertos para cada opcin de bsqueda: PREGUNTA Esta es una forma inadecuada para buscar: CON TODAS LAS PALABRAS: Atlntida Puede afinar la bsqueda intentando esta opcin: CON TODAS LAS PALABRAS: Atlntida continente perdido SIN LAS PALABRAS: pelcula cine filmes entretenimiento viajes Ahora intente lo siguiente: CON TODAS LAS PALABRAS: Atlntida continente perdido CON ALGUNA DE LAS PALABRAS: Atlantes SIN LAS PALABRAS: pelcula cine filmes entretenimiento viajes RESULTADOS

Cuando ensaye cada una de las formas de bsqueda, anote que clase de registros encuentra. Observe que mientras ms especficos sean los trminos que usted incluye o excluye, ms enfocada es su bsqueda.

SEGUNDA CLAVE: Encuentre las Frases, PRECISAR Las palabras se unen en forma predecible. Si usted escribe un frase en la casilla de la opcin de Bsqueda Avanzada de Google que dice CON LA FRASE EXACTA (with the exact phrase), usted podr encontrar pginas en las que las palabras escritas aparezcan juntas y en el orden en que se escribieron. Resulta obvio que esto facilita la bsqueda de cosas que tienen nombre propio compuesto por varias palabras (eje: lugares, ttulos de libros, personas) Tambin es til cuando usted puede recordar una frase particular de algo que usted ha ledo y que ahora debe localizar. Cmo es el resto del cuento que empieza "Simn el Bobito llam al pastelero". La habilidad de hacer bsquedas por frases puede resultar sorprendentemente til. Sospecha usted que un trabajo que entreg uno de sus estudiantes puede ser plagiado si no en su totalidad, si en forma parcial, sin que ste diera los crditos al autor original? Escriba una o dos frases del trabajo y observe que aparece. As mismo puede usted darse cuenta si su trabajo se est copiando sin su autorizacin. Otro uso de esta caracterstica: descubrir la veracidad de cierto tipo de informacin. La prxima vez que reciba notificacin respecto a la aprobacin de una ley muy controversial o sobre un nuevo y peligroso virus de computador, comprubela antes de trasmitirla a otros. Para esto escriba cualquier frase poco usual o singular que vea en el correo electrnico y fjese si existen otros comentarios sobre este rumor en particular. PREGUNTA Esta es una forma inadecuada para buscar: CON TODAS LAS PALABRAS: Atlntida Puede afinar la bsqueda intentando esta opcin: CON TODAS LAS PALABRAS: Atlntida CON LA FRASE EXACTA: patria de los atlantes Ahora intente lo siguiente: CON TODAS LAS PALABRAS: Pombo Afine la bsqueda de la siguiente manera: CON TODAS LAS PALABRAS: Rafael Pombo CON LA FRASE EXACTA: Simn el Bobito llam al pastelero RESULTADOS

TERCERA CLAVE: RECORTAR en Forma Gradual la Direccin de un Sitio en Internet (URL) Esta opcin no es especfica de Google, aunque usted va a utilizarla con frecuencia cuando este usando ms eficazmente ese buscador. Con frecuencia usted encuentra una pgina excelente incrustada en una carpeta que est contenida en otra carpeta que a su vez est metida en otra carpeta. Usted sospecha que existen otras pginas interesantes cerca de ella, pero cmo se pueden encontrar? Una forma sencilla es ir recortando paso a paso la direccin del sitio. Al hacer esto, en ocasiones usted encuentra un mensaje que dice PROHIBIDO! Otras veces accede usted a una lista de archivos y directorios, y algunas veces llega a una pgina que tiene ms enlaces. Es importante saber que cada paso en retroceso le indica a usted con mayor claridad cul es el origen de la pgina. Adems es una buena estrategia a utilizar cuando no se puede localizar una pgina (esto es cuando usted recibe como respuesta de la bsqueda un mensaje 404). En estos casos es posible que el encargado del sitio haya movido la pgina, la haya llevado a una carpeta nueva o haya cambiado el nombre de la carpeta. Recorra el camino retrocediendo hasta el inicio de la direccin y vulvalo a recorrer hacia delante a ver si de sta manera puede encontrar la pgina perdida. Usted ha encontrado un Web Quest realmente bueno y desea saber que ms hay es ese sitio Web puede empezar a recortar la direccin. Empiece aqu: http://www.richmond.edu/academics/a&s/education/projects/webquests/shakespeare/ Ahora recorte la ltima parte: http://www.richmond.edu/academics/a&s/education/projects/webquests/ Qu pudo notar? Continu recortando y observe que sucede: http://www.richmond.edu/academics/a&s/education/projects/ http://www.richmond.edu/academics/a&s/education/ http://www.richmond.edu/academics/a&s/ http://www.richmond.edu/academics/ http://www.richmond.edu/

CUARTA CLAVE: Busque Pginas que se ASEMEJEN Una vez que usted haya encontrado algo que le gusta o requiere utilizando a Google, es muy fcil y adems til encontrar pginas semejantes o similares. Cmo? Debajo del campo destinado a la Bsqueda Avanzada que usted ha estado utilizando hasta ahora, existen dos campos nuevos. Estos le permiten encontrar pginas que Google cree son similares a la que usted ya encontr o que tienen enlaces con la direccin que usted escribi: Encontrar pginas similares a la pgina y Encontrar pginas con enlaces a la pgina. Cmo sabe Google que dos pginas se asemejan? Los detalles del funcionamiento interno de los motores de bsqueda son secretos del oficio, pero podemos asumir con cierto grado de certeza, que los motores se basan en la semejanza de las palabras y los enlaces externos, existentes en las pginas. Lo que si es cierto es que esta opcin funciona admirablemente bien, especialmente cuando usted no sabe que palabras claves debe buscar. Use esta herramienta para encontrar ms informacin sobre algo que para usted es bueno. selo para encontrar pginas que estn enlazadas a la pgina que usted encontr y le es til. Es muy probable que las nuevas pginas tambin le sirvan. Tambin squele brillo a su Ego: si usted ha puesto una pgina hecha por usted en un servidor pblico y en el ha estado durante un tiempo prudencial, entrese de quin ms ha puesto enlaces en sus paginas a su sitio. Suponga que usted ha encontrado un sitio como Eduteka que le proporciona contenido para los docentes que desean integrar la tecnologa a la educacin y desea que otras pginas similares puede encontrar. Escriba en nmero de aciertos para cada opcin de bsqueda: PREGUNTA Use la caracterstica que tiene Google para encontrar pginas que se asemejen a una que a usted le guste mucho: ENCONTRAR PGINAS SIMILARES A LA PGINA: www.maseducativa.com Otra forma de explorar un sitio Web es encontrar quin tiene enlaces a ese sitio. ENCONTRAR PGINAS CON ENLACES A LA PGINA: www.maseducativa.com Pruebe lo siguiente: SIMILARES: kids.msfc.nasa.gov ENLACES: kids.msfc.nasa.gov RESULTADOS

Finalmente para recapitular, recuerde las cuatro claves que le permitirn realizar una bsqueda no solo mejor sino ms efectivamente: ESTRECHAR, PRECISAR, RECORTAR y ASEMEJAR