Práctico Webmaster

Reportaje

Cómo funciona la World Wide Web
Internet, probablemente lo uses a diario de manera rutinaria. ¿Te has preguntado todos los cambios que ha sufrido hasta ser lo que es? Internet esta compuesto por múltiples servicios y protocolos, pero el más usado es el World Wide Web. Descubre lo más relevante de la historia y el funcionamiento de este servicio.

L
118

a World Wide Web o “la Web” como normalmente es conocida, es una red formada por ordenadores encargada de la presentación y obtención de documentos. Estos documentos pueden contener elementos de texto o multimedia. Todos ellos forman una gigantesca red de información que permite ser navegada mediante un simple clic de nuestro ratón. La información contenida en dichos documentos puede presentarse en multitud de

formatos. Se puede leer como texto normal, visualizarse como una fotografía, ser animada como un vídeo, escucharse como música o explorarse como mundo virtual en 3D.

Como muchos de los avances científicos del último siglo el nacimiento de Internet comienza con el impulso del ejército. Debido al temor a una guerra de los Estados

Nacimiento de Internet

Unidos, se decide crear la “Agencia para Proyectos de Investigación Avanzados” (ARPA). Esta agencia se encargó en los siguientes años de crear un sistema de comunicaciones entre ordenadores que fuera capaz de mantenerse en funcionamiento continuamente pese a que uno de los nodos pudiese ser destruido. Aunque pueda parecer que había poco interés científico y mucho militar en estos estudios, debido a lo escasos y caros que eran los ordenadores en aquella época, era

muy necesario avanzar en el campo de las técnicas de comunicación. En 1969, gracias a los estudios realizados en este campo, se pone en funcionamiento Arpanet, que conectó cuatro ordenadores en UCLA (Universidad de California en Los Ángeles), UCSB (Universidad de California en Santa Bárbara), la Universidad de Utah y el SRI (Stanford Information Center). Durante los siguientes años, el número de ordenadores agregados a la red va creciendo rápidamente. Los

Reportaje
tipos de protocolos (la forma con la que se hablan los ordenadores) que implementaba la red van madurando y en 1972 todos usan el mismo. Ese mismo año aparece el correo electrónico y 12 meses más tarde el 75% de las transmisiones son realizadas mediante esta aplicación. Además se produce la primera demostración pública de grandes dimensiones de Arpanet. Dicha demostración se realizó en la Conferencia Internacional sobre Comunicación entre Computadoras (ICCC) en la ciudad de Washington. Gracias a ella muchos de los fabricantes de hardware y software ven las posibilidades de dicha red y deciden empezar a incorporarlos en su línea de productos. A la vez que Arpanet, se estaban creando otro tipo de redes con características similares, esto hizo que surgiera el primer problema, que no era otro, que la incompatibilidad para la conexión entre redes diferentes. Para ello en 1974 y con una revisión en 1978 nace el protocolo TCP/IP (Transmission Control Protocol/ Internet Protocol), que es el actual protocolo que usamos para hacer transmisiones en Internet y que permitía la conexión entre diferentes redes. Año a año el número de usuarios de la red fue aumentando. En 1981 se creo CSNET, una red encargada de proporcionar servicios de correo electrónico entre universidades sin acceso a Arpanet, ambas se fusiona-

Webmaster

Práctico

Desde explorer copiar el código fuente de una página para su posterior edición. Basta con dar Ver, Código fuente.

Una forma para editar o modificar las líneas de texto del código fuente es a través del bloc de notas de Windows. por Internet. En esta primera versión solo es posible navegar en formato texto. La idea de hipertexto (documentos que apuntan a otros documentos y que pueden ser navegados mediante enlaces) no es un invento propio de Bernes-Lee, pero sí es él quien consiguió adaptar esta idea a Internet, logrando la conexión entre páginas en diferentes ordenadores. En 1993 aparece Mosaic, que es el primer navegador que permite mostrar por pantalla imágenes, además de incluir un interfaz gráfico sencillo y estar disponible para sistemas ordenadores con Unix, Macintosh y Windows. Ese mismo año Mosaic ya era usado por más de un millón de personas en todo el mundo, y también en ese año, parte del código de Mosaic, fue reescrito por una empresa privada, que saco al mercado Netscape Navigator. Una año y medio después, eran

ron en el año 1983. Ese mismo año Arpanet deja de ser utilizada por el ejército y 68 de los 113 nodos que lo formaban pasan a formar la red Milnet de uso exclusivo militar. Justo un año después Arpanet deja de existir y una parte de ella se transforma en NSFNET, que es la primera red abierta a la comunidad científica de todo el mundo. Para que te hagas una idea, en esa época los ordenadores estaban conectados entre sí mediante una velocidad de 56Kbps, o lo que es lo mismo: con un módem de los que dispone actualmente cualquier ordenador personal. En 1989 se crea una red similar en Europa, la RIPE (Reseaux IP Europeens) y en el 1988 en España aparece Red Iris (Interconexión de los Recursos Informáticos) que se conectaría a la red NSFNET en el año 1990. Cada vez la red va adquiriendo mas notoriedad y las Documento empresas comienzan a Usuario HTML confiar en su potencial comercial. Como las leServidor Cliente yes americanas no perAplicación Navegador WWW mitían más que el uso meramente científico, Base las empresas presionade Datos ron al gobierno que no tuvo más remedio que La gráfica muestra el funcionamiento de trabajo de la web bajo permitir su uso comerdemanda del usuario. cial. Así pues 1995 se

Creando historia en la WWW, Mosaic fue el primer navegador que permitía al usuario visualizar imágenes en la pantalla. convierte en el año en que se retira la financiación de NSFNET y cuando se produce la apertura de Internet a los ciudadanos. En la actualidad hay más de cien millones de ordenadores conectados y el ritmo de crecimiento es gigantesco.

Durante este tiempo, concretamente en el año 1989, un trabajador del Laboratorio Europeo para la Física de Partículas (CERN), se había puesto a desarrollar un sistema de hipertexto que llamaría World Wide Web. Se trataba de Tim Bernes-Lee, que durante unos años hace funcionar un prototipo similar al actual. No será hasta 1992 cuando pone a disposición de todo el mundo el primer software que permite navegar

Las primeras páginas Web

Netcraft ofrece estadísticas de uso de servidores Web en todo el mundo.

Tim Bernes-Lee: el constructor de un nuevo “mundo”
Graduado en el Queen’s College de la Oxford University (Reino Unido), construyó su primer ordenador con un procesador M6800, unos cuantos chips lógico, algo de soldadura y una televisión vieja. Una vez finalizada la etapa universitaria inició su carrera en el mundo empresarial, trabajando en diferentes compañías relacionados con el mundo de las telecomunicaciones y la tecnología. En 1980 comenzó labores de consultor de software en el CERN (Ginebra, Suiza), Es en este momento cuando, fuera del horario laboral, comenzó a desarrollar un programa que le permitiera almacenar información y recuperarla. Estos trabajos nunca salieron a la luz, pero serían el germen de sus posteriores desarrollos. Su idea consistía en almacenar información que estuviera interconectada mediante enlaces completamente aleatorios. Para ello propuso la creación de un espacio de hipertexto global que permitiera acceder a información en redes completamente independientes y que pudiera ser localizada mediante un identificador universal de documento(URL). Su sueño era crear un espacio donde todo el mundo pudiera compartir la información. Y su base fundamental era que un enlace permitiría acceder a cualquier tipo de datos. En 1984 regresa al CERN con una beca. Es durante estos años cuando termina de perfilar sus trabajos y por fin publica en 1989 su proyecto de hipertexto global que posteriormente llamaría World Wide Web. Bernes-Lee crearía el primer servidor web llamada httpd y el primer navegador. A partir de este momento, se dedica a coordinar el proyecto y redefinir con profesionales a lo largo de todo el planeta la Web actual. En la actualidad trabaja en el Massachusetts Institute of Technology (MIT), uno de los centros más prestigiosos del mundo en investigación tecnológica, y es el director del World Wide Web Consortium (W3C), consorcio encargado de coordinar mundialmente el desarrollo de la Web.

119

Práctico Webmaster

Reportaje
vez que el cliente ha recibido la información, analiza la forma en la cual esta organizado el documento HTML y lo muestra por pantalla. En general los servidores son ordenadores muy potentes, esto es debido a la gran capacidad que deben de tener para poder atender a las múltiples peticiones que le llegan simultáneamente. Los clientes por el contrario suelen ser PCs de sobremesa, puesto que su única misión es la de mostrar por pantalla la información proveniente del servidor. Cuando un usuario visita el contenido de una página web puede encontrarse enlaces o links hacia páginas alojadas en el mismo servidor al cual está solicitando información, o en otros servidores; esto es indiferente a la hora de los pasos que se ha de seguir para ejecutar el enlace. La única acción que realizará el usuario es muy sencilla y consiste en hacer clic sobre el enlace. A partir de este momento un servidor traducirá la dirección Web contenida en el enlace (Por ejemplo http://www.micasa.org/noticias.htm l) en una dirección IP que permitirá acceder a la página. El servidor que realiza esta acción se denomina DNS (Domain Name Server) , su función es la de traducir el nombre de un servidor, para nuestro caso www.micasa.org, en una dirección IP, por ej. 192.234.54.111. Una vez obtenida la dirección IP nuestro navegador se conectará a la misma y le solicitará la página que deseamos ver (En el caso del ejemplo solicitábamos “ noticias.html” ). El servidor buscará la información en sus discos duros y la enviará para que nuestro navegador la muestre por pantalla. La primera versión de HTML estaba limitada a unas pocas etiquetas (que es la manera que tenemos de definir elementos en nuestro documento) y primaba la información sobre la forma de presentación. Entre las etique-

APACHE más que un servidor
Lo que empezó con un proyecto para realizar un servidor Web, se ha ido convirtiendo poco a poco en una las mayores comunidades de

El número de ordenadores conectados a Internet ha crecido de cuatro a, casi, 100 millones en la actualidad desde el nacimiento de Arpanet.

El número de servidores web han pasado de 0 a 100.000 en los últimos 10 años gracias a la explosión de Internet y a la entrada del mundo empresarial en busca de negocio. ya 65 millones los usuarios de dicho servicio. En el año 1995 entra Microsoft en el juego de navegadores regalando su producto Internet Explorer, es en ese momento cuando empieza la guerra de navegadores entre Microsoft y Netscape. Este último pese a tener prácticamente todo el mercado copado y ofrecer un producto mucho mejor fue perdiendo terreno ante las continuas mejoras que iban realizando Microsoft en su explorador. El salto definitivo se produjo cuando Microsoft lanzo la versión 5 de su navegador y Netscape tardó demasiado en sacar al mercado la versión 6. Microsoft comenzó así a ganar terreno en el mercado, siendo en la actualidad el navegador más usado con cerca de un 95% de cuota de mercado. Netscape para intentar combatir a Microsoft puso a disposición de la comunidad internauta el código fuente de Navigator, lo cual originó el nacimiento de un nuevo proyecto llamado Mozilla, el navegador que en la actualidad intenta seguir en número de usuarios a Explorer. tructura de documentos que iba ha hacer que todo este sistema funcionara. El protocolo es la forma que tienen de comunicarse un servidor Web y un navegador, el nombre con que lo bautizó fue HyperText Transfer Protocol (HTTP). En cuanto a la información, era necesaria una forma de estructurarla, que fuera sencilla y en la cual importase más la información que la forma. Para ella creó un lenguaje que debía de ser universal a todos los navegadores, el HyperText Markup Language (HTML). Todas las comunicaciones que son generadas por la Web son transmitidas entre ordenadores conectados mediante una red. Los ordenadores que hacen posible que la Web funcione tienen dos tipos de software, unos son servidores y otros son clientes. Para poder publicar información y hacerla disponible a todo el mundo tenemos que tener un ordenador que ejecute un software servidor. Si lo que queremos es recuperar y ver información de un servidor, lo que debemos de tener es un navegador. El funcionamiento consiste en que un cliente hace peticiones de información al servidor, éste posteriormente busca la información y se la envía de retorno al cliente. Toda esta gestión se realiza hablando mediante el protocolo HTTP. Una

desarrolladores de software libre del planeta. En la actualidad el 63% de los servidores Web que hay en Internet son Apache. El proyecto de servidor web Apache se divide en dos desarrollos. El primero y original, cuya última versión es la 1.3.27, y el llamado Apache 2.0 con la versión 2.0.46. Las diferencias entre ambos varían sobre todo en como el código del servidor web esta escrito, siendo la versión 2.0 mucho más fácil y estable, tanto en su ejecución (se ha mejorado mucho el rendimiento para plataformas no Unix), como en la forma de configurarlo. Además de los servidores web bajo el nombre de Apache Software Foundation nacieron multitud de proyectos que han permitido que el WWW se extienda con mayor rapidez. Para más información visita la página web http://www.apache.org.

HTML y más allá

tas que había, podíamos encontrarnos <TITLE> para el titulo de la página, <UL> para poder hacer listas ordenadas de términos, o los enlaces que nos permitían la navegación entre diferentes documentos. Esta versión no llegó a aparecer como tal y no se realizó ninguna RFQ (Request For Quotation), que es un documento donde se manda la especificación de lo que se desea hacer, una aplicación, un protocolo o un algoritmo para que todo el mundo lo lea y añada, modifique o sugiera cosas que le pueden parecer interesantes.

Mientras que Tim Berners-Lee estaba trabajando en el CERN, creó el protocolo de comunicación y la es-

¿Como funciona la World Wide Web?

Imagen actual de la web de CERN, sitio en el que nacio el primer navegador de Internet de la mano de Tim Bernes-Lee en 1989.

120

Reportaje
En la siguiente versión, la 2.0, el número de etiquetas aumentó, siendo posible incluir una imagen dentro de un documento con la etiqueta IMG. En este momento empezaron a aparecer etiquetas relacionadas con la presentación del texto como <B> o <I> las cuales dibujaban un texto en negrita o en itálica. También entraron a formar parte de la especificación los formularios <FORM>, con la posibilidad de poder realizar operaciones en el servidor Web desde nuestro navegador. Fue ya con la versión 3.2 cuando se produjo el mayor número de mejoras en la especificación de HTML. Aparecieron las tablas <TABLE>, la etiqueta <FONT> que nos permitía modificar el tipo de letra, tamaño y color de nuestros textos, los applets que son pequeños programas escritos en Java que eran ejecutados dentro del navegador y la ejecución de scripts, que eran trozos de código que eran ejecutados también en el cliente, pero con mucha menos potencia que un applet. Es a partir de estas especificaciones cuando las diferentes compañías empiezan a extender HTML y las capacidades que tienen sus navegadores. Concretamente en la versión 3.2 de Netscape Navigator se introdujo el lenguaje en cliente JavaScript. Éste es un lenguaje de programación, interpretado, que se usa dentro del entorno web para poder dar capacidades dinámicas a nuestras páginas Web. Como ejemplo la posibilidad de lanzar un pop-up, tener un reloj que se actualice continuamente, o desactivar una casilla de un formulario dependiendo del contenido de otra. Otra extensión añadida por Netscape fueron las etiquetas <FRAMESET>, que permitían crear varias ventanas con documentos HTML independientes dentro del mismo navegador. Microsoft respondió también con sus propias extensiones y con la creación de JScript que pese a ser muy parecido en la sintaxis a JavaScript aportaba capacidades diferentes. Esto originó que cada una de las plataformas fuera desarrollando su propia especificación y que las extensiones DHTML (Dynamic HTML) no llegaran a extenderse mucho y otras opciones como Flash fueran ganando terreno poco a poco.

Webmaster

Práctico

Página principal del W3C, organismo encargado de velar y proteger los estándares y el correcto desarrollo de la WWW. Así se llega a la actual versión 4.01 de HTML, que como principal mejora ha introducido las hojas de estilo. Estas nos permiten definir fuentes, tamaños, forma, colores, de una manera global para que así la presentación en todos nuestros documentos sea la misma sin necesidad de tener que incluir la etiqueta <FONT> continuapáginas. Al contrario de lenguajes como JavaScript o VBScript, que se ejecutaban en el cliente, una vez, que la página había sido descargada, estos nuevos lenguajes eran ejecutados por el servidor web siendo una pagina HTML de resultado lo que era enviado al cliente. La última tecnología en aparecer

de acceso a la información dependiendo de los copyright o formas de hacer Webcast en directo Emisión de imagen online) como si se tratara de una televisión por cable. La necesidad de mantener cada vez webs con mayor número de información y el aumento de dispositivos para acceder a las mismas, esta facilitando la aparición de lenguajes alternativos al conocido HTML; es el caso del metalenguaje XML del cual han surgido otros lenguajes como Wireless Markup Language (WML), especialmente diseñado para teléfonos móviles con navegador incorporado. Otra tecnología que poco a poco va ganando importancia es el mirroring o Content Distribution Network (CDN). Dicha tecnología consiste en que muchos servidores en lugares completamente distintos contengan la misma información. Así, cuando un usuario quiera acceder a una página,

La reciente tecnología está basada en la actual estructura de la Web, pero desde el CERN se avanza en la Web del futuro. Ésta, conocida como web semántica se orienta al contenido de los documentos.
mente y en caso de que sea necesario un cambio, solo tengamos que realizarlo en un sitio. A partir de esta versión, y debido a la posibilidad de incluir cualquier tipo de archivo en nuestra página, el contenido multimedia va incrementándose cada vez más, ya es posible introducir un stream de vídeo, reproducir una canción mientras navegamos una web o incluir animaciones en Flash. En el lado del servidor, las tecnologías también han ido avanzando poco a poco para facilitar la vida a los desarrolladores. En los primeros momentos, cuando se quería manejar un formulario, se tenía que hacer uso de los Common Gateway Inteface (CGI). Este interface permite pasar información del usuario al servidor web, de éste a una aplicación y posteriormente devolver una respuesta de la aplicación al servidor, y de nuevo al cliente. El siguiente paso fueron los módulos que se ejecutaban dentro del servidor web, así aparecieron lenguajes de programación como ASP o PHP. Estos permitían introducir código que se ejecuta en las han sido los desarrollos Enterprise o Web Services. Un Web Service es simplemente un componente, trozo de código o aplicación que esta instalado en un servidor web y el cual es capaz de intercambiar datos o información con otro Web Service alojado en una máquina distinta. El uso de Web Services aumenta la fiabilidad de nuestras aplicaciones, la tolerancia a fallos y su rendimiento. La cantidad de información contenida en la Web es más y más grande, el número de usuarios va aumentado cada vez más y el número de empresas que deciden formar parte de la Web también. Estas empresas están cambiando su tradicional catálogo en papel por un catálogo online, están buscando crear nuevas posibilidades de negocio dentro de Internet, con lo que se origina que continuamente se este mejorando el funcionamiento de la Web. Además se esta intentando crear nuevos métodos para la búsqueda de contenidos, para la restricción el sistema CDN redireccionará dicha petición al servidor Web que esta más cercano a él. En la actualidad muchos de los grandes servidores usan este sistema. Estas tecnologías están pensadas con la actual estructura de la Web. Pero ya desde el CERN se esta avanzando en la Web del futuro. Se conoce como web semántica y esta orientada no tanto a lo que se ve, como sucede ahora, sino al contenido de los documentos. Esto permitirá mejorar los métodos de búsqueda, y la reutilización de los datos entre diferentes servidores o aplicaciones.

Futuro

Enlaces de interés
World Wide Web Consortium: www.w3.org HTML en el w3c: www.w3.org/MarkUp/ HTTP en el w3c: www.w3.org/Protocols/ Microsoft Explorer: www.microsoft.com/windows/ ie/default.asp Netscape Navigator: www.netscape.com Mozilla: www.mozilla.org/ XML de O’Reilly: www.xml.com/ Semantic Web: www.w3.org/2001/sw/ CERN: www.cern.ch Estadísticas de servidores Web: www.netcraft.com Todo sobre Java 2: java.sun.com Servidor Web Apache: www.apache.org

Porcentaje de servidores utilizados

Servidores totales en Internet por tipo


121