You are on page 1of 10

HTML (acrônimo para a expressão inglesa HyperText Markup Language, que significa Linguagem de Marcação de Hipertexto) é uma linguagem

de marcação utilizada para produzir páginas na Web. Documentos HTML podem ser interpretados por navegadores. A tecnologia é fruto do "casamento" dos padrões HyTime e SGML. HyTime é um padrão para a representação estruturada de hipermídia e conteúdo baseado em tempo. Um documento é visto como um conjunto de eventos concorrentes dependentes de tempo (como áudio, vídeo, etc.), conectados por hiper-ligações. O padrão é independente de outros padrões de processamento de texto em geral. SGML é um padrão de formatação de textos. Não foi desenvolvido para hipertexto, mas tornou-se conveniente para transformar documentos em hiper-objetos e para descrever as ligações.

Índice
• • • •

• • • • • •

1 História 2 Etiquetas 3 Edição de documentos HTML 4 Estrutura básica de um documento o 4.1 Cabeçalho o 4.2 Corpo 5 Hiperligações 6 Caracteres especiais e símbolos 7 Editores HTML 8 Referências 9 Ver também 10 Ligações externas

História
Tim Berners-Lee criou o HTML original (e outros protocolos associados como o HTTP) em uma estação NeXTcube usando o ambiente de desenvolvimento NeXTSTEP. Na época a linguagem não era uma especificação, mas uma coleção de ferramentas para resolver um problema de Tim: a comunicação e disseminação das pesquisas entre ele e seu grupo de colegas. Sua solução, combinada com a então emergente internet pública (que tornaria-se a Internet) ganhou atenção mundial. As primeiras versões do HTML foram definidas com regras sintáticas flexíveis, o que ajudou aqueles sem familiaridade com a publicação na Web. Atualmente a sintaxe do HTML é muito mais rígida, permitindo um código mais preciso. Através do tempo, a utilização de ferramentas para autoria de HTML aumentou, assim como a tendência em tornar a sintaxe cada vez mais rígida. Apesar disso, por questões históricas (retrocompatibilidade), os navegadores ainda hoje conseguem interpretar páginas web que estão longe de ser um código HTML válido. A linguagem foi definida em especificações formais na década de 1990, inspiradas nas propostas originais de Tim Berners-Lee em criar uma linguagem baseada em SGML

para a Internet. A primeira publicação foi esboçada por Berners-Lee e Dan Connolly, e publicada em 1993 na IETF como uma aplicação formal para o SGML (com uma DTD em SGML definindo a gramática). A IETF criou um grupo de trabalho para o HTML no ano seguinte, e publicou o HTML 2.0 em 1995. Desde 1996, as especificações HTML vêm sendo mantidas, com o auxílio de fabricantes de software, pela World Wide Web Consortium (W3C).[1] Apesar disso, em 2000 a linguagem tornou-se também uma norma internacional (ISO/IEC 15445:2000). A última especificação HTML lançada pela W3C foi a recomendação HTML 4.01, publicada no final de 1999. Uma errata ainda foi lançada em 2001. Desde a publicação do HTML 3.5 no final de 1997, o grupo de trabalho da W3C tem cada vez mais — e de 2002 a 2006, de forma exclusiva — focado no desenvolvimento do XHTML, uma especificação HTML baseada em XML que é considerada pela W3C como um sucessor do HTML.[2][3][4] O XHTML faz uso de uma sintaxe mais rigorosa e menos ambígua para tornar o HTML mais simples de ser processado e estendido.

Etiquetas
Todo documento HTML apresenta etiquetas[5], elementos entre parênteses angulares (chevron) (< e >); esses elementos são os comandos de formatação da linguagem. A maioria das etiquetas tem sua correspondente de fechamento:
<etiqueta>...</etiqueta>

Isso é necessário porque as etiquetas servem para definir a formatação de uma porção do documento, e assim marcamos onde começa e termina o texto com a formatação especificada por ela. Alguns elementos são chamados “vazios”, pois não marcam uma região de texto, apenas inserem algum elemento no documento:
<etiqueta>

Uma etiqueta é formada por comandos, atributos e valores. Os atributos modificam os resultados padrões dos comandos e os valores caracterizam essa mudança. Exemplo:
<HR color="red">

No qual:
• • • HR = comando que desenha uma barra horizontal color = atributo que especifica a cor da barra red = valor do atributo color, que é a cor da barra que será desenhada

Cada comando tem seus atributos possíveis e seus valores. Um exemplo, é o atributo size que pode ser usado com o comando FONT, com o HR mas que não pode ser usado com o comando BODY. Isso quer dizer que devemos saber exatamente quais os atributos e valores possíveis para cada comando. De uma maneira geral o HTML é um poderoso recurso, sendo uma linguagem de marcação muito simples e acessível voltada para a produção e compartilhamento de documentos e imagens.

Edição de documentos HTML
Os documentos em HTML são arquivos de texto simples que podem ser criados e editados em qualquer editor de textos comum, como o Bloco de Notas do Windows, ou o TextEdit, do Macintosh. Para facilitar a produção de documentos, no mercado existem editores HTML específicos, com recursos sofisticados, que facilitam a realização de tarefas repetitivas, inserção de objetos, elaboração de tabelas e outros recursos (Ver lista abaixo). Basicamente dividem-se em dois tipos:
• •

Editores de texto fonte: inserem automaticamente as etiquetas, orientando a inserção de atributos e marcações. Editores WYSIWYG: oferecem ambiente de edição com um "esboço" resultado final das marcações.

Estrutura básica de um documento
A estrutura de um documento HTML apresenta os seguintes componentes:
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://www.w3.org/TR/html4/strict.dtd"> <html lang="pt"> <head> <title>Título do Documento</title> </head> <body> texto, imagem, links, ... </body> </html>

As etiquetas HTML não são sensíveis à caixa, portanto tanto faz escrever <HTML>, <Html>, <html> ou <HtMl>. As etiquetas básicas de HTML, cuja presença é altamente recomendada nas páginas são:
• • • <html>: define

o início de um documento HTML e indica ao navegador que todo conteúdo posterior deve ser tratado como uma série de códigos HTML. <head>: define o cabeçalho de um documento HTML, que traz informações sobre o documento que está sendo aberto. <body>: define o conteúdo principal, o corpo do documento. Esta é a parte do documento HTML que é exibida no navegador. No corpo podem-se definir propriedades comuns a toda a página, como cor de fundo, margens, e outras formatações.

Cabeçalho Dentro do cabeçalho podemos encontrar os seguintes comandos:

• • • • •

<title>: define

o título da página, que é exibido na barra de título dos

navegadores. <style>: define formatação em CSS. <script>: define programação de certas funções em página com scripts, podendo adicionar funções de JavaScript. <link>: define ligações da página com outros arquivos como feeds, CSS, scripts, etc. <meta>: define propriedades da página, como codificação de caracteres, descrição da página, autor, etc. São meta informações sobre documento. Tais campos são muitos usados por mecanismos de busca(como o Google) para obterem mais informações sobre o documento, a fim de classificá-lo melhor. Por exemplo, pode-se adicionar o código <meta name="description" content="descrição da sua página" /> no documento HTML para indicar ao motor de busca que texto de descrição apresentar junto com a ligação para o documento. Para o sistema Google, comandos meta como keywords por exemplo não são utilizadas para indexar páginas. Apenas <title> e a meta <description> são usadas para descrever a página indexada.[6]

Obs: as etiquetas <style> e <script> servem tanto para delimitar o espaço usados pelos códigos na página quanto para invocar códigos existentes em outros arquivos externos. Corpo Dentro do corpo podemos encontrar outras várias etiquetas que irão moldar a página, como por exemplo:
• • • • • • • • • • <h1>, <h2>,... <h6>: cabeçalhos

• • •

e títulos no documento em diversos tamanhos. (quanto menor for o número, maior sera o tamanho da letra) <p>: novo parágrafo. <br>: quebra de linha. <table>: cria uma tabela (linhas são criadas com <TR> e novas células com <TD>. Já os cabeçalhos de coluna são criados com a etiqueta <TH>.) <div>: determina uma divisão na página a qual pode possuir variadas formatações. <font>: altera a formatação (fonte, cor e tamanho) de um trecho do texto. <b>, <i>, <u> e <s>: negrito, itálico, sublinhado e riscado, respectivamente. <img>: imagem. <a>: hiper-ligação para um outro local, seja uma página, um e-mail ou outro serviço. <textarea>: caixa de texto (com mais de uma linha); estas caixas de texto são muito usadas em blogs, elas podem ser auto selecionáveis e conter outros códigos a serem distribuídos. <acronym>: acrônimo (sigla) <cite>: citação <address>: endereço

Hiperligações

Uma propriedade importante dos documentos HTML é a possibilidade de fazer hiperligações. Para isso usa-se a etiqueta <a> (do inglês, anchor). Esta tem os atributos: href que define o alvo da hiperligação (que pode ser uma página de Internet, uma parte da mesma página ou um endereço de email) ou name que define um alvo nessa página (a onde se pode fazer uma hiperligação usando a etiqueta a com o atributo href). Exemplos:
• <a href="http://pt.wikipedia.org/">Clique aqui para aceder à página principal da Wikipédia em português.</a> <a name="nome">texto</a>

Em que nome e texto podem ser substituídos por o que se desejar. Depois usa-se <a href="#nome"> </a> para hiperligar a este "anchor".

Caracteres especiais e símbolos
Os caracteres especiais definem-se usando comandos que começam com & e terminam com um ;. Alguns exemplos incluem &aacute; (á), &agrave; (à), &atilde; (ã), &acirc; (â), &auml; (ä) e &ccedil; (ç). Qualquer outra vogal pode ser substituída pelo a destes exemplos, incluindo maiúsculas
Na Internet todos podem disseminar informações. Tanto pessoas "importantes", como qualquer cidadão comum, pois todos contam com canais de distribuição para expor suas idéias. Uma forma de se conseguir isso é criar e publicar páginas (home pages), que podem congregar diferentes tipos de arquivos: textos, imagens, sons e vídeos. Quando se publica um "site" (uma página ou um conjunto delas) obtém-se uma URL, ou seja, um endereço, que ficará acessável pelo serviço WWW, e que permitirá sua visualização por pessoas no planeta todo. Evidentemente, quando alguém acessa e visualiza também poderá copiar os arquivos que quiser. (Se desejar saber como gravar, no Firefox, clique aqui).

HTML
Para criar e publicar páginas é fundamental aprender algo sobre a linguagem HTML, que é simples e pode ser aprendida sem maiores dificuldades por usuários leigos, não sendo necessárias noções anteriores de programação. O que acontece quando se digita um endereço na barra de endereços de um navegador? Qualquer que seja o browser ( Internet Explorer, Firefox, Opera, ou...) ele procurará pelo site solicitado, fazendo um pedido a computadores especificos que estão espalhados pela internet, denominados servidores de DNS. Eles tem uma base de dados que identificam exatamente qual é o computador onde está a informação, pois localizam o seu endereço IP. Após contatar essa máquina, o navegador lhe efetua o pedido de cópia dos arquivos para o computador onde a pessoa está. Toda a comunicação entre os computadores é feita em texto corrido, basicamente usando a linguagem HTML. Essa sigla vem do inglês: Hiper Text Mark-up Language, e pode ser

traduzida por Linguagem de Marcação de Hiper Texto. HTML é uma linguagem de formatação que diz exatamente como o documento foi construído por seu autor. Por exemplo, especifica a posição e tamanho das figuras; o tipo, cor, e tamanho da fonte; a cor do fundo; o tamanho das margens, etc... O navegador, ao ler o arquivo HTML, tem condições de reproduzir exatamente, no computador local, a página que está em outro computador. Assim, essa linguagem é utilizada para criar arquivos que podem ser visualizados na World Wide Web, um dos serviços mais populares da Internet e por correio eletrônico, pois o HTML permite a criação de documentos que podem ser lidos em qualquer tipo de computador e transmitidos pela Internet e por mensagens eletrônicas. Importantíssimo é mencionar que o HTML permite criar ligações entre arquivos. São os links, que possibilitam a navegação virtual, ou seja, ao serem clicados permitem acessar outro arquivo, o qual, evidentemente, pode estar no mesmo computador, ou não e pode ter qualquer natureza: texto, imagem, som, vídeo. Aqui é importante lembrar que hipertexto denomina documentos que podem conter todo o tipo de informação: textos, fotos, animações, trechos de vídeo, sons e programas, além dos links, as ligações para outros arquivos. A linguagem é descritiva e foi criada para ser lida em qualquer computador que tenha instalado um programa navegador (em inglês: browser) como Mozilla suíte, Firefox, Netscape, Internet explorer, Opera, Safari, Planet, entre outros). Uma das principais características do HTML se reflete no fato de se um programa navegador não "entender" um determinado comando, este é ignorado e não é apresentado, não originando mensagem de erro e afetando minimamente o restante do documento. Assim, resumidamente, quando se digita um endereço de um site, o navegador contata o servidor de DNS e descobre onde está o computador que hospeda o site desejado, envia o pedido de cópia do(s) arquivo(s) que está naquele endereço, então, o servidor web analisa e trata o pedido e responde ao navegador com um arquivo de texto, o navegador obedece o texto e constrói a página na tela do cliente, a pessoa vê, em seu monitor, a página web solicitada. Entretanto, como o HTML é uma linguagem descritiva, de formatação, nem sempre diferentes navegadores exibem a mesma apresentação em cada página. Ou seja, os detalhes codificados no HTML podem ser suficientes para um deles mas não suficientes para outro. Assim, cada navegador poderá interpretar os dados de uma forma um pouco diferente. Portanto, quanto mais perfeitamente descrita a página for, maiores serão as chances do documento ser interpretado da mesma forma por diversos navegadores. Linguagem de formatação Diferentemente dos processadores de texto, a linguagem HTML não foi criada para controlar a aparência dos documentos. O HTML apenas informa ao navegador o que são os elementos que estão na página, quais arquivos (imagens, sons) ela contém e onde eles estão. (Por exemplo, um certo trecho é

identificado como o título principal do documento e outro trecho como um link). Essa descrição é feita por meio de comandos, os tags, marcas especiais que determinam o papel de cada elemento dentro do texto e que permitem ao browser interpretar e exibir a página conforme ela foi concebida por seu autor(a). Assim, a formatação do documento é deixada para o navegador. Portanto, cada programa pode exibir a página de um modo um pouco diferente (o que dificulta o trabalho de programação visual). Além disso, cada usuário pode modificar a configuração padrão de seu navegador para que o seu programa mostre o documento na fonte (tipo de letra) e nas cores que desejar. Com o tempo a linguagem foi evoluindo com a introdução de novos tags e novos atributos de estilo. O HTML passou a exercer uma dupla função em relação ao conteúdo: exibir e estilizar, ou seja dar-lhe a aparência visual.

Para se criar documentos HTML pode-se usar qualquer editor de texto, pois basta que se salve um documento com o formato txt com a terminação htm ou html, para que ele possa ser aberto por qualquer navegador. Entretanto , a linguagem HTML é estática, mas pode ser dinamizada por outras linguagens como Javascript e CSS: são do tipo "client side", ou seja são interpretadas pelo browser no computador do cibernauta ou PHP, asp, java: são interpretadas pelos servidores web É importante notar que a maioria dos sistemas operacionais já vêm com um editor simples que cria documentos de tipo txt (Exemplo: bloco de notas - Notepad). Aqui convém notar que o Metapad tem algumas opções extras. O NVU já tem um editor incluído.

HTTP
HTTP significa HyperText Transfer Protocol, o que pode ser traduzido por Protocolo de Transferência de Hipertexto. Assim, HTTP é o protocolo usado pelos computadores para a transmissão de dados na World Wide Web. É importante lembrar que hipertexto é um texto que pode apresentar sons, vídeos, imagens e outras aplicações. Ou seja, os dados que podem ser transferidos podem ser de qualquer tipo. Mas, o que realmente caracteriza o hipertexto é que pode possuir links, isto é, ligações para outros arquivos (textos, imagens, sons, vídeos). Assim, os links possibilitam a "navegação", tanto dentro de um arquivo, de um ponto para outro, ou entre arquivos diferentes, que podem estar em computadores também diferentes, e que podem estar localizados proximamente ou estar extremamente distantes no planeta. Portanto, quando se digita um endereço na barra de endereços em um navegador ou, sempre que se clica sobre um link, o navegador realiza uma comunicação com um servidor da Web por meio do protocolo HTTP e possibilita tudo o que a Internet pode oferecer.

Páginas e sites Quando se utiliza um navegador para visualizar um determinado endereço na Internet diz-se que "se acessa o site".

Assim, para acessar um endereço, tal como http://www.cultura.ufpa.br/dicas, deve-se digitá-lo no local apropriado (barra de endereços) na tela do programa navegador. Isso implicará em que todos os arquivos contidos no endereço sejam copiados e posicionados no computador do usuário. Também são formatados como o autor concebeu e, finalmente, podem ser visualizados na tela do navegador. Quando se acessa um "site", em geral entra-se pela página principal, onde é comum existir uma mensagem de boas vindas e uma espécie de índice, sumário, ou menu, no qual se

pode clicar para chegar às demais páginas. Portanto:
documento é uma página (ou "home page", ou hp) "site" pode ser constituído de 1 ou mais páginas

HTTPS
Alguns endereços começam com HTTPS. O S significa seguro. Sob o protocolo HTTPS, a transferência de dados é feita de uma maneira mais segura, para evitar discrepâncias e interferências indesejadas. Assim, esse protocolo é geralmente utilizado para transações financeiras, comerciais ou bancárias "on line". Para usar https certificados digitais são criptografados para garantir a sessão. Quando se visita um websites com o prefixo no endereço https barras percebe-se que há ícones de segurança ou de bloqueio exibidos na barra de endereços. Os navegadores Mozilla Firefox e Internet Explorer exibem um ícone que é um cadeado. Assim, antes de efetuar uma transação financeira on liine, verifique se o Web site tem prefixo https na barra de endereço. Depois procure o ícone do cadeado para ter certeza que os dados serão criptografados digitalmente. Lembre que é crescente o número de crimes na Internet e que no mundo virtual digital de transações, é difícil capturar ladrões e assaltantes. O melhor a fazer é se proteger.

Formatos .HTM e .HTML
As duas extensões identificam páginas para visualização na Internet e surgiram dos diferentes sistemas operacionais: a extensão HTML é característica do UNIX, enquanto que HTM é do DOS e WINDOWS. Para evitar problemas, foi feita a junção e, para efeitos de compatibilidade, foram mantidas as duas extensões. Entretanto, se existirem 2 documentos com o mesmo nome, por exemplo, um arquivo chamado index.html e outro, index.htm, o servidor irá sempre apresentar o index.html.

Bibliografia

http://pt.wikipedia.org/wiki/HTML