Welcome to Scribd, the world's digital library. Read, publish, and share books and documents. See more
Download
Standard view
Full view
of .
Look up keyword
Like this
2Activity
0 of .
Results for:
No results containing your search query
P. 1
7Zip Paper

7Zip Paper

Ratings: (0)|Views: 25 |Likes:
Published by Jorge Braga Ribeiro

More info:

Categories:Types, School Work
Published by: Jorge Braga Ribeiro on Oct 20, 2010
Copyright:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as PDF, TXT or read online from Scribd
See more
See less

01/30/2011

pdf

text

original

 
 
Sistemas de compressão de ficheiros – o 7Zip
Por: Jorge Braga RibeiroOutubro de 2010
 
 
1. Introdução
Quantas vezes já não teve o problema de ter que mandar uma enorme quantidadede ficheiros e os mesmos ultrapassam o limite dos servidores de email?E que tal agregar todos esses ficheiros em apenas um só?Ou mesmo poupar espaço em disco comprimindo os ficheiros menos usados?Este tipo de funções pode ser desempenhado por algumas ferramentas existentesna Web, a maioria delas pagas, mas outras há gratuitas, que prometem asmesmas funcionalidades a custo zero.Neste
paper 
vamos abordar um deles - o 7zip -http://www.7-zip.org/ .
2. Princípios de Compressão de Ficheiros
Á partida tudo isto pode parecer um pouco de magia, pois se todos os ficheiros sãoconstituídos em bits e bytes, e que da sua quantidade e organização resulta otamanho do ficheiro, como é possível reduzir este tamanho, ficando exactamentecom a mesma quantidade de informação?Bem, por um lado porque a maioria da informação existente nos ficheiros éredundante, isto é contém nos seus caracteres ASCII
1
várias repetições ao longodo ficheiro.Deste modo é possível catalogar ou indexar de outra forma a informação, isto é, sea palavra
ESCOLA
, que contem 6 caracteres ASCII na sua composição, pode serrepresentada por um dígito mais curto, por exemplo um
1
. Isto é se no ficheirolongo a palavra escola aparecer 250 vezes, os 6 caracteres da palavra sãosubstituídos por apenas um.
1
 
ASCII
 
(acrônimo para American Standard Code for Information Interchange, que em português significa "CódigoPadrão Americano para o Intercâmbio de Informação") é uma codificação de caracteres de oito bits baseada noalfabeto inglês). Por exemplo a letra A tem a sua representação como
0100 0001
em binário,
65
em decimal e
41
emhexadecimal.
 
 De uma forma simplista, e se o ficheiro fosse apenas constituído pela palavra
ESCOLA
repetida inúmeras vezes, conseguia-se uma redução do tamanho doficheiro de cerca de 6 vezes! Claro que existem outros factores a considerar.
3. Exemplo de compressão baseada na redundância
Como exemplo peguemos numa frase que está agora muito na moda:
Não perguntem o que o vosso país pode fazer por vocês, perguntem antes o que vocês podem fazer pelo vosso país.
 
Podemos distinguir de imediato:
 
“perguntem” 
aparece duas vezes
 
“país” 
aparece duas vezes
 
“o que” 
aparece duas vezes
 
“vocês” 
aparece duas vezes
 
“vosso” 
aparece duas vezes
 
“fazer” 
aparece duas vezesCom esta simples observação, podemos deduzir que a segunda parte da frase, podeser construída quase totalmente com a utilização de palavras da primeira parte:
perguntem antes o que  vocês podem fazer pelo vosso  país 
 Assim, passamos de um total de 21 palavras, para uma análise em que 6 palavras serepetem na mesma frase (admitindo que a expressão “o que” é só uma palavra).Aplicando uma indexação a estas palavras:
 
“perguntem” 
 
1
 
“país” 
 
2
 
“o que” 
 
3
 
“vocês” 
 
4
 
“vosso” 
 
5
 
“fazer” 
 
6Então a nossa frase poderia ficar escrita da seguinte forma:
Não 1 3 o 5 2 pode 6 por 4, 1 antes 3 4 podem 6 pelo 5 2 
2
Esta expressão é original do discurso de abertura de John F. Kennedy, em 1961:
"Ask not what your country can do for you - ask what you can do for your country." 
 

You're Reading a Free Preview

Download
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->