You are on page 1of 7

UFA ESPE-L

UNIVERSIDAD DE LAS FUERZAS ARMADAS


ESPE
PRIMERA
UNIDAD

Estudiantes: Juan Navarrete


OPTATIVA DE
Bladimir Paucar

PROFESIONALIZACI
Guido Torres
Fecha: 16/05/2017
NRC: 2526
N

Compresin de
TEMA: Mtodo de codificacin de compresin sin prdida de Huffman
OBJETIVOS

General:
Analizar el proceso de codificacin de Huffman para la compresin
de imgenes.
Especifico:
Detallar el algoritmo de codificacin usado en el mtodo de
compresin de Huffman.
Ejemplificar el mtodo de compresin sin perdidas de Huffman

INTRODUCCIN

La compresin de imgenes comprende un conjunto de tcnicas que se


aplican a las imgenes para almacenarlas o transmitirlas de manera
eficiente. Utiliza las tcnicas de compresin de datos digitales, por eso es
importante presentar en qu consiste esta. Segn
Gonzlez y Wood, es el proceso de reduccin del volumen de datos para
representar una determinada cantidad de informacin. Es decir, un conjunto
de datos puede contener datos redundantes que son de poca relevancia o
son datos que se repiten en el conjunto, los cuales si se identifican pueden
ser eliminados

En el caso de las imgenes, se identifican varias formas de


representacin de la imagen, de acuerdo a la forma utilizada se aplican al
menos tres tipos para reducir el nmero de datos redundantes: eliminar
cdigo redundante, eliminar pxeles redundantes y eliminar redundancia
visual. El objetivo para eliminar cdigo redundante es utilizar el menor
nmero de smbolos para representar la imagen; en este tipo es usual
utilizar las tcnicas de compresin por codificacin de Huffman y
codificacin aritmtica, los cuales utilizan clculos estadsticos para lograr
eliminar este tipo de redundancia y reducir la ocupacin original de los
datos.

En el caso de la eliminacin de pxeles redundantes, la mayora de las


imgenes presentan semejanzas o correlaciones entre pxeles debido a las
estructuras similares en las imgenes. De esta manera, el valor de un pxel
puede emplearse para predecir el de sus vecinos; tcnicas como el de
Lempel-Ziv se utilizan para eliminar esta redundancia.

DESARROLLO:

Tcnicas de compresin de imgenes


Las tcnicas de compresin se pueden agrupar en dos grandes clases:
a) Tcnicas de compresin sin prdida de informacin y b) Tcnicas de
compresin con prdida de informacin.

En la primera clase las imgenes comprimidas se regeneran sin


errores, es decir, son iguales al original. Mientras que en la segunda, la
imgenes reconstruidas son ms o menos diferentes de la imagen original.
En cada clasificacin hay estrategias o algoritmos de compresin que
destacan, los que son presentados en las siguientes subsecciones junto con
sus caractersticas. (Boquete L., 1996)

Codificacin de Huffman

Es una tcnica que consiste en asignarle cdigo de bits ms cortos a


los datos que mayor frecuencia de aparicin tienen y cdigos ms largos a
los que aparecen con menos regularidad. Es muy utilizada debido a su
simplicidad, alta velocidad y por no tener problemas de patentes. Fue
desarrollada por David Huffman en 1951. (Huffman DA., 1952)

Bsicamente su algoritmo consiste en la creacin de un rbol binario de


abajo hacia arriba:

Se toma un alfabeto de n smbolos, cada smbolo tiene una frecuencia


de aparicin asociada.
Se colocan los smbolos ordenados de mayor a menor frecuencia, los
que constituyen los nodos hojas del rbol binario.
Se agrupan en pareja los smbolos de menor frecuencia, y se asigna
la suma de sus probabilidades al nodo padre. Se procede a realizar
esta accin hasta que no quedan nodos hoja por unir a ningn nodo
superior, y se ha formado el rbol binario.
Se etiquetan las aristas de cada rama del rbol, con cero a la
izquierda, y con uno a la arista derecha.
Se produce el cdigo de Huffman para ese alfabeto y esas
frecuencias, con los bits recorridos desde la raz hasta las hojas
(Boquete L., 1996)

En el ejemplo de la Figura N. 1, se observa el cdigo binario que se genera


para el alfabeto que se muestra en la base de la estructura y que aparece
junto con sus frecuencias.
Figura 1: Ejemplo cdigo de Huffman (Fuente: Boquete L., 1996)

El cdigo de Huffman

La tcnica ms popular para remover redundancia de cdigo se le debe


a Huffman. Al codificar individualmente los smbolos de una fuente de
informacin, el cdigo de Huffman obtiene el menor nmero posible
de smbolos de cdigo por smbolo de la fuente.

El primer paso es crear una serie de reducciones de fuente


ordenando las probabilidades de los smbolos y combinando los smbolos
de menor probabilidad en un smbolo nico que los reemplaza en la
siguiente reduccin de fuente. En la figura se muestra el proceso.
(Lempel A. 1978)

Figura 2: Proceso de codificacin de Huffman (Fuente: Lempel A.


1978)

Reducciones de fuente de Huffman

A la izquierda, se muestran los smbolos ordenados de mayor a menor


probabilidad.
Para la primera reduccin de cdigo, se unen 0.06 y 0.04 y se combinan
para formar un smbolo compuesto de probabilidad 0.1. Se repite el proceso
con la columna resultante hasta que obtenemos una fuente reducida de 2
smbolos. El segundo paso del procedimiento de Huffman es codificar cada
fuente reducida, empezando con la menor hasta llegar a la original.

Figura 3: Reduccin de fuente de Huffman (Lempel A. 1978)

Asignacin de cdigos

El cdigo binario mnimo para una fuente de 2 smbolos est formado


por los smbolos 0 y 1. Como se muestra en la figura, estos smbolos se
asignan a los 2 smbolos de la derecha (no importa a cul). Ya que el
smbolo de probabilidad 0.6 se gener combinando 2 smbolos en la fuente
reducida a su izquierda, el 0 utilizado para codificarlo se usa ahora para los
2 smbolos que lo formaron, y un 0 y 1 se asignan arbitrariamente despus
de este para distinguirlos. La operacin se repite hasta alcanzar la fuente
original. El cdigo final se muestra en la figura.
Podemos ver que la longitud promedio del cdigo es:
Lprom= (0.4)(1) + (0.3)(2) + (0.1)(3) + (0.1)(4) + (0.06)(5) + (0.04)(5) =
2.2 bits. El procedimiento de Huffman crea el cdigo ptimo para un
conjunto de smbolos y probabilidades si los smbolos se codifican de uno
por uno. La codificacin y decodificacin se hace por medio de una tabla. El
cdigo es un cdigo de bloque que puede ser decodificado
instantneamente de manera nica. (Ejemplo, decodificar 010100111100)

Huffman truncado

La columna 5 ilustra una modificacin simple del cdigo Huffman


conocida como cdigo Huffman truncado. Un cdigo de Huffman truncado
se genera codificando slo los PSI smbolos ms probables de la fuente,
siendo PSI algn entero positivo menor a J. Un cdigo de prefijo seguido por
un cdigo de longitud variable se usa para representar los dems smbolos
de la fuente. En la tabla PSI = 12 y el cdigo de prefijo se genera como la
13ava palabra de cdigo de Huffman (es decir, un smbolo de prefijo cuya
probabilidad es la suma de las probabilidades de los smbolos a13 a a21 se
incluye como el 13avo smbolo durante la codificacin de Huffman de los 12
smbolos ms probables, los 9 restantes se codifican usando el cdigo de
prefijo, en este caso 10, y un valor binario de 4 bits igual al subndice del
smbolo menos 13).
Cdigo B
Cada palabra de cdigo se hace a partir de bits de continuacin,
denotados C, y bits de informacin. El nico propsito de los bits de
continuacin es separar palabras de cdigo individuales, as que estos
simplemente alternan entre 0 y 1 para cada palabra de cdigo en una
cadena. El cdigo que se muestra es llamado cdigo B2, ya que se usan 2
bits de informacin por bit de continuacin. La secuencia de cdigos B2 que
corresponde a la cadena de smbolos de la fuente a11 a2 a7 es 001 010 101
000 010 o 101 110 100 110, dependiendo de si el primer bit de continuacin
se toma como 0 o 1.

Shift codes
Un shift code se genera
1. Ordenando los smbolos de la fuente de manera que sus
probabilidades decrezcan (de manera montona).
2. Dividiendo el nmero total de smbolos en bloques de smbolos del
mismo tamao.
3. Codificando los elementos individuales en cada bloque de manera
idntica.
4. Aadiendo smbolos especiales de shift up y / o shift down para
identificar cada bloque.
Cuando se reconoce un smbolo shift up o shift down en el decodificador,
se mueve un bloque arriba o abajo respecto al bloque de referencia
predefinido.

Conclusiones:
El mtodo de compresin de Huffman consiste en asignarle cdigo de
bits ms cortos a los datos que mayor frecuencia de aparicin tienen,
y cdigos ms largos a los que aparecen con menos regularidad
La codificacin de compresin ofrece mejor rendimiento que la
codificacin de Huffman, la codificacin de Huffman se encuentra
todava en uso generalizado debido a su simplicidad, alta velocidad, y
falta de problemas de patentes.

Recomendaciones:
Consultar con varias fuentes bibliogrficas a fin de conseguir
confiabilidad en la informacin extrada. Adems de ilustrar el texto
con imgenes, para as conseguir una mejor comprensin del tema
tratado.
Bibliografa:
Huffman DA. (1952). A method for construction of minimum
redundancies codes. IRE 40,9
Mazo M, Boquete L, Barea R. (1996) Visin Artificial. Universidad de
Alcal de Henares
Ziv J, Lempel A. (1978) Compression of individual sequences via
variable-rate coding. IEEE Transactionn on Information Theory.