You are on page 1of 5

ARCHIVOS DIRECTOS.

Un archivo relativo (directo) consiste en una coleccin de registros de longitud fija


almacenados uno al lado del otro en un dispositivo de almacenamiento de acceso directo
(direct - access storage device, DASD).
Cada registro en un archivo de organizacin relativa se puede referir por medio de un
nmero -entero- de direccin, el cual indica su distancia o desplazamiento desde el origen
del archivo. Al primer registro en un archivo relativo se le asigna el valor 1, 2 al siguiente y
as sucesivamente. De este modo, la direccin relativa de un valor entero que refleja su
posicin respecto al primer registro del archivo. El acceso aleatorio de un registro en un
archivo de organizacin relativa se hace va su nmero relativo de registro.
ESTRUCTURA.
La manera en que la informacin se almacena difiere mucho en los diferentes sistemas.
Parte de la informacin puede almacenarse en un registro de cabecera asociado al
archivo, esto reduce el espacio necesario para el directorio, haciendo ms fcil mantener
todo el directorio.
La forma mas fcil de estructuracin de un directorio es una lista de entradas, unas para
cada archivo. Esta estructura puede representarse con un simple archivo secuencial, con
el nombre del archivo haciendo las veces de clave.
Caractersticas
o El orden de complejidad ser O(1)
o Se basa en las funciones de seek
o Para obtener un buen rendimiento se deben hacer los registros de una longitud cuyo
mltiplo sea del tamao de un sector del disco. Si el sector es de 512 bytes y nuestro
registro mide 30, lo ms adecuado es que mida 32, ya que 32x16=512 (16 registros en un
viaje al disco)
Se utiliza cuando:
o Los registros son de longitud fija
o Tenemos una manera de saber en qu posicin del archivo est un registro,

OPERACIONES.
Operaciones que se pueden realizar con un directorio:
1. Buscar: Cuando alguien referencia el archivo, debe buscarse en el directorio la entrada
correspondiente al archivo.
2. Crear archivo: Al crear un nuevo archivo. debe aadirse una entrada al directorio.
3. Borrar archivo: Al borrar un archivo, debe eliminarse una entrada al directorio.
4. Listar directorio: Puede solicitarse todo el directorio o una parte.
Una simple lista no se ajusta bien a estas operaciones. Si el directorio es una simple lista
secuencias, no ofrecer ayuda en la organizacin de los archivos y obligara al usuario a
tener cuidado de no usar el mismo nombre para dos tipos diferentes de archivos. Para
resolver este problema se puede acudir a un esquema de dos niveles donde hay un
directorio para cada usuario y un directorio maestro.
Insercin, Supresin y Manejo de Colisiones
Para insertar elementos en archivos relativos se utilizan tcnicas como son las tcnicas
de clculo de direcciones, en estas tcnicas tienen lugar las llamadas "colisiones" que no
son ms que la repeticin de una localidad al momento de almacenar un dato. Las
colisiones no pueden ser eliminadas, lo ms que se puede hacer es tratar de
minimizarlas.
Si las claves primarias de los registros son nmeros consecutivos, se puede hacer un
simple enlace directo entre claves y direcciones. Sencillamente se asocia una llave
primaria ms pequea con la direccin relativa 1, la siguiente clave primaria ms pequea
con la direccin relativa 2, y as sucesivamente.
Existen diferentes mtodos:
Hashing por residuo.
Consiste en dividir la llave por un nmero determinado para obtener la direccin. Para
determinar el nmero divisor se escoge l nmero mximo de registro que almacenara el
archivo, de esta forma el residuo siempre estar en el rango de registros que puede
aceptar el archivo.
Doble hash
Consiste en repetir la operacin HASH para obtener un nuevo resultado. El doble hashing
hace una dispersin de sinnimos a diferencia del sondeo lineal que por su naturaleza
tiende a agrupar los sinnimos. El doble hash tiene un mejor desempeo para factores de
carga menores a 0.5 y acta mejor que el sondeo lineal con factores de carga mayores
para bsquedas exitosas pero no as en bsquedas no exitosas.
Encadenamiento de sinnimos.
El encadenamiento de sinnimos es un mtodo que se enfoca a lograr un acceso ms
rpido a los registros y que se implementa junto con los mtodos de solucin de
colisiones descritos anteriormente, se podra decir que es un complemento a estos
mtodos. La idea del encadenamiento de sinnimos consiste en tener una lista enlazada
de todos los sinnimos que se presenten comenzando con la direccin de origen.

Direccionamiento por cubetas.


El mtodo de direccionamiento por cubetas consiste en asignar un numero especifico de
espacios para contener los sinnimos que se presenten, si el espacio asignado a para
contener los sinnimos fuera totalmente ocupado entonces se buscara el cubo ms
cercano a este, a esto se le llama cubo de control de desbordamiento. Sin duda este
mtodo logra minimizar los desbordamientos por medio de la reservacin de espacios, sin
embargo como es obvio resulta muy costoso en cuanto a utilizacin de memoria, memoria
que sera desperdiciada si no existiera ninguna colisin.

MULTINIVELES DE INDICES

ACCESO DIRECTO POR INDEXAMIENTO


La utilizacin de un ndice denso (con una entrada para cada registro en el archivo
principal) permitir un acceso directo en el archivo principal despus de un proceso de
bsqueda en el ndice.
En virtud de la escasa longitud del registro de ndice, los accesos a disco permitirn la
manipulacin de mltiples registros de este tipo, acelerando as la localizacin de una
llave. En la bsqueda de mejorar la eficiencia del modelo, se pueden implementar las
siguientes variantes:
* ndice clasificado para bsqueda binaria.
* ndice de bsqueda binaria arbolado.

MULTINIVELES DE INDICES
La estructura de rbol balanceado de nivel 2 en el cual el nmero de entradas en cada
bloque se mantiene constante. En este caso el nmero de entradas por bloque de ndices
es tres, y la estructura de ndice se llama un rbol balanceado de orden tres.

La estructura de rbol-B fue diseada como una mejora al rbol balanceado. No es


necesario que cada bloque en un rbol-B contenga el mismo nmero de entradas por
bloque en un rbol-B de orden N debe de estar dentro del siguiente rango:

Cota inferior de ((N 1 ) / 2) <= entradas por bloque >= N 1

El orden N de un rbol-B es igual al mximo nmero de claves por bloque ms uno. Los
rboles-B tienen la propiedad especial de que el nmero de apuntadores en un bloque de
ndices es igual al nmero de claves en el bloque ms uno.
Una de las ventajas del rbol-B sobre el rbol balanceado es que el rbol-B es lo
suficientemente flexible como para acomodar inserciones de claves nuevas.
Supngase que se va a agregar la clave 105 al tercer bloque en el nivel inferior del rbolB de la figura anterior. Ya que el bloque se encuentra totalmente cmo ocupado, ste se
separa en dos bloques.

ORGANIZACIN DE ARCHIVOS SECUENCIALES INDEXADOS.


Una manera efectiva de organizar una coleccin de registros, cuando existe la necesidad
de accesar los registros secuencialmente, por algn valor de llave, como de accesarlos
individualmente, con esa misma llave, es la organizacin de archivos secuenciales
indexados. Un archivo secuencial indexado proporciona la combinacin de tipos de
acceso que manejan un archivo secuencial y un archivo relativo.
Esta organizacin est diseada para utilizar la combinacin de la organizacin relativa y
la secuencial, obteniendo la ventaja de poder acceder a los registros en forma secuencial
y relativamente de manera directa.
Como se pude apreciar la organizacin de archivos secuenciales indexados es efectiva
para satisfacer la necesidad tanto de acceder a los archivos en forma secuencial como de
forma directa mediante algn valor de llave.
Para poder estructurar esta organizacin podemos utilizar uno de los mtodos ms
comunes que es el de construir el ndice como un rbol de valores llave como se vio
anteriormente. Otro mtodo comn es de construir el ndice basndose en la disposicin
fsica de los datos almacenados.
Esto nos da como consecuencia que nuestras aplicaciones crezcan, pudiendo ofrecer
esta organizacin aplicaciones tanto en procesamiento por lotes como interactivo.

Para poder instrumentar esta organizacin existen algunas tcnicas como lo son:
Estructuras de rbol B +.
Es una de las tcnicas ms populares para instrumentar esta organizacin. El rbol B+

consta de dos partes: la parte ndice que consta de los nodos interiores y el conjunto
secuencia que consta de las hojas del rbol.

EQUIPO:
Sierra Mrquez Oscar David
Martnez Albarrn Raymundo
Ramrez Hernndez Jos Antonio

You might also like