Professional Documents
Culture Documents
Tipos de ficheros
INDICE
1. INTRODUCCIN A LOS FICHEROS DE DATOS
1.- Conceptos bsicos 2.- Diseo de registros 3.- Conceptos de organizacin y modo de acceso 4.- Algunas consideraciones sobre el hardware. 5.- Medidas de utilizacin de ficheros. 6.- Operaciones con ficheros. 7.- Tipos de ficheros segn su funcin
3. ORGANIZACIN SECUENCIAL-INDEXADA.
1.- Caractersticas de la organizacin secuencial-indexada. 2.- Estructura de los ficheros con organizacin secuencial-indexada. 3.- ndices a varios niveles. 4.- Ventajas e inconvenientes de la organizacin secuenciaL indexada
Por ejemplo: Consideremos un archivador manual que contiene las fichas con los datos de los empleados de una empresa. Para cada empleado se tiene una ficha que podra tener el formato siguiente:
Ejemplo (Continuacin)
El registro sera toda la informacin correspondiente a un empleado. El campo sera cada una de las informaciones elementales que se tienen de un empleado como por ejemplo: APELLIDOS, NOMBRE, CATEGORA, ...
Para facilitar la bsqueda de una ficha determinada lo ms normal es tener el fichero clasificado por alguna de las informaciones que aparecen en la ficha y que tienen valores diferentes en los registros. Por ejemplo, en el archivador de empleados podran estar ordenadas alfabticamente por los apellidos, de forma que si queremos buscar la ficha de un empleado bastara con saber sus apellidos y lo buscaramos en la posicin que le corresponda por orden alfabtico.
A estos campos que me permiten identificar una ficha y diferenciarla de las dems, facilitando el acceso a una ficha determinada se les conoce con el nombre campo clave. La clave puede estar formada por ms de un campo.
Si observarnos las fichas del archivador de empleados, podemos ver que: 1. La informacin referida a cada empleado est toda un una ficha (registro). 2. Sobre cada ficha las informaciones (campos) aparecen en un orden, que es el mismo para todas (estructura del registro). 3. Las fichas estn ordenadas por algn criterio, para facilitar la bsqueda de una ficha determinada. Por ejemplo, por los apellidos, o por el DNI (campo clave).
2.
3.
Qu organizacin elegir?
La eleccin de una forma de organizacin determinada est en funcin del tipo de aplicacin que le vamos a dar al fichero. Dos factores influyen directamente en la seleccin: la memoria necesaria para almacenar los datos y la velocidad de acceso a los mismos. Ejemplo: Un fichero en el que los registros se actualicen todos juntos una vez al mes, y el tiempo necesario para la actualizacin no sea importante, no puede tener la misma organizacin que un fichero que se actualice todos los das varias veces poniendo al da los datos que contienen sus registros y el tiempo empleado para la actualizacin sea el menor posible.
2.
3.
3.
4. 5.
Escribir (WRITE)
Graba en el soporte la informacin de un registro con la informacin que tenga en la memoria principal.
Reescribir (REWRITE) Graba sobre un registro que ya existe en el fichero. Antes de utilizar esta instruccin se tiene que leer antes el registro que se va a reescribir con una orden de leer (READ).
Para poder utilizar los datos del fichero el sistema operativo utiliza un indicador, o puntero, que se coloca sealando al primer registro de datos del fichero, cuando se da la orden de Abrir (OPEN), y se va desplazando, siempre en la misma direccin, cada vez que se lee o graba un registro. La estructura del fichero se completa con un registro de cabecera que contiene informacin acerca del fichero y un registro que sirve de marca de final de fichero, o EOF (EOF - End Of File), que el sistema utiliza para saber cual es el ltimo registro del fichero. El registro de final de fichero (E.O.F.) se graba, por primera vez en el momento de la creacin del fichero y se va desplazando cuando se aaden nuevos registros al final del mismo.
ORGANIZACIN SECUENCIAL-INDEXADA.
1.- Caractersticas de la organizacin secuencial-indexada:
A los ficheros con este tipo de organizacin se les llama, tambin, ficheros indexados, por que se basa en la utilizacin de ndices, que permiten el acceso a un registro del fichero de forma directa, sin tener que leer los anteriores. Estos ndices son similares a los de los libros. Si nos interesa leer un captulo concreto podemos recurrir al ndice que nos dice en que pgina comienza, y abrimos el libro por esa pgina, sin tener que mirar en todas las pginas anteriores para localizarlo.
b) Permiten utilizar el modo de acceso secuencial y el modo de acceso directo para leer la informacin guardada en sus registros.
El modo de acceso directo se hace conociendo el contenido del campo clave del registro que queremos localizar. Con esa informacin el sistema operativo puede consultar el ndice y conocer la posicin del registro dentro del fichero. En el modo de acceso secuencial los registros son ledos ordenados por el contenido del campo clave, independientemente del orden en que se fueron grabando (El orden lgico no es igual al orden fsico), debido a que el acceso a los datos se hace a travs del ndice, que para hacer ms fcil la bsqueda de los registros permanece siempre ordenado por el campo clave.
c) Solamente se puede grabar en un soporte direccionable. Ej.: disco magntico. Si esto no fuera as no podra emplear el acceso directo.
El AREA DE INDICES es creada por el sistema al mismo tiempo que se van almacenando los datos. Contiene una tabla que asocia las claves con las direcciones de los registros en el rea de datos.
Cada entrada del rea de ndices est formada por el valor ms alto de la clave de cada grupo de registros y un puntero con la direccin del primer registro del grupo.
Un AREA DE EXCEDENTES (o de overflow) donde se graban los registros que no tienen sitio en el rea de datos. Los nuevos registros se insertan y quedan enlazados entre s mediante punteros conservando el orden lgico que marca la clave o ndice principal.
Del tratamiento de los ndices y punteros se encarga el sistema operativo por lo que no va a crear problemas al usuario cuando maneja este tipo de ficheros. El usuario sabe lo que sucede cuando solicita una consulta de un registro, pero no sabe como se realiza internamente esa consulta.
2)
3)
Que las claves de registros diferentes nos den direcciones diferentes. Cuando dos o ms claves diferentes proporcionan, al aplicar la tcnica de direccionamiento, la misma direccin se dice que produce sinnimos. Tambin se dice que esos registros colisionan. Cuando las claves de dos registros dieron lugar a un sinnimo (indican la misma celda), slo uno de ellos puede ser almacenado en esa celda y tenemos que tener previsto algn procedimiento para calcular la posicin en la que se tiene que grabar el otro registro. Los mtodos ms empleados para el tratamiento de sinnimos son los siguientes:
a) Almacenar el registro que colisiona en el primer hueco libre que se encuentre a partir de la direccin que le corresponde, y que est ya ocupada. A este mtodo se le conoce como bsqueda lineal o direccionamiento abierto. b) Creando una zona especial del fichero en la que se grabarn todos los registros que dieron lugar a un sinnimo. A esta zona del fichero se le suele llamar rea de desbordamiento (overflow) o de excedentes. Este es el sistema ms empleado.
A) Direccionamiento directo:
El caso ptimo de aplicacin de esta organizacin se da cuando las claves en el fichero son numricas y toman valores de 1 a n sin huecos intermedios. En este caso la clave k nos conducir a la celda k-sima del fichero pudiendo acceder fcilmente a los datos de ste registro. El campo clave de cada registro contiene su direccin en el fichero. Ej.: fichero de facturas donde tomamos como clave el n de factura.
2.
3.
El algoritmo de direccionamiento debe garantizamos que no se nos producirn dos direcciones iguales para dos valores de clave distintos. En el caso de no elegir un buen mtodo de direccionamiento puede que la aparicin de sinnimos haga complicado el acceso a algunos registros debido a que tendramos que emplear un mtodo de tratamiento de sinnimos que debe controlar el programador.
No permite el acceso secuencial a los registros por otro orden que no sea el orden en que estn grabados en el soporte. Slo se puede utilizar un campo clave para acceder a los registros.
4. 5.