You are on page 1of 118

UNIDAD 1 ALMACENAMIENTO DE DATOS

Temario
1.1 Dispositivos de Almacenamiento 1.2 Discos Magnticos 1.3 Almacenamiento de Datos 1.4 Respaldos y Recuperacin de Datos

Dispositivos de Almacenamiento
Jerarqua de Almacenamiento

Dispositivos de Almacenamiento
Jerarqua de Almacenamiento
Memoria Cach Forma de almacenamiento ms rpida y costosa. Tamao pequeo. Responsabilidad del sistema operativo.

Dispositivos de Almacenamiento
Jerarqua de Almacenamiento

Memoria Principal Memoria rpida, dirigida a satisfacer los pedidos de la CPU. Es el lugar de almacenamiento que se emplea para los datos a procesar.

Dispositivos de Almacenamiento
Jerarqua de Almacenamiento

Discos Magnticos Usados, por lo general, para guardar datos a largo plazo. Su contenido debe trasladarse a memoria principal para su procesamiento. Luego, son devueltos al disco de ser necesarios. Son dispositivos de acceso aleatorio.

Dispositivos de Almacenamiento
Jerarqua de Almacenamiento
Almacenamiento Terciario: Dispositivos que han sido diseados para soportar grandes volmenes de datos, incluso del orden de los terabytes. Tienen tiempos de acceso significativamente mayores, en comparacin a un disco magntico. No obstante, tienen mayor capacidad de almacenamiento y la relacin $/byte es menor.

Dispositivos de Almacenamiento
Jerarqua de Almacenamiento

Discos Magnticos: tres razones por las cuales es necesario usarlo en lugar de la RAM.
Capacidad limitada de la RAM. Memoria RAM ms cara. Memoria RAM es voltil.

Dispositivos de Almacenamiento
Jerarqua de Almacenamiento

Discos Magnticos: dos desventajas respecto de la memoria principal


Necesita mucho ms tiempo para tener acceso a los datos. El costo de la recuperacin depende de donde queden almacenados los datos dentro del dispositivo.

Dispositivos de Almacenamiento
Jerarqua de Almacenamiento

Almacenamiento Terciario: considera... (Racks de) Discos pticos: dotados de un brazo que se encarga de extraer un CD y moverlo al lector. Usados preferentemente para respaldos, publicacin y difusin, ms que un medio de almacenamiento de datos. Cintas. Silos de Cintas.

Dispositivos de Almacenamiento
Discos pticos

Organizacin Fsica: Fabricado sobre un substrato de policarbonato, recubierto


por una lmina reflectante de aluminio, y baado con una laca protectora.

Dispositivos de Almacenamiento
Discos pticos

Organizacin Fsica (2):

Obs.: 6.300 pistas por centmetro aprox.

Dispositivos de Almacenamiento
Discos pticos El disco contiene una pista en espiral, igual que los discos de audio, que empieza en el centro del disco y termina en la parte exterior del mismo.

Si se extendiese la pista en espiral a lo largo de una lnea recta, su longitud total se aproximara a los 5 km.

Dispositivos de Almacenamiento
Discos pticos

Acceso a los Datos:


Cuando se lee la copia, se dirige un rayo lser sobre la pista, mientras se mueve sobre el lente ptico. Los agujeros dispersan la luz, pero los pisos reflejan casi todo de vuelta al lente.

Dispositivos de Almacenamiento
Discos pticos

Acceso a los Datos (2):


Este patrn alternante de intensidades altas y bajas, de luz reflejada, es la seal para reconstruir la informacin original. El esquema de codificacin usado no es 1 para un piso y 0 para un sueloen su lugar, los bits 1 son representados por las transiciones agujero-piso y viceversa. La cantidad de tiempo entre transiciones representa el nmero de bits 0.

Dispositivos de Almacenamiento
Discos pticos

Acceso a los Datos (3): Con esta codificacin, no es posibles dos bits 1
adyacentes.debido a la resolucin del lente ptico, debe haber al menos dos valores 0 entre cualquier par de 1. Esto significa que el patrn de valores 0 y 1 debe ser traducido para conseguir los patrones de 8 bits del byte original.

Dispositivos de Almacenamiento
Discos pticos

Acceso a los Datos (4): Lo anterior considera la utilizacin de una Tabla de


Codificacin EFM:

Dispositivos de Almacenamiento
Discos pticos

Acceso a los Datos (continuacin): Disco Magntico: esquema de velocidad angular constante
(CAV) . Disco Compacto: esquema de velocidad lineal constante (CLV).

Dispositivos de Almacenamiento
Discos pticos

Organizacin fsica (continuacin): Esquema CAV: desperdicia espacio de almacenamiento en las pistas exteriores, pero permite que el disco gire a la misma velocidad. Esquema CLV: no entrega una forma adecuada para llegar a una localizacin especfica, porque necesita cambiar la velocidad de rotacin, pero aprovecha mejor el espacio.

Dispositivos de Almacenamiento
Discos pticos

Capacidad de Almacenamiento: La organizacin CLV no permite el tpico modo de direccionamiento (cilindro, pista, sector). En su lugar, cada segundo de reproduccin es dividido en 75 sectores, cada uno de los cuales guarda 2 KB de datos.

Dispositivos de Almacenamiento
Discos pticos

Capacidad de Almacenamiento: (cont.) Luego, para reproduccin un CD con 74 minutos de

74 minutos * 60 segundos/minuto * 75 sectores/segundo = 333.000 sectores 333.000 sectores * 2 KB/sector = 666.000 KB 650 MB

Dispositivos de Almacenamiento
Discos pticos

Estructura de un Sector: La frecuencia de muestreo de un CD es de 44.1 kilohertz


(44.100 veces por segundo). As, se pueden registrar sonidos con frecuencias que variarn hasta los 20 kilohertzel lmite superior audible por el odo humano. Un muestreo como el anterior, unido a una representacin de 16 bits, requiere almacenar 88.200 bytes por segundo. Grabar sonido estreo significa duplicar la cantidad anterior, subiendo a 176.400 bytes por segundo.

Dispositivos de Almacenamiento
Discos pticos

Estructura de un Sector: Al dividir los 176.400 bytes por los 75 sectores por segundo, se tienen 2.352 bytes por sectores, de los cuales 2.048 bytes son de datos, y el resto:
Sincronizacin ID Sector Deteccin y Correccin de errores Nulos

Dispositivos de Almacenamiento
Discos pticos

Otras caractersticas: Unidad de Velocidad Simple (1X): 150 KB/seg Rendimiento del Tiempo de Bsqueda: problema en el
acceso aleatorio, por su lentitud. Capacidad de Almacenamiento: amplia. Escritura y Lectura Asimtricas para los CD-ROM: una escritura, muchas lecturas.

Temario
1.1 Dispositivos de Almacenamiento 1.2 Discos Magnticos 1.3 Almacenamiento de Datos 1.4 Respaldos y Recuperacin de Datos

Discos Magnticos
Mecnica del Disco

Conjunto de superficies magnetizables, que rotan a alta velocidad, pasando bajo una cabeza lectograbadora. Un pack de disco magntico (disco duro) est constituido por varios platos de aluminio recubiertos de xido magntico.

Discos Magnticos
Mecnica del Disco

Cada superficie utilizable est dividida en varias pistas concntricas. Cada pista se organiza en sectores, separados entre s por espacios (gaps) sin datos.
Los gaps representan alrededor del 10% del total de la pista. Se usan para identificar el comienzo de un sector.

Discos Magnticos
Mecnica del Disco

El sector es una unidad indivisible, tanto en la lectura como en la escritura al disco, como en el manejo de errores.

Discos Magnticos
Mecnica del Disco

Sector v/s Bloque: El sector es una unidad fsica del disco, mientras que un bloque es una unidad lgica, creacin de un software (S.O., SABD) para usar el disco. Tpicamente un bloque tiene al menos la misma capacidad de un sector, pudiendo contener varios ms.

Discos Magnticos
Mecnica del Disco

El conjunto de pistas de varias superficies que tienen el mismo radio, conforman un cilindro.

Discos Magnticos
Mecnica del Disco

El mecanismo de lectura/escritura ms comn de los discos de un brazo son las cabezas lectograbadoras que se mueven radialmente sobre las superficies que giran a gran velocidad.

Discos Magnticos
Controlador del Disco

Uno o ms discos son manejados por el controlador de disco, que es un pequeo procesador capaz de :
Controlar el brazo mecnico que mueve las cabezas lectograbadoras a un radio especfico. En ste, una pista de cada superficie estar bajo la cabeza correspondiente, y podr ser leida/escrita. Seleccionar una superficie a leer/escribir, y seleccionar un sector desde la pista asociada. El controlador tambin es responsable de determinar cuando se ha alcanzado el inicio del sector requerido. Transferir los bits ledos desde el sector del disco a la memoria principal del computador, transferir los bits en sentido contrario en caso de una operacin de escritura.

Discos Magnticos
Caractersticas de Almacenamiento

Velocidad de Rotacin: 5.400 rpm... Platos por Unidad: 5 platos (8 superficies utilizables) Pistas por Superficie: 10.000 Sectores por Pista: 500 ... Tamao de una Pista: 100.000 bytes Tamao de un Sector: 512 4.096 bytes

Discos Magnticos
Acceso al Disco

No es posible modificar un bloque directamente en el discopara esto, se hace necesario el uso de un buffer en memoria principal, donde se guarda temporalmente una copia del bloque requerido.

Discos Magnticos
Acceso al Disco

Para cumplir con lo anterior, a cada archivo de datos abierto se le asocia, al menos, un buffer en memoria. Su tamao debe ser lo suficientemente grande para contener un bloque. Las operaciones necesarias para la modificacin son
Leer el bloque a la memoria principal. Hacer los cambios sobre la copia en la memoria principal. Escribir el contenido del bloque de regreso al disco.

Discos Magnticos
Acceso al Disco

Polticas de Reemplazo: cuando la memoria asignada para los buffers se llena, el sistema operativo debe empezar a devolver bloques al disco para as tener espacio en donde guardar los nuevos datos que debe leer, usando algoritmos como:
FIFO: primer bloque leido, primer bloque devuelto al disco. LRU: retorna el bloque menos recientemente usado. LFU: devuelve el bloque menos frecuentemente usado.

Discos Magnticos
Caractersticas de Acceso

Tiempos de Acceso a un Sector:


de bsqueda (seek time): tiempo necesario para desplazar las cabezas al cilindro requerido. de latencia: transcurrido desde que el brazo est en el cilindro requerido y hasta que se site sobre la pista correcta. de transferencia: tiempo para realizar la transferencia de los bytes solicitados de la RAM al disco o viceversa.

Discos Magnticos
Caractersticas de Acceso

Luego, el tiempo promedio para recuperar un bloque de disco, desde una pista de N bloques, es:
1 1 T = TS + --- TL + --- Tt 2 N

Discos Magnticos
Mejorando el Tiempo de Acceso

Tcnica 1: Organizar los Datos por Cilindros Objetivo: se minimizan los movimientos del brazo del disco.
Ventaja: aplicaciones con fuerte uso del disco, donde los accesos pueden ser predecidos y slo hay un proceso usando el disco, son apoyadas. Desventaja: no ayuda en casos donde hay varios procesos pequeos ejecutndose en paralelo, compartiendo el mismo disco, con acceso no predecibles.

Discos Magnticos
Mejorando el Tiempo de Acceso

Tcnica 2: Ordenamiento de Solicitudes al Disco (Planificacin del Disco)


Objetivo: reducir el impacto del tiempo de bsqueda, acortando los movimientos de bsqueda sobre el disco, mediante el algoritmo del ascensor u otro similar. Algoritmos existentes: FIFO, SJF (Shortest Job First), tipo Ascensor.

Discos Magnticos
Mejorando el Tiempo de Acceso

Algoritmos: suponer que el controlador del disco recibe solicitudes a los cilindros 30, 100, 25, 120, 5, estando el brazo actualmente en el cilindro 50.
FIFO: el servicio es por orden de llegada. Para el ejemplo dado: 30, 100, 25, 120, 5. SJF (Shortest Job First): se atiende primero a la solicitud del cilindro ms cercano a la actual posicin del brazo del disco. Para el ejemplo dado: 30, 25, 5, 100, 120.

Discos Magnticos
Mejorando el Tiempo de Acceso

Algoritmos: de tipo ascensor


SCAN: el brazo del disco parte de un extremo del disco y se mueve hacia el otro, atendiendo las solicitudes a medida que llega a cada cilindro, hasta llegar al otro extremo del disco. Ah, la direccin de movimiento de la cabeza se invierte, y contina la atencin. La cabeza barre continuamente el disco de un extremo a otro. C-SCAN: el brazo llega a un extremo del disco y retorna inmediatamente al otro sin realizar ninguna operacin. As, las solicitudes slo se procesan en un sentido.

Discos Magnticos
Mejorando el Tiempo de Acceso

Algoritmos: de tipo ascensor (2)


LOOK: funciona igual que el SCAN pero sin llegar al extremo fsico del disco, sino que slo a la ltima solicitud en cada direccin, para luego cambiar de sentido. Para el ejemplo dado, suponiendo que el brazo va en ascenso: 100, 120, 30, 25, 5. C- LOOK: similar al C-SCAN pero al igual que el LOOK slo llega a la ltima solicitud en cada direccin.

Discos Magnticos
Mejorando el Tiempo de Acceso

Ventaja: reduce el tiempo promedio de accesos al disco cuando stos no son predecibles. Problema: el algoritmo es ms efectivo en situaciones donde hay muchas solicitudes al disco esperando, y la espera promedio de los procesos involucrados es alta.

Discos Magnticos
Mejorando el Tiempo de Acceso

Tcnica 3: Optimizacin en el Uso de Buffers


Es posible coordinar el uso de los buffers de modo que mientras algunos se estn utilizando para procesamiento, otros se estn llenando de datos del disco. Adicionalmente, se pueden aplicar las tcnicas de lectura adelantada y escritura retardada.

Discos Magnticos
Mejorando el Tiempo de Acceso Lectura Adelantada (read-ahead): cuando se pueden predecir los accesos, es posible cargar algunos bloques a la memoria principal antes de que sean realmente necesitados. Ventaja: agiliza los tiempos de acceso, en situaciones de predecibilidad de los datos. Desventaja: requiere (buffers de) memoria principal extra; no sirve cuando los accesos son aleatorios.

Discos Magnticos
Mejorando el Tiempo de Acceso Escritura Retardada (write-behind): consiste en mantener los datos en el cach hasta que se producen momentos de desocupacin del sistema de disco. Ventaja: disminuye las escrituras al disco. Desventaja: requiere mecanismos adicionales para evitar que se pierdan los datos an no grabados en el disco.

Discos Magnticos
Mejorando el Tiempo de Acceso

Tcnica 4: Intercalacin (separacin) de sectores.


Para minimizar la latencia, los datos pueden ser ubicados de tal forma que el sector que contenga el dato sea aqul que est justo bajo la cabeza cuando ste es requerido, es decir intercalacin de sectores.

Discos Magnticos
Mejorando el Tiempo de Acceso

Tcnica 5: Cabezas Fijas, haciendo nulo el tiempo de bsqueda.

Tcnica 6: Aumento de la densidad de almacenamiento, debido al uso de pelculas magnticas ms delgadas, y a cabezas ms precisas y finas.

Discos Magnticos
Mejorando el Tiempo de Acceso

Tcnica 7: Usar Mltiples Discos


Objetivo: al contar con N discos, operados bajo un mismo controlador, el tiempo total asociado a la lectura/escritura de un bloque de cada disco, ser equivalente a la N-sima parte de lo que tardara leer los N bloques del mismo disco.

1 4 7

2 5 8

3 6 9

Discos Magnticos
Mejorando el Tiempo de Acceso Ventaja: incrementa la tasa a la cual los requerimientos de disco pueden ser atendidos. Problema: lecturas y/o escrituras al mismo disco no pueden satisfechas a la vez, de modo que el factor de escalabilidad puede ser menos al factor por el cual el nmero de disco crece. Desventaja: el costo de varios discos pequeos excede el valor un disco nico con la misma capacidad total.

Discos Magnticos
Mejorando el Tiempo de Acceso

Tcnica 8: Usar Discos Espejos


Objetivos:
1 2 3 1 2 3

Agilizar el acceso a los datos, pues la recuperacin se puede hacer sobre ms de un disco a la vez. Evitar que un problema en un disco (incluso fatal para todo su contenido) implique una prdida de datos.

Discos Magnticos
Mejorando el Tiempo de Acceso Ventajas: Aumenta la tasa a la cual pueden atenderse los requerimientos de disco, para todo tipo de aplicaciones. Mejora la tolerancia a fallas. Desventaja: aumenta los costos debido a los discos adicionales.

Discos Magnticos
Discos RAID

Las dos ltimas tcnicas descritas, combinadas con otras como son el uso de discos sincronizados y archivos entrelazados, dan origen a los llamados sistemas RAID, definidos como arreglo (vector) redundante de discos independientes. A continuacin se presentan algunos de los niveles RAID ms comunes.

Discos Magnticos
Discos RAID

RAID 0: Reparticin de Datos entre discos (stripping).

Caractersticas: Objetivo: velocidad. Ofrece el mejor rendimiento, pero no tolerancia a fallas. Mnimo: dos discos. Aplicaciones: edicin/produccin de imgenes, video y prensa.

Discos Magnticos
Discos RAID

RAID 1: Discos Espejos (mirroring).

Caractersticas: Objetivo: seguridad. El rendimiento podra mejorar en las lecturas; sin efecto en escrituras. Mnimo: dos discos. Aplicaciones: financieras, contabilidad.

Discos Magnticos
Discos RAID

RAID 3: Acceso Paralelo a Datos.

Caractersticas: Objetivo: seguridad. Datos divididos en bytes, disco de paridad. Mnimo: tres discos. Aplicaciones: produccin/distribucin de video en streaming, aplicaciones de imagen/video/prensa, servidores monousuario

Discos Magnticos
Discos RAID

RAID 5: Acceso Independiente a Datos.

Caractersticas: Objetivo: seguridad y rendimiento. Mejor que RAID 3 pues los datos se dividen en bloques. Mnimo: tres discos (usualmente cinco). Aplicaciones: servidores de archivos y aplicaciones, servidores de bases de datos, servidores de internet, email, news.

Discos Magnticos
Discos RAID

RAID 10: es un RAID 1 en paralelo a un RAID 0.

Caractersticas: Objetivo: rendimiento y seguridad (en funcin de la capacidad). Mejor que RAID 3 pues los datos se dividen en bloques. Siempre un nmero par de discos.

Discos Magnticos
Discos RAID

RAID 0+1: stripping y mirroring.

Caractersticas: Objetivo: rendimiento y seguridad. Aplicaciones: de imagen, archivos generales.

Discos Magnticos
Discos RAID

Implementaciones de Sistemas RAID: En hardware: mejores rendimiento, capacidad de almacenamiento, confiabilidad. En software: ms flexibilidad de (re)configuracin, ms barato por unidad de capacidad de almacenamiento.

Temario
1.1 Dispositivos de Almacenamiento 1.2 Discos Magnticos 1.3 Almacenamiento de Datos 1.4 Respaldos y Recuperacin de Datos

Almacenamiento de Datos
Organizacin Fsica de los Datos

Representacin y organizacin fsica sobre un medio de almacenamiento (ndices, punteros, listas, etc.). Representa la visin del administrador de los archivos (o de la base de datos, DBA), que es dependiente del dispositivo. El archivo es visto como una coleccin de bloques en memoria secundaria.

Almacenamiento de Datos
Organizacin Fsica de los Datos

Operaciones a considerar: Controlar accesos. Asignar y administrar buffers. Crear y mantener directorios. Crear y mantener tablas en la memoria principal.

Almacenamiento de Datos
Organizacin Fsica de los Datos

Archivos de Datos

Bloques de Datos

Registros de Datos (Largo Fijo, Largo Variable)

Tipos (Elementos) de Datos

Almacenamiento de Datos
Elementos de Datos

Pregunta a responder: cmo se registran en el disco los diferentes tipos de datos, al momento de declaraciones como:
create table ActorDeCine ( nombre CHAR(30), domicilio VARCHAR(255), sexo CHAR(1), fecha_nacimiento DATE );

Almacenamiento de Datos
Elementos de Datos

Tipo CHAR(n): este string de largo fijo se representa mediante un arreglo de n bytes. Si el valor guardado tiene un largo menor, se completa el espacio con algn carcter especial.

Almacenamiento de Datos
Elementos de Datos

Tipo VARCHAR(n): este string de largo variable se puede representar de dos formas:
Largo ms contenido: asignando un arreglo de (n+1) bytes, siendo el primero de stos el largo real del dato. Bytes no usados se ignoran. String terminado en Nulo: asigna, tambin, un arreglo de (n+1) bytes, pero sin registrar el largo, sino que tras el ltimo byte de dato vlido, se coloca un carcter nulo.

Almacenamiento de Datos
Elementos de Datos

Tipo DATE: representable mediante un string de largo fijo (tpicamente CHAR(10). Ejemplo: 15-04-2004 se presenta con 10 caracteres, uno por cada dgito ms uno por cada guin. Una idea similar se sigue con las horas, expresadas como HH:MM:SS, o similar.

Almacenamiento de Datos
Elementos de Datos

Tipo BLOB: representa un dato de gran tamao, tales como imgenes (GIF, JPEG), pelculas en formato MPEG y el audio. Almacenamiento: Secuencia de bloques, guardados consecutivamente en un cilindro para su fcil recuperacin. No obstante puede ser almacenados como una lista enlazada de bloques.

Almacenamiento de Datos
Elementos de Datos

Almacenamiento: (cont.) Por otro lado, puede requerirse que el BLOB sea recuperado muy rpidamente, de modo que guardarlo en un solo disco resulte insuficiente particionar el dato BLOB entre varios discos, alternando sus bloques entre ellos.

Almacenamiento de Datos
Organizacin Fsica de los Datos

Archivos de Datos

Bloques de Datos

Registros de Datos (Largo Fijo, Largo Variable)

Tipos (Elementos) de Datos

Almacenamiento de Datos
Registros

El esquema del registro, que guarda informacin rescatada del create table, contiene entre otros: Los atributos del archivo, sus tipos y restricciones. El orden en el cual aparecen en la tupla. Separadores de atributos.

Almacenamiento de Datos
Registros

Registros de Largo Fijo: todos los atributos tienen un largo fijo y conocidoconsiderar la siguiente definicin de un registro.
create table deposito { nombreSucursal char(20), numeroCuenta numeric(3), nombreCliente char(20), saldo numeric(3) };

Almacenamiento de Datos
Registros de Largo Fijo

Almacenamiento secuencial:

Almacenamiento de Datos
Registros de Largo Fijo

Almacenamiento secuencial: problemas... Difcil la eliminacin de un registro...marca de borrado o llenar con otro registro. A menos que el tamao del bloque sea un mltiplo del registro, algunos registros no podrn almacenarse completamente en un bloque.

Almacenamiento de Datos
Registros de Largo Fijo

Almacenamiento secuencial:

Eliminacin del Registro 2, con corrimientos de datos

Almacenamiento de Datos
Registros de Largo Fijo

Almacenamiento secuencial:

Eliminacin del Registro 2, con traslado del registro 8

Almacenamiento de Datos
Registros de Largo Fijo

Almacenamiento secuencial, con uso de punteros:

Eliminacin de los Registros 1, 4 y 6.

Almacenamiento de Datos
Registros de Largo Variable

Registro de Largo Variable: al menos uno de los atributos del registro tiene la siguiente caractersticas..

Atributo de Largo variable: varchar, blob u otros.

Atributo Repetitivo o con Ocurrencias Mltiples: el caso de las colecciones, en orientacin a objetos.

Atributo con Distintos Tipos: similar a las uniones de C.

Atributo Opcional: puede ser nulo (clusula NULL de SQL).

Almacenamiento de Datos
Registros de Largo Variable

a) Atributo de Largo Variable:


Por lo general, se guardan al final del registro. En el encabezado se maneja un puntero al inicio de cada campo de este tipo.

Almacenamiento de Datos
Registros de Largo Variable

b) Atributo Repetitivo:
Una alternativa es usar un caracter de separacin para delimitar los valores repetitivos del campo, y otro separador para indicar el trmino del campo. Otra alternativa es usar un puntero a la primera ocurrencia del campo, ms un nmero que indique la cantidad de veces de la repeticin.

Almacenamiento de Datos
Registros de Largo Variable

c) Atributo de Distintos Tipos: Cada tipo es precedido por un campo indicador de tipo.

Almacenamiento de Datos
Registros de Largo Variable

d) Atributo Opcional:
Si el nmero total de campos del registro es alto, pero el nmero de campos fijos es bajo, se puede incluir una secuencia de duplas <nombre del campo, valor del campo>, en vez de guardar slo los valores. La secuencia anterior puede considerar un nmero de campo, en lugar del nombre + un esquema para mantener una correspondencia entre los campos y dichos nmeros.

Almacenamiento de Datos
Registros de Largo Variable

Grupo Repetitivo: caso especial de registro de largo variable, donde un grupo de atributos se pueden repetir ms de una vez. Ej.: en un seudo-C...
struct deposito { int nmero_cuenta; char nombre_cliente[20]; float saldo; };

struct lista-deposito { char nombre_sucursal[20]; deposito lista(info_cuenta); }

Almacenamiento de Datos
Registros de Largo Variable

Grupo Repetitivo: formas posibles de representacin el disco son..


Espacio reservado Uso de marca especial como fin de registro Punteros entre registros (lista enlazada)

Almacenamiento de Datos
Registros de Largo Variable

Grupo Repetitivo: uso de marca especial como fin de registro.

Almacenamiento de Datos
Registros de Largo Variable

Grupo Repetitivo: uso de marca especial como fin de registro .problemas!!


No es fcil volver a usar el espacio que ocupaba un registro que se elimin. En general, los registros no disponen de espacio para crecer.

por lo tanto, no se usa normalmente.

Almacenamiento de Datos
Registros de Largo Variable

Grupo Repetitivo: Espacio Reservado.

Almacenamiento de Datos
Registros de Largo Variable

Grupo Repetitivo: Punteros (bsico)

Almacenamiento de Datos
Registros de Largo Variable

Grupo Repetitivo: Punteros con dos archivos.

Almacenamiento de Datos
Organizacin Fsica de los Datos

Archivos de Datos

Bloques de Datos

Registros de Datos (Largo Fijo, Largo Variable)

Tipos (Elementos) de Datos

Almacenamiento de Datos
Organizacin de Registros en Bloques

Factor de bloqueo (fb): nmero de registros por bloque, cuya expresin asociada generalmente es: tamao del bloque / tamao del registro

Almacenamiento de Datos
Organizacin de Registros en Bloques

Est la posibilidad de usar el espacio libre que queda porque el tamao del bloque no es mltiplo del tamao del registro, mediante registros atravesados.
Bloque i

Registro 1
R egistro 4

R egistro 1

Registro 2

R egistro 2

Registro 3 Registro 6

R egistro 3

Bloque i+1

Registro 4

R egistro 5

Registro 5

R egistro 6

R egistros no A travesados

Bloque i

R egistro 1 Registro 1 R egistro 4b

R egistro 2 2 Registro R egistro 5 R egistro 6

R Registro egistro 3 3

R egistro 4a 4a Registro

Bloque i+1

Registro 4b

Registro 5

Registro 6

R egistro 7

Registro 7

R egistros A travesados (Registros Span)

Almacenamiento de Datos
Organizacin de Registros en Bloques

Bloques usados por un Archivo: a partir del factor de bloqueo de un archivo, se puede determinar el nmero de bloques que ste usado... nmero de registros / factor de bloqueo

Almacenamiento de Datos
Organizacin de Registros en Bloques

Tamao de un Bloque.

Almacenamiento de Datos
Organizacin Fsica de los Datos

Archivos de Datos

Bloques de Datos

Registros de Datos (Largo Fijo, Largo Variable)

Tipos (Elementos) de Datos

Almacenamiento de Datos
Archivos de Datos

Un archivo tiene un encabezado o descriptor de archivo con: El esquema del registro, o bien un puntero al lugar donde el SABD lo almacena. Estampillas de tiempo que indican el momento que el registro fue modificado/ledo por ltima vez. Informacin para determinar las direcciones de disco de los bloques del archivo.

Almacenamiento de Datos
Archivos de Datos: organizacin de bloques

Asignacin Contigua.
bloque 1 bloque 2 bloque 3 bloque 4

Almacenamiento de Datos
Archivos de Datos: organizacin de bloques

Asignacin Enlazada (encadenamiento de bloques).

Asignacin Enlazada (mediante tabla auxiliar FAT)

Almacenamiento de Datos
Archivos de Datos: organizacin de bloques

Asignacin Indexada.

Temario
1.1 Dispositivos de Almacenamiento 1.2 Discos Magnticos 1.3 Almacenamiento de Datos 1.4 Respaldos y Recuperacin de Datos

Respaldos y Recuperacin de Datos


Tipos de Fallas

Falla intermitente: cuando un intento por leer o escribir un sector no es exitoso, pero tras algn(os) intento(s) se logra realizar la operacin. Dao Parcial del Disco: cuando uno o ms bits se corrompen, y llega a ser imposible leerlos correctamente, no importa las veces que se intente.

Respaldos y Recuperacin de Datos


Tipos de Fallas

Falla en la Escritura: cuando se trata de escribir un sector, pero no es posible escribirlo ni volverlo a recuperar. Una causa posible es una cada de potencia al momento de la escritura. Dao Total del Disco: donde el disco completo, de forma repentina y permanente, deja de estar disponible.

Respaldos y Recuperacin de Datos


Manejo de Fallas

Fallas intermitentes pueden ser corregidas mediante las sumas de chequeo, basadas en la tcnica de la paridad. El problema de la paridad anterior es que si dos bits se ven modificados, el sistema ser incapaz de detectar el error. La solucin es agregar varios bits de paridad, pero a costa de que el espacio necesitado va en aumento, sino generar respaldos.

Respaldos y Recuperacin de Datos


Manejo de Fallas

Respaldo: copia de los datos en otro medio magntico, a partir de la cual es posible restaurar el sistema a un momento previo. Recuperacin: labor llevada a cabo cuando es necesario volver al estado del sistema en el momento del respaldo.

Respaldos y Recuperacin de Datos


Respaldos

Aspectos a considerar:
Plan de respaldo (documentado y comunicado!!!) Cules datos incluir Tipos de respaldos Cantidad de copias Modalidad de las copias Cundo hacerlo.

Respaldos y Recuperacin de Datos


Respaldos

Modalidad de las Copias:


Copia Simple: se hace un nico ejemplar del respaldo. Copia Doble: se repite la tarea de respaldar, con el fin de tener dos ejemplares del mismo. Copia generacional (abuelo-padre-hijo): se hacen respaldos a lo largo del tiempo, generndose una historia de los respaldos.
Ti-1 Ti Ai-1 Ai Ai+1

RAbuelo

RPadre

RHijo

Respaldos y Recuperacin de Datos


Respaldos

Tipos de Respaldos:
Global, completo (full back-up). Parcial: slo una aplicacin, una plataforma Incremental: respaldando las modificaciones que han ocurrido ... ... desde el ltimo respaldo preimgenes, post-imgenes. Diferencial: dem al anterior, salvo que para recuperar se considera slo el ltimo respaldo diferencial. Simultneo (online): apoyado en discos espejos.
A1 Ai Aj T1 T 2 T3 Ti T i+1 R1 R2 R3

Respaldos y Recuperacin de Datos


Recuperacin de Archivos

Recuperacin: es el proceso que se encarga de restaurar la base de datos al estado previo a una error, prdida o catstrofe de la misma. Mtodo de Recuperacin: Restore-Rerun
Respaldo Completo Archivo RESTORE / RERUN Transacciones Archivo Recuperado

Mtodo de Recuperacin: Rollback


Archivo Actualizado ROLL BACK Pre-Imagen Archivo Recuperado a un estado previo

Mtodo de Recuperacin: Rollforward


Full-backup del Archivo ROLL FORWARD Post-Imagen Archivo Recuperado a un estado posterior al dao

Respaldos y Recuperacin de Datos


Recuperacin de Archivos

Puntos de chequeo (checkpoint): Cuando se est actualizando un archivo, cada cierto conviene grabar un registro especial en el archivo de transacciones (y pre-imgenes, si existe). Esta marca permite saber, ante fallas de proceso, hasta donde se haba llegado en el proceso de actualizacin, para luego reasumir el trabajo desde la ltima marca.

Respaldos y Recuperacin de Datos


Recuperacin de Archivos

Puntos de Chequeo:
Transacciones

checkpoint

checkpoint

checkpoint rehacer de ac en adelante

Tema Adicional: Transacciones


Recuperacin de Archivos

Transacciones: conjunto de operaciones (DML) que forman una unidad lgica de trabajo o procesamiento, con propiedades definidas (ACID)
Atomicidad: cualquier cambio de estado producido por una transaccin es atmico (todo o nada). Consistencia: cada transaccin lleva a una base de datos, desde un estado consistente a otro tambin consistente. Aislamiento (Isolation): la ejecucin concurrente de un conjunto de transacciones debe comportarse como si cada transaccin fuera la nica en proceso. Durabilidad: la base de datos garantiza que los cambios producto de una transaccin comprometida perduren en el tiempo.

Tema Adicional: Transacciones


Recuperacin de Archivos

Transacciones: operaciones asociadas.


Compromiso (commit): indicacin de que una transaccin se ha ejecutado por completo, y que todos los cambios se deben guardar para siempre en la base de datos. Rollback: una transaccin no ha podido comprometerse, por lo que se deben deshacer todos los cambios que haba generado a la fecha uso de registros undo (preimgenes).

Bibliografa
Database System Implementation (captulos 2, 3 y 4). H. Garcia-Molina, J. Ullman y J. Widow. Prentice Hall, Nueva Jersey, EE. UU. , 2000. Fundamentos de Sistemas de Bases de Datos (captulos 5 y 6). R. Elmasri y S. Navathe. Pearson Educacin, Madrid. 5ta. Edicin, 2007. Fundamentos de Bases de Datos. A. Silberschatz, H. Korth y S. Sudarshan. Mc Graw-Hill/Interamericana de Espaa, Madrid, 2006.

You might also like