You are on page 1of 19

INFORME TCNICO

Resumen general del proyecto informtico para la realizacin del


Censo de Poblacin y Viviendas 2001.

Versin Fecha Realizado por


2 18/04/2001 Jos Antonio Perea Yustres
Consideraciones generales acerca de la arquitectura informtica a emplear, as como
la estrategia de reconocimiento ptico a emplear. Se ndica la adecuacin tcnica de
la solucin propuesta y los sistemas a gestionar en el proceso de produccin censal.
Documento Word: Resumen del proyecto informtico censal 20010418.doc
Resumen general del proyecto informtico para la realizacin del Censo de Poblacin y Viviendas 2001 11/09/2001

El Real Decreto Ley 1336/1999, de 31 de julio, dispone la formacin de los Censos de


Edificios, Locales, Viviendas y Poblacin a realizar en el 2001.

La Orden del Ministerio de la Presidencia, de 9 de agosto de 2000, dicta las instrucciones


para la formacin de los Censos de Poblacin y Viviendas de 2001.
Esta operacin est incluida en el Plan Estadstico Nacional, y mas concretamente en el
Real Decreto 1126/2000, de 16 de junio, por el que se aprueba el plan 2001-2004.

Principios estratgicos:

Los objetivos bsicos a conseguir se orientan a:


- Maximizar la calidad de la operacin
- Optimizar los recursos disponibles
Teniendo como referencia la planificacin de las tareas de la operacin, los calendarios
contemplados y la necesidad de realizar una explotacin exhaustiva de la informacin a
partir de la preimpresin de la misma con los datos del Registro de Poblacin de Padrn
continuo disponible en el INE por su funcin coordinadora del total de los Padrones
Municipales, el plan de actuacin establecido ha sido el siguiente:
- El establecimiento de un convenio de colaboracin con la Direccin General del
Catastro para la armonizacin de los callejeros de direcciones postales de los registros
de poblacin y viviendas del INE y de Catastro para la gestin del IBI (Impuesto de
Bienes Inmuebles), para mejorar el directorio y facilitar la recogida
- La preimpresin de la documentacin censal a partir de los directorios referidos
- La gestin de la contratacin del personal eventual y de las nminas del mismo, a
partir de las adaptaciones necesarias a los sistemas habitualmente utilizados para
estos fines
- La oferta de cumplimentacin del Censo por internet, de forma complementaria a la
recogida tradicional por agentes en cuestionarios en papel
- La gestin de la recogida de la informacin basada en un sistema de seguimiento a
partir de la informatizacin de las Oficinas Comarcales establecidas al efecto, con co-
nexiones telemticas a los centros del INE y con el proveedor de servicios de la cum-
plimentacin por internet
- La dotacin de un centro de atencin al usuario, integrado en el centro de proveedor
de servicios de cumplimentacin por internet, para dar soporte a las consultas del
informante por cualquier medio
- La consideracin de las nuevas tcnicas asociadas a la captura de la informacin
basadas en OCR (Reconocimiento ptico de Caracteres) y de sistemas automticos de
codificacin, as como de la gestin documental asociada
- La utilizacin de las tcnicas mas adecuadas para la depuracin de la informacin
basada en los sistemas de imputacin automtica disponibles en el momento de la
explotacin
- La consideracin de un plan de difusin orientado a ofrecer al usuario un conjunto de
productos estndar y la posibilidad de realizar peticiones a medida complementarias

Instituto Nacional de Estadstica 2


Resumen general del proyecto informtico para la realizacin del Censo de Poblacin y Viviendas 2001 11/09/2001

- La integracin de un conjunto de cartografa digital como apoyo a la recogida as


como para facilitar la difusin censal a nivel de seccin censal para todo el territorio,
con los lmites de contorno en general y con contenido detallado para las secciones de
ncleos para los municipios mayores de 25.000 habitantes disponibles.

Resultados:
Los resultados a obtener en esta operacin son los siguientes:
- Recuento de la poblacin y explotacin estadstica de las variables investigadas, as
como proponer las rectificaciones a los datos de inscripcin padronal correspondien-
tes a los Ayuntamientos
- Recuento de los edificios y viviendas y explotacin estadstica de las variables investi-
gadas, as como actualizacin derivada de los datos de callejero previa notificacin de
los mismos a los Ayuntamientos
Para ello se partir de la informacin recogida en los CR (Cuadernos de Recorrido) de
cada seccin censal, de las HP (Hojas Padronales) y de los CC (Cuestionarios Censales de
Vivienda/Hogar, e individual en su caso), que se distribuirn preimpresos y con un diseo
orientado a la recogida de las bajas y modificaciones a introducir, complementado con los
modelos de altas correspondientes.
En cuanto al Censo de Edificios y Locales, las tareas informticas asociadas son las
siguientes:
- Captura de la informacin, y en especial de las variaciones introducidas en la recogi-
da, mediante un proceso de digitalizacin, OCR y videograbacin de los literales ma-
nuscritos, generando finalmente los ficheros de variaciones de unidades poblaciona-
les, viales, aproximaciones postales y huecos.
- Generacin y envo a los Ayuntamientos de las propuestas de variacin a los calleje-
ros, de acuerdo a los ficheros normalizados de intercambio establecidos con motivo
de la gestin del Padrn continuo
- Actualizacin de los callejeros con la informacin de vuelta procedente de los Ayun-
tamientos
- Depuracin e imputacin de la informacin recogida, por procedimientos automticos
y a medida
- Generacin de los ficheros finales para agregacin y difusin de los resultados
- Tabulacin de resultados a los niveles de desagregacin geogrfica que corresponda
En cuanto a los Censos de Poblacin y Viviendas, las tareas informticas asociadas son
las siguientes:
- Generacin de los ficheros diccionarios para la codificacin automtica y/o asistida de
las variables geogrficas y de actividad econmica para incluir en el proceso de captu-
ra y validacin de la informacin
- Control de la cobertura de la informacin recogida en comparacin con los correspon-
dientes resmenes derivados de los CR
- Captura de la informacin y en especial de las variaciones introducidas en la recogida,
mediante un proceso de digitalizacin, OCR, codificacin y videograbacin en su caso,
generando finalmente los ficheros de variaciones asociadas, con contratacin externa

Instituto Nacional de Estadstica 3


Resumen general del proyecto informtico para la realizacin del Censo de Poblacin y Viviendas 2001 11/09/2001

- Depuracin e imputacin de la informacin recogida, por procedimientos automticos


y a medida (metodologas DIA y NIM)
- Generacin de los ficheros finales para agregacin y difusin de los resultados, con
las medidas necesarias para asegurar la confidencialidad de la informacin individual
- Tabulacin de resultados a los niveles de desagregacin geogrfica que corresponda
El proceso de las personas y hogares tendr dos partes diferenciadas: en primer lugar,
recoger las variaciones a los datos de inscripcin padronal a efectos de aprobacin de las
cifras de poblacin a la fecha de referencia censal, as como para comunicacin a los
Ayuntamientos, previa comparacin con el Padrn nacional para evitar la generacin de
duplicados. En segundo lugar, depurar el resto de la informacin personal mediante los
procedimientos que corresponda de acuerdo al calendario establecido (resultados
provisionales 12 y 18 meses despus de la fecha de referencia y resultados detallados 24
y 36 meses despus).

Visin global del proyecto:


El procesamiento informtico de la informacin se asumir por el INE con recursos
propios, a excepcin de las tareas de apoyo a la gestin de la recogida, de la captura y
depuracin bsica asociada, que son objeto de diferentes contrataciones de suministro y
de arrendamiento, as como de diferentes servicios especficos.
Arquitectura de sistemas y de comunicaciones:
La arquitectura de sistemas y de comunicaciones asociada viene determinada de una
parte por los sistemas disponibles en el propio INE, tanto en sus Servicios Centrales como
en sus Delegaciones Provinciales y de otra por las contrataciones de los servicios de la
cumplimentacin de los censos por Internet y de comunicacin telefnica de las Oficinas
Comarcales con el INE. Estos sistemas se completan con los sistemas asociados a los
procesos de captura basados en OCR, que sern explotados por el adjudicatario de una
contratacin externa del servicio, en un centro nico ubicado en Madrid y dotado de la
infraestructura tcnica necesaria que se describe despus en este mismo documento.
Adems, para asegurar que los intercambios de informacin se realizan en las debidas
condiciones de seguridad y poder asegurar igualmente la confidencialidad de la informa-
cin en el caso de ficheros con datos de carcter personal, se ha considerado procedente
definir una extranet entre las Oficinas Comarcales y el INE, que se ha denominado Red
Privada de los Censos (RPC), y que se contratar mediante un concurso pblico ad hoc.
La RPC constar del conjunto de equipos fsicos y lgicos y del sistema de comunicacio-
nes del propio INE, complementado con un conjunto de redes locales, una para cada una
de las Oficinas Comarcales.
Las comunicaciones entre dichas redes darn servicio tanto a voz como a datos a travs
de telefona mvil, pasando siempre por los servicios centrales del INE.
El siguiente diagrama representa simplificadamente la red informtica del INE.

RED DEL INE:

Instituto Nacional de Estadstica 4


Resumen general del proyecto informtico para la realizacin del Censo de Poblacin y Viviendas 2001 11/09/2001

Servidores R/3 y Servidor Servidor


N i C C
Servidor
AIX

Router

Capitan Haya, 51 Castellana, 183


Router
Router
DD.PP
Josefa Valcarcel

DMZ
Router

Pasarela Servidor
Otros C WWW
id

Red
Privada
Censos

Router
Internet
Cortafuego
HOST Intranet

OPERACIN DE CAPTURA:

La operacin de captura de la informacin documental en papel se realizar en un nico


centro de procesamiento situado en Madrid (San Fernando de Henares), mediante un
sistema de reconocimiento ptico de caracteres, codificacin automtica, control de
rango y coherencia intra e inter registros, que contempla los siguientes procesos:

Digitalizacin mediante escner ptico


Control de cobertura de la digitalizacin
Reconocimiento de caracteres
Sistema de mejora de literales y codificacin asistida
Videocorreccin asociada al reconocimiento y a los controles de coherencia
Control del flujo de trabajo
Control de calidad
Gestin documental

Instituto Nacional de Estadstica 5


Resumen general del proyecto informtico para la realizacin del Censo de Poblacin y Viviendas 2001 11/09/2001

En consecuencia se requerir dotar a dicho centro de una red de rea local de alta
capacidad con un sistema de digitalizacin basado en un nmero suficiente de escneres
de alta produccin, un conjunto de servidores de reconocimiento, base de datos, unida-
des de almacenamiento masivo de la informacin y un conjunto de estaciones de trabajo
para realizar las tareas de videocorreccin, as como de un sistema de gestin documen-
tal de seguimiento y control de los trabajos, segn contiene la figura adjunta:

Se ha optado por una red gestionada con WINDOWS 2000 SERVER y SQL/SERVER 2000
como base de datos, utilizando una aplicacin de captura desarrollada a medida para esta
operacin con el producto de reconocimiento ptico de caracteres BELLVIEW SCAN,
seleccionada mediante un concurso pblico previo para este proyecto en base a un
ensayo de la operacin.
El sistema en desarrollo contempla los siguientes procesos:

1. Digitalizacin mediante escner ptico:

Mediante este dispositivo de entrada se capturarn las imgenes de los distintos


cuestionarios, individuales, del hogar, padronales y cuadernos de recorrido.

En este proceso de digitalizacin se generarn los ficheros de imgenes a una


compresin estndar, almacenndose en los soportes adecuados con una gran ca-
pacidad de almacenamiento y con las facilidades de recuperacin que permitan su
posterior tratamiento.

Instituto Nacional de Estadstica 6


Resumen general del proyecto informtico para la realizacin del Censo de Poblacin y Viviendas 2001 11/09/2001

2. Control de cobertura de la digitalizacin:

En este proceso se contrastarn los recuentos de documentos que entran al proce-


so de digitalizacin y los documentos digitalizados por el escner. Se comprobar
que todos los documentos de los lotes de documentacin han sido digitalizados y
que se ha realizado una correcta indexacin mediante su nmero de hueco.

3. Reconocimiento de caracteres:

Reconocer:

Escritura manual encasillada


Cdigos de barra
Omnifont
OMR

Para ello se utilizar software de reconocimiento con motores ICR numricos y al-
fabticos, motores OMR y motores de BarCode.

Dependiendo de la tipologa del campo (preimpreso, manuscrito, OMR, BarCode) y


su importancia descriptiva e identificativa, se utilizarn tcnicas asociadas de mejo-
ras de literales y codificacin asistida, y tcnicas de videocorreccin.

4. Sistema de mejora de literales y codificacin asistida:

Se utilizar para aquellos campos que se requieran, los diccionarios, tablas, pro-
gramas de coherencia y sistema de codificacin asistida asociados a variables
geogrficas, de actividad y de ocupacin.

En funcin de los ndices de fiabilidad y de valores de coherencia, se proceder a


dar como vlido el campo o en su defecto presentarlo en videocorreccin.

5. Videocorreccin:

El proceso de videocorreccin de campos se realizar:

a) Asociado al reconocimiento:

ndice de fiabilidad de reconocimiento bajo


ndice de fiabilidad de diccionario bajo
Identificaciones en cuestionarios de altas y modificaciones
Campos de especial relevancia
Rechazos directos

b) Asociado a los controles de coherencia:

Deteccin y correccin de valores fuera de rango e inconsistencias intra e in-


terregistros

En consecuencia, el sistema estar preparado para realizar videocorreccin espe-


cializada al nivel de campo, y masiva al nivel de carcter. Debe presentarse la ima-
gen del cuestionario en pantalla al nivel de carcter, campo, contexto y cuestiona-
rio completo.

Instituto Nacional de Estadstica 7


Resumen general del proyecto informtico para la realizacin del Censo de Poblacin y Viviendas 2001 11/09/2001

Si as se requiere, el sistema deber poder realizar la videograbacin completa de


todos los cuestionarios.

6. Control del flujo de trabajo:

Se controlar el flujo del trabajo e integrarlo dentro del sistema de Gestin y Reco-
nocimiento a desarrollar considerando todas las operaciones y fases por las que
pasa cada lote de trabajo y los distintos cuestionarios que lo componen.

7. Control de calidad:

Se integrarn en el sistema aquellos controles que permitan comprobar:

El nivel de sustituciones producidas en el reconocimiento ptico


El nivel de calidad en la realizacin de la codificacin asistida y el uso de
diccionarios
El nivel de calidad del sistema de videocorreccin
El nivel de calidad del flujo de trabajo

Se desarrollarn los resmenes de control necesarios para la comprobacin del ni-


vel de calidad de los procesos.
Igualmente se realizarn las estimaciones necesarias para la planificin de la reali-
zacin del trabajo de explotacin.

8. Gestin documental:

Se incluir un sistema de gestin documental aplicado al proyecto censal, que


permita la recuperacin de las imgenes y de los datos, de los ficheros resultado
de la explotacin.

Esquema de produccin censal del INE

El esquema de produccin censal del INE se divide en las siguiente reas de gestin:
o rea A - Gestin de entrada / salida de la documentacin censal: Esta unidad ser
la responsable del control de entrada / salida de la documentacin censal. Se en-
cargar del control y gestin de las reas de recepcin, control de la documenta-
cin, almacn de entrada, almacn de salida y expedicin. Realizar la preparacin
de la documentacin en lotes de trabajo y su distribucin para su digitalizacin.
Una vez finalizados los procesos informticos de produccin censal, remitir la do-
cumentacin al almacn de salida verificando su integridad.

o rea B - Gestin de la digitalizacin de la documentacin censal. Esta unidad con-


tar con personal experto en sistemas de digitalizacin que se encargarn de reali-
zar una correcta digitalizacin de la documentacin censal verificando los niveles
de calidad de las imgenes resultantes. Debern realizar los mantenimientos pre-
ventivos que se especifiquen al principio de cada jornada de trabajo y gestionarn
las incidencias producidas en el proceso de digitalizacin.

o rea C - Gestin del sistema de Videograbacin censal. Esta unidad se encargar


de realizar la entrada de datos de los caracteres no reconocidos por el sistema in-
formtico censal, as como la correccin de los caracteres interpretados errnea-

Instituto Nacional de Estadstica 8


Resumen general del proyecto informtico para la realizacin del Censo de Poblacin y Viviendas 2001 11/09/2001

mente por el sistema. Estos procesos sern realizados mediante un sistema de


presentacin en pantalla de la imagen de los distintos cuestionarios censales.

o rea D- Gestin de Validacin de datos censales. Ser la encargada de realizar la


depuracin de los datos censales una vez obtenidos los ficheros de datos corres-
pondientes, control de duplicaciones, falsas altas... todo conforme al sistema de
procesamiento informtico censal realizado por el INE.

o rea E - Gestin del sistema de tratamiento de los cuadernos de recorrido censa-


les. Sern los encargados de realizar la gestin del tratamiento especfico que re-
quiere este tipo de documento. Est conformado por personal de digitalizacin,
control , videograbacin y validacin.

o rea F Control de backup. Control del sistema de backup

o rea G - Gestin del control informtico. Personal responsable de todos los proce-
sos, trabajos y personas del sistema de produccin censal. Deber conocer en pro-
fundidad aspectos globales del sistema y especficos de los procesos de reconoci-
miento, mejora de literales, diccionarios, Videograbacin... Deber controlar todos
los procesos que se realicen a los lotes de trabajo. Deber controlar la secuencia
de los documentos, la cobertura de los lotes con los ficheros de las oficinas comar-
cales y con los cuadernos de recorrido. Debe conseguir que los ndices de produc-
tividad, que en su momento se consideren ptimos, se cumplan.

o rea H - Gestin del control y administracin, almacenamiento, comunicaciones y


seguridad fsica y lgica de los ficheros de imgenes y datos censales. Personal
especializado responsable de todos los sistemas y soportes de almacenamiento de
imgenes y datos de la red general de produccin censal del INE. Tambin ser
responsable de la seguridad fsica y lgica de la informacin ( imgenes y datos).
Se encargar tambin de la exportacin de los datos y de las comunicaciones con
otros centros censales y /o centros INE. Este personal deber dar solucin a los
problemas de carcter informtico que se puedan presentar en la red general de
produccin censal. Deber conocer las aplicaciones y sistemas fsicos y lgicos
empleados para poder resolver las incidencias que se produzcan (ver anexo co-
rrespondiente al equipamiento informtico censal) . Deber mantener y optimizar
los dispositivos fsicos y lgicos para que realicen una produccin conforme a los
objetivos fijados.

o rea I - Control de calidad. Debern realizar los procesos de Videocorreccin nece-


sarios y en el volumen que se determine para testar que los ndices de fiabilidad /
eficacia del produccin censal son los adecuados o por el contrario deben mejorar-
se. Un lote de trabajo no ser dado por bueno sin la autorizacin de esta unidad.

o rea J - Gestin del sistema de incidencias. Se encargar de solucionar las inci-


dencias que se produzcan en relacin a la documentacin censal (deterioro fsico,
incorrectas identificaciones, control de cobertura con las oficinas comarcales...).
Ante el posible deterioro fsico de algunos cuestionarios, que imposibilite su co-
rrecta digitalizacin, debern realizar un proceso de entrada de datos tradicional
generando un cuestionario virtual que sustituya al daado. Otras incidencias sern
solucionadas mediante la digitalizacin personalizada de cada cuestionario y su
posterior proceso de Videograbacin. Una vez solucionada la incidencia los cues-
tionarios, imgenes y datos sern remitidos a donde se gener la incidencia para
su integracin en los correspondientes lotes de trabajo.

Instituto Nacional de Estadstica 9


Resumen general del proyecto informtico para la realizacin del Censo de Poblacin y Viviendas 2001 11/09/2001

o rea K - Gestin del control, seguimiento y administracin de la red general de


produccin censal del INE. Sern los responsables de gestionar y controlar todas
las reas especificadas anteriormente para la realizacin de la produccin censal
en los tiempos previstos y en las condiciones ms ptimas. Debern optimizar los
dispositivos, sistemas... con el fin de optimizar la produccin censal conforme al
plan establecido. Debern realizar el seguimiento pormenorizado de los flujos de
trabajo y presentar al INE informes de los resultados obtenidos y de la planifica-
cin prevista. Debern estar en continuo contacto con la Unidad de Control del INE
para conseguir los ndices de calidad que se pretenden.
El trabajo finalizar una vez est en poder del INE los ficheros de datos e imgenes
de todo el Censo de Poblacin y viviendas 2001 conforme a los ndices de calidad
de todos los procesos de produccin.
La documentacin censal ser almacenada y controlada por la empresa licitante en
las instalaciones que el INE determine para tal fin hasta que se determine su des-
truccin.
El servicio a prestar se realizar en su totalidad en un centro puesto a disposicin del
adjudicatario, dotado de las condiciones de habitabilidad y seguridad requeridas para
desarrollar esta actividad, ubicado en Madrid.

Los equipamientos fsicos y lgicos necesarios tambin sern puestos a disposicin


del adjudicatario, conforme al modelo de procesamiento establecido, que se repre-
senta en los grficos siguientes:

Instituto Nacional de Estadstica 10


Resumen general del proyecto informtico para la realizacin del Censo de Poblacin y Viviendas 2001 11/09/2001

Instituto Nacional de Estadstica 11


Resumen general del proyecto informtico para la realizacin del Censo de Poblacin y Viviendas 2001 11/09/2001

La documentacin en papel se compone de los siguientes tipos de cuestionario:

Cuadernos de Recorrido.
Hojas Padronales
Cuestionarios Censales
o Vivienda
o Hogar
o Individual

Tipo de Previsin del Previsin de Previsin de Previsin de Previsin del n


cuestionario N total de imgenes a imgenes a imgenes a zona de imgenes
1 2
Cuestionarios zona de zona ICR videocorreccin completas a
3
Digitalizacin videograbacin
Padrn 13.000.000 26.000.000 15.000.000 1.500.000 150.000
Hogar 13.000.000 26.000.000 15.000.000 2.250.000 225.000
Individual 18.000.000 18.000.000 18.000.000 3.600.000 360.000
Vivienda 13.000.000 26.000.000 15.000.000 1.500.000 150.000

1
Esta previsin se refiere al nmero de imgenes que pueden tener algn tipo de dato no preimpreso, y
que por tanto iran a zona de ICR.
2
Esta previsin se refiere al nmero de imgenes que tendran en algn campo datos a videocorregir.
3
Esta previsin se refiere al nmero total de imgenes (A4 - 1 cara) que tendran que videograbarse
completamente. Esta cantidad es el resultante de aplicar un porcentaje previsto al dato anterior.

Instituto Nacional de Estadstica 12


Resumen general del proyecto informtico para la realizacin del Censo de Poblacin y Viviendas 2001 11/09/2001

Cuadernos 40.000 4.000.000 4.000.000 400.000 40.000


de recorrido
Total 57.040.000 100.000.000 67.000.000 9.250.000 925.000

Tanto las hojas padronales como los cuestionarios censales tienen modelos bilinges para cada
uno de los idiomas oficiales del estado. Igualmente tienen diferentes modelos segn el nmero de
personas que componen la unidad familiar.

TIPOS DE CUESTIONARIOS CENSALES

CODIGO TIPO IMPRESIN MOD. CUESTIONARIO IDIOMA

0000 Personalizado Vivienda Castellano

0011 Personalizado Vivienda Bilinge Genrico

0101 Altas Vivienda Castellano

0112 Altas Vivienda Bilinge Genrico

0303 Personalizado Vivienda colectiva Castellano

0314 Personalizado Vivienda colectiva Bilinge Genrico

Instituto Nacional de Estadstica 13


Resumen general del proyecto informtico para la realizacin del Censo de Poblacin y Viviendas 2001 11/09/2001

0404 Altas Vivienda colectiva Castellano

0415 Altas Vivienda colectiva Bilinge Genrico

1001 Personalizado Hoja Padronal Cabecera Castellano

1012 Personalizado Hoja Padronal Cabecera Bilinge Genrico

1102 Altas Hoja Padronal Castellano

1113 Altas Hoja Padronal Bilinge Genrico

1304 Personalizado Hoja Padronal Castellano

1315 Personalizado Hoja Padronal Bilinge Genrico

1405 Altas Hoja Padronal Castellano

1416 Altas Hoja Padronal Bilinge Genrico

3003 Personalizado Cuest. Hogar cabecera Castellano

3014 Personalizado Cuest. Hogar cabecera Bilinge Genrico

3036 Personalizado Cuest. Hogar cabecera Gallego-castellano

3047 Personalizado Cuest. Hogar cabecera Vasco-castellano

3093 Personalizado Cuest. Hogar cabecera Cataln-castellano con


preguntas adicionales

3104 Altas Cuest. Hogar cabecera Castellano

CODIGO TIPO IMPRESIN MOD. CUESTIONARIO IDIOMA

3115 Altas Cuest. Hogar cabecera Bilinge Genrico

3137 Altas Cuest. Hogar cabecera Gallego-castellano

3148 Altas Cuest. Hogar cabecera Vasco-castellano

3183 Altas Cuest. Hogar cabecera Cataln-castellano con


preguntas adicionales

3306 Personalizado Cuestionario Hogar Castellano

3317 Personalizado Cuestionario Hogar Bilinge Genrico

3339 Personalizado Cuestionario Hogar Gallego-castellano

3341 Personalizado Cuestionario Hogar Vasco-castellano

Instituto Nacional de Estadstica 14


Resumen general del proyecto informtico para la realizacin del Censo de Poblacin y Viviendas 2001 11/09/2001

3396 Personalizado Cuestionario Hogar Cataln-castellano con


preguntas adicionales

3407 Altas Cuest. Hogar Siguiente Castellano

3418 Altas Cuest. Hogar Siguiente Bilinge Genrico

3431 Altas Cuest. Hogar Siguiente Gallego-castellano

3442 Altas Cuest. Hogar Siguiente Vasco-castellano

3497 Altas Cuest. Hogar Siguiente Cataln-castellano con


preguntas adicionales

4105 Altas Cuestionario Individual Castellano

4116 Altas Cuestionario Individual Gallego-castellano

En cuanto a los sistemas de digitalizacin principal y de digitalizacin incidencias, una vez


realizados pruebas con los diferentes digitalizadores del mercado, se ha determinado que
la velocidad nominal de digitalizacin base para la digitalizacin deber ser de 120 ppm.
que se estima se corresponde con producciones reales con velocidades de digitalizacin
de 65 a 85 ppm. para digitalizaciones a 200 dpi.
Una produccin real de 16 a 24 horas, est sujeta a incontables interrupciones, algunas
programadas y otras no programadas.
Interrupciones programadas:

Dentro de cada turno de trajo (8 horas) hay que dedicar 1 hora a tareas de limpieza
y mantenimiento:
o Limpieza de rodillos de alimentacin
o Limpieza de rodillos de arrastres
o Limpieza de los sensores pticos
o Limpieza y revisin de lmparas
o Eliminacin (aspirado) del polvo que generan los documentos.
o Limpieza de elementos pticos

Cada hora hay que detener el escner para hacerle una limpieza ligera de las par-
tes pticas y una calibracin.

Cada vez que se termina de digitalizar una caja (lote), el escner se detiene. El ope-
rador deber retirar los documentos colocarlos en las cajas, coger otra caja, e indi-
car al sistema que comienza un nuevo lote.
Interrupciones no programadas:

Atascos, cada vez que se produce un atasco del papel, hay que detener el escner,
dependiendo el tipo de atasco esta interrupcin puede ser de varios minutos.

Instituto Nacional de Estadstica 15


Resumen general del proyecto informtico para la realizacin del Censo de Poblacin y Viviendas 2001 11/09/2001

Doble alimentacin. Cuando se produce una doble alimentacin, el sistema avisa


al operador y este detiene, el escner. En esto momento hay que eliminar las pgi-
nas mal digitalizadas y digitalizarlas de nuevo.

Pgina no identificada. El escner debe identificar la pgina que esta digitalizando


utilizando para ello unos nmeros de pgina impresos en los cuestionarios. Si el
escner no est totalmente seguro de la pgina reconocida, se detiene y el opera-
dor se lo indica manualmente.

Regmarks no identificados. Cada vez que un regmark no es identificado la pgina


es rechazada por el escner para ser digitalizada de nuevo.

Averas del escner.


Todo esto hace que la velocidad real de la produccin oscile de los 65 a 85 documentos
por minuto (duplex A4).
El nmero de unidades (escneres y UPC) necesarios para cumplir el calendario de
realizacin del trabajo en un mximo de 4 meses, requiere una produccin diaria por
unidad de digitalizacin de 62.400 cuestionarios, de lo que se deduce que es necesario un
conjunto de 12 unidades de produccin censal (10 UPC de hojas padronales y cuestiona-
rios censales y 2 UPC para el procesamiento de los Cuadernos de Recorrido y de backup
de incidencias) y 4 unidades de gestin de incidencias.
Dichos equipos de digitalizacin de las imgenes debern ser de altas prestaciones, en
cuanto a fiabilidad, velocidad y resolucin y se pondrn a disposicin del adjudicatario
del servicio de operacin, gestin y control del sistema integral de produccin orientado a
la captura y depuracin de la documentacin censal, a fin de asegurar que cumplen con
todas las prescripciones tcnicas que se exigen en el correspondiente pliego de clusulas
administrativas y de prescripciones tcnicas.
Debido al volumen de la informacin a capturar y habida cuenta de que este tipo de
operacin es de carcter excepcional (cada 10 aos en el mejor de los casos), es por lo
que procede la contratacin de un suministro en rgimen de arrendamiento de los
equipos, amn de la insuficiente disponibilidad presupuestaria para financiar su adquisi-
cin.

Censo por Internet y centro de atencin al usuario:

A) Ideas claves:

Espaa es el primer pas del mundo que permite la cumplimentacin del Censo por
Internet a todas las personas previamente empadronadas en la vivienda donde resi-
den.

La cumplimentacin por Internet del Censo ser totalmente confidencial y fcil de


realizar, en funcin de procedimientos de seguridad acordes con la informacin a
cumplimentar.

El INE agradecer la cumplimentacin por Internet del Censo mediante la entrega


gratuita de datos estadsticos sobre la distribucin geogrfica de un apellido que el
informante solicite (salvaguardando la confidencialidad estadstica).

Para cumplimentar el Censo por Internet, ser necesario esperar a recibir el sobre
censal en la vivienda donde se reside y seguir las instrucciones que en l se indican.

Instituto Nacional de Estadstica 16


Resumen general del proyecto informtico para la realizacin del Censo de Poblacin y Viviendas 2001 11/09/2001

B) Descripcin somera:

Se trata de establecer un mecanismo que permita la cumplimentacin de los cuestio-


narios censales por Internet, como una posibilidad aadida al mecanismo tradicional
de recogida en papel.

Las experiencias anlogas anteriores de otros pases son slo tres y de alcance mucho
mas limitado que el espaol: Singapur ofreci la posibilidad de cumplimentar el Cen-
so por Internet en el 2000 pero slo al 20% de su poblacin (la parte muestral de su
censo); los EE.UU. ofrecieron tambin esa posibilidad en su Censo del 2000 pero slo
a una parte limitada de los destinatarios de su llamado cuestionario corto y, finalmen-
te, Suiza ha ofrecido la cumplimentacin por Internet a aquellas comunas que subcon-
traten la realizacin del Censo con la Oficina Federal Estadstica, habiendolo hecho un
60% de las comunas (la subcontratacin implica un pago a la Oficina Federal) y que-
dando fuera de la posibilidad de cumplimentar el Censo por Internet un 10% de la
poblacin.

Segn el diseo de la operacin censal espaola, en los cuestionarios en papel que se


van a repartir figura preimpresa determinada informacin individual de cada ciudada-
no, obtenida de la base de datos padronales.

Se establecer el cuestionario censal en el servidor web seguro correspondiente,


debiendo estar previsto un mecanismo de firma electrnica avanzada para que un
usuario pueda modificar sus datos padronales, en el caso en que haya detectado un
error en los datos preimpresos. Si, por el contrario, considera que sus datos padrona-
les preimpresos son correctos, podr proceder a la cumplimentacin del censo pro-
piamente dicho por Internet, con el procedimiento de autenticacin establecido.

Brevemente descrito y sin entrar en matices ni en la totalidad de la casustica, el


mecanismo de autenticacin previsto se basa en: 1) el nmero de hueco (cdigo iden-
tificativo incluido en el cuestionario censal); 2) una clave dedicada la cumplimentacin
por Internet (tambin incluida en el cuestionario censal); 3) el DNI de una de las per-
sonas incluidas en el cuestionario censal (DNI tambin preimpreso en el cuestionario)
y 4) el nombre del padre y de la madre tal y como figuran en el DNI indicado el punto
anterior (esta informacin no figura preimpresa en el cuestionario censal).

Relacionado directamente con esta cuestin de la autenticacin, se establecern los


procedimientos necesarios de control de accesos incorrectos, intento de fraude, blo-
queos y desbloqueos de cuestionarios, etc., segn las especificaciones que se deter-
minen.

El servidor web citado deber cumplir los requisitos sobre los idiomas a incluir
(cooficiales en Espaa y algunos extranjeros), lo que incluye la necesidad de que los
ficheros o las pantallas de ayuda se incorporen en dichos idiomas y que se establez-
can adecuados mecanismos por omisin (de modo que en funcin de la configuracin
del navegador que est utilizando el usuario se seleccione un idioma determinado).

Se incluir tambin el conjunto de normas de edicin del cuestionario en formato


web; es decir el conjunto de edits necesario para que se asegure la calidad y consis-
tencia de cada uno de los cuestionarios cumplimentados por Internet, debiendo co-

Instituto Nacional de Estadstica 17


Resumen general del proyecto informtico para la realizacin del Censo de Poblacin y Viviendas 2001 11/09/2001

municarse al usuario que est procediendo a la cumplimentacin por Internet de cual-


quier problema que impida la aceptacin final de dicha cumplimentacin, para que el
usuario proceda a subsanar los errores correspondientes.

Se implementar un mecanismo de "pago inmediato" al informante que cumplimente


el censo por Internet, consistente en la obtencin automtica e inmediata (una vez
cumplimentado de forma totalmente correcta el cuestionario por Internet) de un estu-
dio de frecuencias del apellido que solicite el informante (slo uno por cuestionario
censal) a partir de los propios datos padronales, con las normas adecuadas para res-
petar la confidencialidad.

Asimismo, el sistema permitir que el usuario pueda interrumpir su trabajo de


cumplimentacin del cuestionario, pudindolo continuar posteriormente. En el mo-
mento en que la cumplimentacin se haya finalizado de forma totalmente correcta, el
sistema deber proporcionar al usuario determinado nmero que pueda actuar de
recibo o de comprobante de que dicha cumplimentacin completa se ha producido.

Se implementarn los requisitos necesarios para la creacin y mantenimiento de la


base de datos, conteniendo los cuestionarios cumplimentados por Internet, lo que
incluye la comunicacin a establecer con las Oficinas Comarcales, o con las Delega-
ciones Provinciales para la actualizacin (a partir de los datos identificativos de los
cuestionarios recogidos por Internet) de sus respectivas bases locales conteniendo los
datos identificativos de los cuestionarios recogidos en papel.

Esa comunicacin con las Oficinas Comarcales considerar diferentes posibilidades:


En primer lugar, y como mecanismo bsico existir un procedimiento de envo o de
descarga, de modo que cada Oficina Comarcal y cada Delegacin Provincial dispondr
semanalmente de un fichero conteniendo los datos identificativos de los cuestionarios
recogidos por Internet.

Adems, existir un servidor web de modo que la base de datos conteniendo los datos
identificativos de los cuestionarios cumplimentados por Internet ser accesible y per-
mitir consultar y descargar en su caso ficheros compuestos de dichos identificativos,
accediendo a la misma por Internet, aquellos usuarios autorizados tanto de las Ofici-
nas Comarcales como de las Delegaciones Provinciales y Servicios Centrales, por
rangos de fechas. Por ltimo, se implementar un mecanismo para la consulta telef-
nica (automtica y autorizada) de dicha base de datos, conteniendo los datos identifi-
cativos de los cuestionarios cumplimentados por Internet.

Existir un centro de atencin telefnica, incluyendo todo aquello que resulte necesa-
rio para la resolucin de dudas sobre la cumplimentacin de un cuestionario censal
por Internet. Se incluye dentro de este centro de atencin la necesidad de que se dis-
ponga de la posibilidad de plantear cuestiones y resolver dudas por correo electrni-
co, debindose los dos sistemas apoyarse entre s para pasar del correo al telfono de
manera casi inmediata y viceversa. En este centro de atencin telefnica se contem-
plar la existencia del servicio en varios idiomas (segn las especificaciones idiomti-
cas que se hayan establecido, de forma anloga a lo que exista en el servidor web que
aloje el cuestionario). Este centro de atencin telefnica ser tambin el centro dedi-
cado a la resolucin de dudas para la cumplimentacin del cuestionario censal en
papel.

RED DE LAS OFICINAS COMARCALES:

Instituto Nacional de Estadstica 18


Resumen general del proyecto informtico para la realizacin del Censo de Poblacin y Viviendas 2001 11/09/2001

M o d e m R T C /G S M
Im p r e s o r a

P C E .C o m a r c a l P C E .C o m a r c a l

Las aplicaciones a explotar en la RPC son las siguientes:

Gestin de contratacin del personal eventual implicado en la operacin de recogida.


Incluye la generacin de las certificaciones de trabajos realizados para trasladar esta
informacin al sistema de gestin de nminas.

Aplicacin de gestin de la recogida de la informacin tanto en Delegaciones Provin-


ciales como en los Servicios Centrales, en coordinacin con las aplicaciones instala-
das en las Oficinas Comarcales.

Aplicaciones de depuracin, imputacin y generacin de ficheros finales y obtencin


de resultados agregados.

Instituto Nacional de Estadstica 19

You might also like