Capitulo 13 Salud Pública La salud pública presenta varias situaciones interesantes de diseño de almacenes de datos.

En este capítulo vamos a imaginar primero que trabajamos para un consorcio de salud pública grande, luego que trabajamos para una organización de facturación para proveedores de servicios y hospitales, y, finalmente, que trabajamos para una clínica grande, con millones de registros complejos de tratamiento de los pacientes. Cada una de estas situaciones sugerirá importantes técnicas de diseño aplicables a la salud pública y otras industrias. En el capítulo 13 se discuten los siguientes conceptos: y y y y y y y Circulo de Valor para la salud pública, centrado en los registros de tratamiento de los pacientes. Tabla de Hechos tipo Snapshot Acumulativa para manejar facturas de líneas de productos médicos. Mas dimensiones del tipo Role-Playing aplicadas a múltiples fechas y proveedores. Dimensiones Multivaluadas (de varios valores), como por ejemplo un número abierto de diagnósticos, junto con las fechas de vigencia y factores de ponderación para apoyar a las asignaciones. Tabla de Hechos Extendida para apoyar el análisis de rentabilidad. Manejo de los eventos médicos complejos. Tabla de Hechos para almacenar medidas heterogéneas y muy escasas.

una clínica. empresas. es más amplio e incluye no sólo los tratamientos que dan lugar a los costos. farmacias. farmacéuticas. de una empresa a otra. Nuestro gran consorcio de salud pública debe ser capaz de compartir los registros de facturación de tratamiento. un hospital o un laboratorio. los consorcios de salud pública se asemejan más a un círculo de valor. Y. porque no hay orden evidente en el tiempo. los problemas de conformación de las dimensiones comunes siguen siendo exactamente los mismos. Un grupo representativo de las dimensiones que debe conformar el consorcio de salud pública incluye: y y Fecha/Calendario Paciente . Hay dos tipos principales de registros de tratamiento de los pacientes. por último. los resultados y las notas del proveedor durante el curso del tratamiento. compañías de seguros y agencias gubernamentales. como se ilustra en la Figura 13.1.Circulo de Valor para Salud Publica Un típico consorcio grande de salud pública es una red de proveedores. y de compañía de seguros a programas gubernamentales de salud pública. El registro de tratamiento médico. sin problemas. El registro de facturación de tratamiento corresponde a una línea de producto en una factura al paciente de un consultorio. Sin embargo. ¡Esta figura no es un diagrama o esquema! Es una imagen de cómo todas estas diversas organizaciones necesitan compartir los mismos datos críticos: los registros de tratamiento del paciente. de organización a organización. clínicas. por el contrario. laboratorios. en cuanto a la prestación del servicio de salud pública. sino también todas las pruebas de laboratorio. El consorcio de salud pública será capaz de funcionar si y sólo si puede implementar un conjunto de dimensiones conformadas. A diferencia de la cadena de valor que se describe en el Capítulo 3. y vamos a verlas en secciones separadas. El círculo de valor para la salud pública difiere de la cadena de valor lineal clásica. hospitales. Las cuestiones relacionadas con estos dos tipos de registros son muy diferentes. los registros médicos de un paciente tienen que estar disponibles a corto plazo para el uso médico legítimo por cualquiera de los proveedores primarios. Mientras los individuos se muevan de un lugar a otro. una imagen coherente de la historia de ese individuo debe poderse crear en cualquier momento. Los registros de facturación de todos los diferentes tipos de proveedores deben tener un conjunto completo de dimensiones comunes con el fin de ser procesados por las compañías de seguros y los que pagan facturas médicas.

accidentes. debido a la falta de un número nacional de identidad confiable y porque la gente están asociados por separado en consultorios médicos y hospitales y situaciones de trabajo. algunas de estas dimensiones son muy difíciles de conformar.google. mientras que otras son más fáciles de lo que parecen a primera vista. y el CPT-4 (Current Procedural Terminology. Una fila médica no siempre identificara a las dimensiones empresa. plan de salud o compañía de seguros. volumen 3. además actualizado y distribuido por el HHS.y y y y y y y y y y Parte Responsable (familiar. exámenes) Medicamento Diagnóstico Resultado Lugar (oficina. householding. Los diagnósticos normalmente siguen el estándar ICD-9-CM (International Classification of Diseases. y proveedores de servicios ofrecen servicios similares a la industria de la salud pública. tutor. 9th Revision: Clinical Modification) volúmenes 1 y 2. El estándar ICD9-CM. abogados. 4th Edition). hospital) Una fila de facturación probablemente necesite todas estas dimensiones. Los problemas con las dimensiones de parte responsable y paciente son muy similares a los temas que discutimos en el Capítulo 6 en relación con la consolidación de múltiples fuentes de información de los clientes. busque los términos householding o merge-purge en un motor de búsqueda en Internet como Google (www. incluyendo: y y y y y y y Servicios Médicos Servicios de Terapia Física y Ocupacional Procedimientos Radiológicos Pruebas de Laboratorios Clínicos Otros procedimientos de diagnostico medico Servicios para la audición y visión Servicios de transporte (incluyendo ambulancias) . En el negocio de la salud pública. El estándar HCPCS (Health Care Financing Administration Common Procedure Coding System). Y el procesamiento de quejas de las compañías de seguros necesitaría aún más dimensiones en relación a los demandantes. Las dimensiones de diagnóstico y tratamiento son mucho más estructuradas y predecibles de lo que uno podría esperar debido a que la industria de los seguros y el gobierno han ordenado sus contenidos. al menos en los Estados Unidos. actualizado y distribuido por la AMA (American Medical Association). y los tipos de transacciones necesarias para el procesamiento de quejas.com). pruebas de laboratorio. El Departamento de Salud y Servicios Humanos (HHS por sus siglas en inglés) de los Estados Unidos mantiene esta norma en cuanto a los Estados Unidos se refiere. define los códigos para tratamientos y gestión. clínica. Vamos a eliminar de los almacenes de datos de la salud pública el aspecto de las compañías de seguros. secundaria) Proveedor (cualquier profesional de la salud que administre tratamientos) Tratamiento (procedimientos facturables. excepto la dimensión de resultados. Las dimensiones de parte responsable y paciente son las más difíciles. empleado) Empresa Plan de Salud Compañía de Seguros (primaria. porque vamos a tratar con ese tipo de temas en el capítulo 15. cubren servicios relacionados a la salud y otros ítems. Para obtener más información sobre estas empresas. software tipo merge-purge. El mismo matching de clientes. centro de atención ambulatoria.

a continuación. Hemos descrito este proceso en el capítulo 3. . pero los principios son exactamente los mismos cuando se aplican al círculo de valor de la salud pública.y y y Suministros Médicos Dispositivos Ortopédicos y Prótesis Equipo Médico duradero Los dentistas son capaces de utilizar el CDPN (Code on Dental Procedures and Nomenclature). en un contexto de transporte de productos. cualquier organización que tenga privilegios de acceso adecuados puede profundizar a través de las tablas de hechos por separado. Cuando todas las dimensiones de nuestra lista se han conformado. actualizado y distribuido por la ADA (American Dental Association). para servicios dentales. El uso de dimensiones compatibles garantiza que este proceso de búsqueda está bien definido. uniendo la información haciendo coincidir los encabezados de cada fila.

El grano de snapshot periódica es el grano de opción para procesos con tiempo de ejecución de muy larga duración. tratamiento. ¿cuál es la medida que estamos registrando? El grano de transacción es el más fundamental. Aunque el mundo puede ser reconstruido a partir de las transacciones individuales. tales como pedidos o facturas médicas. así como todas las operaciones de pago resultantes de la factura que se envía. tales como cuentas bancarias y pólizas de seguros. Recuerde que el grano de la tabla de hechos es la definición fundamental de lo que constituye una fila de la tabla de hechos. y queremos ver el estado actual de todas las facturas pendientes de pago. diagnóstico. tenemos tres opciones fundamentales de grano para la tabla de hechos. incluyendo paciente. Recibimos las transacciones primarias de facturación de los proveedores y hospitales. la snapshot periódica no hace un buen trabajo al capturar el comportamiento de procesos rápidos y de corta duración. vamos a suponer que el escenario estándar de una factura incluye: y y y y y y y Fecha de Tratamiento Fecha de Facturación a la Compañía de Seguros Primaria Fecha de Facturación a la Compañía de Seguros Secundaria Fecha de Facturación a la Parte Responsable Fecha de Pago a la Última Compañía de Seguros Primaria Fecha de Pago a la Última Compañía de Seguros Secundaria Fecha de Pago a la Última Parte Responsable . este grano no puede ser el mejor grano para empezar a cumplir con nuestros reportes de objetivos de negocio. Cuando algo acerca la línea de producto cambia. preparamos y enviamos las facturas a todos los contribuyentes responsables. Además. En otras palabras. Y. La mayor parte de la interesante actividad que rodea a una factura médica se lleva a cabo rápidamente en uno o dos meses. siempre que consideramos incluir una fuente de datos en el almacén de datos. esta fila representará la historia acumulada de esa línea de producto desde el momento de la creación de la fila hasta el día actual. no podemos ver el estado actual de las facturas pendientes de pago. Nuestro almacén de datos para la facturación en salud pública debe cumplir una serie de objetivos de negocio. Vamos a elegir el grano snapshot acumulativa para nuestras facturas de salud pública. actualizado cada 24 horas. por supuesto. En el ejemplo de facturación en salud pública. porque muchas de las consultas requerirían poner al día las transacciones desde el inicio del tratamiento del paciente. Queremos analizar las cuentas y los montos en dólares de todas las facturas por cada dimensión a nuestra disposición. Queremos ver cómo se han pagado estas facturas y qué porcentaje de las mismas no se ha cobrado. y seguimos el progreso de los pagos efectuados. Una sola fila en la tabla de hechos representará una sola línea de producto en una factura de salud pública. Además. proveedor. Queremos ver cuánto tiempo toma recibir el pago. si la snapshot periódica sólo está disponible a final de mes. visitamos la fila única de acumulación y la modificamos adecuadamente. y cualquier combinación de todas éstas. las consultas deben ser simples. fecha. Sin embargo.Factura de Salud Pública Imaginemos que trabajamos para una organización de facturación para proveedores de salud pública y hospitales. Desde el punto de vista de la organización de facturación. y el ¡tiempo de respuesta debe ser instantáneo! Como ya comentamos en el capítulo 5. el grano de transacción incluiría todas las transacciones de entrada de los proveedores y hospitales.

el tratamiento realizado. las compañías de seguros primaria y secundaria. conocemos la parte responsable. listando cuidadosamente todo lo que sabemos en cierto en el contexto de esta fila. el proveedor. tal vez la compañía de seguros primaria está facturada. y número de identificación maestro de la factura. monto cancelado. El propósito del grano de la snapshot acumulativa es colocar cada factura de salud pública en un formato uniforme para que los objetivos de negocios descritos anteriormente puedan ser satisfechos fácilmente. Asumiremos que una fila es creada en esta tabla de hechos cuando las actividades transaccionales son primero recibidas de los proveedores y hospitales y las facturas iniciales son enviadas. pero la secundaria y la parte responsable no lo están. duración del tratamiento. En una factura dada. Los hechos interesantes que decidimos acumular a través de la historia de una línea de producto en la factura de salud publica incluyen el monto facturado. Si los usuarios de negocios necesitan ver ocasionalmente todos los detalles de una situación de facturación de pagos particularmente complicada. pendientes de una respuesta de la compañía de seguros primaria. la historia acumulada de una línea de producto en una factura de salud pública). entonces una tabla de hechos con grano transaccional se necesitaría de acompañante. el diagnostico. Estas se convierten en nuestras dimensiones. número de unidades de tratamiento (dependiendo del tipo de tratamiento). el paciente. la empresa. la ubicación del tratamiento.Elegimos estas fechas para ser una descripción adecuada de una factura normal. como se muestra en la Figura 13. Por un periodo de tiempo después de que la . la organización proveedora. monto que todavía no se ha pagado (calculado).2. En nuestra hipotética organización de facturación. los montos pagados por las compañías de seguros primaria y secundaria. monto enviado a colecciones. el monto pagado por la parte responsable. Una snapshot acumulativa no intenta describir en su totalidad situaciones inusuales. número de días desde la facturación hasta el pago de las compañías de seguros (primaria y secundaria) y la parte responsable. podemos completar la lista de dimensiones. monto total pagado (calculado). Ahora que tenemos una idea clara de lo que representa una fila individual de la tabla de hechos (por ejemplo.

las columnas de cada vista para que sean distinguibles y las herramientas de consultas puedan acceder directamente a las vistas y presentar los nombres de las columnas al usuario final de una manera en que él lo entienda. Las claves sustitutas asignadas en la dimensión fecha deberían ser asignadas consecutivamente en orden de fecha. Si la tabla de hechos en particionada por la clave de fecha de tratamiento. entonces una reorganización física de la base de datos en ese momento puede recuperar almacenamiento en disco y mejorar el rendimiento. En los pocos días y semanas siguientes después de la creación de la fila. tiene 7 claves foráneas apuntando a la dimensión fecha. creamos 7 vistas en la simple tabla dimensión fecha subyacente. con fines estéticos. Hacemos esto para que el particionado físico de una tabla de hechos pueda ser cumplido utilizando una de las claves foráneas basadas en fecha. La clave sustituta de la fecha en la tabla de hechos no debe ser nula. entonces el agrupamiento físico (particionando) probablemente será bien preservado a través de estos cambios porque asumimos que la fecha de tratamiento no es normalmente revisitada y cambiada. Esta actualización destructiva ofrece algunos desafíos para el administrador de la base de datos. Las claves sustitutas correspondientes a condiciones especiales como No Aplica . las ultimas 5 fechas no son aplicables. y unimos la tabla de hechos con estas 7 vistas por separado. los pagos son recibidos y las facturas son enviadas a la compañía de seguros secundaria y a la parte responsable. y y y y . Si la mayoría de estas filas acumulativas se estabilizan y dejan de cambiar dentro de 90 días (por ejemplo). Corrupto o No Ocurrido Todavía deberían ser asignadas al comienzo del final del rango numérico para que estas filas sean físicamente particionadas juntas en la partición caliente con la data mas reciente. El ancho de la fila en bases de datos como Oracle crecerá cada vez que ocurra una actualización porque los hechos numéricos pueden ser cambiados de un número pequeño a un número más grande. como si fuesen 7 tablas dimensiones fecha independientes. Hacemos esto si se espera que estas filas cambien. a través de una interfaz de usuario. Esta es la única dimensión donde las claves sustitutas tienen alguna relación a la semántica subyacente de la dimensión. pero la descripción entera de la fecha en correspondiente fila de la tabla dimensión fecha puede. No unimos las 7 claves foráneas basadas en fechas a una simple instancia de la tabla dimensión fecha. Nos referimos a estas 7 vistas como roles jugados por la tabla dimensión fecha. Esto puede ocasionar separación de bloques y fragmentación si no hay disponible suficiente espacio a nivel de bloques en el disco duro para acomodar este crecimiento. Roles Jugados por la Dimensión Fecha Las tablas de hechos tipo snapshot acumulativa siempre implican múltiples marcas de fecha. ser nula. Nuestro ejemplo. Las definiciones de las 7 vistas utilizando la tabla dimensión fecha deberían renombrar. Esto permite que las 7 fechas sean independientes. y las claves y hechos apropiados son destructivamente actualizados. el cual es típico.fila es primero introducida en la base de datos. la misma fila de la tabla de hechos es re-visitada. Las claves foráneas deberían ser enteros simples que sirvan de claves sustitutas. Cada vez que estos eventos ocurren. Tal unión demandaría que las 7 fechas fueran todas iguales. Este es un buen lugar para reiterar algunos puntos importantes: y Las claves foráneas en la tabla de hechos no pueden ser marcas de fecha como tal porque tienen que manejar el caso No Aplica . de hecho. En nuestro ejemplo recomendamos que la clave de fecha de tratamiento sea usada como base para el particionado físico de la tabla de hechos. En cambio.

en ocasiones hay más de 3 diagnósticos. ¿Qué conocemos que sea cierto en el contexto de la medida? Casi siempre nos referimos a. La dimensión diagnostico en nuestra tabla de hechos de facturación de salud pública es otro buen ejemplo. y queremos incluir tal dimensión en nuestro diseño. Más adelante en este capítulo veremos como la dimensión doctor necesita tener varios roles en procedimientos quirúrgicos complejos dependiendo de si es el doctor responsable primario. . Reemplazamos la clave foránea de diagnostico en la tabla de hechos con una clave de grupo de diagnósticos.Aunque el comportamiento de la dimensión fecha (varios roles) es muy característico de las tablas de hechos tipo snapshot acumulativa.2. Desafortunadamente. casi como si fuesen roles. Esta clave de grupo de diagnósticos está conectada por una unión muchos-a-muchos a una tabla puente grupo de diagnósticos. casi siempre descalificamos esa dimensión porque los significados con valores múltiples pertenecen a un grano más bajo de medida. ¿Qué toma en un simple valor en el contexto de la medida? Si algo tiene muchos valores en el contexto de la medida. el estilo de diseño de múltiples aberturas sirve para aplicaciones muy ineficientes porque la consulta no sabe a priori cual abertura dimensional restringir para un diagnostico en particular.3. hay un buen incentivo para conservar estos diagnósticos junto a la fila de facturación. los diagnósticos no se comportan como roles. Finalmente. la cual contiene una fila separada por cada diagnostico en un grupo particular. especialmente para pacientes de tercera edad que son hospitalizados. por ejemplo. Sin embargo. consultor o asistente. Manejamos la naturaleza del final abierto de múltiples diagnósticos con el diseño mostrado en la Figura 13. otras dimensiones en ocasiones juegan roles de manera similar. los diagnósticos no encajan en roles bien definidos con la excepción de posibles diagnósticos admitidos y diagnósticos descartados. como la dimensión Compañía de Seguros en la Figura 13. Además. los cuales son bien conocidos. Sin embargo. En el momento del tratamiento. Diagnóstico Dimensión Multivaluada Normalmente escogemos las dimensiones que rodean una fila de la tabla de hechos preguntando. Las dimensiones basadas en roles sobre las que hablamos en la sección anterior están categorizadas más natural y disjuntamente. Organizaciones reales para el pago de facturas médicas algunas veces encuentran pacientes con ¡más de 50 diagnósticos! Además. como el caso en que asociamos múltiples clientes con una cuenta en el Capitulo 9. hay algunas situaciones en donde los valores múltiples son naturales e inevitables. Si siempre hubiese un máximo de 3 diagnósticos. pudiésemos estar tentados a crear 3 dimensiones diagnostico. el paciente tiene uno o más diagnósticos.

pero en esta caso obtendremos lo que se llama un reporte de impacto. Si decidimos no aplicar los factores de ponderación en una consulta dada. y es difícil reconstruirlos si las ubicaciones han sido combinadas físicamente con los hechos numéricos. Finalmente.Si un paciente tiene 3 diagnósticos. Primero. Este tipo de reporte debería llamarse reporte correcto por ponderación. entonces ese paciente es asignado a un grupo de diagnósticos con 3 diagnósticos. Esto se hace rara vez. todavía podemos sumar los montos facturados por diagnostico. Vemos que los factores de ponderación son simplemente una manera de ubicar los hechos numéricos aditivos a lo largo del diagnostico. Ahora ambas. aparecería en las herramientas de acceso a los datos como una tabla de hechos estándar con una clave foránea normal a la dimensión diagnostico. En este caso una tabla extra cuya clave primaria es el grupo de diagnósticos. cuando se combinen. Algunos sugerirían que cambiásemos el grano de la tabla de hechos a línea de producto por diagnostico en vez de solo línea de producto.3 causa problemas a sus herramientas de modelado que insiste en las relaciones apropiadas clave-foránea-a-clave-primaria. tal vez quisiéramos ver los números no ubicados. el diseño equivalente en la Figura 13.3. Finalmente. y empezaríamos a cuestionar la importancia física de una fila individual. Una pregunta como ¿Cuál es el monto total facturado a través de todos los posibles tratamientos en cualquier manera que involucre el diagnostico de XYZ? sería un ejemplo de un reporte de impacto. En la Figura 13. el tamaño de la tabla de hechos se multiplicaría por el número de diagnósticos promedio. una utilizando los factores de ponderación y otra sin utilizarlos.4 puede usarse. y el gran total será el gran total correcto de montos facturados. Podemos usar los factores de ponderación para ubicar cualquiera de los hechos numéricos aditivos a lo largo de diagnósticos individuales. Dos vistas pueden ser definidas. una vista SQL podría ser definida combinando la tabla de hechos y la tabla puente de grupos de diagnósticos para que esta dos tablas. El número de filas se saldría de los límites en esta situación. si la unión muchos-a-muchos en la Figura 13. la tabla de hechos y la tabla puente tienen . en algunas tablas de hechos tenemos más de una dimensión multivaluada. es insertada entre la tabla de hechos y la tabla puente. De esta manera podemos añadir todos los montos facturados por diagnostico. En este caso tomaríamos los factores de ponderación y físicamente multiplicarlos por los hechos numéricos originales. Asignamos un factor de ponderación numérico a cada diagnostico en el grupo tal que la suma de todos los factores de ponderación en el grupo es exactamente 1. Segundo. por 3 razones.

En el mundo real. es utilizado. sin embargo. el cual es un hecho calculado. En casos en los cuales la relación representada en la tabla puente cambia con el tiempo.2. En este caso reforzaríamos la tabla puente con dos marcas de fecha para capturar las fechas de inicio y fin. Estos incluyen los costos consumibles. Los factores de ponderación pueden omitirse. el número de filas podría crecer exponencialmente y seria inmanejable. probablemente el grupo de diagnósticos seria único para el paciente porque evolucionara en el tiempo como tipo 2. Si un grupo diagnósticos único fuese creado para cada tratamiento de paciente externo. el costo del asistente. No hay información adicional en esta tabla extra. Si no es encontrado. En una situación de hospitalización. un sistema de reconocimiento y grupos de re-uso deberían utilizarse. Reportes correctamente ubicados pueden ser creados solamente si los factores de ponderación lo permiten. una organización que paga facturas decidiría como administrar los grupos de diagnósticos. pero entonces solamente se pueden generar reportes de impacto utilizando las dimensiones multivaluadas. En situaciones de alto volumen como facturas médicas o cuentas bancarias. cambiando de dimensión lentamente (SCD). entonces un nuevo grupo de diagnósticos es creado. el costo de la ubicación.uniones convencionales muchos-a-muchos en todas direcciones. la dimensión multivaluada toma un pequeño pero variable numero de valores bien definidos. el costo del equipo. Extendiendo una Tabla de Hechos de Facturación para Mostrar Eficiencia La Figura 13. Esto requiere que cada conjunto de diagnósticos sea revisado en la tabla maestra de grupos de diagnósticos. y ganancia total antes de los gastos generales y administrativos (G&A). También nos permiten realizar consultas de tipo time-span. Si estos hechos adicionales pueden ser añadidos al . Para resumir esta discusión acerca de las dimensiones multivaluadas. el costo del proveedor. podemos listar los problemas que rodean un diseño basado en estas dimensiones: y y y y y En el contexto de las medidas de la tabla de hechos.5 muestra un conjunto extendido de hechos que pudieran ser añadidos al esquema básico de facturación de la Figura 13. como identificar todos los pacientes que presentan un diagnostico dado en cualquier momento entre dos fechas. mejoramos la tabla puente con fechas de inicio y fin. son muy útiles para hacer consultas y llevar el control de los cambios. Si el grupo existente es encontrado. Mientras ambas marcas de fecha complican la administración de la tabla puente de grupos de diagnósticos. Probablemente la mejor aproximación es tener un portafolio estándar de grupos de diagnósticos que se utilizaría repetidamente.

Si una organización deseara enfocarse exclusivamente en hospitalizaciones. Para costos basados en actividades como los que incluimos en la lista. Mostramos organizaciones de proveedores para ambos roles porque los proveedores pueden representar a diferentes organizaciones en el control del hospital. ¡Ahora la organización de salud pública puede analizar la eficiencia por todas las dimensiones! Dimensiones para Hospitalizaciones Facturadas La primera parte de este capítulo describe un diseño comprensivo y flexible para tratamientos de salud pública facturados que cubriría tanto facturas a pacientes internos como externos. Cada uno de estos costos se eleva potencialmente desde un sistema fuente separado. pero si se puede lograr un acuerdo en el conjunto de ubicaciones. con las nuevas dimensiones escritas en negritas. Se convierte ahora en una vista completa de las ganancias y perdidas (P&L) del negocio de la salud pública. El diagnostico actual describe el estado de conocimiento del paciente al momento del tratamiento. . Estos costos no son parte del proceso de facturación y normalmente no deberían recolectarse al mismo tiempo que los datos de facturación.6 muestra un conjunto revisado de dimensiones especializadas para hospitalizaciones. En la Figura 13. El diagnostico descartado no es conocido hasta que el paciente es dado de alta y es aplicado de manera retroactiva a todas las filas que han sido ingresadas como parte de la hospitalización. la base de datos P&L resultante es increíblemente poderosa. Tenemos además 3 dimensiones diagnostico multivaluadas en cada fila de tratamiento facturado. la data de dicha fuente tendría que ser ubicada debajo de la facturación de línea de producto. El diagnostico admitido es determinado al comienzo de la hospitalización y debería ser el mismo para cada fila de tratamiento que forma parte de la misma hospitalización. Todas las ubicaciones son controversiales y hasta cierto punto arbitrarias. tal vez valga el esfuerzo para hacer esta ubicación.2 para proveer más información específica del hospital. el poder de la tabla de hechos crece enormemente.6 mostramos dos roles para el proveedor: proveedor admitido y proveedor atendido. sería razonable modificar la estructura dimensional de la Figura 13. Para poder traer esta data a la tabla de hechos de facturación.esquema de facturación. La Figura 13.

.

7. es natural para abastecer a un amplio conjunto de hechos. Podemos modelar eventos complejos con el diseño visto en la figura 13. Así pues. es posible que se desee modelar ciertos acontecimientos muy complejos. En una operación de trasplante de corazón. asumiendo que los diversos costos pueden ser asignados a cada evento quirúrgico. Dejamos de lado los factores de ponderación en todas las dimensiones multivaluadas en este diseño. Una de las preocupaciones más práctica es que la mayoría de las organizaciones no estaría dispuesto a ceder docenas o cientos de factores de ponderación. Nuestra técnica de colocación de los factores de ponderación de manera independiente en que cada dimensión es sólo una parte del problema.7. Asumimos que un procedimiento quirúrgico consiste en un solo médico responsable y un número variable de médicos tratantes. los procedimientos y tipos de equipos. indicado por la negrita en la figura 13. En un trasplante de corazón diferente puede implicar un equipo con una composición diferente.Eventos Complejos en el Cuidado de la Salud En un hospital. Se muestra el amplio conjunto de hechos que permitan un completo análisis de P&L (ganancias y pérdidas) por hacer en los procedimientos quirúrgicos. médico de cabecera (Attending Physician) y asistencia profesional (Assisting Professionals) son todas asumidas por una dimensión proveedor global. estaríamos apoyando implícitamente todas las combinaciones complejas de valores de ponderación. algunas de las cuales no tendrían sentido. No parece valer la pena decir que la parte correcta de asignar el importe total facturado de la cirugía conjuntamente asignado a cada asistente sea posible y cada pieza sea posible de los equipos tiene mucho significado. todo el equipo de especialistas y los asistentes que se reúnen para este evento. Las dimensiones medico responsable (Responsible Physician). Nosotros combinamos la técnica de dimensiones role-playing y dimensiones multivaluadas. También asumimos que el paciente tiene un diagnóstico de varios valores (multivalued diagnosis) antes de la cirugía y un diagnóstico independiente de varios valores después de la cirugía. como intervenciones quirúrgicas mayores. . Las dimensiones diagnostico multivaluadas: antes de la cirugía (Pre-Sigery Diagnosis Key) y después de la cirugía (Post-Sigery Diagnosis Key) son asumidas por una única dimensión diagnostico. los profesionales de la asistencia. Si tratamos de proporcionar los factores de ponderación de las dimensiones multivaluadas. El grano en la tabla de hecho es el mismo procedimiento quirúrgico. tenemos seis dimensiones multivaluadas.

¿cuál es el valor total de todas las cirugías realizadas que utiliza una máquina corazón-pulmón? También puede pedir que los médicos. Sin embargo. Nos impulsa la sospecha de que si el grano se podría definir como una entrada de registro individual para un paciente. y que las piezas de los equipos involucrados en diversos tipos de cirugía.Figura 13. a los gráficos y fotografías. que los profesionales de la asistencia. como se describe en el capítulo 5). Por ejemplo. casi todos de los cuales serían nulos o ceros para cualquier entrada de salud específico. la gran variedad de posibles entradas de registro médico nos vence. ya nuevos . Sin embargo. este estilo de ranura fija de diseño es muy inflexible. podemos preguntarnos qué tipos de cirugía son rentables o no rentables y por qué. a una de una especie pruebas de laboratorio. no intentamos hacer consultas e informes al mismo tiempo que analizamos todos los tipos de datos. nos gustaría ofrecer un marco estándar y sencillo para todos los registros para un paciente determinado. Los registros en un archivo de paciente puede tomar muchas formas diferentes. En tal tabla de hechos que podrían tener la tentación de ofrecer un campo de datos para cada tipo de medición. si hemos asignado a cada uno de los costos de la cirugía de una manera racional. Teniendo en cuenta esta variabilidad extrema. Pronto terminaría con una fila de la tabla de hechos ridículamente llena de muchos campos de hechos. Además. podemos crear muchos informes de impacto útil. que van desde el formato estándar de datos numéricos capturado en línea. Algunos campos serán numéricos y algunos campos sería banderas (o claves foráneas a las dimensiones basura que consiste en grupos de banderas. que debe ser capaz de capturar la mayor parte de la historia clínica en una sola tabla de hechos. Y. sin embargo. por último. Registros Médicos Los Registros Médicos Generales son un reto para el almacén de datos debido a su extrema variabilidad.7 Transacción eventos quirúrgicos tabla de hechos extendida para mostrar pérdidas y ganancias Sin los factores de ponderación. a los comentarios de texto libre introducido por un profesional de la salud.

La combinación de dos números que se han tomado como parte de un evento es más difícil porque ahora tenemos que buscar a dos filas de la tabla de hechos. En la figura 13. los tipos de valores de las banderas se encuentran en la dimensión tipo de entrada. . Si la entrada es una bandera (flag) (por ejemplo.tipos de medición pueden ser añadidos por la alteración física de la tabla de hechos con la adición de un nuevo campo. junto con las restricciones aditivas. SQL le gusta realizar funciones aritméticas en una fila. hay algunas ventajas y desventajas importantes. la columna de la cantidad general se utiliza para cada entrada numérica. debemos tener cuidado de no mezclar cantidades incompatibles en un cálculo. Para muy escasas situaciones. la dimensión tipo de entrada alerta a la aplicación que solicita buscar en estos campos de la tabla de hechos. sin alterar la estructura de la tabla de hechos. Este enfoque es elegante por su flexibilidad exquisita. con una dimensión especial que llamamos una dimensión de hechos. sí / no o alto / medio / bajo). En este momento no tenemos datos escasos y deben volver al método clásico de la tabla de hechos. Podemos añadir nuevos tipos de medida sólo mediante la adición de nuevas filas en la dimensión de hecho. en otras palabras. La unidad de medida para una entrada numérica dada se encuentra anexa dentro de la fila dimensión de entrada. no a través de las filas. el comentario y el nombre del archivo JPEG) son válidos para la entrada específica y la forma de interpretar cada campo. Si un evento dio lugar a 10 medidas numéricas. complica las aplicaciones de acceso de datos. como la densidad de los hechos crece. ahora tenemos 10 filas de la tabla de hechos en lugar de una sola fila en el diseño clásico. porque existe una fila sólo si existe la medición. terminamos vomitando demasiadas filas hecho. lo que representa el hecho. porque todas las medidas numéricas reside en una columna de importe único. La dimensión de tipo de entrada también determina cuál de los cuatro tipos de los campos de hecho (cantidad. Por ejemplo. la bandera.8 el tipo de entrada es una dimensión que describe lo que significa la fila o. debemos ser conscientes de que este enfoque general. Sin embargo. Hecho de dimensión de hechos dispersos Nosotros nos encargamos de la extrema variabilidad de la entrada de registro médico. como entornos de prueba clínica / laboratorio o de fabricación. Sin embargo. Por otra parte. se trata de un compromiso razonable. Usando una dimensión de hecho puede generar una gran cantidad de nuevas filas la tabla de hechos. Si la entrada es un comentario de texto libre o un objeto multimedia. Además. También elimina los valores nulos en el clásico diseño de tabla de hechos de posición. como imágenes JPEG gráfico o una fotografía.

la tabla de hechos debe tener una clave foránea que apunta a una dimensión de comentario. la visualización y edición de programas puede acceder a la imagen libremente. y que rodean a estas tablas de hechos con descripciones contemporáneas de lo que sabemos es verdad en el momento de las mediciones. y los cambios en las etiquetas que se adhieren a las entidades (tipo 3 DCS). Sin embargo. los comentarios de texto libre se producen sólo en algunos registros. ya que probablemente es sólo una clave simple y natural que une varias entradas registro médico que formaban parte de un panel de prueba en particular. Hay dos casos interesantes que deben ser discutidos por separado. En el capítulo 4. a pesar de que nuestros resúmenes para el mes anterior y el de ahora van a cambiar. la ubicación. proveedor responsable. En Nuestro DW de Cuidado de la Salud. supongamos que recibimos hoy una fila de tratamiento que es de varios meses de antigüedad. La desventaja es que una base de datos separada de los archivos gráficos se debe mantener en sincronía con la tabla de hechos. . Estos procedimientos son una parte importante de nuestro Extracción-Transformación-Carga (ETL) de los procedimientos con cada actualización. La ventaja de usar un nombre de archivo JPEG es que la creación de otra imagen. Comentarios de texto libre no deben ser almacenados en una tabla de hechos directamente.8 deben ser bastante obvias. como se muestra en la figura 13. el equipamiento y las dimensiones del diagnóstico fueron todos los presentes en diversas formas en los diseños anteriores. El uso de un nombre de archivo JPEG para referirse a una imagen. Que llegan tarde filas de hechos Usando nuestro escenario de Cuidado de la Salud. El ID de panel de prueba es un estándar de dimensión degenerada. Dado que estos cambios ocurren de manera imprevisible y. Retrocediendo en el tiempo Como profesionales de almacenamiento de datos. Más bien. en lugar de incorporar la imagen como una gota directamente en la base de datos. debemos elegir las filas dimensión de edad contemporánea que se aplican a este tratamiento cuidadosamente. entonces nuestro proceso involucra los siguientes pasos: 1) Para cada dimensión. Presumiblemente. no funcionará.8. esporádicamente. es algo así como una decisión arbitraria. hemos desarrollado técnicas de gran alcance para capturar con precisión el flujo histórico de los datos de nuestras empresas. que permiten a las dimensiones de los pacientes. Nuestras mediciones numérica s entran en la tabla de hechos. los cambios reales en las entidades en los puntos en el tiempo (tipo 2 DCN). Sin embargo ¿qué hacemos cuando recibimos-llega tarde los datos que debimos haber cargado en el almacén de datos hace semanas o meses? Algunos de nuestros procedimientos. y del pagador evolucionar cada vez que estas entidades cambian sus descripciones.Las otras dimensiones en la figura 13. Estas descripciones contemporáneas se empaquetan como tablas de dimensiones en nuestro esquema dimensional. busque la fila correspondiente dimensión cuyo sello de fecha es la última fecha del sello inferior o igual a la fecha del tratamiento. hemos llamado a estas dimensiones de variación lenta (SCDs por sus siglas en inglés). proveedores. En la mayoría de los DW operacionales que están dispuestos a insertar esta fila que llegan tarde a su posición histórica correcta. Si hemos estampado la fecha de la dimensión filas de nuestro tipo 2 SCD. hemos desarrollado técnicas específicas para el procesamiento de sobrescribe (tipo 1 DCN). proveedor de asistir. ya que es un desperdicio de espacio y pocas veces participan en las consultas. El paciente.

o cuando se realiza una copia de seguridad o de restauración. Un segundo punto sutil se remonta a nuestra suposición de que tenemos un almacén de datos operativos que está dispuesto a insertar estas filas que llegan tarde a meses antigüedad. para encontrar las filas de otro Juan Pérez. que puede ser hoy. Uno se refiere a la fecha del tratamiento actual. en cierto modo. pero el otro paciente. Hoy en día se nos notifica que Juan Pérez se casó el 15 de julio de 1999 y ha estado casado desde entonces. proveedor y pagador. Para añadir esta nueva información para el almacenamiento de datos requiere los siguientes pasos: y y Insertar una fila nueva. de Juan Pérez en la dimensión de los pacientes con el atributo de estado civil en "Casado" y la fecha de vigencia establecida en "15 de julio de 1999. Ahora podemos enrollar los registros de tratamiento ya sea operacional o por los libros. se le afecta a todas las filas del tratamiento de un lapso de tiempo determinado. entonces usted no puede cambiar un total mensual de edad. Que llegan tarde dimensión filas Una fila de dimensión que llega tarde se presenta un conjunto completamente diferente de las cuestiones que. con una clave sustituta nueva. y el otro se refiere a la fecha de la reserva. Supongamos que la fila dimensión paciente Juan Pérez contiene un atributo de la bandera estado civil que siempre contiene el valor "único". Se puede garantizar que todas las filas de hechos en un lapso de tiempo ocupan la misma partición física. donde las claves de la fecha de sustitución son asignados en un orden secuencia predecible. El tercero punto sutil es la necesidad de insertar la fila de tratamiento que llega tarde en la partición física correcta de la base de datos con sus hermanos y hermanas contemporánea." Avanzar hacia adelante en la tabla de dimensiones del paciente del 15 de julio de 1999. Tenemos un número de filas de pacientes para Juan Pérez. y las dimensiones pagador. incluso si ese total anterior era incorrecto. porque se trata de una dimensión de variación lenta y otros atributos como la dirección de Juan y la situación laboral ha cambiado en los últimos dos años. vuelva a colocar las teclas naturales de la fila hecho de que llegan tarde con las claves suplentes. . se supone que todas las filas de nuestra dimensión contienen sellos de doble fecha que indique el lapso de tiempo en el que una descripción detallada todo era válida. Si su almacén de datos ha de vincular a los libros. De esta manera.2) Utilizando las teclas de sustituto en la cada una de las filas de la dimensión del paso 1. 3) Insertar la fila hecho de que llegan tarde en la partición física correcta de la base de datos que contiene las filas otro hecho desde el momento del tratamiento llegan tarde. proveedor. si se declara la partición física de la tabla de hechos que se basa en la dimensión de la fecha. sin embargo debe referirse a las descripciones de edad en la forma que hemos descrito anteriormente. En primer lugar. Un compromiso interesante es llevar a dos dimensiones fecha en los registros de tratamiento. Hay algunos puntos sutiles aquí. Tenemos que tener cuidado de tener una cadena ininterrumpida de que no se superponen las fechas de inicio y fin para cada paciente. Si usted está en esta situación. son más complejos que una fila hecho de que llegan tarde. cuando se mueve una partición física de una forma de almacenamiento a otro. y de manera destructiva sobrescribe el campo de estado civil de "casado". Ahora usted tiene una situación difícil en el que la dimensión de la fecha en el registro de tratamiento es para una fecha de reserva. En la mayoría de los casos esto es lo que quieres hacer. porque tenemos que buscar las filas justa dimensión de la fila del hecho de nuevo a punto de ser insertado. usted debe tener una discusión con su jefe departamento de finanzas para asegurarse de que él o ella entienden lo que está haciendo.

vemos en este ejemplo por qué las claves suplentes para todas las dimensiones excepto la fecha o la hora no se pueden pedir en cualquier forma. pero usted debería ser capaz de automatizar estos pasos en un buen ambiente de ETL programables. Este es un cambio bastante complicado. tenemos que comprobar para ver si algún otro cambio se llevó a cabo por Juan Pérez el 15 de julio de 1999. estas técnicas. usted puede fácilmente tener una clave sustituta de alto valor que representa una fila dimensión que es muy antigua. Esperemos que estos lleguen tarde-hecho y dimensión filas son inusuales en la mayoría de nuestros DW. ya que estamos usando un par de marcas de fecha en cada fila de las dimensiones del producto. en lugar de técnicas especializadas para el caso poco común. En segundo lugar. así que dar la bienvenida a las filas de edad. también. No necesitamos una fila nueva dimensión en este caso especial. Nunca se sabe cuándo se va a tener que asignar una clave sustituta para una fila que llega tarde.y Buscar todas las filas de hechos que involucra a John Pérez del 15 de julio de 1999 hasta el primer cambio al lado de él en la dimensión después de 15 de julio 1999 y destructiva cambiar la clave de los pacientes extranjeros en las filas de hechos a la nueva clave sustituta creada en el paso 1. y también tenemos que encontrar el más cercana a la fila posterior julio paciente de 15 de Juan Pérez y establecer la fecha final para el 15 de julio 1999 la entrada a la fecha de inicio de la fila siguiente. Algunas industrias. Tenemos algunos problemas sutiles en este caso. tenemos que encontrar la más cercana a la fila anterior paciente de 15 julio de Juan Pérez y cambiar su fecha de finalización al 15 de julio de 1999. puede ser el modo dominante de procesamiento. En tales casos. sólo tenemos que realizar el paso 2. En primer lugar. que son muy molestos. ¿Lo tienes? Por último. como la salud. . hemos tomado un compromiso como guardianes del almacén de datos para presentar la historia de nuestra empresa con la mayor precisión posible. Si es así. tienen un gran número de filas que llegan tarde. Y puesto que las claves sustitutas son asignadas en orden numérico sin ningún tipo de lógica o de la estructura. ya que están haciendo nuestras bases de datos más completa. Si nada más. ya que cambiar la cuenta y el total de antecedentes. Sin embargo.

Podríamos llamar a este tipo de informe de un informe bien ponderado. en especial la dimensión del diagnóstico. La incorporación de estos hechos basado en el costo es muy atractivo. En este caso. que contienen muchas dimensiones multivaluadas. la dimensión de varios valores todavía nos permite producir informes de impacto. donde un gran número de organizaciones tienen que mirar a los mismos datos al mismo tiempo sin ningún tipo de sentido de la secuencia del tiempo. no construimos factores de ponderación dentro de todas las dimensiones multivaluadas porque la interacción entre los mismos no tiene sentido. Sin embargo. y y y y y y . Las dimensiones multivaluadas. Las dimensiones de hechos utilizadas para organizar las medidas heterogéneas y muy dispersas dentro de un marco sencillo y uniforme. así como funciones desempeñadas por el proveedor y el pagador de las dimensiones de las tablas de hechos de este capítulo. expresamente mencionada en una dimensión subyacente único maestro.Resumen Cuidado de la salud no sólo es un área de aplicación importante en sí mismo. comentarios de texto libre e imágenes de datos. sino que también proporciona el diseñador de almacenamiento de datos con una serie de ejemplos de diseño claro que uno puede utilizar en muchas otras situaciones. Este grano es apropiado debido a la duración relativamente breve de una factura médica en comparación con algo como una cuenta bancaria. Un amplio conjunto de costos basado en los hechos que nos permiten poner en práctica un esquema de pérdidas y ganancias. pero es mucho trabajo. en algunos casos en los que no están dispuestos a asignar factores de ponderación. resultados de laboratorio de tipo uno-en-un-millón. Los mejores costos para añadir a un diseño basado en la actividad debido a que estos costos no son demasiado controvertido como para asociarse con filas de hechos individuales. donde la instantánea periódica es más apropiado. medidas textuales categóricas. En este capítulo hemos visto: y El círculo de valor. los problemas de la construcción de un círculo de valor de almacenamiento de datos arquitectura de bus con dimensiones compatibles y los hechos se ajustaban exactamente lo mismo que las cadenas de valor más convencionales. tales como facturas médicas nuestros artículos de línea. Los roles se implementan como distintos puntos de vista. El grano acumula instantánea de la tabla de hecho se aplica a un elemento de proyecto de línea médica. ocasionalmente. Nuestro ejemplo cubre aproximadamente los registros médicos generales. En muchos casos podemos asociar un factor de ponderación de cada uno de los valores de una dimensión multivaluada de entrada para permitir que las asignaciones deben ser calculados sobre datos numéricos de la tabla de hechos. los cuales consisten en medidas numéricas estándares. Sin embargo. Eventos Complejos modelados como simples filas de la tabla de hechos. Funciones desempeñadas por la dimensión de la fecha en que el grano instantánea acumulando.

Sign up to vote on this title
UsefulNot useful