Professional Documents
Culture Documents
Sqlserveranalysisservices2008 130426184749 Phpapp01
Sqlserveranalysisservices2008 130426184749 Phpapp01
Características
Usuarios Oficinistas, contadores, personal informático, clientes, Gerentes, ejecutivos, juntas directivas, analistas de
jefes de departamentos operativos información.
Tipo de diseño de base de datos Modelo de datos entidad-relación y/o sistemas de base de Base de datos multidimensionales, esquemas
datos orientados a aplicaciones OLTP relacionales del tipo estrella, con objetivos estratégicos
en la información
Nivel de detalle de los datos Se almacenan con el mayor detalle ya que se trata de las Datos agregados en distintos niveles, no interesa el
transacciones específicas detalle sino el resumen de los datos
Características del Hardware y Servidores de pequeños a medianos, sistemas de alta Servidores de grandes a gigantes, optimizados para
configuración redundancia, configurados para tener recuperaciones almacenar grandes volúmenes de datos y responder a
ante fallos y optimizados para realizar transacciones consultas complejas que involucran mucha información
puntuales en línea y con multitud de usuarios y con pocos usuarios
Operaciones normales Mucha lectura y escritura: actualizaciones, inserciones, Básicamente, lectura de los datos: consultas complejas
sistemas de seguridad con alta redundancia, consultas. de los usuarios
Volúmenes de datos La información es siempre la actual, el volumen de datos Se almacena información histórica, creciendo los
no responde a la cantidad de transacciones que se Datawarehouse constantemente. Los volúmenes se
almacenen. De 100 MB a 1 o 2 GB. miden en Gigabytes a Terabytes.
Cubos
►SSAS permite consultas grandes
cantidades de datos de forma flexible
gracias al almacenamiento de la o na
información en cubos 19
199 98
rc
B a adr
l
e id
la
9 M evi l
El cubo es el interfaz primario entre 200 S
0
usuarios y datos en una aplicación de BI Producto 1
Representa un conjunto lógico de datos en
un empresa, ventas, inventarios, Producto 2
transacciones, finanzas etc.
Es una estructura multidimensional Producto 3
Color
Vendedor
Fecha
Medida:
Cantidad Vendida
Tablas de hecho y Tablas de dimensiones
Employee_Dim
EmployeeKey
Tabla de dimensiones EmployeeID
...
Time_Dim
Product_Dim
TimeKey Tabla de hechos ProductKey
TheDate Sales_Fact
... TimeKey ProductID
EmployeeKey ...
ProductKey
CustomerKey
ShipperKey
►Soporte multilenguaje
►Nuevos asistentes de minería de datos
►Posibilidad de modificar cálculos sin tener que
reprocesar cubos
Características para los desarrolladores
► Entornos de gestión:
Intelligence
Development Studio (BIDS)
SQL Server Management Studio
► MDX Scripting
Posibilidad de integrar los scripts con ensamblados externos
► XML/A
Estabasado en Simple Object Access Protocol (SOAP)
Aporta acceso universal a cualquier entorno multidimensional a través
de HTTP
► ADOMD.NET
proveedor estándar de .NET que permite a los clientes acceder a
orígenes de datos multidimensionales
► AMO
Librería de objetos .NET utilizada en aplicaciones para administrar
SSAS mediante programación
Dimensiones, atributos, cubos, seguridad.
Unified Dimensional Modeling
Unified Dimensional Model (UDM)
► Combina el modelo relacional, el multidimensional y el híbrido en un solo modelo de
datos
► Permite a los procesos de análisis y reporting de OLAP ser transparentes al método de
almacenamiento.
► Está construido como una capa de abstracción sobre los datos y aporta una pasarela
entre cómo los usuarios finales ven los datos y cómo los datos finales son físicamente
almacenados
BI Corporativo - Hoy
Datos Modelos Herramientas
MOLAP OLAP
Browser (1)
MOLAP OLAP
Browser (2)
Datamart Reporting
Tool (1)
Datamart
Reporting
Tool (2)
DW Reporting
Tool (3)
BI Corporativo - Hoy
Datos Modelos Herramientas
MOLAP OLAP
Browser (1)
Datamart
Reporting
Tool (1)
DW Reporting
Tool (3)
Datos Modelos
Duplicados Duplicados
Relacional vs OLAP
Característica Relacional OLAP
Flexibilidad del esquema
Acceso a datos en tiempo real
Almacenamiento único de datos
Gestión simple
Informes detallados
Alto rendimiento
Orientación al usuario final
Facilidad de exploración y navegación
Riqueza analítica
Riqueza semántica
BI Corporativo – UDM
Datos Modelos Herramientas
MOLAP OLAP
Browser (1)
MOLAP OLAP
Browser (2)
Datamart Reporting
UDM Tool (1)
Datamart
Reporting
Tool (1)
DW BI Applications
Analysis Services – Servidor UDM
Datos Modelos Herramientas
Hojas de cálculo
MOLAP Analysis
Services
XML/A or OLEDB
Frontales de BI
MOLAP
Datamart
Datamart Informes Ad-Hoc
UDM
LOB Datamart
Informes ricos
DW Cache
DW
Dashboards
UDM: Componentes
Seguridad
UDM
Scope(Customer.Country.USA, *);
Cálculos (scripts Mdx) Sales = 2;
End Scope;
Políticas de Almacenamiento/Caching
► Una vez creado el cubo puede ser modificado mediante el Cube Designer.
Métodos de Construcción
► Puede generarse un cubo empleando o no un data source
Con data source, es necesario especificar un data source view valido y seleccionar las
tablas de hecho y de dimensión
Sin data source es necesario definir las tablas para generar el data source view
Identificando Tablas de Hecho y de Dimensiones
► Una vez seleccionado el data source view el Cube Wizard automáticamente analiza las relaciones entre las
tablas
► Para esto se basa en las claves primarias y secundarias, así como en los datos numéricos de las tablas
► Cuenta con la posibilidad de seleccionar tablas de hecho y dimensiones para representar la dimensión
tiempo
► Ofrece la posibilidad de especificar dimensiones compartidas incluida a través de múltiples cubos
Mapeo de periodos de tiempo
► Creación de jerarquías de dimensiones de tiempo basándonos en las
columnas seleccionadas de la tabla de dimensión de tiempo.
► La granularidad de la dimensión de tiempo se determina en función de las
reglas de negocio de la organización y de las necesidades de reporting
Selección de Medidas y Revisión de la
Jerarquía de Dimensiones
► Las medidas son las cantidades agregadas que son analizadas a través de varias
dimensiones
► Las columnas clave o de referencia no participan en los grupos de medidas.
► El asistente para cubos automáticamente detecta las jerarquías entre medidas y nos
ofrece la posibilidad de revisar sus resultados para excluir dimensiones o jerarquías.
Añadiendo Business Intelligence al Cubo
► Pueden añadírsele al cubo expresiones MDX o scripts , así como modificar cálculos.
► La clase de BI elegida determina los elementos de la solución que serán afectados
► El asistente realiza cambios en los data source views, dimensiones y definiciones de
cubo en base al tipo de inteligencia seleccionada
Indicadores de Rendimiento (Key
Performance Indicators)
► Solo podemos añadir KPI si el cubo
está procesado
► Una vez añadidas es necesario
reprocesar el cubo
Acciones
► Son sentencias MDX almacenadas y mantenidas por una base de datos de Analysis Services
► Son ejecutadas por aplicaciones cliente
► Contienen información sobre cuando y como las sentencias MDX serán mostradas y manejadas
por las aplicaciones cliente
► Para ejecutar una acción un usuario final debe realizar una operación especifica que la
inicialice
Perspectivas
►Aportan facilidad de acceso a los datos
►Similares a las vistas en SQL Server
►Aportan un subconjunto de datos
Múltiples lenguajes
Funciones definidas por el usuario
► SSAS aporta funciones intrínsecas para utilizarse con MDX y con lenguajes Data Mining Extensions (DMX)
► Posibilidad de añadir esemblados a instancias o bases de datos de Analysis Services, para crear funciones
externas definidas por el usuario en lenguajes como Visual Basic® .NET o Microsoft Visual C#® .NET.
► Tras añadir el ensamblado los métodos públicos de la librería son expuestos como funciones definidas por el
usuario a las expresiones, procedimientos, cálculos y acciones MDX y DMX.
► Para llamar a una función definida por el usuario es necesario hacer referencia a su nombre completo
Select<Assembly>.<Class>.<Method>(<parameters>)on 0 from<Cube>
Administración de SSAS 2008
Migración a SSAS 2008
► Analysis Services Migration Wizard:
Gráficamente
Línea de comandos:
MigrationWizard.exe
MSSQLServerOLAPService arrancado
en origen y destino
► En el proceso de migración el asistente
copia las bases de datos de SSAS 2000 y
las recrea en una instancia de SSAS 2008.
► Las bases de datos de origen se
mantienen intactas
► Para un mayor rendimiento resulta
interesante migrar las bases de datos de
una en una
Autentificación de usuarios
►Autentificación por defecto
►Si la instancia está configurada para permitir acceso
anónimo Windows no autentica a los usuarios
►Tras autenticar a un usuario Analysis Services comprueba
los permisos asociados para visualizar, actualizar datos o
realizar tareas administrativas.
►Para poder realizar tareas los roles tienen que tener
permiso a nivel de los distintos objetos de la base de
datos
►Al instalar una instancia de SSAS todos los miembros de
grupo local de administradores (incluidos los
administradores del dominio) tienen permiso para
realizar cualquier tarea
►Como novedad, se requiere aprovisionamiento para las
cuentas administrativas
Analysis Services server role
►Rol fijo que aporta acceso administrativo a objetos en una
instancia de SSAS.
►No pueden añadirse o eliminarse permisos de este rol
►Los miembros pueden acceder a todos las bases de datos y
objetos de las instancias de SSAS.
Creación de bases de datos y configuración de propiedades
Mantenimiento de roles de base de datos
Gestión de trazas
►BI Portal
►Microsoft Office Bussiness Scorecard Manager 2005
►Microsoft Office PerformancePoint Server 2007
►Herramientas de terceros
Novedades en SQL Server Analysis
Services 2008
►Asistente de Dimensiones mejorado (Atributos
“browsables”)
►Recomendaciones de mejores prácticas en el entorno
►Entorno gráfico para relaciones de atributos mejorado
►Conjuntos dinámicos mejorados (Dynamics Set)
►Uso de vistas de rendimiento dinámico (Dynamics
Managements Views)
Soluciones de minería de
datos en SSAS 2008
Introducción al Data Mining
► Su razón de ser el analizar conjuntos de datos y plantearles
cuestiones de negocio
► También permite generar modelos de predicción y evaluar su
acierto
► Antes de generar soluciones de Data Mining es preciso crear
modelos que describan el problema de negocio
► Un modelo de data mining se basa en un conjunto de
algoritmos que se construyen a partir de las reglas
fundamentales del analisis.
Exploracion
Descubrimiento de patrones
Prediccion de patrones
“La ciencia de extraer información útil desde grandes volúmenes de datos o bases de datos”
- D. Hand, et al 2001
s
ule
ing
k
or
s
nr
ee
ter
tw
s
tio
ies
Tr
ye
Ne
lus
ing
cia
ion
Ba
er
C
al
so
ter
eS
cis
ur
q.
ïve
As
us
Se
Ne
Tim
De
Na
Cl
√ √ √ √ √ √ Classification
√ √ √ √ √ Regression
√ √ √ Segmentaion
√ √ √ √ √ √ Assoc. Analysis
√ √ √
Anomaly Detect.
√
Seq. Analysis
√
Time series
►Decision Tree
Identifica el arbol de atributos que mejor predice un
resultado
Aporta una jerarquia de atributos utiles para tomar una
decision
►Cluster
Identifica
como los datos forman subgrupos y como estos
subgrupos son diferentes unos de otros, encuentra patrones
sin un objetivo especifico
Algoritmos
►Association rule
Identifica
un subgrupo de datos que participa en una
transacción especifica. Suele emplearse para localizar
tendencias de consumo
►Sequence cluster
Identifica
el evento que probablemente ocurrirá a
continuación
►Time Series
Identifica tendencias que están sucediendo
Toma como parámetro un atributo baso en tiempo
Útil para realizar pronósticos
►Neural network
Identifica el arbol de atributos que mejor predice el resultado
Similar al de decission pero tiene una estructura
tridimensional
Modelos de Data Mining
►Podemos aplicar modelos a los siguientes escenarios:
Tendencias de ventas
Que productos pueden venderse juntos
Secuencia en la que los consumidores añaden productos a
sus cestas
►Se crean después de que un algoritmo analiza un
conjunto de datos y encuentra patrones y tendencias
en los datos
►El resultado se emplea para establecer parámetros en
el modelo
►Tipos
Relacionales
OLAP
Pasos para la creación de modelos de
Data Mining
► Definir el problema
► Preparar los datos
► Explorar los datos
► Construir el modelo
► Explorar y evaluar el modelo
► Desplegar y actualizar el modelo
Creación de estructuras de Data Mining
►Especificaremos los siguiente:
El algoritmo inicial del modelo.
La dimensión del cubo que se
quiere usar como origen de datos
Un atributo que puede emplearse
como clave de modelo, en base al
que se seleccionaran los atributos
y las medidas utilizadas
Contenidos y tipos de datos de
cada columna
Data Mining Designer
Data Mining Extensions (DMX)
►Lenguaje para crear y trabajar con modelos de mineria
►Contiene instrucciones DML y DDL