El SQL Server 2014 Data
Quality Services (DQS) es una solución de calidad de datos basada en el
conocimiento. Esto significa que necesita mantener una o varias Bases de Conocimiento (KBs). En una KB,
mantiene todo el conocimiento relacionado con una porción específica de datos,
por ejemplo, los datos del cliente. En los proyectos DQS, se realiza las
actividades de limpieza, perfilado, y coincidencia. También puede utilizar una
base de datos staging intermedia a la cual copiar sus datos de origen y
exportar los resultados del proyecto DQS. El DQS incluye componentes de
servidor y de cliente. Para utilizar el DQS, debe iniciar por instalar los
componentes DQS.
Arquitectura DQS
Con DQS, la calidad de
datos está ahora disponible a una audiencia más amplia que para el caso de
herramientas de SQL Server anteriores. El DQS fue diseñado para facilidad de
uso. A través de una interface sencilla e intuitiva, DQS permite a los usuarios
del negocio y a los DBAs participar más directamente en las actividades de
calidad de datos. Con esta funcionalidad, puede realizar mejoras de calidad de
datos en un tiempo muy corto. Como se mencionó anteriormente, el DQS incluye
componentes de servidor y de cliente. La figura siguiente muestra una visión
general rápida de la arquitectura DQS.
El componente Data Quality Server incluye tres bases de datos:
· DQS_MAIN, que incluye procedimientos almacenados DQS. Los procedimientos
almacenados DQS constituyen el motor DQS actual. Además, DQS_MAIN incluye las
bases de conocimiento publicadas. Una KB publicada es una KB que ha sido
preparada para ser utilizada en proyectos de limpieza.
· DQS_PROJECTS, que incluye datos para la gestión de la base de
conocimiento y los datos necesarios durante los proyectos de limpieza y de
coincidencia.
· DQS_STAGING_DATA, que proporciona un área de almacenamiento intermedio
donde puede copiar los datos de origen para limpieza y donde puede exportar los
resultados de limpieza.
Puede preparar sus propias
bases de conocimiento localmente, incluyendo los datos de referencia. Sin
embargo, también puede utilizar los datos de referencia de la nube. Puede usar
Windows Azure MarketPlace DataMarket para conectar a los proveedores de datos
de referencia. Por supuesto, también puede utilizar una conexión directa a
proveedores de datos de referencia de terceros a través de una interfaz
predefinida.
Con la aplicación Data
Quality Client, puede administrar las bases de conocimiento; ejecutar los
proyectos de limpieza, perfilado, y coincidencia; y administrar el Data Quality
Services. A partir del SQL Server 2012 se incluye dos nuevas herramientas para
ayudar con estas tareas. Puede usar la transformación DQS Cleansing de SSIS
para realizar la limpieza dentro de un Data Flow de su paquete SSIS. Esto
permite realizar la limpieza de lotes sin la necesidad de la interactividad
requerida por el Data Quality Client. Con el complemento gratuito de Master
Data Services (MDS) para Microsoft Excel, puede realizar la coincidencia de
datos maestros en una hoja de cálculo Excel. Los componentes DQS deben ser
instalados junto con el MDS con el fin de permitir la integración DQS/MDS. Los
clientes adicionales, incluyendo las aplicaciones de terceros, estarán
disponibles en un futuro próximo.
Instalación DQS
Antes de instalar el DQS,
debería determinar si el sistema cumple los pre-requisitos. Para Data Quality
Server, necesita tener Servicios de Motor de Base de Datos del SQL Server 2014
instalado. Además, con el fin de administrar las bases de datos DQS, es
necesario tener instalada también Herramientas de Administración. La figura siguiente
muestra la página Selección de Características del Programa de Instalación SQL
Server 2014. Las características remarcadas en esta figura son el mínimo que
debería ser seleccionado para cumplir con los pre-requisitos del Data Quality
Server.
Para el Data Quality Client, es necesario el Microsoft .NET Framework 4.
Si no lo tiene instalado en su ordenador, automáticamente será instalado
durante la instalación del Data Quality Client. Además, necesita al menos el
Windows Internet Explorer 6 SP1.
Instalar los componentes
DQS utilizando el Programa de Instalación de SQL Server 2014. Necesitará
seleccionar las siguientes características:
· Data Quality Services bajo Servicios de Motor de Base de Datos para
instalar el Data Quality Server.
·
Cliente de Calidad de Datos para instalar el Data Quality Client.
El Programa de Instalación de SQL Server instala un archivo de
instalación adicional, el DQSInstaller.exe, cuando selecciona la casilla de
verificación Data Quality Services. Este archivo es copiado en la carpeta de la
instancia SQL Server en el equipo. Además, necesitará agregar el usuario actual
(uno mismo) al rol de servidor fijo sysadmin durante la instalación, para que
pueda ejecutar el DQSInstaller más tarde para terminar la instalación.
Después que el Programa de
Instalación SQL Server finaliza la instalación, necesitará realizar algunas
tareas posteriores a la instalación. En primer lugar, debe ejecutar la
aplicación DQSInstaller. Esta aplicación hace lo siguiente:
·
Crea las bases de datos DQS_MAIN, DQS_PROJECTS, y DQS_STAGING_DATA.
· Crea dos logins necesarios para Data Quality Server:
##MS_dqs_db_owner_login## y ##MS_dqs_service_login##.
· Crea tres roles en la base de datos DQS_MAIN: dqs_administrator,
dqs_kb_editor y dqs_kb_operator.
·
En la base de datos master, crea el procedimiento almacenado
DQInitDQS_MAIN.
· Registra la instalación en el archivo DQS_install.log. Este archivo es
típicamente creado en la carpeta C:\Program Files \ Microsoft SQL Server \ MSSQL12.
<nombre_instancia> \ MSSQL \
Log.
· Para la integración MDS, si una base de datos MDS es instalada en la
misma instancia SQL Server como Data Quality Server, la aplicación DQSInstaller
crea un usuario asignado al login MDS. También añade este usuario al rol
dqs_administrator en la base de datos DQS_MAIN.
Los usuarios deben ser
miembros de cualquiera de los tres roles DQS en la base de datos DQS_MAIN con
el fin de poder conectarse al Data Quality Server. Los miembros de los roles de
servidor fijo sysadmin pueden conectarse al Data Quality Server por defecto.
La transformación DQS Cleansing de SSIS es instalada durante la
instalación de SSIS. El complemento MDS para Excel MDS es una descarga
separada.
Si instala el Data Quality
Client en un equipo diferente de uno donde el Data Quality Server está
instalado, debe habilitar el protocolo TCP/IP para la instancia SQL Server donde
está instalado el Data Quality Server. Utilice el SQL Server Configuration
Manager para realizar esta tarea.
Instalando el Data Quality Services
En los
siguientes ejercicios, instalará el Data Quality Server y el Data Quality
Client. Esta práctica supone que su ordenador cumple los pre-requisitos para
esta instalación.
Ejecutar el Programa de Instalacion de SQL Server
Usamos el Programa de
Instalación SQL Server para instalar los componentes DQS.
1. Inicie el Programa de
Instalación de SQL Server 2014.
2. En el Centro de Instalación
SQL Server, seleccione la ficha Instalación (la segunda desde la parte superior
en el lado izquierdo).
3. Seleccione enlace Nueva
Instalación Independiente de SQL Server o Agregar Características a una
Instalación Existente.
4. Espere hasta que las Reglas
Globales han sido verificadas. Cuando la operación es finalizada, prosigue con
Actualizaciones de Productos.
5. Espere mientras los
archivos de instalación son instalados. La página Instalar Reglas de SQL Server
2014 Setup debería aparecer. Corrija los errores y verifique cualquier
advertencia. Si no hay errores, haga clic en Siguiente.
6. En la página Tipo de
Instalación, seleccione la opción Agregar Características a una Instancia
Existente de SQL Server 2014. Seleccione la instancia en la que desea alojar
las bases de datos DQS de la lista desplegable de las instancias instaladas en
su equipo. Haga clic en Siguiente.
7. En la página Selección de
Características, seleccione las casillas de verificación para las opciones Data
Quality Services y Cliente de Calidad de Datos, como se muestra en la figura
siguiente. Luego haga clic en Siguiente.
8. Espere mientras las reglas
de instalación sean verificadas.
9. En la página Requerimientos
de Espacio de Disco, haga clic en Siguiente.
10. En la página Error
Reporting, desactive la casilla de verificación y haga clic en Siguiente.
11. En la página Reglas de
Configuración de Características, haga clic en Siguiente.
12. En la página Listo para
Instalar, haga clic en Instalar.
13. Espere hasta que la
instalación haya finalizado.
14. En la página Completo, haga
clic en Cerrar.
15. Cierre la ventana de
Instalación SQL Server.
Realizar Tareas Post-Instalación de DQS
Después de completar la
parte de la instalación que implica el Programa de Instalación de SQL Server
2014, tiene que terminar las tareas post-instalación también. En este
ejercicio, utilizará la aplicación de instalación, DQSInstaller.exe, para
completar la instalación Data Quality Server.
1. Inicie el DQSInstaller. Puede
iniciarlo desde el menú Inicio. En la barra de tareas, haga clic en Inicio,
seleccione Todos los Programas y haga clic en Microsoft SQL Server 2014 en la
carpeta de Microsoft SQL Server 2014, haga clic en Data Quality Services, y
luego haga clic en Data Quality Server Installer. Si esta en Windows 8 u 8.1,
busque el ejecutable SQL Server 2014 Data Quality Server Installer en el bloque
Microsoft SQL Server 2014 y dele clic.
También puede iniciar el DQSInstaller desde el
Explorador de Windows. Si ha utilizado las carpetas de instalación
predeterminadas para la instancia predeterminada, entonces la aplicación está
localizada en la carpeta C:\Program Files\Microsoft SQL
Server\MSSQL12.MSSQLSERVER\MSSQL\Binn.
Además, puede ejecutar el DQSInstaller desde el símbolo
del sistema también.
2.
Se le pedirá una contraseña para la llave maestra de base de datos. Esta
clave es utilizada para cifrar las llaves de proveedores de servicios de datos
de referencia si se configura los proveedores de datos de referencia. Las
llaves son almacenadas en la base de datos DQS_MAIN. La contraseña debe tener
al menos ocho caracteres y debe contener una letra mayúscula (A, B, C, ... Z),
una letra minúscula (a, b, c, ... z), y un número (0, 1, 2, ... 9). Proporcione
una contraseña, confírmela y pulse Enter.
3. Espere hasta que el
DQSInstaller termine. Pulse cualquier tecla en la ventana de símbolo del sistema
para terminar. Si hay algún error, compruebe el registro de errores.
DQSInstaller crea un archivo de registro de instalación denominado
DQS_install.log, que se encuentra en la carpeta C:\Program Files\Microsoft SQL
Server\MSSQL12.MSSQLSERVER\MSSQL\Log para la instancia predeterminada.
Debe conceder los roles DQS a los usuarios para
autorizarlos a realizar actividades DQS.
4. Compruebe si puede
conectarse desde el Data Quality Client a su Data Quality Server. En la barra
de tareas, haga clic en Inicio, seleccione Todos los Programas y haga clic en
Microsoft SQL Server 2014 en la carpeta de Microsoft SQL Server 2014, haga clic
en Data Quality Services, y luego haga clic en Data Quality Client.
5.
En la ventana Conectar con el Servidor que aparece, seleccione el
servidor en el que instaló su Data Quality Server, como se muestra en la figura
siguiente. Haga clic en Conectar.
7.
Con el Explorador de Objetos de SSMS, compruebe también para ver si las
tres bases de datos DQS se han instalado correctamente. Si lo están, deben
aparecer en el Explorador de Objetos, como se muestra en la figura.
1 comentarios:
Este post muestra como instalar el MDS. Espero les sea de utilidad.
Publicar un comentario