viernes, 12 de febrero de 2016

Resumen del capitulo 6: Fundamentos de inteligencia de negocios: bases de datos y administración de la información


Organización de los datos en un entorno de archivos tradicional

La administración de datos es de gran relevancia  ya que si una empresa no tiene la información necesaria, precisa o la más importante, puede ser porque los datos en sus sistemas de información se han organizado de mal manera y no se han sabido mantener de manera apropiada. Esto se comprende de mejor forma analizando cómo es que los sistemas de información organizan los datos en archivos de computadora, junto con los métodos tradicionales de administración de archivos.

 TÉRMINOS Y CONCEPTOS DE ORGANIZACIÓN DE ARCHIVOS

Precisamente al observar este tema no es fácil  a simple vista el concepto de archivos tradicionales y organización de archivos a nivel de sistemas de información  sin embargo este libro lo explica muy bien refiriéndose a que un sistema computacional organiza los datos en una jerarquía que empieza con bits y bytes, y progresa hasta llegar a los campos, registros, archivos y bases de datos. Un bit representa la unidad más pequeña de datos que una computadora pue de manejar. Un grupo de bits, denominado byte, representa a un solo carácter, que puede ser una letra, un número u otro símbolo. Pero también esta lo que se denomina campo que es un agrupamiento de caracteres en una palabra, un conjunto de palabras o un número completo (como el nombre o la edad de una persona) y un grupo de campos relacionados, como el nombre del estudiante, el curso que va a tomar, la fecha y la calificación, representan un registro y un grupo de registros del mismo tipo se denomina archivo y un grupo de archivos relacionados constituye una base de datos. Se podría agrupar con los archivos en los historiales personales de los estudiantes y sus antecedentes financieros, esto con el fin de crear una base de datos de estudiantes. Pero la cadena continua ya que un registro describe a una entidad y una entidad es una persona, lugar, cosa o evento sobre el cual se almacena y se mantiene  información, además de que  cada cualidad que describe a una entidad específica se denomina atributo.

PROBLEMAS CON EL ENTORNO DE ARCHIVOS TRADICIONAL

Contabilidad, finanzas, manufactura, recursos humanos, ventas y marketing han desarrollado sus propios sistemas y archivos de datos. Desde luego que cada aplicación requería sus propios archivos y programa para operar. Generalmente, este proceso conduce a varios archivos maestros creados, mantenidos y operados por divisiones o departamentos separados. Los problemas que resultan de esto son la redundancia e inconsistencia de los datos, la dependencia programa-datos, la inflexibilidad, la seguridad defectuosa de los datos y la incapacidad de compartir datos entre aplicaciones. Al describir el primer problema redundancia e inconsistencia de los datos que se refiere a la presencia de datos duplicados en varios archivos, así que se almacenan los mismos datos en más de un lugar o ubicación. La redundancia ocurre cuando distintos grupos en una organización recolectan por separado la misma pieza de datos y la almacenan de manera independiente unos de otros. La confusión resultante dificultaría a las compañías el proceso de crear sistemas de administración de relaciones con el cliente, de administración de la cadena de suministro o sistemas empresariales que integren datos provenientes de distintas fuentes. En cuanto al problema de la dependencia programa-datos es referido al acoplamiento de los datos almacenados en archivos y los programas específicos requeridos para actualizar y dar mantenimiento a esos archivos, de manera que los cambios en los programas requieran cambios en los datos. Todo programa de computadora tradicional tiene que describir la ubicación y naturaleza de los datos con los que trabaja. Aquí se aclara el concepto de archivos tradicional ya que en este entorno, cualquier cambio en un programa de software podría necesitar un cambio en los datos a los que tiene acceso ese programa. Tal vez un programa se modifique de un código postal de cinco dígitos a nueve. Si el archivo de datos original se cambiara para usar códigos postales de nueve dígitos en vez de cinco, entonces otros programas que requirieran el código postal de cinco dígitos ya no funcionarían en forma apropiada y el detalle importante y desventajoso es que la implementación apropiada de dichos cambios podría costar millones de dólares. El otro problema es la  falta de flexibilidad esto es que un sistema de archivos tradicional tiene la posibilidad de entregar informes programados de rutina luego de determinado esfuerzo extenso de programación, pero no tiene la flexibilidad de  entregar informes ad hoc ni responder de manera oportuna a los requerimientos de información no anticipados. La información que se necesita por las solicitudes ad hoc está en alguna parte del sistema, pero el problema es que puede ser  bastante costoso recuperarla. Puede darse el caso de que varios programadores tengan que trabajar durante semanas para reunir los elementos de datos requeridos en nuevo archivo. La seguridad defectuosa es otro problema ya que se lleva a cabo poco control o poca administración de los datos, el acceso a la información, así como su diseminación, pueden estar sin ningún o poco control. Probablemente la gerencia no tenga forma de saber quién está accediendo a los datos de la organización, o tenga acceso a modificarlos. Y continuando con los problemas la falta de compartición y disponibilidad de los datos es otro ya que como las piezas de información en los distintos archivos y las diferentes partes de la organización no tienen relación entre sí, es casi imposible compartir o acceder a la información de una manera adecuada. La información no se presta para que fluya libremente entre las diferentes áreas funcionales. Si los usuarios encuentran valores desiguales de la misma pieza de información en dos sistemas diferentes, tal vez no quieran usar estos sistemas debido a que no pueden confiar en la precisión de sus datos.

LA METODOLOGÍA DE LAS BASES DE DATOS PARA LA ADMINISTRACIÓN DE DATOS
 Una base de datos es una colección de datos organizados con el propósito de dar servicio a muchas aplicaciones de manera eficiente, al centralizar los datos y controlar los que son redundantes. El detalle se encuentra en que en vez de guardar los datos en archivos separados para cada aplicación, se almacenan de manera que los usuarios piensen que están en una sola ubicación. Una sola base de datos da servicio a varias aplicaciones.

SISTEMAS DE ADMINISTRACIÓN DE BASES DE DATOS

Para comenzar esclareciendo conceptos un Sistema de Administración de Bases de Datos (DBMS) es software que le da la posibilidad a una organización de  centralizar los datos, administrarlos eficientemente y proveer acceso a los datos almacenados mediante programas de aplicación. El DBMS actúa como una interfaz entre los programas de aplicación y los archivos de datos físicos. Cuando el programa de aplicación solicita un elemento de datos, como el sueldo bruto, el DBMS lo busca en la base de datos y lo presenta al programa de aplicación. En cambio si utilizara archivos de datos tradicionales, el programador tendría que especificar el tamaño y formato de cada elemento de datos utilizado en el programa y después decir a la computadora en dónde están ubicados. El DBMS le quita la carga al programador o al usuario final de comprender en dónde y cómo están almacenados los datos en realidad, al separar las vistas lógica y física de los datos. Aquí es importante detenerse a analizar que la vista lógica presenta los datos de acuerdo con la manera en que los observan los usuarios finales o los especialistas de negocios, y la vista física muestra la verdadera forma de organización y estructuración de datos en los medios de almacenamiento físicos. Un DBMS resuelve los problemas del entorno de archivos tradicionales  ya que disminuye la redundancia e inconsistencia de los datos al minimizar los archivos aislados en los que se repiten los mismos datos. Es probable que el DBMS no logre que la organización elimine la redundancia de datos del todo, pero puede ayudar a controlarla. El DBMS desacopla los programas y los datos, con lo cual estos últimos se pueden independizar por eso soluciona el problema de la dependencia de programa-datos. Se tendrá más acceso y  disponibilidad de la información, y también se disminuirán los costos de desarrollo y mantenimiento de los programas debido a que los usuarios y programadores pueden realizar consultas ad hoc de la información  en la base de datos. El DBMS además ataca otro problema el de la seguridad ya que permite a la organización administrar los datos, su uso y su seguridad en forma central.

DBMS relacional
 El DBMS relacional es el tipo más popular de sistemas DBMS en la actualidad para PCs y computadoras más grandes. Las bases de datos relacionales representan los datos como tablas bidimensionales a las cuales se les llama relaciones, a estas se les puede hacer referencia como si fueran archivos. Cada tabla contiene datos sobre una entidad y sus atributos. La manera en la que  organiza una base de datos relacional la información sobre proveedores y piezas es que a base de datos tiene una tabla separada para la entidad proveedor y una para la entidad pieza. Cada elemento individual de datos para cada entidad se almacena como un campo separado, y cada campo es un atributo para esa entidad. La información real sobre un solo proveedor que reside en una tabla se denomina fila. Los datos para la entidad pieza tienen su propia tabla separada. También existen las bases de datos orientadas a objetos que almacena los datos y los procedimientos que actúan sobre esos datos como objetos que se pueden recuperar y compartir de manera automática. Los Sistemas de Administración de Bases de Datos Orientados a Objetos (OODBMS) se pueden utilizar para manejar los diversos componentes multimedia o los applets de Java que se utilizan en las aplicaciones Web, que por lo general integran piezas de información provenientes de una variedad de orígenes, eso sí,  son lentos en comparación con los DBMS relacionales para procesar grandes números de transacciones. Pero una vez vistos los relacionales y los de objetos podemos ver que existen los sistemas DBMS objeto-relacional híbridos, que ofrecen las capacidades de los sistemas DBMS tanto orientados a objetos como relacionales.

CAPACIDADES DE LOS SISTEMAS DE ADMINISTRACIÓN DE BASES DE DATOS

Un DBMS tiene capacidades y herramientas para organizar, administrar y acceder a los datos en la base de datos, de estas las más importantes son: su lenguaje de definición de datos, el diccionario de datos y el lenguaje de manipulación de datos. Los DBMS tienen una capacidad de definición de datos para especificar la estructura del contenido de la base de datos esto es importante debido a que podría usarse para crear tablas de bases de datos y así definir las características de los campos en cada tabla. La otra capacidad es importante ya que esta información sobre la base de datos se puede documentar en un diccionario de datos, esto es un archivo automatizado o manual que almacena las definiciones de los elementos de datos y sus características. Los diccionarios de datos para las grandes bases de datos corporativas pueden capturar información adicional, como el uso, la propiedad (quién en la organización es responsable de dar mantenimiento a la información), autorización, seguridad y los individuos, funciones de negocios, programas e informes que utilizan cada elemento de datos. La mayoría de los DBMS tienen un lenguaje especializado conocido como lenguaje de manipulación de datos el cual se utiliza para agregar, modificar, eliminar y recuperar los datos en la base. Este lenguaje contiene comandos que permiten a los usuarios finales y a los especialistas de programación extraer los datos de la base para satisfacer las solicitudes de información y desarrollar aplicaciones.

DISEÑO DE BASES DE DATOS

Primeramente hay que tener claro que para diseñar una base de datos hay que entender las relaciones entre la información, el tipo de datos que se mantendrán en la base, cómo se utilizarán y la forma en que tendrá que cambiar la organización para administrarlos desde una perspectiva a nivel de toda la compañía. La base de datos requiere tanto un diseño conceptual como uno físico, el diseño conceptual  de la base de datos es un modelo abstracto de ésta desde una perspectiva de negocios, mientras que el diseño físico muestra la verdadera disposición de la base de datos en los dispositivos de almacenamiento de acceso directo.
Diagramas de normalización y de entidad-relación
 El diseño de bases de datos conceptual describe la forma en que se deben agrupar los elementos de datos en la base.  El proceso de diseño identifica las relaciones entre los elementos de datos y la manera más eficiente de agruparlos en conjunto para satisfacer los requerimientos de información de la empresa. Este proceso también identifica a los elementos de datos redundantes y las agrupaciones de elementos de datos requeridas para ciertos programas de aplicaciones específicos. Los grupos de datos se organizan, refinan y optimizan hasta que emerge una vista lógica general de las relaciones entre todos los datos en la base.

USO DE BASES DE DATOS PARA MEJORAR EL DESEMPEÑO DE NEGOCIOS Y LA TOMA DE DECISIONES

Pagar a los proveedores, procesar pedidos, llevar el registro de los clientes y pagar a los empleados, son algunas de las operaciones que puede realizar una empresa gracias a la utilización de sus bases de datos. Pero además su importancia se refleja en que se necesitan bases de datos para suministrar información que colabora a la compañía a operar sus negocios eficientemente, y ayudar a los gerentes y empleados a tomar mejores decisiones. Si una compañía desea saber cuál producto es el más popular o quién es su cliente más rentable, la respuesta radica en los datos.

ALMACENES DE DATOS

Un almacén de datos es una base de datos que almacena la información actual e histórica de gran interés para los encargados de tomar decisiones en la compañía. Los datos se originan en muchos sistemas de transacciones operacionales básicos, como los sistemas de ventas, las cuentas de clientes, la manufactura, y pueden incluir datos de transacciones de sitios Web. El almacén de datos consolida y estandariza la información de distintas bases de datos operacionales, de modo que se pueda utilizar en toda la empresa para el análisis gerencial y la toma de decisiones.

HERRAMIENTAS PARA LA INTELIGENCIA DE NEGOCIOS: ANÁLISIS DE DATOS MULTIDIMENSIONAL Y MINERÍA DE DATOS 

Las principales herramientas para la inteligencia de negocios incluyen el software para consultas e informes de bases de datos, herramientas para el análisis de datos multidimensional (procesamiento analítico en línea), y herramientas para la minería de datos.
Minería de datos: La minería de datos está más orientada al descubrimiento , al encontrar patrones y relaciones ocultas en las bases de datos grandes e inferir reglas a partir y reglas se utilizan para guiar la toma de decisiones y pronosticar el efecto de esas decisiones. Los tipos de información que se pueden obtener de la minería de datos son: asociaciones, secuencias, clasificaciones, agrupamientos y pronósticos.
 Minería de datos y minería Web: Existen herramientas que pueden extraer elementos clave de los conjuntos de datos extensos no estructurados, descubrir patrones y relaciones, así como sintetizar la información. Las empresas podrían recurrir a la minería de texto para analizar las transcripciones de los call centers de servicio al cliente para identificar las principales cuestiones de servicio y reparación. También existe lo llamado  minería de estructura Web que extrae información útil de los vínculos incrustados en documentos Web.

LAS BASES DE DATOS Y WEB

Actualmente son muchas las  compañías que utilizan Web para poner parte de la información en sus bases de datos internas a disposición de los clientes y los socios de negocios. Existen varias ventajas en cuanto al uso de Web para acceder a las bases de datos internas de una organización. La primera es que el software de navegador Web es mucho más fácil de usar que las herramientas de consulta propietarias, la segunda es que la interfaz Web requiere pocos o ningún cambio en la base de datos interna.
ADMINISTRACIÓN DE LOS RECURSOS DE DATOS

ESTABLECIMIENTO DE UNA POLÍTICA DE INFORMACIÓN


La política de información establece procedimientos y rendiciones de cuentas específicos, identifica qué usuarios y unidades organizacionales pueden compartir información, en dónde distribuirla y quién es responsable de actualizarla y mantenerla. Si se analiza en una empresa pequeña, los propietarios o gerentes son los que establecerían e implementarían la política de información, en cambio en una organización grande, administrar y planificar la información, requiere con frecuencia de una función de administración de datos formal. La administración de datos es responsable de las políticas y procedimientos específicos a través de los cuales se pueden administrar los datos como un recurso organizacional. Estas responsabilidades abarcan el desarrollo de la política de información, la planificación de los datos, la supervisión del diseño lógico de la base de datos, y el desarrollo del diccionario de datos, así como el proceso de monitorear la forma en que los especialistas de sistemas de información y los grupos de usuarios finales utilizan los datos. 


Aquí una explicacion mediante un video:


No hay comentarios:

Publicar un comentario