Organización de los datos en un
entorno de archivos tradicional
La administración de datos es de
gran relevancia ya que si una empresa no
tiene la información necesaria, precisa o la más importante, puede ser porque
los datos en sus sistemas de información se han organizado de mal manera y no
se han sabido mantener de manera apropiada. Esto se comprende de mejor forma
analizando cómo es que los sistemas de información organizan los datos en
archivos de computadora, junto con los métodos tradicionales de administración
de archivos.
TÉRMINOS Y CONCEPTOS DE ORGANIZACIÓN DE
ARCHIVOS
Precisamente al observar este
tema no es fácil a simple vista el concepto
de archivos tradicionales y organización de archivos a nivel de sistemas de información
sin embargo este libro lo explica muy
bien refiriéndose a que un sistema computacional organiza los datos en una
jerarquía que empieza con bits y bytes, y progresa hasta llegar a los campos,
registros, archivos y bases de datos. Un bit representa la unidad más pequeña
de datos que una computadora pue de manejar. Un grupo de bits, denominado byte,
representa a un solo carácter, que puede ser una letra, un número u otro
símbolo. Pero también esta lo que se denomina campo que es un agrupamiento de
caracteres en una palabra, un conjunto de palabras o un número completo (como
el nombre o la edad de una persona) y un grupo de campos relacionados, como el
nombre del estudiante, el curso que va a tomar, la fecha y la calificación,
representan un registro y un grupo de registros del mismo tipo se denomina
archivo y un grupo de archivos relacionados constituye una base de datos. Se
podría agrupar con los archivos en los historiales personales de los
estudiantes y sus antecedentes financieros, esto con el fin de crear una base
de datos de estudiantes. Pero la cadena continua ya que un registro describe a
una entidad y una entidad es una persona, lugar, cosa o evento sobre el cual se
almacena y se mantiene información, además
de que cada cualidad que describe a una
entidad específica se denomina atributo.
PROBLEMAS CON EL ENTORNO DE ARCHIVOS
TRADICIONAL
Contabilidad, finanzas,
manufactura, recursos humanos, ventas y marketing han desarrollado sus propios
sistemas y archivos de datos. Desde luego que cada aplicación requería sus
propios archivos y programa para operar. Generalmente, este proceso conduce a
varios archivos maestros creados, mantenidos y operados por divisiones o
departamentos separados. Los problemas que resultan de esto son la redundancia
e inconsistencia de los datos, la dependencia programa-datos, la
inflexibilidad, la seguridad defectuosa de los datos y la incapacidad de
compartir datos entre aplicaciones. Al describir el primer problema redundancia
e inconsistencia de los datos que se refiere a la presencia de datos duplicados
en varios archivos, así que se almacenan los mismos datos en más de un lugar o
ubicación. La redundancia ocurre cuando distintos grupos en una organización
recolectan por separado la misma pieza de datos y la almacenan de manera
independiente unos de otros. La confusión resultante dificultaría a las
compañías el proceso de crear sistemas de administración de relaciones con el
cliente, de administración de la cadena de suministro o sistemas empresariales
que integren datos provenientes de distintas fuentes. En cuanto al problema de
la dependencia programa-datos es referido al acoplamiento de los datos
almacenados en archivos y los programas específicos requeridos para actualizar
y dar mantenimiento a esos archivos, de manera que los cambios en los programas
requieran cambios en los datos. Todo programa de computadora tradicional tiene
que describir la ubicación y naturaleza de los datos con los que trabaja. Aquí se
aclara el concepto de archivos tradicional ya que en este entorno, cualquier
cambio en un programa de software podría necesitar un cambio en los datos a los
que tiene acceso ese programa. Tal vez un programa se modifique de un código
postal de cinco dígitos a nueve. Si el archivo de datos original se cambiara
para usar códigos postales de nueve dígitos en vez de cinco, entonces otros
programas que requirieran el código postal de cinco dígitos ya no funcionarían
en forma apropiada y el detalle importante y desventajoso es que la
implementación apropiada de dichos cambios podría costar millones de dólares.
El otro problema es la falta de
flexibilidad esto es que un sistema de archivos tradicional tiene la
posibilidad de entregar informes programados de rutina luego de determinado
esfuerzo extenso de programación, pero no tiene la flexibilidad de entregar informes ad hoc ni responder de
manera oportuna a los requerimientos de información no anticipados. La
información que se necesita por las solicitudes ad hoc está en alguna parte del
sistema, pero el problema es que puede ser
bastante costoso recuperarla. Puede darse el caso de que varios
programadores tengan que trabajar durante semanas para reunir los elementos de
datos requeridos en nuevo archivo. La seguridad defectuosa es otro problema ya
que se lleva a cabo poco control o poca administración de los datos, el acceso
a la información, así como su diseminación, pueden estar sin ningún o poco
control. Probablemente la gerencia no tenga forma de saber quién está
accediendo a los datos de la organización, o tenga acceso a modificarlos. Y
continuando con los problemas la falta de compartición y disponibilidad de los
datos es otro ya que como las piezas de información en los distintos archivos y
las diferentes partes de la organización no tienen relación entre sí, es casi
imposible compartir o acceder a la información de una manera adecuada. La
información no se presta para que fluya libremente entre las diferentes áreas funcionales.
Si los usuarios encuentran valores desiguales de la misma pieza de información
en dos sistemas diferentes, tal vez no quieran usar estos sistemas debido a que
no pueden confiar en la precisión de sus datos.
LA METODOLOGÍA DE LAS BASES DE
DATOS PARA LA ADMINISTRACIÓN DE DATOS
Una base de datos es una colección de datos
organizados con el propósito de dar servicio a muchas aplicaciones de manera
eficiente, al centralizar los datos y controlar los que son redundantes. El
detalle se encuentra en que en vez de guardar los datos en archivos separados
para cada aplicación, se almacenan de manera que los usuarios piensen que están
en una sola ubicación. Una sola base de datos da servicio a varias
aplicaciones.
SISTEMAS DE ADMINISTRACIÓN DE
BASES DE DATOS
Para comenzar esclareciendo
conceptos un Sistema de Administración de Bases de Datos (DBMS) es software que
le da la posibilidad a una organización de
centralizar los datos, administrarlos eficientemente y proveer acceso a
los datos almacenados mediante programas de aplicación. El DBMS actúa como una
interfaz entre los programas de aplicación y los archivos de datos físicos. Cuando
el programa de aplicación solicita un elemento de datos, como el sueldo bruto,
el DBMS lo busca en la base de datos y lo presenta al programa de aplicación. En
cambio si utilizara archivos de datos tradicionales, el programador tendría que
especificar el tamaño y formato de cada elemento de datos utilizado en el
programa y después decir a la computadora en dónde están ubicados. El DBMS le
quita la carga al programador o al usuario final de comprender en dónde y cómo
están almacenados los datos en realidad, al separar las vistas lógica y física
de los datos. Aquí es importante detenerse a analizar que la vista lógica
presenta los datos de acuerdo con la manera en que los observan los usuarios
finales o los especialistas de negocios, y la vista física muestra la verdadera
forma de organización y estructuración de datos en los medios de almacenamiento
físicos. Un DBMS resuelve los problemas del entorno de archivos tradicionales ya que disminuye la redundancia e
inconsistencia de los datos al minimizar los archivos aislados en los que se repiten
los mismos datos. Es probable que el DBMS no logre que la organización elimine la
redundancia de datos del todo, pero puede ayudar a controlarla. El DBMS
desacopla los programas y los datos, con lo cual estos últimos se pueden
independizar por eso soluciona el problema de la dependencia de programa-datos.
Se tendrá más acceso y disponibilidad de
la información, y también se disminuirán los costos de desarrollo y
mantenimiento de los programas debido a que los usuarios y programadores pueden
realizar consultas ad hoc de la información en la base de datos. El DBMS además
ataca otro problema el de la seguridad ya que permite a la organización
administrar los datos, su uso y su seguridad en forma central.
DBMS relacional
El DBMS relacional es el tipo más popular de
sistemas DBMS en la actualidad para PCs y computadoras más grandes. Las bases
de datos relacionales representan los datos como tablas bidimensionales a las
cuales se les llama relaciones, a estas se les puede hacer referencia como si
fueran archivos. Cada tabla contiene datos sobre una entidad y sus atributos. La
manera en la que organiza una base de
datos relacional la información sobre proveedores y piezas es que a base de
datos tiene una tabla separada para la entidad proveedor y una para la entidad
pieza. Cada elemento individual de datos para cada entidad se almacena como un
campo separado, y cada campo es un atributo para esa entidad. La información
real sobre un solo proveedor que reside en una tabla se denomina fila. Los
datos para la entidad pieza tienen su propia tabla separada. También existen las
bases de datos orientadas a objetos que almacena los datos y los procedimientos
que actúan sobre esos datos como objetos que se pueden recuperar y compartir de
manera automática. Los Sistemas de Administración de Bases de Datos Orientados
a Objetos (OODBMS) se pueden utilizar para manejar los diversos componentes
multimedia o los applets de Java que se utilizan en las aplicaciones Web, que
por lo general integran piezas de información provenientes de una variedad de orígenes,
eso sí, son lentos en comparación con
los DBMS relacionales para procesar grandes números de transacciones. Pero una
vez vistos los relacionales y los de objetos podemos ver que existen los
sistemas DBMS objeto-relacional híbridos, que ofrecen las capacidades de los
sistemas DBMS tanto orientados a objetos como relacionales.
CAPACIDADES DE LOS SISTEMAS DE
ADMINISTRACIÓN DE BASES DE DATOS
Un DBMS tiene capacidades y
herramientas para organizar, administrar y acceder a los datos en la base de
datos, de estas las más importantes son: su lenguaje de definición de datos, el
diccionario de datos y el lenguaje de manipulación de datos. Los DBMS tienen
una capacidad de definición de datos para especificar la estructura del
contenido de la base de datos esto es importante debido a que podría usarse
para crear tablas de bases de datos y así definir las características de los
campos en cada tabla. La otra capacidad es importante ya que esta información
sobre la base de datos se puede documentar en un diccionario de datos, esto es
un archivo automatizado o manual que almacena las definiciones de los elementos
de datos y sus características. Los diccionarios de datos para las grandes
bases de datos corporativas pueden capturar información adicional, como el uso,
la propiedad (quién en la organización es responsable de dar mantenimiento a la
información), autorización, seguridad y los individuos, funciones de negocios,
programas e informes que utilizan cada elemento de datos. La mayoría de los
DBMS tienen un lenguaje especializado conocido como lenguaje de manipulación de
datos el cual se utiliza para agregar, modificar, eliminar y recuperar los
datos en la base. Este lenguaje contiene comandos que permiten a los usuarios
finales y a los especialistas de programación extraer los datos de la base para
satisfacer las solicitudes de información y desarrollar aplicaciones.
DISEÑO DE BASES DE DATOS
Primeramente hay que tener claro
que para diseñar una base de datos hay que entender las relaciones entre la
información, el tipo de datos que se mantendrán en la base, cómo se utilizarán
y la forma en que tendrá que cambiar la organización para administrarlos desde
una perspectiva a nivel de toda la compañía. La base de datos requiere tanto un
diseño conceptual como uno físico, el diseño conceptual de la base de datos es un modelo abstracto de ésta
desde una perspectiva de negocios, mientras que el diseño físico muestra la
verdadera disposición de la base de datos en los dispositivos de almacenamiento
de acceso directo.
Diagramas de normalización y de
entidad-relación
El diseño de bases de datos conceptual
describe la forma en que se deben agrupar los elementos de datos en la base. El proceso de diseño identifica las relaciones
entre los elementos de datos y la manera más eficiente de agruparlos en
conjunto para satisfacer los requerimientos de información de la empresa. Este
proceso también identifica a los elementos de datos redundantes y las
agrupaciones de elementos de datos requeridas para ciertos programas de
aplicaciones específicos. Los grupos de datos se organizan, refinan y optimizan
hasta que emerge una vista lógica general de las relaciones entre todos los
datos en la base.
USO DE BASES DE DATOS PARA
MEJORAR EL DESEMPEÑO DE NEGOCIOS Y LA TOMA DE DECISIONES
Pagar a los proveedores, procesar
pedidos, llevar el registro de los clientes y pagar a los empleados, son
algunas de las operaciones que puede realizar una empresa gracias a la utilización
de sus bases de datos. Pero además su importancia se refleja en que se
necesitan bases de datos para suministrar información que colabora a la
compañía a operar sus negocios eficientemente, y ayudar a los gerentes y
empleados a tomar mejores decisiones. Si una compañía desea saber cuál producto
es el más popular o quién es su cliente más rentable, la respuesta radica en
los datos.
ALMACENES DE DATOS
Un almacén de datos es una base
de datos que almacena la información actual e histórica de gran interés para
los encargados de tomar decisiones en la compañía. Los datos se originan en
muchos sistemas de transacciones operacionales básicos, como los sistemas de
ventas, las cuentas de clientes, la manufactura, y pueden incluir datos de
transacciones de sitios Web. El almacén de datos consolida y estandariza la
información de distintas bases de datos operacionales, de modo que se pueda
utilizar en toda la empresa para el análisis gerencial y la toma de decisiones.
HERRAMIENTAS PARA LA INTELIGENCIA
DE NEGOCIOS: ANÁLISIS DE DATOS MULTIDIMENSIONAL Y MINERÍA DE DATOS
Minería de datos: La minería de
datos está más orientada al descubrimiento , al encontrar patrones y relaciones
ocultas en las bases de datos grandes e inferir reglas a partir y reglas se
utilizan para guiar la toma de decisiones y pronosticar el efecto de esas
decisiones. Los tipos de información que se pueden obtener de la minería de
datos son: asociaciones, secuencias, clasificaciones, agrupamientos y
pronósticos.
Minería de datos y minería Web: Existen herramientas
que pueden extraer elementos clave de los conjuntos de datos extensos no
estructurados, descubrir patrones y relaciones, así como sintetizar la
información. Las empresas podrían recurrir a la minería de texto para analizar
las transcripciones de los call centers de servicio al cliente para identificar
las principales cuestiones de servicio y reparación. También existe lo llamado minería de estructura Web que extrae
información útil de los vínculos incrustados en documentos Web.
LAS BASES DE DATOS Y WEB
Actualmente son muchas las compañías que utilizan Web para poner parte de
la información en sus bases de datos internas a disposición de los clientes y
los socios de negocios. Existen varias ventajas en cuanto al uso de Web para
acceder a las bases de datos internas de una organización. La primera es que el
software de navegador Web es mucho más fácil de usar que las herramientas de
consulta propietarias, la segunda es que la interfaz Web requiere pocos o
ningún cambio en la base de datos interna.
ADMINISTRACIÓN DE LOS RECURSOS DE
DATOS
ESTABLECIMIENTO DE UNA POLÍTICA
DE INFORMACIÓN
La política de información
establece procedimientos y rendiciones de cuentas específicos, identifica qué
usuarios y unidades organizacionales pueden compartir información, en dónde
distribuirla y quién es responsable de actualizarla y mantenerla. Si se analiza
en una empresa pequeña, los propietarios o gerentes son los que establecerían e
implementarían la política de información, en cambio en una organización
grande, administrar y planificar la información, requiere con frecuencia de una
función de administración de datos formal. La administración de datos es
responsable de las políticas y procedimientos específicos a través de los
cuales se pueden administrar los datos como un recurso organizacional. Estas
responsabilidades abarcan el desarrollo de la política de información, la
planificación de los datos, la supervisión del diseño lógico de la base de
datos, y el desarrollo del diccionario de datos, así como el proceso de
monitorear la forma en que los especialistas de sistemas de información y los
grupos de usuarios finales utilizan los datos.
Aquí una explicacion mediante un video:
Aquí una explicacion mediante un video:
No hay comentarios:
Publicar un comentario