Redundancias

Cuando tenemos almacenados una serie de datos, como por ejemplo los B, C, D, etc. y, a partir de éstos, es posible determinar el dato A, decimos que dicho dato A es deducible del conjunto de datos formado por B, C, D, etc. En esta situación, si, además de los datos mencionados también almacenamos el dato A, entonces se produce lo que llamaremos redundancia, es decir el almacenamiento de un dato junto con el conjunto de aquéllos que permiten deducirlo.

Dicho dato, por ejemplo el A, es, pues, redundante con los datos B, C, D, etc.

Los diversos casos de redundancia pueden abarcar desde el almacenamiento de un mismo dato con dos nombres distintos (A y B, por ejemplo) hasta aquellas situaciones en las que uno se puede derivar del otro u otros mediante operaciones matemáticas (por ejemplo, cuando un dato es un porcentaje fijo de otro; cuando existe un algoritmo que permite obtenerlo de forma directa, etc.),

Las redundancias pueden clasificarse de acuerdo, con un criterio clásico, en dos tipos principales: el de las redundancias de tipo lógico y el de las de tipo físico. El primer grupo está formado por las que se producen cuando la información contiene ya redundancias al introducirla en el ordenador. Este tipo de redundancia suele ser siempre indeseable, ya que su única consecuencia es el aumento del volumen total de datos a almacenar sin que de ello se derive ventaja alguna (salvo la posibilidad de verificar los datos contrastándolos mutuamente).

El segundo tipo, el de la redundancia física, se da cuando el propio ordenador es el que genera redundancias, aunque manteniendo la concordancia entre los datos redundantes entre Si. Por su parte, la redundancia física es un recurso de diseño que se emplea con  frecuencia en aquellos casos en los que el calculo del valor correspondiente a un dato, aunque A puede obtenerse mediante deducción, es excesivamente dificultoso y dicho valor es válido durante mucho tiempo. En este caso es más razonable almacenarlo, aunque sea de forma redundante, ya que así se evita volver a deducirlo con posterioridad todas las veces que haya que utilizarlo.

Estos problemas se plantean en aquellas empresas o instituciones en las cuales  por motivos políticos, económicos, etc.- la mecanización de los procesos de tratamiento y almacenamiento de información en ficheros se inició de forma independiente en diversas áreas de la misma institución. Estas situaciones han  provocado la  existencia de varios ficheros redundantes que contienen información acerca de proveedores, materiales para la fabricación, clientes, etc.

Lo que hacen las técnicas de bases de datos es racionalizar la mecanización de la totalidad de la información mediante la consecución de un sistema (llamado bases de datos) formado por un conjunto interrelacionado de datos entre lo que no haya redundancias (o éstas sean sólo de tipo físico), además de un sistema que permita acceder a la información (llamado apuntador).

Este proceso permite, como consecuencia de la supresión de las redundancias, disminuir el espacio la de memoria ocupado por la información, además de ahorrar una gran cantidad de procesos y de eliminarla necesidad de corregir y las posibles discrepancias que pudieran existir entre los diversos ficheros.

Sin embargo, esta nueva estructura de los datos y sus ventajas tienen un precio que queda reflejado en la necesidad de mantener una estructura de datos completa (mantener la coherencia de diversos ficheros relacionados entre si, así como conservarla posibilidad de acceder a ellos de un modo no secuencial); controlar  los accesos simultáneas (para que los diversos procesos simultáneos no se entorpezcan mutuamente); proteger los programas en lo que respecta a las modificaciones delas características de datos que no se necesitan; disponer de técnicas que permitan reconstruir los ficheros y, por último, controlar el acceso a los datos por parte de los diversos programas de la base de datos.

Las herramientas que se han desarrollado para garantizar los puntos arriba mencionados se agrupan bajo la denominación  global de sistema de gestión de bases de datos. Dichos sistemas están determinados fundamentalmente por las siguientes características.

La descripción de la base de datos es globalmente exterior a los programas y está gestionada por el sistema de gestión de la base de datos, ya que cada programa conoce únicamente la existencia de los datos que necesita para desarrollarse. Debido a que el sistema de gestión dela base de datos es el que dispone de una visión global de conjunto de los ficheros, los programas no acceden directamente a ellos sino a través del sistema   de gestión.

Y, finalmente, el sistema de gestión lleva a cabo funciones tales como control de accesos y recogida de información, que no están  ligados a ningún programa concreto de aplicación.