jueves, 5 de septiembre de 2013

1.3 Almacenamiento de la Informacion


Un dispositivo de almacenamiento de datos es un dispositivo para grabar o almacenar información (datos). La grabación se puede hacer usando virtualmente cualquier forma de energía. Un dispositivo de almacenamiento puede guardar la información y procesarla, o ambas. Un dispositivo que únicamente guarda la información es un dispositivo de grabación. Dispositivos que procesan la información (equipo de almacenamiento de datos) pueden tener acceso a un medio extraible (portable) separado o a un componente permanente para almacenar y recuperar la información.

El almacenamiento de datos electrónicos es el almacenamiento que requiere corriente eléctrica para almacenar y de recuperar datos. La mayoría de los dispositivos de almacenamiento que no requieren la óptica visual a los datos leídos caen en esta categoría. Los datos electrónicos se pueden almacenar en un formato de la señal análoga o numérica. Este tipo de datos se considera ser datos electrónicamente codificados, si no están almacenados electrónicamente. La mayoría de los medios de almacenamiento de datos electrónicos se consideran almacenamiento (permanente) permanente, es decir, los datos seguirán almacenados cuando la energía se quita del dispositivo. En cambio, la información electrónicamente almacenada se considera memoria volátil.


1.3.1 CD-ROM

CD-ROM (siglas del inglés Compact Disc - Read Only Memory) es un prensado disco compacto que contiene los datos de acceso, pero sin permisos de escritura, un equipo de almacenamiento y reproducción de música, el CD-ROM estándar fue establecido en 1985 por Sony y Philips. Pertenece a un conjunto de libros de colores conocido como Rainbow Books que contiene las especificaciones técnicas para todos los formatos de discos compactos.
La Unidad de CD-ROM debe considerarse obligatoria en cualquier computador que se ensamble o se construya actualmente, porque la mayoría del software se distribuye en CD-ROM. Algunas de estas unidades leen CD-ROM y graban sobre los discos compactos de una sola grabada (CD-RW). Estas unidades se llaman quemadores, ya que funcionan con un láser que "quema" la superficie del disco para grabar la información.
Actualmente, aunque aún se utilizan, están empezando a caer en desuso desde que empezaron a ser sustituidos por unidades de DVD. Esto se debe principalmente a las mayores posibilidades de información, ya que un DVD-ROM supera en capacidad a un CD-ROM.



1.3.2 Técnicas de Compresión de Datos

La compresión de datos es la reducción del volumen de datos tratables para representar una determinada información empleando una menor cantidad de espacio. Al acto de compresión de datos se denomina compresión, y al contrario descompresión.
El espacio que ocupa una información codificada (datos, señal digital, etc.) sin compresión es el cociente entre la frecuencia de muestreo y la resolución. Por tanto, cuantos más bits se empleen mayor será el tamaño del archivo. No obstante, la resolución viene impuesta por el sistema digital con que se trabaja y no se puede alterar el número de bits a voluntad; por ello, se utiliza la compresión, para transmitir la misma cantidad de información que ocuparía una gran resolución en un número inferior de bits.
La compresión es un caso particular de la codificación, cuya característica principal es que el código resultante tiene menor tamaño que el original.
La compresión de datos se basa fundamentalmente en buscar repeticiones en series de datos para después almacenar solo el dato junto al número de veces que se repite. Así, por ejemplo, si en un fichero aparece una secuencia como "AAAAAA", ocupando 6 bytes se podría almacenar simplemente "6A" que ocupa solo 2 bytes, en algoritmo RLE.
En realidad, el proceso es mucho más complejo, ya que raramente se consigue encontrar patrones de repetición tan exactos (salvo en algunas imágenes). Se utilizan algoritmos de compresión:
  • Por un lado, algunos buscan series largas que luego codifican en formas más breves.
  • Por otro lado, algunos algoritmos, como el algoritmo de Huffman, examinan los caracteres más repetidos para luego codificar de forma más corta los que más se repiten.
  • Otros, como el LZW, construyen un diccionario con los patrones encontrados, a los cuales se hace referencia de manera posterior.
  • La codificación de los bytes pares es otro sencillo algoritmo de compresión muy fácil de entender.
A la hora de hablar de compresión hay que tener presentes dos conceptos:

  1. Redundancia: Datos que son repetitivos o previsibles
  2. Entropía: La información nueva o esencial que se define como la diferencia entre la cantidad total de datos de un mensaje y su redundancia.
La compresión física y lógica

La compresión física actúa directamente sobre los datos; por lo tanto, es cuestión de almacenar los datos repetidos de un patrón de bits a otro.
La compresión lógica, por otro lado, se lleva a cabo por razonamiento lógico al sustituir esta información por información equivalente.

La compresión simétrica y asimétrica

En el caso de la compresión simétrica, se utiliza el mismo método para comprimir y para descomprimir los datos. Por lo tanto, cada operación requiere la misma cantidad de trabajo. En general, se utiliza este tipo de compresión en la transmisión de datos.

La compresión asimétrica requiere más trabajo para una de las dos operaciones. Es frecuente buscar algoritmos para los cuales la compresión es más lenta que la descompresión. Los algoritmos que realizan la compresión de datos con más rapidez que la descompresión pueden ser necesarios cuando se trabaja con archivos de datos a los cuales se accede con muy poca frecuencia (por razones de seguridad, por ejemplo), ya que esto crea archivos compactos.

La compresión con pérdida

La compresión con pérdida, a diferencia de la compresión sin pérdida, elimina información para lograr el mejor radio de compresión posible mientras mantiene un resultado que es lo más cercano posible a los datos originales. Es el caso, por ejemplo, de ciertas compresiones de imágenes o de sonido, como por ejemplo los formatos MP3 o el Ogg Vorbis.
Como este tipo de compresión elimina información que está contenida en los datos que se van a comprimir, por lo general se habla de métodos de compresión irreversible.
Los archivos ejecutables, por ejemplo, no pueden comprimirse mediante este método, porque necesitan especialmente preservar su integridad para poder ejecutarse. De hecho, es inconcebible reconstruir un programa omitiendo y después agregando bits.
Por otro lado, los datos multimedia (audio, video) pueden tolerar un cierto nivel de degradación sin que los órganos sensoriales (el ojo, el tímpano, etc.) distingan alguna degradación importante.

La codificación adaptativa, la semiadaptativa y la no adaptativa

Algunos algoritmos de compresión están basados en diccionarios para un tipo específico de datos: éstos son codificadores no adaptativos. La repetición de letras en un archivo de texto, por ejemplo, depende del idioma en el que ese texto esté escrito.
Un codificador adaptativo se adapta a los datos que va a comprimir. No parte de un diccionario ya preparado para un tipo de datos determinado.
Un codificador semiadaptativo crea un diccionario según los datos que va a comprimir: crea el diccionario mientras analiza el archivo y después lo comprime.



No hay comentarios:

Publicar un comentario