Un dispositivo de
almacenamiento de datos es un dispositivo para grabar o almacenar información
(datos). La grabación se puede hacer usando virtualmente cualquier forma de
energía. Un dispositivo de almacenamiento puede guardar la información y
procesarla, o ambas. Un dispositivo que únicamente guarda la información es un
dispositivo de grabación. Dispositivos que procesan la información (equipo de
almacenamiento de datos) pueden tener acceso a un medio extraible (portable)
separado o a un componente permanente para almacenar y recuperar la
información.
El almacenamiento de
datos electrónicos es el almacenamiento que requiere corriente eléctrica para
almacenar y de recuperar datos. La mayoría de los dispositivos de
almacenamiento que no requieren la óptica visual a los datos leídos caen en
esta categoría. Los datos electrónicos se pueden almacenar en un formato de la
señal análoga o numérica. Este tipo de datos se considera ser datos
electrónicamente codificados, si no están almacenados electrónicamente. La
mayoría de los medios de almacenamiento de datos electrónicos se consideran
almacenamiento (permanente) permanente, es decir, los datos seguirán
almacenados cuando la energía se quita del dispositivo. En cambio, la
información electrónicamente almacenada se considera memoria volátil.
1.3.1 CD-ROM
CD-ROM (siglas del
inglés Compact Disc - Read Only Memory) es un prensado disco compacto que
contiene los datos de acceso, pero sin permisos de escritura, un equipo de
almacenamiento y reproducción de música, el CD-ROM estándar fue establecido en
1985 por Sony y Philips. Pertenece a un conjunto de libros de colores conocido
como Rainbow Books que contiene las especificaciones técnicas para todos los
formatos de discos compactos.
La Unidad de CD-ROM
debe considerarse obligatoria en cualquier computador que se ensamble o se
construya actualmente, porque la mayoría del software se distribuye en CD-ROM.
Algunas de estas unidades leen CD-ROM y graban sobre los discos compactos de
una sola grabada (CD-RW). Estas unidades se llaman quemadores, ya que funcionan
con un láser que "quema" la superficie del disco para grabar la
información.
Actualmente, aunque
aún se utilizan, están empezando a caer en desuso desde que empezaron a ser
sustituidos por unidades de DVD. Esto se debe principalmente a las mayores
posibilidades de información, ya que un DVD-ROM supera en capacidad a un
CD-ROM.
1.3.2 Técnicas de Compresión
de Datos
La compresión
de datos es la reducción del volumen de datos tratables para
representar una determinada información empleando una menor cantidad de
espacio. Al acto de compresión de datos se denomina compresión, y
al contrario descompresión.
El espacio que ocupa
una información codificada (datos, señal digital, etc.) sin compresión es
el cociente entre la frecuencia de muestreo y la resolución. Por
tanto, cuantos más bits se empleen mayor será el tamaño del archivo.
No obstante, la resolución viene impuesta por el sistema digital con
que se trabaja y no se puede alterar el número de bits a voluntad; por ello, se
utiliza la compresión, para transmitir la misma cantidad de información que
ocuparía una gran resolución en un número inferior de bits.
La compresión es un
caso particular de la codificación, cuya característica principal es que
el código resultante tiene menor tamaño que el original.
La compresión de datos
se basa fundamentalmente en buscar repeticiones en series de datos para después
almacenar solo el dato junto al número de veces que se repite. Así, por ejemplo,
si en un fichero aparece una secuencia como "AAAAAA", ocupando 6
bytes se podría almacenar simplemente "6A" que ocupa solo 2 bytes, en algoritmo RLE.
En realidad, el
proceso es mucho más complejo, ya que raramente se consigue encontrar patrones
de repetición tan exactos (salvo en algunas imágenes). Se utilizan algoritmos
de compresión:
- Por un lado, algunos buscan series largas
que luego codifican en formas más breves.
- Por otro lado, algunos algoritmos, como el algoritmo
de Huffman, examinan los caracteres más repetidos para luego codificar de
forma más corta los que más se repiten.
- Otros, como el LZW, construyen un
diccionario con los patrones encontrados, a los cuales se hace referencia
de manera posterior.
- La codificación de los bytes pares es
otro sencillo algoritmo de compresión muy fácil de entender.
A la hora de hablar de
compresión hay que tener presentes dos conceptos:
- Redundancia: Datos que son repetitivos o previsibles
- Entropía: La información nueva o esencial que se define como la diferencia entre la cantidad total de datos de un mensaje y su redundancia.
La compresión física y lógica
La compresión física actúa directamente sobre
los datos; por lo tanto, es cuestión de almacenar los datos repetidos de un
patrón de bits a otro.
La compresión lógica, por otro lado, se lleva a cabo por razonamiento lógico al sustituir esta información por información equivalente.
La compresión lógica, por otro lado, se lleva a cabo por razonamiento lógico al sustituir esta información por información equivalente.
La compresión simétrica y asimétrica
En el caso de la compresión simétrica, se
utiliza el mismo método para comprimir y para descomprimir los datos. Por lo
tanto, cada operación requiere la misma cantidad de trabajo. En general, se
utiliza este tipo de compresión en la transmisión de datos.
La compresión asimétrica requiere más trabajo
para una de las dos operaciones. Es frecuente buscar algoritmos para los cuales
la compresión es más lenta que la descompresión. Los algoritmos que realizan la
compresión de datos con más rapidez que la descompresión pueden ser necesarios
cuando se trabaja con archivos de datos a los cuales se accede con muy poca
frecuencia (por razones de seguridad, por ejemplo), ya que esto crea archivos
compactos.
La compresión con pérdida
La compresión con pérdida, a diferencia de la
compresión sin pérdida, elimina información para lograr el mejor radio de
compresión posible mientras mantiene un resultado que es lo más cercano posible
a los datos originales. Es el caso, por ejemplo, de ciertas compresiones de
imágenes o de sonido, como por ejemplo los formatos MP3 o el Ogg
Vorbis.
Como este tipo de compresión elimina
información que está contenida en los datos que se van a comprimir, por lo
general se habla de métodos de compresión irreversible.
Los archivos ejecutables, por ejemplo, no
pueden comprimirse mediante este método, porque necesitan especialmente
preservar su integridad para poder ejecutarse. De hecho, es inconcebible
reconstruir un programa omitiendo y después agregando bits.
Por otro lado, los datos multimedia (audio,
video) pueden tolerar un cierto nivel de degradación sin que los órganos
sensoriales (el ojo, el tímpano, etc.) distingan alguna degradación importante.
La codificación adaptativa, la semiadaptativa
y la no adaptativa
Algunos algoritmos de compresión están basados
en diccionarios para un tipo específico de datos: éstos son codificadores no
adaptativos. La repetición de letras en un archivo de texto, por ejemplo,
depende del idioma en el que ese texto esté escrito.
Un codificador adaptativo se adapta
a los datos que va a comprimir. No parte de un diccionario ya preparado para un
tipo de datos determinado.
Un codificador semiadaptativo crea
un diccionario según los datos que va a comprimir: crea el diccionario mientras
analiza el archivo y después lo comprime.
No hay comentarios:
Publicar un comentario