| Artículos | 01 FEB 1998

Compresión y codificación en Internet

Compartir

Fernando Bauzá.

Compresión y codificación en Internet - Truco

Existen dos cosas muy diferentes que se les hace a los archivos en Internet:

Codificarlos y Comprimirlos .

Codificarlos . Se codifica un archivo cuando se necesita pasarlo por un sitio que no tiene la capacidad de mantener su formato original . Por ejemplo, cuando se envían documentos con acentos por un sitio que no los soporta ( los programas de correo usan MIME, para esto ) , o cuando se necesita enviar un archivo binario por un medio que sólo soporta texto .

En el Mac los archivos no son solamente binarios ( en los PC y en Unix los archivos pueden ser binarios o de texto ) , sino que los binarios tienen dos partes: una es la sección de datos ( data fork ) que es esencialmente el equivalente a los archivos binarios de otras plataformas y otra la de recursos ( resource fork ) que contiene partes, definiciones y códigos específicos del Mac ( como ventanas, información, iconos, tipo y creador ) . Al enviar un archivo de Mac a través de una " puerta " ( como un servidor FTP o HTTP de Unix o PC ) se pierden los recursos y sólo quedan los datos . Esto es trivial en archivos de datos como documentos de Word, hojas de Excel, gráficas o películas ( en los cuales sólo se pierde el icono y la previsualización ) , pero es importantísimo en programas, que quedan inutilizados al quitar la sección de recursos . Hace tiempo, algunos usuarios de Mac tenían problemas para enviar y recibir sus archivos por Internet porque los intermediarios ( servidores ) movían solamente las secciones de datos, dejando las secciones binarias en el camino . Por esta causa se crearon unos formatos de codificación para Mac que permiten convertir un archivo dual ( datos y recursos ) en un archivo binario común y corriente . Se crearon dos formatos:

HQX: Muy semejante al UUE ( Unix to Unix Encode ) , se llama BinHex y convierte un archivo de Mac a un archivo de texto que contiene toda la información original pero transformada de 8 bits a 7 bits . La desventaja principal es que al convertir algo en un lenguaje ( 8 bits ) a un lenguaje más limitado ( 7 bits ) , el archivo resultante ocupa, en promedio, un 35% más de tamaño que el original . Este es el formato más antiguo y se utiliza todavía por su seguridad y

universalidad .

BIN: Macbinary, es un formato más nuevo . En vez de codificar un archivo binario a texto lo que hace simplemente es crear un paquete binario que contiene tanto los recursos como los datos del programa original, así pues, el aumento de tamaño es casi inexistente y el archivo viaja sin mayores problemas, siendo para otros sistemas un archivo binario común y corriente .

Hoy día los navegadores y programas de correo y de ftp reconocen automáticamente un formato " . bin " y lo decodifican, por lo que ni siquiera se necesita decodificarlo o tener el decodificador . Stuffit Expander se encuentra en formato " . bin " en las paginas de Aladdin, por lo que se puede obtener gratuitamente y como el navegador o programa de FTP lo decodifica automáticamente al recibirlo, sólo es necesario ejecutar el instalador al terminar de bajarlo . No es necesario en realidad codificar los archivos, a menos que se sepa que la otra persona tiene problemas específicos, ya que los archivos ya son archivos binarios y si se tiene bien configurado Internet Config o Netscape todo funcionará correctamente .

Comprimirlos: La compresión de archivos se hace por dos razones principalmente, para que un archivo grande ocupe menos, y para juntar muchos archivos separados en uno sólo . Los formatos de compresión funcionan viendo los archivos que comprimen y haciendo una tabla, en la que comparan todas las veces que la información aparece repetida y resumiéndola . Por ejemplo, la siguiente frase

Dábale arroz a la zorra el abad

Podría comprimirse así:

aba=1

rr=2

D [ 1 ] le a [ 2 ] oz a la zo [ 2 ] a el [ 1 ] d

Y si fuera un formato más avanzado podría incluso incluir movimientos de las palabras ( por ejemplo [ n1 ] significa 1 normal, [ i1 ] significa 1 invertido ) y quedaría

aba=1

le=2

arroz=3

a l=4

D [ n1 ] [ n2 ] [ n3 ] [ n4 ] a [ i3 ] e [ i4 ] [ i1 ] d

Los formatos de compresión comparan cosas parecidas en un archivo y lo resumen, creando una tabla de conversión en el camino que, al descomprimir el archivo se usa para recrear el archivo original ( por eso los archivos de texto se comprimen tanto, y un archivo gráfico con pocos colores solidos se comprime mejor que una foto ) . En Mac se utiliza mucho el formato " . sit " ( StuffIt ) para comprimir ( Compact Pro, " . cpt " , no está tan difundido ) . El formato " . sit " no solamente comprime sino que además convierte todo en un sólo archivo binario que se puede enviar y recibir a través de Internet como cualquier otro archivo binario .

Existen dos tipos de compresión, " lossy " con pérdida y " lossless " , sin pérdida de información . La compresión con pérdida se utiliza en formatos que pueden modificarse sin alterar el original sustancialmente, por ejemplo, en archivos de imagen se puede reducir el numero de colores o quitar combinaciones de color que el ojo no ve o no aprecia, en archivos de sonido se pueden quitar sonidos de fondo que no se oyen o frecuencias fuera del rango humano . En este tipo de compresión existe un control entre mejor calidad y mejor compresión . Por otro lado la compresión sin pérdidas se utiliza para archivos con información no modificable ( como programas, textos, documentos, hojas de calculo y otros ) y es el formato que se utiliza también cuando no se sabe cuál utilizar ya que mantiene el original perfectamente intacto . Los formatos de imágenes " jpeg " ( " . jpg " ) , " tiff " ( con compresión LZW ) , " . gif " , y los de sonido " . au " , " . wav " , " . snd " , " . mpg " , " . mpeg " son formatos de compresión con perdidas . Los formatos de archivos " . zip " , " . sit " , " . cpt " , " . rar " , " . ace " , " . gzip " , " . zoo " hacen compresión sin perdidas . Los formatos " uue " , " . hqx " , " . tar " , " . bin " son formatos de codificación, no formatos de compresión .

Tamaños de compresión - Truco

¿ Qué utilidad de compresión comprime más ? La compresión de Disinfectant ( v3 . 7 . 1 ) con cuatro utilidades diferentes da estos los resultados ( el porcentaje de compresión es el que brinda cada programa ) , ordenados de mayor a menor:

Tamaño original: 354 . 570 bytes ( 346K )

Con CompactPro: 164 . 449 bytes ( 161K ) [ 54% ]

Con ZipIt: 162 . 658 bytes ( 158K ) [ 54% ]

Con Stuffit: 156 . 875 bytes ( 153K ) [ 56% ]

Con DiskDoubler: 150 . 010 bytes ( 147K ) [ 57% ]

No es una recompresión sucesiva, sino que en cada caso he comprimido el original . Queda claro, pues, que " . cpt " comprime menos que " . zip " , que " . zip " comprime menos que " . sit " , y que DiskDoubler comprime más que los otros tres . DiskDoubler es una utilidad comercial que crea archivos comprimidos que sólo pueden ser expandidos por otro DiskDoubler, por eso no está tan extendida .

Josep Lluís Mtnz . Benlliure, vía LSPM

Grabación de CDs compatibles con PC

P . :Necesito saber si la grabación de Discos Compactos se comporta igual que la grabación de disquetes, es decir ¿ hay que " decirles " que es una grabación que ha de poder ser leída por una maquina PC o Mac, o es indiferente ?

Sé que un CD de Mac no es ni siquiera reconocido por un PC, entonces,

Contenidos recomendados...

Comentar
Para comentar, es necesario iniciar sesión
Se muestran 0 comentarios
X

Uso de cookies

Esta web utiliza cookies técnicas, de personalización y análisis, propias y de terceros, para facilitarle la navegación de forma anónima y analizar estadísticas del uso de la web. Consideramos que si continúa navegando, acepta su uso. Obtener más información