pt.phhsnews.com


pt.phhsnews.com / Por que o Zip é capaz de compactar arquivos simples melhor do que vários arquivos com o mesmo conteúdo?

Por que o Zip é capaz de compactar arquivos simples melhor do que vários arquivos com o mesmo conteúdo?


A capacidade de compactar nossos arquivos para facilitar o compartilhamento e / ou o transporte deles pode A vida electrónica é muito mais fácil, mas por vezes podemos ver resultados de tamanhos estranhos ou inesperados depois de os compactarmos. Por que é que? A postagem de perguntas e respostas do SuperUser de hoje tem as respostas para as perguntas de um leitor confuso.

A sessão de perguntas e respostas de hoje nos é oferecida por SuperUser - uma subdivisão do Stack Exchange, um agrupamento de sites de perguntas e respostas.

Foto cedida por Jean-Etienne Minh-Duy Poirrier (Flickr).

A pergunta

SuperUser reader sixtyfootersdude quer saber porque o zip é capaz de compactar arquivos individuais melhor do que vários arquivos com o mesmo tipo de conteúdo:

Suponha que eu tem 10.000 arquivos XML e deseja enviá-los para um amigo. Antes de enviá-los, gostaria de compactá-los.

Método 1: Não compactá-los

Resultados:

Método 2: Compactar cada arquivo separadamente e enviá-lo 10.000 arquivos XML compactados

Comando:

Resultados:

Método 3: Criar um único arquivo Zip contendo todos os 10.000 arquivos XML

Comando:

Resultados:

Método 4: Concatenar os arquivos em um único arquivo e Zip It

Comando:

Resultados:

Perguntas

  • Por que obtenho resultados tão melhores quando estou apenas fechando um único arquivo?
  • Esperava obter resultados drasticamente melhores usando o método 3 em vez do método 2, mas não. Por que isso é
  • Este comportamento é específico para zip? Se eu tentasse usar o Gzip, obteria resultados diferentes?

Informações Adicionais

Meta Data

Uma das respostas dadas sugere que a diferença são os metadados do sistema armazenados no arquivo zip. Eu não acredito que isso possa ser o caso. Para testá-lo, fiz o seguinte:

O arquivo zip resultante é de 1,4 MB. Isso significa que ainda há aproximadamente dez MB de espaço inexplicado.

Por que o zip é capaz de compactar arquivos individuais melhor do que vários arquivos com o mesmo tipo de conteúdo?

Os colaboradores Alan Shutko e Aganju do SuperUser da Resposta

têm a resposta para nós. Primeiro, Alan Shutko:

A compactação Zip é baseada em padrões repetitivos nos dados a serem compactados, e a compactação fica melhor quanto mais tempo o arquivo estiver, pois mais e mais padrões podem ser encontrados e usados.

Simplificado, se você compactar um arquivo, o dicionário que mapeia códigos (curtos) para padrões (mais longos) é necessariamente contido em cada arquivo zip resultante; se você zipar um arquivo longo, o dicionário é reutilizado e se torna ainda mais eficaz em todo o conteúdo.

Se seus arquivos são um pouco parecidos (como o texto sempre é), a reutilização do 'dicionário' se torna muito eficiente. o resultado é um arquivo zip total muito menor.

Seguido pela resposta de Aganju:

Em zip, cada arquivo é compactado separadamente. O oposto é compactação sólida , ou seja, os arquivos são compactados juntos. 7-zip e Rar usam compactação sólida por padrão. Gzip e Bzip2 não podem comprimir múltiplos arquivos, então o Tar é usado primeiro, tendo o mesmo efeito da compressão sólida

Como os arquivos xml têm estrutura similar (e provavelmente conteúdo similar), se os arquivos forem compactados juntos a compressão será maior

Por exemplo, se um arquivo contiver a string “ ” e o compressor já encontrar essa string em outro arquivo, ele será substituído por um pequeno ponteiro para a correspondência anterior. Se o compressor não usar compactação sólida, a primeira ocorrência da string no arquivo será registrada como um literal , que é maior.


Tem algo a acrescentar à explicação? Som desligado nos comentários. Quer ler mais respostas de outros usuários do Stack Exchange com experiência em tecnologia? Confira o tópico de discussão completo aqui.


O que exatamente é uma máquina a vapor, e eu quero um?

O que exatamente é uma máquina a vapor, e eu quero um?

As Steam Machines, também conhecidas como Steamboxes, são a tentativa da Valve em levar os jogos de PC para a sala de estar. De certa forma, eles competirão com consoles de jogos como o Xbox One, PlayStation 4 e Wii U. Esses PCs serão feitos por uma grande variedade de fabricantes, assim como os PCs para jogos.

(how-to)

Como corrigir os erros do HomeKit “O endereço não é registrado com o iCloud”

Como corrigir os erros do HomeKit “O endereço não é registrado com o iCloud”

Embora a Apple tenha feito melhorias sérias na estrutura do HomeKit smarthome, ainda há mais do que alguns fantasmas na máquina. Vamos dar uma olhada em como banir o extremamente frustrante erro “O endereço não está registrado no iCloud” para que o sistema volte a funcionar. Qual é o problema com esse erro?

(how-to)