S2D Deep Dive – NVMe, Tiers e Dedup

Olá pessoal, no post de hoje, veremos com um pouco mais de detalhes o NVMe, os Tiers do Storage Spaces Direct (S2D) e o processo de Deduplicação (Dedup).

NVMe Drives

“O NVMHCI (NVMHCI) é uma especificação lógica de interfaces de dispositivo para acesso à mídias de armazenamento não-voláteis conectadas através de um barramento PCI Express (PCIe). A sigla, NVM, significa memória não volátil, que é comumente a memória flash que vem na forma de drives de estado sólido (SSDs). O NVM Express, como uma interface de dispositivo lógico, foi projetado desde o início para aproveitar a baixa latência e o paralelismo interno de dispositivos de armazenamento baseados em flash.” By Wikipedia.

Na prática, os dispositivos NVMe em nível macro são HDs SSD’s conectados diretamente em barramentos PCIe, no S2D, eles são utilizados principalmente como dispositivos de cache, já que são muito mais rápidos que HDs SSD’s normais, pois utilizam a vantagem de estarem conectados no barramento PCIe. Como já visto em outros posts e no meu e-book sobre S2D, é possível mesclar os HDs, utilizando HDs mecânicos, SSD’s normais e NVMe’s em conjunto, tudo dependendo do tipo de uso esperado.

A única desvantagem atual dos HDs NVMe são seus altos valores $, porém, com o tempo o valor deve diminuir acompanhando o desenvolvimento da tecnologia e sua demanda no mercado.

Os NVMe podem ser instalados diretamente em slots PCIe, como na figura acima, ou através de outras conexões especificas (M.2 por exemplo). Alguns servidores utilizam conexões PCIe frontas, onde é possível instalar um NVMe (que neste caso possui o mesmo formato de um HD SSD normal) na parte frontal do servidor, junto aos demais HDs, porém, deverão existir slots específicos, que possuem uma marcação indicativa.

Tiers no S2D

Em soluções de storage convencionais, é possível segregar por tiers (camadas) o armazenamento dos dados, onde basicamente programamos para que os dados menos acessados (frios) sejam armazenados em HD’s mecânicos e os dados mais acessados (quentes) sejam armazenados em HD’s SSD ou NVMe por exemplo. Além desta configuração básica, é possível avançar para programações mais especificas, onde um tipo de dado tem preferencia por discos mais rápidos por exemplo.

No S2D, existe a mesma possibilidade de utilizar tiers, porém, o formato é um pouco diferente.

Com o S2D, você tem apenas dois níveis de armazenamento. O Caching Tier, que é construído a partir de NVMe’s ou SSD’s e o Capacity Tier, que é construído a partir de SSD’s e/ou HDD’s para armazenar dados frios. Dependendo do número e tipo de discos, o nível de capacidade também pode ter algum tipo de camada como um nível de capacidade rápido para seus dados “quentes”, mas isso só é possível quando você usa NVMe, SSD, HDD ou SSD para armazenamento em cache e HDD’s com diferentes velocidades de RPM (10k, 15k, etc) dentro do mesmo conjunto de armazenamento.

A figura abaixo descreve um exemplo para esses pools de armazenamento:

Deduplicação

“Na computação, a desduplicação (ou Deduplicação/Dedup) de dados é uma técnica especializada de compactação de dados para eliminar cópias duplicadas de dados repetidos.” By Wikipedia.

O Dedup para S2D esta disponível apenas para Windows Server 2019, prometendo ter uma taxa de redução de duplicatas de até 50%.

Por exemplo: Você cria um arquivo em excel, manda para o departamento administrativo, automaticamente o colaborador vai salvar numa pasta compartilhada na rede, logo você terá dois arquivos com as mesmas informações. Agora imagine este cenário em um ambiente com diversos colaboradores, criando, copiando e salvando arquivos iguais ou parecidos. Isso com certeza gera um grande volume de dados duplicados. Quando aplicada a deduplicação ela automaticamente irá comparar os dados serem gravados em disco com os já existentes e criar apontamentos para o arquivo principal, ou seja não salvará arquivos duplicados.

Por hoje é isso, um abraço e até a próxima!

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

%d blogueiros gostam disto: