sábado, 16 de febrero de 2013

Deduplicación en NETAPP



.. En almacenamiento uno de los principales objetivos es lograr mejorar la eficiencia y la reducción del espacio de datos requeridos, en este sentido NetApp a través de su sistema operativo Data Ontap ofrece la funcionalidad de Deduplicación.

Deduplicación como concepto es el proceso en el cual se realiza una comprobación byte a byte de bloques de datos iguales y reemplazarlos en un único bloque compartido, esto hará que se “salve” un porcentaje de los datos haciendo más óptimo la distribución del espacio.

El proceso de Deduplicación se realiza en “Background” y puede ser manual o programado sin importar que tipo de aplicaciones se almacenan ni tampoco que protocolos de acceso se utiliza. La cantidad de espacio que se ahorra dependerá del tipo de datos que se almacenen.



Requisitos para Deduplicación

La tabla muestra los requisitos de deduplicación en cabinas de almacenamiento de NetApp

 

¿Como trabaja la Deduplicación?

Para determinar que bloques pueden compartirse DataOntap realiza una “Marca” que consiste en un resumen de los datos del bloque, por tanto dos bloques con la misma “Marca” son los que son susceptibles a ser compartidos.

Al configurar un volumen para deduplicación DataOntap confecciona una base de datos de estas “Marcas”, este proceso es llamado RECOPILACION.

Cuando se inicia el proceso de deduplicación se realiza una operación de clasificación utilizando las “Marcas”  de los bloques cambiados como clave, el resultado de esta clasificación se añade a la información de base de datos de “Marcas”.  Si aparecen las mismas “Marcas” en la operación de clasificación y en la base de datos de “Marcas”, pueden existir bloques que pueden compartirse y convertirse en un solo bloque. La comprobación que realiza DataOntap para garantizar que los bloques sean iguales se realiza byte a byte.

Para minimizar el coste de la deduplicación se utiliza las funcionalidades de WAFL , por ejemplo, cada bloque de datos en disco es protegido con una suma de verificación, por tanto, se utiliza esta suma como base de la “Marca”, esto es permitido porque WAFL no sobrescribe un bloque de datos que esté en uso.

 
Mejores Prácticas para la aplicación de Deduplicación.


 A continuación detallamos consideraciones importantes al aplicar la deduplicación.

·        Si a nivel de aplicación se crean poco datos nuevos es recomendable ejecutar la deduplicación con poca frecuencia ya que nos ofrece pocas ventajas. Depende de la tasa de cambios de los datos.

·        La deduplicación consume recursos del sistema y el rendimiento de I/O tanto de lectura como escritura puede variar, en este sentido las capacidades de la deduplicación dependen de las aplicaciones y datos almacenados.

·        Se recomienda realizar procesos de deduplicación alternos entre volumenes ya que mientras más procesos concurrentes se realicen habrá más consumo de recursos .

·        Utilizar el modo automático para que se ejecute solamente cuando se haya escrito una gran cantidad de datos adicionales en un volumen.

·        Se recomienda ejecutar la deduplicación manualmente.

·        Ejecutar la deduplicación como un proceso nocturno y preferentemente después de los procesos de Snapshots.

·        Para garantizar que la deduplicación se realice correctamente de deberá de disponer de aproximadamente un 2% de tamaño total de datos  en el volumen.

Más información la podemos encontrar en el siguiente TR


Bueno amigos espero que este post les sea de utilidad.

Hasta pronto....

No hay comentarios:

Publicar un comentario