.. En
almacenamiento uno de los principales objetivos es lograr mejorar la eficiencia
y la reducción del espacio de datos requeridos, en este sentido NetApp a través
de su sistema operativo Data Ontap ofrece la funcionalidad de Deduplicación.
Deduplicación
como concepto es el proceso en el cual se realiza una comprobación byte a byte
de bloques de datos iguales y reemplazarlos en un único bloque compartido, esto
hará que se “salve” un porcentaje de los datos haciendo más óptimo la
distribución del espacio.
El proceso de
Deduplicación se realiza en “Background” y puede ser manual o programado sin
importar que tipo de aplicaciones se almacenan ni tampoco que protocolos de
acceso se utiliza. La cantidad de espacio que se ahorra dependerá del tipo de
datos que se almacenen.
Requisitos para
Deduplicación
La tabla muestra
los requisitos de deduplicación en cabinas de almacenamiento de NetApp
¿Como trabaja la
Deduplicación?
Para determinar
que bloques pueden compartirse DataOntap realiza una “Marca” que consiste en un
resumen de los datos del bloque, por tanto dos bloques con la misma “Marca” son
los que son susceptibles a ser compartidos.
Al configurar un
volumen para deduplicación DataOntap confecciona una base de datos de estas “Marcas”,
este proceso es llamado RECOPILACION.
Cuando se inicia
el proceso de deduplicación se realiza una operación de clasificación
utilizando las “Marcas” de los bloques
cambiados como clave, el resultado de esta clasificación se añade a la
información de base de datos de “Marcas”.
Si aparecen las mismas “Marcas” en la operación de clasificación y en la
base de datos de “Marcas”, pueden existir bloques que pueden compartirse y convertirse
en un solo bloque. La comprobación que realiza DataOntap para garantizar que
los bloques sean iguales se realiza byte a byte.
Para minimizar el
coste de la deduplicación se utiliza las funcionalidades de WAFL , por ejemplo,
cada bloque de datos en disco es protegido con una suma de verificación, por
tanto, se utiliza esta suma como base de la “Marca”, esto es permitido porque
WAFL no sobrescribe un bloque de datos que esté en uso.
Mejores
Prácticas para la aplicación de Deduplicación.
A continuación detallamos consideraciones importantes al aplicar la deduplicación.
·
Si a
nivel de aplicación se crean poco datos nuevos es recomendable ejecutar la
deduplicación con poca frecuencia ya que nos ofrece pocas ventajas. Depende de
la tasa de cambios de los datos.
·
La deduplicación
consume recursos del sistema y el rendimiento de I/O tanto de lectura como
escritura puede variar, en este sentido las capacidades de la deduplicación
dependen de las aplicaciones y datos almacenados.
·
Se
recomienda realizar procesos de deduplicación alternos entre volumenes ya que
mientras más procesos concurrentes se realicen habrá más consumo de recursos .
·
Utilizar
el modo automático para que se ejecute solamente cuando se haya escrito una
gran cantidad de datos adicionales en un volumen.
·
Se
recomienda ejecutar la deduplicación manualmente.
·
Ejecutar
la deduplicación como un proceso nocturno y preferentemente después de los
procesos de Snapshots.
·
Para
garantizar que la deduplicación se realice correctamente de deberá de disponer
de aproximadamente un 2% de tamaño total de datos en el volumen.
Más información
la podemos encontrar en el siguiente TR
Bueno amigos
espero que este post les sea de utilidad.
Hasta pronto....
No hay comentarios:
Publicar un comentario