La retención de datos corporativos a largo plazo como herramienta de mejora de la productividad

Publicado el 13 Dic 2012

OLYMPUS DIGITAL CAMERA

Autor: Daniel Maganto, country manager de CommVault Systems Iberia

La retención o conservación de los datos corporativos, concebida como la distribución de las copias de seguridad de los datos a través de entornos concretos de trabajo, está adquiriendo un creciente peso específico en la política estratégica de cualquier clase de organización: desde grandes compañías e instituciones hasta pequeñas y medianas empresas.

Según datos de la consultora IDC, el avance que ha supuesto la tecnología digital está permitiendo afrontar durante el quinquenio 2008-2012 un crecimiento anual de los datos, a escala mundial, de entre el 50 y el 60 por ciento. En torno al 95 por ciento de dichos datos es de carácter desestructurado, pudiendo incluir aquí emails, ficheros de texto y música, documentos, imágenes y vídeos. Los usuarios finales generan alrededor del 70 por ciento de esos contenidos, que pueden compartir de manera fácil más allá de los límites de la organización en la que desarrollan su actividad. Asimismo, dichos usuarios finales están almacenando datos personales en recursos compartidos en red donde saben que dispondrán de la correspondiente copia de seguridad.

Buena parte de los datos desestructurados de cualquier organización muy probablemente tenga bastante poco que ver con su negocio y una significativa cantidad de los mismos son redundantes. En otras palabras, la mayoría de los entornos de almacenamiento son una mezcla de datos activos, inactivos, irrelevantes y antiguos. Y los administradores TI deben lidiar con dicha realidad de la manera más eficaz y con el menor coste posible, siempre teniendo en cuenta ese formidable crecimiento del 50-60 por ciento anteriormente indicado.

Una cosa que esos administradores TI tienen a su favor es que los costes referidos a almacenamiento de datos ‘en bruto’ continúan bajando en un 50 por ciento año tras año. Cuando la retención de los datos se ve afectada por diversas circunstancias (desde las referidas al propio negocio a las necesidades de los usuarios finales, pasando por los requerimientos en materia de regulación y/o conformidad o a las cuestiones históricas) muy a menudo el almacenamiento barato se contempla como la solución para el reto del crecimiento del volumen de datos. Pero las políticas de retención pueden ser muy difíciles de llevar a cabo si estos requerimientos son muy conflictivos. Pongamos algunos ejemplos: las empresas que operan en Europa y Estados Unidos han de aunar la necesidad de conservar los datos en materia de conformidad con el respeto a la privacidad de los datos de los usuarios; e incluso en función del país donde se hallan creado dichos datos, las exigencias de su conservación a largo plazo pueden variar de apenas unos años a un siglo (típico caso de los historiales médicos).

Como consecuencia de este conflicto, muchas empresas e instituciones están aplicando una política de retención de datos a largo plazo con independencia de que éstos sean activos, inactivos, irrelevantes o antiguos. Si bien esta práctica puede ser asumible en cierta clase de datos, la aplicación indiscriminada de políticas de retención a largo plazo que no tenga en cuenta la idiosincrasia de dichos datos o la utilización de la capacidad de almacenamiento de una organización puede dar lugar a ineficiencias bastante considerables. Si tenemos en cuenta que la cantidad de bytes de datos se duplica cada 18 meses y que los presupuestos TI tienden a la baja, la compra de más espacio de almacenamiento para conservar datos de muy variada índole es una propuesta cara que no solucionará el problema de la gestión de la información corporativa.

Además, la retención a largo plazo sin una idea sobre las características de los datos no permite la predicción exacta de las necesidades de almacenamiento. De hecho, el coste de su gestión se incrementa entre un 30 y un 40 por ciento cada año y las ineficiencias y complejidades crecen conforme se añaden dispositivos de almacenamiento heterogéneos al centro de datos de la organización. Y, pese a todo, el principal desafío para los administradores TI no radica tanto en el crecimiento de los datos como en la manera de desarrollar políticas de gestión a largo plazo específicamente concebidas a las distintas clases de datos con que se cuenta. La solución ideal radicará en afrontar estos desafíos permitiendo un incremento en la utilización de los recursos de almacenamiento existentes, añadiendo tan sólo esos activos cuando sea absolutamente necesario.

Conviene tener presente que la senda hacia un coste eficiente no es sólo una cuestión de almacenamiento por niveles, deduplicación o gestión de recursos. El camino óptimo es en realidad una estrategia de reducción de esos tres pilares que permitirá una sólida disminución del volumen de datos así como pasarlos al nivel de almacenamiento más idóneo. Esta clase de estrategia integrada permitirá: explotar los recursos de almacenamiento existentes; eliminar la adquisición reactiva mediante el aplazamiento de las compras de almacenamiento; alinear la retención y localización con el valor comercial de los datos; y controlar de manera constante los datos de producción para la aplicación de políticas de retención realmente consistentes. Si una estrategia de reducción de datos aspira a ser de primer nivel, debe comenzar con el análisis: hay que saber lo que se tiene para ser capaz de optimizar las tecnologías de reducción de datos de manera coherente.

La comprensión de los datos es el primer paso para reducir, de manera eficaz, la cantidad de almacenamiento que hay que gestionar y el número de los que hay que hacer copia de seguridad y archivo. El análisis a través de la gestión de recursos de almacenamiento (conocida también por sus siglas SRM) ayuda a tomar decisiones correctas en relación con la retención, nivel de almacenamiento y previsión de capacidad. SRM identifica e informa sobre cuestiones como acceso, modificación, y características de uso de archivos y aplicaciones (por ejemplo, Exchange, Notes, SharePoint o bases de datos) y ayuda a encontrar la capacidad de almacenamiento no usada y sobredimensionada. Hallar la capacidad de almacenamiento no empleada y los recursos que pueden explotarse contribuye a eliminar las adquisiciones reactivas mediante la reducción de costes o el aplazamiento de las actualizaciones de capacidad. También permite establecer una práctica eficaz de niveles de almacenamiento. Además, debería aprovecharse SRM para la continua monitorización de la producción de datos almacenados con el fin de garantizar que los usuarios finales no consuman capacidad de almacenamiento con sus datos personales sobre redes compartidas.

El aprovechamiento de las herramientas SRM para determinar las características de acceso y modificación de datos y archivos ayuda a identificar si dichos contenidos son activos, inactivos, irrelevantes o antiguos, lo que facilita la determinación e implantación de las políticas de retención más eficientes (eliminación y archivado) en los distintos niveles de almacenamiento. Por ejemplo, los sistemas que incorporan muchos archivos recientemente modificados son buenos candidatos para el backup mientras que las copias de seguridad de datos inactivos deberían evitarse para reducir costes; sin embargo, los archivos con muchos ficheros inactivos/no empleados a los que no se ha accedido o que no se han modificado recientemente, son idóneos para el archivado.

Una vez que se han identificado los candidatos al archivado, se pueden crear algunas reglas para su optimización moviendo los datos inactivos desde al almacenamiento primario a un entorno de almacenamiento más barato para su conservación a largo plazo. Esto es una extensión natural de SRM porque el archivado permite la alineación de los datos retenidos conforme su valor de negocio. Cuando los inactivos o antiguos se mueven a un archivo, se queda un trozo pequeño en lugar del original, lo que reduce significativamente el uso de almacenamiento en el sistema de producción. Los usuarios finales no ven ninguna diferencia, dado que el acceso a los contenidos archivados es transparente para ellos. Las reglas de retención aplicadas facilitan un abaratamiento de los costes de almacenamiento al poder seleccionar distintos niveles de almacenamiento para retención a largo plazo.

Por último, para completar la estrategia de reducción de los datos es preciso aplicar una tecnología de deduplicación que se encuentre integrada en las capacidades de SRM y archivado. La deduplicación es una tecnología de disminución de datos que está siendo cada vez más empleada para aminorar los procesos de copias de seguridad y archivo de los datos allí donde hay más datos redundantes en entornos de almacenamiento primario. Una vía para maximizar la eficacia de la deduplicación es aprovechar un enfoque basado en un software que sea global e incrustado (lo que permite, entre otras cosas, aprovechar los sistemas de almacenamiento existentes). El enfoque ‘incrustado’ (es decir, que el software de deduplicación esté integrado en una solución de backup y archivado completa) permite que las duplicaciones sean capturadas durante la transferencia, reduciendo las ventanas de backup y el ancho de banda de red. Y la perspectiva ‘global’ extiende estas capacidades al permitir deduplicar múltiples tipos de datos, fuentes, plataformas y niveles de almacenamiento.

En suma, sin desaceleración a la vista en lo que se refiere al crecimiento digital de los datos y con las constantes limitaciones de los presupuestos TI, el desarrollo de una estrategia integrada de reducción de datos es clave para disminuir costes económicos en la retención de datos a largo plazo. La integración del análisis a través de la gestión de recursos de almacenamiento (SRM) para identificar las características de uso de los datos, permite el desarrollo e implantación de estrategias de archivado idóneas para toda clase de datos, lo que comenzará a reducir dichos costes de almacenamiento. Cuando se de un paso más hacia delante y se integre con un software de deduplicación global e incrustado en dicha estrategia, se pueden aminorar significativamente los datos en disco y cinta, atenuar los costes de adquisición de almacenamiento y reducir considerablemente los gastos de almacenamiento offsite de los datos corporativos.

¿Qué te ha parecido este artículo?

Tu opinión es importante para nosotros.

Redacción

Artículos relacionados

Artículo 1 de 2