El único componente de un Data Center que mantiene su crecimiento en tamaño y cantidad es el almacenamiento que es un área fascinante de la computación. La Empresas líderes de TI continúan buscando la máxima eficiencia al organizar y operar sus centros de datos. Como la TI se ha transformado en la tecnología de negocios de las empresas modernas, la indisponibilidad de los datos, aun por un breve período de tiempo se ha convertido en algo inaceptable. Entre tanto, a los trabajadores de TI se les asigna día a día la resolución de problemas de negocios cada vez más sofisticados, en donde el eje central, usualmente, es la cantidad masiva de datos. En la vida cotidiana, solo una pequeña proporción de los datos son esenciales -datos a los que el usuario necesita acceso inmediato (por ejemplo, los correos electrónicos que han llegado en el día) , en tanto que muchos de los datos son pasivos, (no requieren de un acceso inmediato -como ejemplo, los correos electrónicos de hace 2 años). Digamos que una pequeña proporción de los datos pasivos se pueden transformar en activos en algún momento en función de las necesidades, lo cual puede generar dificultades serias cuando la cantidad de datos es de escala masiva, sin importar la cantidad de datos necesarios o de usuarios involucrados.
Esto incluye un conjunto de problemas desafiantes para los ingenieros e investigadores de la problemática del almacenamiento. ¿Cómo se puede asegurar que la infraestructura de almacenamiento sea escalable, efectiva, y confiable sin disrupciones en el acceso aun cuando se trate de actualizaciones o de mantenimiento? ¿Cómo accedemos a los datos activos la más rápido que sea posible mientras se mantiene al almacenamiento de los datos pasivos lo mas económicamente posible? ¿Cómo aseguramos que los datos son gestionados en forma continua, a lo largo de todo el ciclo de vida? Las empresas líderes del almacenamiento y las innovadoras, continúan invirtiendo talentos y recursos para resolver este conjunto de problemas de la vida real.
Cambiando el Escenario de la Gestión de Datos
Actualmente los usuarios de almacenamiento pueden elegir entre afrontar los costos de capital para construir sus propias infraestructuras de almacenamiento o utilizar un servicio de almacenamiento pagable en función de su utilización. La problemática de gestión, en ambos casos requiere las habilidades de múltiples locatarios -para permitir una compartimetización completa de grupos de usuarios y entregarles a dichos locatarios un acceso seguro y un nivel de servicio garantizado. Existen modelos económicos sofisticados de servicios de concentración que les indican a los CIO y gerentes de TI como comprender la naturaleza dinámica del capital y de los costos de explotación para establecer el mejor costo total de posesión de un centro de datos (TCO Total Cost of Ownertship).
Los avances en las tecnologías de los componentes de almacenamiento, como discos flash o de estado sólido; tarjetas de memorias de almacenamiento; y el mejoramiento permanente de los discos magnéticos; ofrecen nuevas alternativas para los sistemas de almacenamiento que ofrecen los fabricantes. Los usuario buscan soluciones que oculten la complejidad de la selección de componentes, la ubicación de los datos y la protección de los datos. En este sector de permanente crecimiento, genéricamente conocido como el almacenamiento corporativo, la empresa de investigación IDC predice el escalamiento de estas arquitecturas presentará el mayor crecimiento en 2013 . [source] Los ingenieros de sistemas han buscado desde la década de 1970 arquitecturas en racimo (cluster) que sean permanentes y puedan escalar a tamaños de grandes proporciones. Las arquitecturas en racimo permiten la integración con las grandes computadoras centrales, (mainframes) y los sistemas resistentes a fallos de alto costo. La innovación en la arquitectura de los sistemas de almacenamiento por medio de componentes normalizados y conexiones en racimo están consiguiendo la proliferación de productos económicamente alcanzables. Tales sistemas ofrecen una infraestructura de almacenamiento altamente ágil, escalable, virtualizable y que puede operar en forma no disruptiva.
Los sistemas de almacenamiento moderno incluyen un gran conjunto de algoritmos e innovaciones arquitectónicas, que se han desarrollado durante las últimas décadas. Los sistemas de almacenamiento se caracterizan por un conjunto significativo de tecnologías de base que resultan esenciales para la construcción de los productos y que aun no han sido completamente identificadas. Entre estas tecnologías se incluyen algoritmos para la protección de los datos a nivel de las capas de almacenamiento de los discos y de sistemas de archivos resilentes, tecnologías de almacenamiento eficientes, tales como la deduplicación y la compresión de archivos, los sistemas de archivos o de instantáneas de volúmenes y clones. Las arquitecturas en racimo ofrecen capacidades adicionales significativas para minimizar las disrupciones debidas a los fallos y durante los períodos de actualizaciones y de rutinas de mantenimiento. La evidencia actualmente muestra que las arquitecturas de almacenamiento principal son enracimo, y que se combinan bien con los componentes habituales para ofrecer el mejor valor al cliente.
El Tema de este Mes
Para la edición de este mes de Computing Now he reunido un conjunto de artículos que examinan las tendencias en las arquitecturas de gestión de datos y las soluciones de almacenamiento en racimo en las empresas modernas.
En “IaaS Arquitectura de Nube: Desde los Data Centers Virtualizados y hacia las Infraestructuras Federadas,” Rafael Moyano Vozmediano, Ruben Montero e Ignacio Llorente, presentan una interesante visión de la anatomía de las infraestructuras en nube, así como una explicación del concepto del OS en nube y su rol en la apertura de los data centers corporativos modernos.
El articulo de Lee Garber “Convergencia de Infraestructuras: Considerando el Problema de la Efectividad.” El artículo se origina en una historia de Noticias de Computación sobre la integración de los componentes de los Data Centers, incluyendo servidores, almacenamiento e infraestructura de red. Tal convergencia de arquitecturas de infraestructura puede incluir componentes de un único o de varios proveedores de primera línea. Este artículo presenta las oportunidades y desafíos en la construcción flexible de la convergencia de la infraestructura de los sistemas a partir de componentes disponibles en el mercado, es decir, data centers pre-armados.
Boris Grot y sus colegas realizan un análisis profundo sobre las soluciones de escalamiento con procesadores de baja potencia a fin de lograr un TCO optimo en el artículo “Optimización del TCO de los Data Centers con escalamiento de Procesadores” El artículo define al TCO como “una métrica de optimización que considera el costo de las infraestructuras inmobiliarias, de potencia y de refrigeración; el costo de adquisición del hardware y los costos operativos. Este es un excelente estudio que logrará un alcance de alto impacto en las arquitecturas de los sistemas de almacenamiento.
En el siguiente artículo de Yaoguang Wang y sus colegas “HAaaS: Hacia los Sistemas Distribuidos de Alta Disponibilidad” discute sobre un requerimiento de importancia en las arquitecturas de almacenamiento contemporáneas de alta disponibilidad. El artículo presenta una solución que utiliza un almacenamiento compartido para resolver algunas cuestiones de importancia de la gestión del estado.
Finalizamos con el artículo “Una Solución Novedosa para el Almacenamiento de Sistemas Distribuidos: Almacenamiento para Servicio en la Nube” es una ponencia de conferencia realizada por Yu Zhang, Weidong Liu y Jiaxing Song que discute sobre las propiedades de los Servicios en la Nube y ofrece datos significativos sobre la construcción de un servicio de almacenamiento compartido.
Para expandir los artículos del tema de este mes le pregunté a Tim Russell, vice presidente del ciclo de datos de soluciones de ecosistema en NetApp, sobre los cambios y desafíos que el prevé en la implementación de las arquitecturas de almacenamiento en racimo en los usuarios corporativos. Como líder de un equipo que desarrollada soluciones de gestión de datos desde su creación y hasta la retención a largo plazo, y habiendo previamente liderado un grupo de estrategia de producto que identificaba y evaluaba las tendencias del mercado a largo plazo, Russell, continuamente interactúa con grandes usuarios de sistemas de almacenamiento. En este video exclusivo comparte su visión sobre los sistemas de almacenamiento corporativos.
También hablé con Rajkumar Buyya, Profesor de Ciencias de la Computación e Ingeniería de Software y futuro Fellow del Australian Research Council y Director de los Laboratorios de Computación en la Nube y Sistemas Distribuidos de la Universidad de Melbourne, Australia. En su respuesta por video a mis preguntas, Buyya comenta sobre su trabajo y perspectivas de investigación en los dominios de los sistemas en racimos.
Soluciones de Escala Corporativa
Los consumidores de TI, empleados, clientes, suministradores y socios, demandan experiencia personalizadas con la TI en sus negocios rápidamente cambiantes y en sus vidas personales. Para los CIOs y tecnólogos empresariales de IT, la discontinuidad del servicio empresarial no es viable. La tecnología está cambiando rápidamente y generando modelos que orientan hacia nuevas líneas de pensamiento para ofrecer la tecnología de soporte de negocios a los clientes corporativos. La arquitectura de gestión de datos es una solución clave y los sistemas de almacenamiento en racimos proporcionan los fundamentos para una tecnología de negocios moderna en la empresa.
Sundara Nagarajan es Director Técnico en NetApp y profesor visitante en el International Institute of Information technology en Banalore, India. Actualmente es el enlace regional de Computing Now para la actividades de la IEEE Computer Society en India. Se lo puede contactar en s.nagarajan at computer dot org