Data Gravity y su influencia en el Cloud Data Management

Diseñar e implementar estructuras analíticas con un entendimiento cabal de los retos de la “gravedad de los datos” es fundamental para crear un entorno tecnológico ágil, fiable y seguro. De otra forma podría ponerse en riesgo la capacidad de innovar. Por ello también se hace esencial contar con una estrategia de gestión de datos sólida, con principios relevantes de Cloud Data Management.

Publicado el 31 May 2022

ey

Estamos creando, capturando, procesando y consumiendo datos como nunca en nuestra historia. La reconocida consultora IDC predice que para el año 2025, cada persona conectada a Internet tendrá al menos una interacción de datos cada 18 segundos, esto debido a los miles de millones de dispositivos IoT desplegados en todo el mundo, que se espera que generen más de 90 Zettabytes (o 90 mil millones de terabytes) de datos en 2025. La pandemia del Covid-19 no ha hecho más que acelerar el proceso de creación de datos a nivel global, ya que más personas han estado aprendiendo, trabajando o divirtiéndose desde casa, generando y consumiendo datos cada vez con mayor frecuencia.

Como resultado de este fenómeno, vemos cómo grandes volúmenes de datos incrementan su tamaño rápidamente, a la vez que aumentan las necesidades de procesamiento en tiempo real y de ingesta hacia la nube para acceder a mayores capacidades de almacenamiento, cómputo e inteligencia analítica, que nos permitan extraer más valor desde estos conjuntos de datos.

Es en este contexto es que el término “Data Gravity” cobra gran relevancia. Acuñada el año 2010 por el ingeniero Dave McCrory, la gravedad de los datos indica que las aplicaciones y los datos se atraen mutuamente, de manera similar a la atracción entre cuerpos que explica la Ley de la Gravedad. A medida que crecen los volúmenes de datos, también crecen las dificultades para moverlos, por lo que se torna atractivo que se mantengan en una ubicación. Esto genera que las aplicaciones o los servicios se desplacen hacia donde residen los datos, atraídos justamente por el efecto de esta gravedad.

No es que los datos creen literalmente atracción gravitacional, pero lo que sí vemos en la práctica es que pequeñas aplicaciones y otros conjuntos de datos se reúnen alrededor de grandes masas de datos. Y en la medida que estos datos y aplicaciones se hacen más grandes, resulta cada vez más complejo moverlos, generando el problema de la gravedad de los datos. Esta dificultad puede llegar a ser bastante compleja, ya que esta gravedad podría llegar a obstaculizar la capacidad de una organización para agilizar sus procesos o incluso para innovar. Es por ello que se torna fundamental contar con una estrategia de gestión de datos sólida, incorporando principios relevantes de Cloud Data Management. Uno de los primeros aspectos que es recomendable definir en empresas que estén enfrentando este desafío es una arquitectura centrada en los datos, con un fuerte enfoque en la accesibilidad. Esta accesibilidad debe estar definida de tal manera que genere un impacto positivo en distintos temas, entre los que me gustaría destacar el rendimiento de las aplicaciones y la gestión de la seguridad de todos los entornos involucrados.

Grandes retos

Uno de los grandes desafíos que surgen por los problemas de la atracción gravitacional de grandes conjuntos de datos es la latencia. Como comentamos anteriormente, en la medida que “las masas de datos” aumentan de tamaño, es más difícil moverlas, por lo que las organizaciones están buscando que esta data se almacene más cerca de las aplicaciones y servicios que requieren una menor latencia. Esto puede lograrse siguiendo el paradigma de Edge Computing, utilizando aplicaciones nativas de la nube que puedan ejecutarse en la punta, permitiendo que los datos se creen y almacenen cerca del punto de origen. Según “2021 Cloud Data Storage & Infrastructure Trends Survey” de IDC, el 47% de las empresas utiliza una arquitectura de almacenamiento en la nube centralizada, pero en dos años esa cifra se reducirá al 22%. Por el contrario, el 25% de los encuestados tiene actualmente una arquitectura de almacenamiento híbrida, pero se espera que esa cifra aumente al 47% en dos años. Todo esto ha generado que el Edge Computing sea una de las tendencias actuales más importantes en tecnología. Según IDC, para el año 2023 más de la mitad de la nueva infraestructura tecnológica de las empresas estará en el borde. En la misma línea, Gartner predice que para el año 2025 el 75% de los datos generados por las empresas se creará y procesará fuera de un centro de datos tradicional o cloud.

Los datos en el centro

Algunas organizaciones también enfrentan otro tipo de problemáticas a la hora de abordar este tema, por ejemplo, la existencia de sistemas legados que no facilitan un despliegue nativo en la nube o la necesidad de dar cumplimiento a ciertas normativas. En estos casos puede ser interesante cambiar la perspectiva, cambiar al paradigma y situar los datos en el centro de la estrategia. En este sentido, podría ser interesante empezar a preguntarse: ¿cómo puedo utilizar mis datos desde la nube?

Son diversos los beneficios de una arquitectura consciente de los problemas de la gravedad de los datos. En primer lugar, puede aumentar la facilidad de uso y la fluidez de las operaciones, facilitando a su vez la ejecución de distintas innovaciones al mejorar las capacidades de generar, buscar y descubrir conjuntos de datos, entregando mayores herramientas a los equipos analíticos para entrenar, implementar y desplegar modelos predictivos y prescriptivos.

Diseñar e implementar estructuras analíticas con un entendimiento cabal de los desafíos de la gravedad de los datos es fundamental para crear un entorno tecnológico ágil, fiable y seguro. Poner los datos en el centro de las decisiones arquitectónicas permite mejorar en gran medida el acceso y la disponibilidad, desbloqueando la flexibilidad y las capacidades de innovación de la compañía. En la medida que las organizaciones consigan superar los desafíos de la latencia y logren activar los datos a escala, estarán habilitando capacidades clave para impulsar la toma de decisiones a partir de sus datos.

¿Qué te ha parecido este artículo?

¡Síguenos en nuestras redes sociales!

Redacción

Artículos relacionados