Windows

Red Hat, Hortonworks prep OpenStack para Hadoop

Creating Hadoop 2-Node Cluster

Creating Hadoop 2-Node Cluster
Anonim

Fusionando los mundos del big data y la computación en la nube, Red Hat, Hortonworks y el integrador Hadoop Mirantis están construyendo conjuntamente un software programa, llamado Savanna, que facilitará la implementación de Apache Hadoop en un servicio en la nube de OpenStack.

El software "permitirá a Hadoop aprovechar la arquitectura de almacenamiento de escalamiento horizontal que ofrece OpenStack", dijo el CEO de Adrian Ionel Mirantis. "Las empresas tendrán una forma mucho más fácil de implementar y usar Hadoop a escala".

Mirantis lanzó el proyecto a principios de este mes, donando el código a la Fundación OpenStack. OpenStack es una colección de software de código abierto diseñado para ofrecer servicios de cómputo, almacenamiento y redes compartidos bajo demanda. Y Apache Hadoop es un marco de procesamiento de datos para analizar grandes cantidades de datos en múltiples servidores en un clúster. Ambos conjuntos de software son cada vez más probados e implementados por organizaciones.

[Más información: los mejores servicios de transmisión de TV]

"La nube proporciona una infraestructura económica de bajo costo que se escala fácilmente. Y eso es algo que muy importante en el mundo de Hadoop, ya que muchos de estos proyectos están girando rápidamente dentro de las unidades de negocios, y no necesariamente hablan con la gente de TI ", dijo Shaun Connolly, vicepresidente de estrategia de Hortonworks. Savanna trabajará con cualquier distribución Hadoop estándar, no solo con la distribución propia de Hortonworks.

Savanna proporcionará una forma fácil de instalar un clúster Hadoop en una nube OpenStack. Los administradores pueden especificar la topología del clúster, la cantidad de nodos, el hardware requerido y otros atributos. El proyecto está preparando a Savanna para ser un elemento de la suite OpenStack, accesible mediante una API (interfaz de programación de aplicaciones) o mediante una GUI disponible para el panel de OpenStack.

Con el tiempo, el software ofrecerá funciones adicionales, como auto -scaling, la capacidad de programar cuándo se ejecuta una implementación de Hadoop y la capacidad de administrar múltiples clústeres de Hadoop. Savanna también podrá reasignar el poder computacional no utilizado en una grilla OpenStack para las cargas de trabajo de Hadoop. Y Savanna proporcionará un punto de integración para el software de aprovisionamiento y administración de terceros de Hadoop, especialmente el Apache Ambari.

El equipo espera tener demostraciones del software listas para la Cumbre de Hadoop en junio.

Más allá de proporcionar un tiempo potencial- herramienta de ahorro para los administradores, Savanna es notable porque muestra cómo las empresas se vuelven más dependientes del software de código abierto. "Estamos empezando a ver proyectos importantes como Hadoop y OpenStack para integrarlos, porque existe un gran impulso en la empresa para llegar a una infraestructura unificada de código abierto", dijo Ionel.

Joab Jackson cubre software empresarial y tecnología en general. noticias para El servicio de noticias IDG. Sigue a Joab en Twitter en @Joab_Jackson. La dirección de correo electrónico de Joab es [email protected]