Componentes

Actualizaciones de datos de Aster 'primera línea' Base de datos analítica

PES 2020 #1 I ELEGIMOS NUESTRO EQUIPO PARA LIGA MASTER

PES 2020 #1 I ELEGIMOS NUESTRO EQUIPO PARA LIGA MASTER
Anonim

Startup Aster Data Systems lanzó la versión 3.0 de su base de datos analítica nCluster el martes, enmarcándola como ideal para el almacenamiento de datos de "primera línea".

"Tradicionalmente, pensamos en el almacenamiento de datos como una tarea administrativa", escribió el CEO de Aster Mayank Bawa en un blog publicar el martes. "El almacén de datos se puede cargar en ventanas de carga separadas: las cargas pueden retrasarse (el efecto neto es que los usuarios comerciales recibirán sus informes tarde); las cargas, las copias de seguridad y la ampliación pueden sacar depósitos de datos fuera de línea, lo cual está bien desde estas tareas pueden realizarse fuera de horario comercial (noches / fines de semana). "

Pero los clientes de Aster, que incluyen aCerno, una red de distribución de publicidad en Internet," confían en el análisis de datos para sus ingresos ", dijo Bawa.

Aster's nCluster 3.0 distribuye cargas de trabajo en varios servidores y facilita agregar máquinas adicionales para obtener más potencia. El software también divide los diversos componentes de una carga de trabajo de análisis de datos en piezas discretas.

Un nivel de "cargador" se ocupa de la carga y exportación de datos desde y hacia fuentes externas; una capa "trabajador" almacena datos en discos conectados localmente para consultar; y una capa de nodos "reina" realiza planificación y procesamiento inteligente de consultas.

Mientras tanto, los usuarios trabajan con el clúster como si fuera una sola entidad.

La capacidad de escalar segmentos del clúster significa que los usuarios pueden agregar recursos en áreas donde más se necesitan, dice Aster.

Para estas capacidades básicas, la versión 3.0 agrega una serie de funciones para el uso "siempre activo", incluida la capacidad de agregar capacidad, reequilibrar datos y recuperar datos mientras el system are live.

Aster también trabajó para agregar paralelización en todo el sistema, según un ejecutivo de la compañía.

"Queremos construir sistemas que puedan manejar 10x, 100 veces más datos que cualquier otro sistema actual. Pero esto también es mucha información para cualquier servidor básico único ", dijo el CTO Tasso Argyros en una publicación de blog. "Así que invertimos mucho esfuerzo en I + D para paralelizar cada una de las funciones del sistema, no solo para consultar, sino también para cargar, exportar datos, realizar copias de respaldo y actualizaciones. Además, les permitimos a nuestros usuarios elegir cuánto quieren paralelizar todos estas funciones, sin tener que escalar todo el sistema. "

El lanzamiento también incluye soporte para MapReduce, una técnica de programación desarrollada originalmente por Google que facilita a los desarrolladores escribir programas para analizar grandes conjuntos de datos. El competidor de Aster Greenplum también anunció recientemente el soporte de MapReduce.

Las características adicionales incluyen la capacidad de seleccionar niveles de compresión de datos para tablas individuales, una herramienta de actualización de "un clic"; y mejores características de seguridad, como LDAP (Protocolo ligero de acceso a directorios) para la autenticación y la capacidad de administrar privilegios de usuario en los niveles de clúster, base de datos y tablas.

Muchos de los clientes iniciales de Aster, que también incluyen MySpace, se centran en la web, dijo Curt Monash, presidente de Monash Research.

"Una tremenda fracción del crecimiento y la oportunidad en el almacenamiento de datos radica en tratar con tipos relativamente nuevos de datos", dijo. "Hay grandes almacenes de datos que tratan OLTP tradicionales, datos transaccionales, pero Aster no es necesariamente un competidor líder en el análisis de eso. El punto óptimo en el análisis de grandes cantidades de datos son actualmente los datos de la web y los eventos de red asociados". Cita

Monash administración de procesamiento en paralelo y soporte para MapReduce como fortalezas clave de Aster: "Aster es una startup con un producto relativamente inmaduro, pero han pensado mucho en cómo hacer que el procesamiento paralelo sea fácil de administrar".

NCluster 3.0 ejecuta en servidores x86 estándar. El precio se basa en la cantidad de datos que se administran. La compañía dijo anteriormente que los costos comienzan en US $ 100,000.