Slurm que significa (Utilidad simple de Linux para la gestión de recursos)es un programador de tareas y administrador de cargas de trabajo excelente, potente, modular y de código abierto creado para clústeres de Linux de cualquier tamaño. Slurm es un sistema de gestión de clústeres y programación de trabajos tolerante a fallas y altamente conectable con muchos complementos opcionales que puede usar. Brinda administración de carga de trabajo en varias computadoras poderosas y centros de datos en todo el mundo.
Las funciones principales de Slurm
Slurm tiene tres funciones principales, en primer lugar, asigna acceso exclusivo y/o no exclusivo a los recursos a los usuarios que desean realizar algún trabajo durante un período de tiempo determinado. A continuación, Slurm utiliza un marco que ayuda a iniciar, ejecutar y monitorear el trabajo en un conjunto de hosts asignados en un clúster y su función final es que controla el uso de recursos al administrar una cola de trabajo pendiente.
Características exclusivas de Slurm
Puede encontrar muchos administradores de carga de trabajo, pero Slurm tiene muchas características únicas que lo diferencian de otros administradores de carga de trabajo y estas características incluyen:
Arquitectura Slurm
El sistema Slurm se basa en un administrador centralizado, slurmctld que monitorea diferentes recursos y trabajos, y puede incluir un administrador de respaldo responsable para proteger el estado del sistema en caso de cualquier falla. Cada host en el clúster tiene un daemon slurmd que se compara con un shell remoto y recibe el trabajo, lo ejecuta, devuelve el estado y luego espera a que se ejecute más trabajo. el daemon también permite la comunicación tolerante a fallas en la jerarquía de configuración del sistema. También hay un slurmdbd(daemon de base de datos slurm) opcional que se usa para registrar información contable de varios clústeres administrados por Slurm en una sola base de datos. Puede leer sobre la arquitectura completa desde aquí
A continuación se muestra una imagen que muestra los diferentes componentes del sistema Slurm
Componentes del sistema Slurm
Una imagen que muestra diferentes entidades del sistema Slurm
Entidades del sistema Slurm
Lea el cliente testimonios sobre Slurm. Es posible que desee comprobar y probar el sistema de gestión de clústeres y programación de trabajos de Slurm si está trabajando en clústeres de Linux de cualquier tamaño. Para cualquier información adicional, puede dejar sus pensamientos sobre Slurm aquí dejando un comentario en la sección de comentarios a continuación.