PERSONAL DE APOYO
LEZCANO Nelson Facundo
datos académicos
Título/s
Ingeniero en Informática
Categoría
PROFESIONAL ADJUNTO
Tarea
- Continuar con el soporte a usuarios y asistencia técnica relacionados al uso de los clusters y a la infraestructura de tecnologías de información en general. - Mejorar la documentación para el uso de los clusters: generar una documentación más detallada y alojarla en una wiki especializada o migrarla a una plataforma en nube, como por ejemplo, readthedocs. - Actualizar políticas de uso del clúster Pirayú: en particular se pedirá a usuarios externos hacer uso de mecanismos que permitan hacer checkpoints de sus ejecuciones, de manera de que estas puedan ser reanudadas posteriormente si se detienen. Esta política permitirá evitar el desperdicio de recursos y energía que se tendrían si los resultados de una corrida se perdieran al ser interrumpida la ejecución. Será necesario ayudar a implementar este feature en caso de que el software no lo provea, o asistirlos en el uso de herramientas externas para este fin, tales como DMTCP. - Llevar a cabo el reempadronamiento de usuarios del clúster Pirayú para deshabilitar usuarios inactivos. - Encuestar a los usuarios en ciertos puntos que hacen a la relevancia del clúster Pirayú como una herramienta de trabajo diaria y esencial: consultar sobre la cantidad de papers que han publicado haciendo uso del clúster y cantidad de papers que esperan poder generar el próximo año usando el mismo; saber si han incluido gastos de horas de cómputo en su presupuesto, si han colaborado o no económicamente, o si lo piensan hacer en el futuro. El resultado de esta encuesta podría resaltar la importancia que tiene el clúster en sus trabajos de investigación y ayudar a impulsar una mayor participación desde el punto de vista presupuestario, permitiendo que el clúster siga funcionando y siendo mantenido de manera apropiada. - Completar la migración de usuarios y nodos de cómputo del clúster Pirayú a la implementación más reciente de dicho clúster. En la actualidad una pequeña fracción de nodos de corren en sistemas operativos antiguos debido a que ciertos usuarios dependen de paquetes de software legacy preparados para correr de forma óptima en esos equipos. Por ese motivo migrar los usuarios implica también migrar esas aplicaciones de manera que puedan ser lanzadas en el sistema operativo con el que cuenta Pirayú actualmente. - Mediante el software GLPI registrar e inventariar la infraestructura y hardware de los clusters, eventos de mantenimientos, y resolución de tickets de tareas. - Documentar procedimientos internos en el software de gestión documental Alfresco. - Continuar con la migración de servicios alojados en servidores bare metal hacia servidores virtualizados. Esto permitirá simplificar las tareas de mantenimiento, backup y control, y también mejorar la eficiencia del uso de recursos de hardware y consumo eléctrico. - Actualizar el sistema operativo y los servicios del servidor de licencias de software ya que actualmente cuenta con uno obsoleto y con vulnerabilidades de seguridad conocidas. - Mejorar el sistema de reporte de estadísticas de clusters XDmoD agregando plugins para el análisis de rendimiento de los jobs de cómputo. - Estudiar la factibilidad de implementar un modelo de inteligencia artificial que pueda ser adecuado para la asistencia en problemas frecuentes en el uso del cluster y envío de jobs. Así también ver la posibilidad de implementar un monitoreo inteligente de los jobs que corren en los clusters para detectar problemas de uso inadecuado de los recursos, subocupación, cuellos de botella de IO, entre otros. Se espera que puedan ser reportados automáticamente al usuario. El modelo debería poder leer las métricas de las fuentes de datos del servicio Prometheus con el cual los obtenemos, e incluso analizar las gráficas provistas por el servicio de Grafana. - Actualizar el sistema operativo del clúster Pirayú y los paquetes base. Específicamente, deberemos migrar de Rocky 8.6 a Rocky 8.10, distribución que nos otorga soporte de seguridad hasta el año 2029. - Comenzar con las tareas de soporte a usuarios y administración de la SuperComputadora Clementina XXI.
Director
RAMAJO, DAMIAN ENRIQUE / INV INDEPENDIENTE
Lugar de trabajo
[CIMEC] CENTRO DE INVESTIGACION DE METODOS COMPUTACIONALES -
[CCT SANTA FE] CENTRO CIENTIFICO TECNOLOGICO CONICET - SANTA FE -
[CONICET] CONSEJO NACIONAL DE INVESTIGACIONES CIENTIFICAS Y TECNICAS -