PERSONAL DE APOYO
LEZCANO Nelson Facundo
datos académicos
Título/s
Ingeniero en Informática
Categoría
PROFESIONAL ADJUNTO
Tarea
- Continuar con el soporte a usuarios y asistencia técnica relacionados al uso de los clusters y a la
infraestructura de tecnologías de información en general.
- Mejorar la documentación para el uso de los clusters: generar una documentación más detallada y
alojarla en una wiki especializada o migrarla a una plataforma en nube, como por ejemplo, readthedocs.
- Actualizar políticas de uso del clúster Pirayú: en particular se pedirá a usuarios externos
hacer uso de mecanismos que permitan hacer checkpoints de sus ejecuciones, de manera de que
estas puedan ser reanudadas posteriormente si se detienen. Esta política permitirá evitar el
desperdicio de recursos y energía que se tendrían si los resultados de una corrida se perdieran al ser
interrumpida la ejecución. Será necesario ayudar a implementar este feature en caso de que el
software no lo provea, o asistirlos en el uso de herramientas externas para este fin, tales como
DMTCP.
- Llevar a cabo el reempadronamiento de usuarios del clúster Pirayú para deshabilitar usuarios
inactivos.
- Encuestar a los usuarios en ciertos puntos que hacen a la relevancia del clúster Pirayú como una
herramienta de trabajo diaria y esencial: consultar sobre la cantidad de papers que han publicado
haciendo uso del clúster y cantidad de papers que esperan poder generar el próximo año usando el
mismo; saber si han incluido gastos de horas de cómputo en su presupuesto, si han colaborado o no
económicamente, o si lo piensan hacer en el futuro. El resultado de esta encuesta podría resaltar la
importancia que tiene el clúster en sus trabajos de investigación y ayudar a impulsar una mayor
participación desde el punto de vista presupuestario, permitiendo que el clúster siga funcionando y
siendo mantenido de manera apropiada.
- Completar la migración de usuarios y nodos de cómputo del clúster Pirayú a la implementación
más reciente de dicho clúster. En la actualidad una pequeña fracción de nodos de corren en sistemas
operativos antiguos debido a que ciertos usuarios dependen de paquetes de software legacy
preparados para correr de forma óptima en esos equipos. Por ese motivo migrar los usuarios implica
también migrar esas aplicaciones de manera que puedan ser lanzadas en el sistema operativo con el
que cuenta Pirayú actualmente.
- Mediante el software GLPI registrar e inventariar la infraestructura y hardware de los clusters,
eventos de mantenimientos, y resolución de tickets de tareas.
- Documentar procedimientos internos en el software de gestión documental Alfresco.
- Continuar con la migración de servicios alojados en servidores bare metal hacia servidores
virtualizados. Esto permitirá simplificar las tareas de mantenimiento, backup y control, y también
mejorar la eficiencia del uso de recursos de hardware y consumo eléctrico.
- Actualizar el sistema operativo y los servicios del servidor de licencias de software ya que
actualmente cuenta con uno obsoleto y con vulnerabilidades de seguridad conocidas.
- Mejorar el sistema de reporte de estadísticas de clusters XDmoD agregando plugins para el
análisis de rendimiento de los jobs de cómputo.
- Estudiar la factibilidad de implementar un modelo de inteligencia artificial que pueda ser
adecuado para la asistencia en problemas frecuentes en el uso del cluster y envío de jobs. Así
también ver la posibilidad de implementar un monitoreo inteligente de los jobs que corren en los
clusters para detectar problemas de uso inadecuado de los recursos, subocupación, cuellos de
botella de IO, entre otros. Se espera que puedan ser reportados automáticamente al usuario. El
modelo debería poder leer las métricas de las fuentes de datos del servicio Prometheus con el cual
los obtenemos, e incluso analizar las gráficas provistas por el servicio de Grafana.
- Actualizar el sistema operativo del clúster Pirayú y los paquetes base. Específicamente, deberemos
migrar de Rocky 8.6 a Rocky 8.10, distribución que nos otorga soporte de seguridad hasta el año
2029.
- Comenzar con las tareas de soporte a usuarios y administración de la SuperComputadora
Clementina XXI.
Director
RAMAJO, DAMIAN ENRIQUE / INV INDEPENDIENTE
Lugar de trabajo
[CIMEC] CENTRO DE INVESTIGACION DE METODOS COMPUTACIONALES -
[CCT SANTA FE] CENTRO CIENTIFICO TECNOLOGICO CONICET - SANTA FE -
[CONICET] CONSEJO NACIONAL DE INVESTIGACIONES CIENTIFICAS Y TECNICAS -
[CCT SANTA FE] CENTRO CIENTIFICO TECNOLOGICO CONICET - SANTA FE -
[CONICET] CONSEJO NACIONAL DE INVESTIGACIONES CIENTIFICAS Y TECNICAS -