INVESTIGADORES
OLIVIERI Alejandro Cesar
congresos y reuniones científicas
Título:
ALGORITMOS GENÉTICOS Y OPTIMIZACIÓN CON COLONIAS DE HORMIGAS APLICADOS A LA SELECCIÓN DE VARIABLES QUÍMICAS EN CALIBRACIÓN ANALÍTICA MULTIVARIADA
Autor/es:
BORTOLATO, S.; ALLEGRINI, FRANCO; OLIVIERI, ALEJANDRO
Lugar:
Santa Fe
Reunión:
Jornada; XVIII Jornadas de Jóvenes Investigadores de la AUGM; 2010
Resumen:
La computación natural se está empleando cada vez con mayor frecuencia para la resolución de múltiples problemas químicos. Ejemplos apropiados son los algoritmos genéticos e inmunes, la optimización con colonias de hormigas o enjambres de partículas, el templado simulado, las redes neuronales artificiales, etc. En la calibración analítica multivariada, en la que se correlacionan múltiples señales instrumentales con propiedades químicas de muestras o concentraciones de analitos específicos, es necesario usualmente seleccionar las variables o descriptores químicos más relevantes. El objeto de esta actividad es elegir un conjunto de variables significativas para calibrar un modelo multivariado que conduzca al menor error de predicción de la propiedad o concentración de interés en muestras independientes de contraste. Cuando el número de variables disponible es alto, como sucede con frecuencia en la calibración con datos espectroscópicos (cientos a miles de señales medidas a diferentes longitudes de onda), la selección de variables no puede realizarse en forma comprensiva en un tiempo razonable, requiriéndose algoritmos de búsqueda eficientes.Los algoritmos genéticos se han empleado profusamente en el pasado con el objetivo antes expresado, empleando una analogía con la evolución natural: las variables a seleccionar se asocian con un valor de 1 y las a descartar con un valor de 0. Con estos dígitos ("genes") se construye un vector llamado cromosoma. Luego de creada una población inicial de cromosomas, estos evolucionan mediante mecanismos similares a procesos de mutación y cría. Los cromosomas mejor adaptados (los que conducen a menores valores de una dada función objetivo, como el error de predicción en muestras independientes) son retenidos en cada generación, mientras que los peor adaptados se descartan. Después de un dado número de generaciones, el mejor cromosoma describe las variables más significativas a emplear en el modelo multivariado.La optimización con colonias de hormigas ha sido recientemente introducida en la literatura para propósitos similares de selección, restando aún analizar sus propiedades en conjuntos complejos de datos. Este algoritmo recurre a una analogía con la búsqueda de alimento por parte de un conjunto de hormigas; éstas recorren el espacio multidimensional dejando un rastro de "feromona" inversamente proporcional al valor de la función objetivo a minimizar. La feromona va evaporándose de ciclo en ciclo, pero se refuerza cuando las hormigas encuentran un camino eficiente (mejor valor de la función objetivo). Para el problema de selección de variables, éstas se asocian a dimensiones espaciales cuyas coordenadas permitidas son 1 ó 0 (selección o descarte de la variable correspondiente respectivamente).La habilidad selectiva de variables significativas de estos dos algoritmos se comparará frente a conjuntos de espectros de absorción en el infrarrojo cercano (NIR), destinados a la determinación de propiedades tales como los grados Brix en muestras de azúcar de caña, el número de octano en muestras de nafta y el contenido de materia grasa en semillas de oleaginosas. La medición de estas propiedades es de gran interés en las industrias alimentaria y petroquímica.