INVESTIGADORES
PASTORE Juan Ignacio
artículos
Título:
Algoritmo goloso de selección de características para aplicación a datos de microarray
Autor/es:
BOUCHET, A.; PASTORE, J.; GONZALEZ, A.; BALLARIN, V.; BRUN, M.
Revista:
Mecanica Computacional
Editorial:
Asociación de Mecánica Computacional
Referencias:
Lugar: Santa Fé. Argentina; Año: 2007 vol. XXVI p. 2145 - 2151
ISSN:
1666-6070
Resumen:
El objetivo del análisis de la expresión genética es generar un algoritmo que permita asignarca cada patrón de expresión un fenotipo y que éste se corresponda con el fenotipo verdadero del paciente bajo análisis. Este análisis también puede ser útil para determinar los genes cuya expresión caracteriza los fenotipos patológicos. Para ello los especialistas deben construir arreglos experimentales que permitan confirmar los datos obtenidos a partir de los algoritmos. Uno de los mayores problemas que se presenta en el análisis estadístico de microarreglos es el de la gran dimensionalidad de los datos con respecto a la cantidad disponible de muestras. El error verdadero de un clasificador, diseñado a partir de los datos, disminuye cuando aumenta la cantidad de características, hasta cierto número óptimo a partir del cuál el error se incrementa nuevamente. Para solucionar este problema es necesario aplicar algoritmos de selección y extracción de características. En este trabajo presentamos un algoritmo goloso que puede seleccionar un conjunto de características, con baja correlación entre si, que permite predecir la variable dependiente. Este algoritmo mantiene el objetivo original de seleccionar genes altamente correlacionados a la variable dependiente, pero con un factor de peso dado por su máxima correlación a algún elemento del conjunto seleccionado en la iteración anterior. El funcionamiento del algoritmo fue probado mediante datos simulados. En todos los casos fue posible seleccionar las mejores características a partir de muchos candidatos en tiempo razonable, obteniendo resultados con alto nivel de predicci´on y menor tamaño.