INVESTIGADORES
PRATTA Guillermo Raul
congresos y reuniones científicas
Título:
Categorización de nuevos genotipos de tomate e identificación de caracteres de fruto que contribuyen a deferenciar ideotipos superiores
Autor/es:
FAVIERE, G.; VITELLESCHI, M.S.; PRATTA, G.R.
Lugar:
Rosario
Reunión:
Congreso; XIX Congreso y XXXVIII Reunión Anual de la SBR; 2017
Institución organizadora:
Sociedad de Biología de Rosario
Resumen:
En tomate (Solanum lycopersicum L.) es posible incrementar la calidad de los frutos y su vida poscosecha mediante programas de mejoramiento genético. La construcción de una regla de clasificación que permita tanto categorizar nuevos genotipos obtenidos por hibridación seguida de selección artificial como identificar los caracteres de fruto que contribuyen a diferenciar ideotipos superiores, resulta de interés como herramienta para explotar de forma eficiente la variabilidad generada. Una técnica no paramétrica promisoria para construir una regla de clasificación que presente esas utilidades es Random Forest (RF, o Bosques Aleatorios). Este método, incluido dentro de la disciplina del machine learning o aprendizaje automático, consiste en la generación de múltiples árboles de decisión a partir del conjunto de datos ingresado, en base a un algoritmo que selecciona en forma autónoma un grupo de observaciones para el entrenamiento y otro para la validación de la información originada. A partir de los árboles generados, se establece la clasificación de cada individuo u objeto según la categoría mayoritaria. El objetivo fue aplicar RF para categorizar un grupo de nuevos genotipos de tomate e identificar los caracteres que determinan su comportamiento diferencial. Se evaluaron 66 plantas pertenecientes a 8 RILs (Recombinant Inbred Lines, o Líneas Endocriadas Recombinantes) derivadas por selección antagónica y divergente a partir de un cruzamiento interespecífico de tomate: ToUNR1, ToUNR5, ToUNR6, ToUNR8, ToUNR9, ToUNR15, ToUNR17, ToUNR18. En cada planta se evaluaron los siguientes caracteres de fruto (registrándose el valor promedio): peso, diámetro, altura, forma, vida poscosecha, sólidos solubles, porcentaje de reflectancia, cociente de absorbencias entre 540 nm y 675 nm (a/b), firmeza, pH, acidez y número de lóculos. Para el análisis de datos, en una primera etapa se probaron distintos números de árboles de clasificación, y para cada uno de ellos se calcularon los porcentajes de error de clasificación global (PECG) y de error correspondiente a cada genotipo (ECCG). Luego, una vez determinado el número de árboles óptimo, se obtuvo a través de su combinación una clasificación global de los genotipos, cuya adecuación se verificó a través del error out-of-bag (OOB, o porcentaje de observaciones mal clasificadas). Finalmente, la contribución de cada carácter a la mejor clasificación lograda se estimó mediante Mean Decrease Accuracy (MDA, o Disminución Media en la Precisión) y Mean Decrease Gini (MDG, o Disminución Media en el Índice de Gini). A partir de PECG y ECCG, se determinó que el número óptimo de árboles de clasificación fue igual a 200. La combinación de estos 200 árboles permitió obtener una clasificación global de los genotipos, logrando diferenciar las 8 RILs con un error OOB de 0%. Los valores de MDG y MDA para esta clasificación global óptima coincidieron en determinar que los caracteres que contribuyen a diferenciar los genotipos fueron porcentaje de reflectancia, acidez, pH, sólidos solubles y firmeza. Como conclusión, RF resultó una técnica válida y efectiva para categorizar un grupo de nuevos genotipos de tomate e identificar los caracteres que determinar su comportamiento diferencial.