INVESTIGADORES
PRATTA Guillermo Raul
congresos y reuniones científicas
Título:
Clasificación de poblaciones de tomate por caracteres de fruto mediante Random Forest.
Autor/es:
FAVIERE, G.; VITELLESCHI, M.S.; GUILLERMO RAUL PRATTA
Lugar:
Rafaela
Reunión:
Jornada; III Jornadas Regionales de Genética del Litoral (SAG); 2018
Institución organizadora:
SAG
Resumen:
La clasificación de poblaciones es necesaria para obtener el máximo provecho de su variación genética. El objetivo fue clasificar 5 poblaciones de tomate (RIL1, RIL18, su F1 o Híbrido de Segundo Ciclo y ambas BCs) por 10 caracteres de fruto mediante Random Forest, un método que permiteconstruir una regla de clasificación con el menor error, reconociendo patrones a partir del conjunto de variables en estudio y proporcionando un ranking de la importancia de las variables que resultan fundamentales. Como método de referencia se aplicó Análisis Discriminante. Para dividir cada nodo de los árboles, se optó por seleccionar aleatoriamente 3 variables. Los porcentajes del error declasificación global fueron mínimos y similares tanto con 200 como con 300 árboles (28,26%), por lo que se decidió combinar 200. No hubo errores en la clasificación de los genotipos uniformes, siendo los errores de 9,09% en BC1 y 23,53% en BC2. Tanto las medidas MDA (Mean Decrease Accuracy) como MDG (Mean Decrease Gini) indicaron que forma, contenido en sólidos solubles y diámetro fueron los caracteres de fruto que más contribuyeron a la clasificación de estas poblaciones. Además, el Análisis Discriminante tuvo un error de clasificación mayor (43,48%). En un trabajo previo en que se aplicó Random Forest a un conjunto de RILs, se obtuvieron resultados similares aunque los errores en la clasificación de genotipos fueron nulos. Los errores encontrados en las BCs podrían ser atribuidos a su segregación genética. Se concluye que Random Forest es unmétodo apropiado para clasificar poblaciones de tomate