INVESTIGADORES
CABRERA Mario Roberto
congresos y reuniones científicas
Título:
El uso de redes neuronales para optimizar el proceso de foto identificación en tortuga verde (Chelonia mydas)
Autor/es:
BUTELER, CANDELA; CABRERA, MARIO R.; VELEZ RUBIO, GABRIELA
Lugar:
La Paloma
Reunión:
Congreso; VI Jornadas de Estadística Aplicada; 2021
Institución organizadora:
Universidad de la República, Uruguay
Resumen:
La identificación individual de animales puede brindar valiosa información ecológica. En tortugasmarinas, puede utilizarse el patrón de las escamas de los laterales de la cabeza para tal fin. Luego, con fotos de este patrón de escamas y su procesamiento a través de un software es posible identificarlas, metodología conocida como foto identificación. Generalmente, esto implica un procesamiento previo de las imágenes que puede demandar mucho tiempo. Para ciertos softwares, es necesario el recorte del área de interés. Los análisis de fotos bilaterales requieren separar el conjunto de fotos izquierdas por un lado y el de derechas por otro para posteriores análisis ya que las tortugas marinas no presentan simetría bilateral perfecta. El objetivo del presente trabajo es determinar la eficacia de redes convolucionales para discriminar entre fotos izquierdas de derechas de la especie de tortuga marina Chelonia mydas, en términos de tiempo, pérdida y precisión, con el set de datos original y con el set de datos aumentado a través derotaciones. De esta manera, lo que se busca es reducir el tiempo de procesamiento para realizar foto identificación cuando se tengan bases de datos muy extensas. Se utilizó la base de datos provenientes de la ONG Karumbé (Investigación y conservación de tortugas marinas en Uruguay) constituida por fotos de tortugas obtenidas desde 2001 hasta 2020. Esta base consta de un total de 3988 fotos: 1999 del perfil izquierdo y 1989 del derecho. En las imágenes se puede observar la cabeza y a veces partes del cuerpo (aletas o caparazón) así como fondos heterogéneos. Este trabajo fue realizado con lenguaje Python. Primero se procedió a cambiar el tamaño de las imágenes con el objetivo de que todas tuvieran la misma dimensión (200 x 200 pixeles). Las imágenes fueron guardadas en Google Drive y divididas en dos carpetas, “Derechas” e “Izquierdas” y fueron asignadas a una categoría correspondiente a la carpeta a la cual pertenecían. Las imágenes y sus categorías se convirtieron en array, es decir pasaron de lista a numpy. Luego, el conjunto de datos se dividió en conjunto de entrenamiento (80%) y testeo (20%). El siguientepaso fue convertirlas en float y estandarizarlas. Después, se cambiaron los niveles categóricos a one-hot. El conjunto de entrenamiento fue a su vez dividido en conjunto de entrenamiento y de validación. El set de datos original se utilizó para aumentar el número de fotos a través de rotaciones de -10 y +10 grados. Esta función permite crear a partir de una imagen original, imágenes rotadas en un ángulo determinado pero que posean el mismo tamaño. Se utilizó una red neuronal convolucional para el set de datos original y la misma red para el set de datos aumentado. La imagen de entrada fue de tamaño 200 x 200 x 3. La red constó de 9 capas (Conv2d, LeakyReLU, MaxPooling2D, Dropout, Fatten, Dense, LeakyReLU, Dropout y Dense) y 10240994 parámetros. Se realizaron 10 épocas. El set de datos original contó con 3190 imágenes de entrenamiento (2552 de entrenamiento propiamente dicho y 638 de validación) y 798 de testeo. El set de datos aumentados contó con 9570 imágenes de entrenamiento (7656 de entrenamiento y 1914 de validación). Para el set de datos original, el tiempo de procesamiento fue de 768 s; la pérdida fue de 0,5318 para los datos de validación y 0,4598 para los datos de testeo; y la precisión fue de 0,7313 para los datos de validación y de 0,7995 para los datos de testeo. Para el set de datos aumentado, el tiempo deprocesamiento fue de 2238 s; la pérdida fue de 0,4079 para los datos de validación y de 0,4064 para los datos de testeo; y la precisión fue de 0,8235 para los datos de validación y de 0,8145 para los datos de testeo. Se puede observar que tiene un efecto positivo realizar un aumento del set de datos original ya que mejora la precisión y la pérdida es menor, aunque el tiempo de procesamiento requerido es mayor. De esta manera, fue posible separar las fotos izquierdas de las derechas con una precisión del 82% para el set de datos aumentado. En futuros estudios podría evaluarse otras redes neuronales para mejorar la precisión.