BECAS
SENRA Daniela
congresos y reuniones científicas
Título:
Identificación de células pluripotentes a partir de datos de expresión génica de células únicas usando redes de interacción de proteínas
Autor/es:
SENRA, DANIELA; GUISONI, NARA; DIAMBRA, LUIS
Lugar:
San Carlos de Bariloche
Reunión:
Congreso; 107 Reunión de la Asociación de Física Argentina; 2022
Resumen:
Un estado celular puede ser establecido según la variedad y cantidad de las proteı́nas presentes en la célula. Éstas, a su vez, están determinadas por los niveles de actividad de los genes asociados a cada proteı́na, es decir, por su transcriptoma. La tecnologı́a actual permite acceder a esta información en células individuales mediante la secuenciación de su ARN, lo que equivale a generar datos para decenas de miles de genes en decenas de miles e incluso millones de células, configurando un problema tı́pico de big-data. Esta técnica está siendo ampliamente utilizada para definir estados celulares conocidos y determinar nuevos tipos celulares. También ofrece una capacidad prometedora para explicar los procesos de desarrollo. En este sentido, la cuantificación de la pluripotencia es relevante para comprender los procesos de diferenciación, los linajes celulares y la jerarquı́a de linajes. Esta herramienta también es aplicada en la investigación del cáncer, por ejemplo, para identificar las células madre cancerosas, que se han sugerido como responsables de la metástasis, remisión y resistencia a las terapias.Los datos de transcriptoma de célula única (scRNA-seq) permiten el ordenamiento pseudotemporal de las células individuales a lo largo de una trayectoria de diferenciación. Esta inferencia de trayectorias involucra el uso de un conjunto de técnicas computacionales para el tratamiento de datos multidimensionales. Previo a la inferencia de trayectorias, muchas veces es necesario determinar el origen de las trayectorias, es decir, las células madre o progenitoras. En este trabajo, proponemos una herramienta para cuantificar la pluripotencia a partir de datos de scRNA-seq. Nuestro enfoque utiliza la red de interacción proteı́na-proteı́na asociada con el proceso de diferenciación y la matriz de expresión génica para calcular un ı́ndice que llamamos actividad de diferenciación. Esta medida refleja qué tan activa es la red de diferenciación para cada célula. Comparamos el rendimiento de nuestro algoritmo con dos herramientas publicadas anteriormente, para cuatro conjuntos de datos de scRNA-seq: mama, colon, médula ósea y pulmón. Los métodos son comparados en términos de eficiencia, requerimiento de memoria RAM, interpretabilidad biológica, entre otros. Finalmente realizamos un flujo de trabajo completo desde la matriz de cuentas crudas hasta la inferencia de trayectoria utilizando el conjunto de datos de mama.