INVESTIGADORES
GUISONI Nara Cristina
congresos y reuniones científicas
Título:
Identificación de células pluripotentes a partir de datos de expresión génica de células únicas usando redes de interacción de proteínas
Autor/es:
DANIELA SENRA; NARA GUISONI; LUIS DIAMBRA
Lugar:
San Carlos de Bariloche
Reunión:
Congreso; 106a Reunión Nacional de Física; 2022
Institución organizadora:
AFA
Resumen:
Un estado celular puede ser establecido según la variedad y cantidad de las proteínaspresentes en la célula. Éstas, a su vez, están determinadas por los niveles de actividad delos genes asociados a cada proteína, es decir, por su transcriptoma. La tecnología actualpermite acceder a esta información en células individuales mediante la secuenciación de su ARN, lo que equivale a generar datos para decenas de miles de genes en decenas de milese incluso millones de células, configurando un problema típico de big-data. Esta técnica estásiendo ampliamente utilizada para definir estados celulares conocidos y determinar nuevostipos celulares. También ofrece una capacidad prometedora para explicar los procesos dedesarrollo. En este sentido, la cuantificación de la pluripotencia es relevante paracomprender los procesos de diferenciación, los linajes celulares y la jerarquía de linajes.Esta herramienta también es aplicada en la investigación del cáncer, por ejemplo, paraidentificar las células madre cancerosas, que se han sugerido como responsables de lametástasis, remisión y resistencia a las terapias.Los datos de transcriptoma de célula única (scRNA-seq) permiten el ordenamientopseudotemporal de las células individuales a lo largo de una trayectoria de diferenciación.Esta inferencia de trayectorias involucra el uso de un conjunto de técnicas computacionalespara el tratamiento de datos multidimensionales. Previo a la inferencia de trayectorias,muchas veces es necesario determinar el origen de las trayectorias, es decir, las célulasmadre o progenitoras. En este trabajo, proponemos una herramienta para cuantificar lapluripotencia a partir de datos de scRNA-seq. Nuestro enfoque utiliza la red de interacciónproteína-proteína asociada con el proceso de diferenciación y la matriz de expresión génicapara calcular un índice que llamamos “actividad de diferenciación”. Esta medida refleja quétan activa es la red de diferenciación para cada célula. Comparamos el rendimiento denuestro algoritmo con dos herramientas publicadas anteriormente, para cuatro conjuntos dedatos de scRNA-seq: mama, colon, médula ósea y pulmón. Los métodos son comparadosen términos de eficiencia, requerimiento de memoria RAM, interpretabilidad biológica, entreotros. Finalmente realizamos un flujo de trabajo completo desde la matriz de cuentas crudashasta la inferencia de trayectoria utilizando el conjunto de datos de mama.