IQUIFIB   02644
INSTITUTO DE QUIMICA Y FISICOQUIMICA BIOLOGICAS "PROF. ALEJANDRO C. PALADINI"
Unidad Ejecutora - UE
congresos y reuniones científicas
Título:
Dataminig en Pfam
Autor/es:
DI DOMENICO TOMAS; JOSE MARIA DELFINO; MORTEN NIELSEN; CRISTINA MARINO BUSLJE
Lugar:
Universidad Nacional de Quilmes
Reunión:
Workshop; Biología Computacional de Proteínas; 2009
Institución organizadora:
Universidad Nacional de Quilmes
Resumen:
<!-- /* Style Definitions */ p.MsoNormal, li.MsoNormal, div.MsoNormal {mso-style-parent:""; margin:0cm; margin-bottom:.0001pt; mso-pagination:widow-orphan; font-size:12.0pt; font-family:"Times New Roman"; mso-fareast-font-family:"Times New Roman";} @page Section1 {size:595.3pt 841.9pt; margin:70.85pt 3.0cm 70.85pt 3.0cm; mso-header-margin:35.4pt; mso-footer-margin:35.4pt; mso-paper-source:0;} div.Section1 {page:Section1;} --> Pfam es una base de datos comprehensiva y precisa de familias y dominios de proteínas. Cada entrada de PfamA es generada con un alineamiento semilla curado de secuencias seleccionadas con las cuales se genera un perfil de Hidden Markov models (HMMs). Con este perfil se construye automáticamente un alineamiento completo con todas las secuencias proteicas detectadas como de la familia. PfamA ademas contiene accesion numbers permanentes, tiene anotación funcional y cross-referencias con otras bases de datos. La versión actual de NCBI-PfamA es la 23 la cual fue liberada en Septiembre 2008. Contiene 10340 familias de proteínas que cubren el 72% de las proteínas depositadas en UNIPRO-KB. Aunque hay varias herramientas en la web para acceder y manipular los datos, hay muchas ventajas en trabajar localmente con la base de datos relacional que es públicamente disponible. En este trabajo presentamos algunas guías para realizar una instalación local, mostrar estadística descriptiva y analizar los datos contenidos. Además proponemos el uso de herramientas que permitirán al usuario explotar los datos contenidos de una manera mas adecuada a cada necesidad.