PROGRAMA NACIONAL CIENCIA Y JUSTICIA
Jorge Gurlekian: cuando la voz es una pista para hallar al autor de un delito
El investigador del CONICET brinda talleres de asesoramiento con pautas para manipular las evidencias de registros de habla en crímenes.
Las evidencias más clásicas que se extraen en una escena del crimen para encontrar al autor de un delito suelen ser muestras de ADN o rastros de huellas digitales. Pero no son las únicas: el registro de voces también es una herramienta de gran utilidad –aunque menos explorada- en el ámbito forense. El investigador del Consejo Nacional de Investigaciones Científicas y Técnicas (CONICET) y responsable del Laboratorio de Investigaciones Sensoriales (LIS) -miembro del Instituto de Inmunología, Genética y Metabolismo (INIGEM, CONICET-UBA)-, Jorge Gurlekian, se especializó en esa área de conocimiento: el de la comunicación verbal dentro de la Ingeniería Electrónica.
Gurlekian, que participó en el desarrollo de un software de reconocimiento automático del habla, también realizó la única base de datos con registro de voces argentinas. Porque, como él mismo explica, “los factores que permiten identificar a una persona a partir del registro de su voz son cientos. No solo importa cómo se dice, sino con qué palabras. La historia de una persona –su formación, su cultura, su vida familiar- se trasluce muchísimo en el lenguaje. Otro aspecto a tener en cuenta es el estilo según con quién se hable: con familiares, con amigos o en una clase con alumnos. Y el estado de salud: cansada, resfriada, todo eso afecta la voz”.
Es decir: existen infinitos modos de habla y cuestiones que la determinan: la región en la que se nace, la edad, la contextura física, el género, y también las características físicas del lugar donde hablamos, que también distorsiona nuestra voz: el ambiente, el ruido, la música. O el medio a través del cual nos comunicamos: mientras en la vida utilizamos unos ocho mil ciclos de frecuencias graves a agudas, por teléfono solo se captan tres mil. Por eso durante varios años, la ciencia creyó que era imposible reconocer una voz. “En los 80, la única prueba posible para reconocer una voz registrada en una escena del crimen era la llamada `perceptual`: se tenía una grabación –la evidencia- y se buscaba un panel de diez personas con buen oído –se sigue usando ahora el mismo método, similar al juicio por jurados de Estados Unidos-. Eran diez personas con entrenamiento musical, generalmente fonoaudiólogas. Se les daba una planilla con atributos -tonalidad, aguda o grave-, intensidad -habla fuerte o débil-, características de la voz -nasal, no nasal, rítmica, aleatoria-. Eran quince o veinte rasgos clasificados, con una escala cada rasgo de 0 a 5. Las personas debían escuchar la voz grabada –una frase- y la frase de los sospechosos. Y tenían que puntuar. Si era muy parecida, nada parecida, así con todas las características o atributos. Se sumaban las respuestas de todos, para cada atributo, y se hacía un promedio de identificación”, explica Gurlekian.
Años después, lo que siguió fue un derrotero de avances hasta llegar a nuevas herramientas. “Todos los años –recuerda Gurlekian- se reunían científicos del área de la comunicación verbal de renombre internacional para ver cómo lo podían mejorar”. Los investigadores, entonces, comenzaron a desarrollar bases de datos de voces: registros grabados de distintos lugares del mundo, para tener referencias y usar en técnicas probabilísticas.
Así, se comenzó a pensar técnicas para compensar la variabilidad del hablante. “Eso tomó ímpetu desde el año 2010 a esta parte y fue un salto fenomenal”, asegura el investigador, quien apunta a que el estímulo mayor para ello lo realizó el National Institute for Standards and Technology (NIST), de Estados Unidos. “En determinado momento, grabaron doscientas voces en EEUU nativos y provenientes de todas partes del mundo –chicanos, indios, latinos- como evidencia e hicieron bases de datos de habla inglesa. Luego lanzaron un concurso mundial: te mandaban la base de datos y doscientas voces grabadas para que digas si correspondían o no entre sí”. El segundo año que se lanzó el concurso, Gurlekian decidió participar con sus colegas del LIS. “Participamos y salimos cuartos en el mundo, junto con España, dentro de una lista que dieron de los veinte primeros participantes”.
El concurso fue un estímulo para que, en 2009, Gurlekian impulse la creación de una base de datos de voces en el país. Hizo una de dos mil hablantes, con voces grabadas con números, dígitos, apellidos, direcciones, frases ricas fonéticamente. Esa base esa se utiliza hoy para estudios de reconocimiento de habla y del hablante. ¿Cómo la hizo? Tal como él mismo explica, “dividí al país en regiones, de acuerdo a la variación dialectal. Busqué coordinadores en cada una de esas regiones –fonoaudiólogas-. Le dije a cada coordinador que grabase a cien personas. Acá en Buenos Aires se grabaron cuatrocientas, porque fue todo en proporción. Todos los que grabaron sus voces obtuvieron un número, que luego en la lotería se sorteó por concurso y se le entregó mil dólares a uno de esos participantes. Era la época del 1 a 1. A las coordinadoras, se les instruyó, se les dio un teléfono celular que fue donado por (una empresa de telefonía móvil), se hizo toda una logística: ellos tenían que llamar por teléfono acá a nuestro laboratorio para que los grabemos. En tres meses se hizo una base de mil personas, a través del teléfono. Después al año siguiente hicimos otra por celular y tuvimos una base representativa de dos mil personas de Argentina”.
Hoy, en el mundo se utilizan tres grandes métodos para realizar pericias judiciales sobre registros de voces en escenas del crimen: uno sigue siendo el perceptual –también conocido como “subjetivo auditivo”- , con un jurado de voces; otro es el método semiautomático –donde se miden formantes-, con una base de voces en un software que mide las características de una voz a través de métodos estadísticos; y un tercer método, el automático, que se desarrolló principalmente en Rusia, España y Argentina. “Es un sistema de identificación de voz que realizaron dos ex becarios de CONICET en nuestro laboratorio, y se llama Forensia”, comenta Gurlekian.
El científico, que además forma parte del Consejo Asesor del Programa Nacional Ciencia y Justicia, hoy da talleres de “Identificación forense de hablantes”, en los que explica cómo manipular la evidencia de una voz registrada en una escena del crimen. “Es necesario instruir a la policía que accede a la escena del crimen, para que al recoger esa evidencia no la adultere. Por ejemplo, en el caso del habla, grabar una voz y pasarla luego a formato MP3 es algo que parece inocuo y es terrible, porque distorsiona y lmita la señal. Algo tan sencillo –cómo grabar la evidencia- como eso puede llegar a alterarla. Por eso es fundamental instruirse en cómo tomar muestras y saber si la muestra es válida. La evidencia mal tomada –concluye- no sirve”.
Cintia Kemelmajer