Fonética forense

Francis Nolan

 

A tarefa forense  para qual os foneticistas  são  chamados  é  denominada identificação de falantes.  Normalmente  a  polícia    quer  saber  se  um  suspeito  é  o  orador  em  uma  gravação incriminadora.  Dada  a  plasticidade  da    voz  e  a  variabilidade  da  relação entre  a  fala  e  a  'máquina', muitas vezes os foneticistas  se afastam  da  identificação  e  preferem  utilizar denominações como comparação. Seja qual for a terminologia,  o  Santo  Graal  da  pesquisa   nessa  área  é um conjunto  de  propriedades recuperáveis do sinal da fala (muitas vezes  degradado)  e  que  variam  mais  entre os oradores do que  dentro da fala  de  um  indivíduo.

Durante sua aplicação forense inicial, na metade do  século XX,  o perito em fonética comparava  essencialmente  uma  extensão  da  dialetologia,  com foco  na  análise  auditiva  de  consoantes  e mais  particularmente  vogais,  dada  a  maior  robustez deste último  na  transmissão telefônica.  A  falta  de  valorização  do  potencial  de   equivalência perceptiva  em  sinais acústicos  distintos  e  do  tamanho  das populações     relevantes,  sem dúvida  levou  a  uma  superestimação  da  confiabilidade  do    método. À medida que a análise fonética acústica tornou-se  comum,  a  ênfase na comparação dos falantes  mudou   para  o método 'auditivo-acústico',  combinando  o  ouvido  treinado   com medidas de  parâmetros como frequência  fundamental  e formantes   vocálicos.   As  duas  abordagens  fornecem   em certa medida,  informações complementares.  O  método ‘auditivo-acústico’  continua sendo  o  paradigma  dominante  em  muitas  jurisdições,  incluindo o Reino Unido  e  a  Alemanha.  Mas   neste  século, tem início uma terceira, com a  disponibilidade  de  técnicas poderosas    para   verificação/identificação/ automática de falantes,   contando em grande parte  com  informações  espectrais  resultantes  do trato  vocal  e  codificadas (padronizadamente) como Coeficientes de  Frequência   Mel (MFCCs).).    Em condições ideais,  e  com  uma  população  de referência  adequada  para se basear, esses  métodos  podem  estimar a probabilidade de que a amostra de voz padrão tenha sido  produzida  pelo  suspeito em oposição a  outro  falante  da  população.

Os trabalhos desta discussão têm em comum que eles olham além das fontes usuais de informações específicas do orador, seja na pronúncia percebida, nas pistas acústicas (como formantes) usadas para caracterizar categorias linguísticas ou nos MFCCs de métodos automáticos relacionados ao trato vocal. A França compara compare explicitamente os MFCCs e uma caracterização espectral alternativa em termos de distribuições de formantes de longo prazo (LTFDs) com uma análise auditiva componencial da qualidade da voz. A última análise de 'VPA' é baseada nas configurações articulatórias de Laver [1]. Somente configurações supralaríngeas estão incluídas. As análises MFCC e LTFD mostram-se altamente correlacionadas e semelhantes no poder discriminatório do falante; a análise auditiva do VPA menos correlacionada e um pouco menos poderosa. Sugere-se que a análise da APV possa capturar informações parcialmente complementares sobre o trato vocal.

Chan investiga  o  potencial de caracterização do falante  de padrões tonais  em  mandarim  e  em   cantonês. Os tons  do    primeiro,  com  seu sistema de tom menos  lotado,  em geral  proporcionam  melhor  discriminação  dos  falantes. Se o nível  f0  for  normalizado,  a forma do contorno retém o poder discriminativo  do aferido . Além disso, Chan leva  em conta o  efeito  do ambiente   tonal,   mostrando  que a coarticulação  a tons 'conflitantes' em  ambos os lados  da sílaba  alvo  causa uma  redução significativa  da  discriminação  em  cantonês,  mas  não  em  mandarim.

Com o  trabalho  de  Kolly somos lembrados de que o ato de  falar  envolve  mais do que  as  palavras  ditas.  Eles não  olham  para  episódios  de  fala,  mas  para  os  pontos de parada  -  as  pausas. Mostra-se  que é  a medida que um alto-falante alterna  entre os nativos suíços, alemães, inglês e francês  há  um  grau  de  consistência  no número  e  duração  das  pausas nas frases de leitura, bem como a  variação  entre  os falantes.   Em linhas semelhantes, Braun  e  Rosin  mostram  que    há  variação  considerável  entre  os falantes na  distribuição  de  diferentes  tipos de fenômenos de  hesitação e que  a  distribuição  mostra  estabilidade entre gravações de  fala  espontânea em  três  dias diferentes . 

Todos esses  quatro  artigos  nos  lembram da  complexidade da  fala   e  da  multiplicidade  de  maneiras  pelas  quais  informações específicas do orador podem  ser  impressas  nele.  A fala  é cognitiva  e  física  e  também  é  crucialmente  voltada para ouvintes,  e  por isso  sujeita  a  restrições complexas.  O Gestalt  de  uma 'voz'  é  multifacetado, assim como  é  a  variação  dentro  dela. Esses  artigos  destacam a  individualidade  em características menos  óbvias  e  menos  pesquisadas  da    voz. O grande  desafio será    encontrar    formas  de  explorar  esses  padrões na comparação de falantes,   seja  dentro  do  método  auditivo-acústico de comparação de  falantes  ou  como  um adjunto  aos  métodos automáticos.

 

Referência

[1] Laver, J. (1980) A  Descrição Fonética  da Qualidade de Voz  Quality. Cambridge: Cambridge  University  Press