El eco digital de la voz

Continuando con el estudio particular de los diversos datos susceptibles de comparación para fines biométricos, encontramos la medición de un dato que, quizá es el más común e ilustrativo de la huella humana de las personas en su interacción social, que, a la par del nombre, representa una de las improntas más relevantes que se generan en la consciencia individual y colectiva de las personas a partir de la expresión de las ideas y los sentimientos, y que, quizá cumple con un propósito más allá de la simple comunicación, sino que, como uno de los sentidos y mecanismos de integración con el entorno físico y digital, constituye una de los más altos mecanismos de interacción con el entorno a partir de la emisión de sonidos, que representa la vía más básica y a la vez, más depurada de interacción de las personas en un entorno social.

Si se identifica, en general la socialización e interacción humana se produce a través de la combinación armónica de los distintos medios con los que cuenta la humanidad para reconocerse en lo individual y para construir humanidad, lo cual, provoca que la conformación del colectivo de cultura y conocimiento constituye una combinación de las expresiones y percepciones humanas, que, comparándolas como máquinas cuentan con la percepción y obtención de información a través de los sentidos de la vista, el olfato, el tacto, el gusto y el oído, los cuales son interpretados a través del cerebro en función de una serie de códigos y formas, que, encuentran a la expresión oral como la principal expresión de interacción para la socialización, que se complementa a través de la sensibilización de los diversos sentidos para crear una experiencia mental, a partir de la intelectualización de las ideas complementadas a través de los registros físicos, de lo cual, se nutre la vista, así como, la percepción del olfato, el gusto y el tacto, que a la vez, se traducen en experiencias que interpretan el entorno físico.

Particularmente, la interacción de información entre el oído y la voz, representan, como puede advertirse la base de la socialización a partir del que representa el único sentido que cuenta con un canal natural para el intercambio de las ideas y la conformación del raciocinio a partir de la interpretación mental de una serie de expresiones a partir del sonido que son interpretables por el cerebro, como el mecanismo esencial de la interacción con ondas y frecuencias percibidas y generadas por el cuerpo humano, lo cual, provoca que más allá de la generación de ideas, se generen registros puntuales de la identidad de las personas que las expresan y que, desde el ámbito filial permiten generar memorias en torno a las experiencias surgidas con la interacción humana, no obstante, la generación de sonidos representan una amplia gama de funciones con las que el ser humano interactúa, además de la transmisión de ideas, para percibir emociones, generar interacción con el entorno y, emular las características de los objetos que rodean la existencia, encontrando además las altas expresiones de esta sensibilidad a partir del canto.

Sin embargo, como mecanismo básico de expresión y más allá de las experiencias sensibles que provoca la memoria en torno a la expresión de una persona con relación a otra, sea a través de la simple voz o, mediante protocolos más elaborados, como lo es el canto, la voz de las personas cuenta con parámetros medibles regulares que permiten, mediante su tratamiento biométrico, utilizar la representación de los sonidos en registros de información, para hacerlo comparable para efectos de identificación y autenticación, lo cual, inclusive lo hace mucho más confiable cuando se combina con parámetros dinámicos como podría ser dicción de una palabra o una frase que provoca que, se vuelva una clave difícil de emular, salvo que ésta sea conocida en contravención de las medidas de seguridad establecidas para tales efectos.

La producción de la voz, requiere, cuando menos, tres elementos básicos, por una parte la respiración como fuente de energía y potencia; la fuente sonora a partir de la laringe y la vibración de las cuerdas vocales, y, la caja de resonancia, que genera la modificación del sonido base y la articulación a partir de la estructura anatómica sobre la cual la persona genera el sonido, lo cual, quizá constituya la parte fundamental para atribuir las características particulares para cada tonalidad de la voz.

Como en el caso de los biométricos, se llama el uso de una huella, en lo particular, hablamos de la huella vocal que se conforma a partir de la captura los rasgos únicos de cada usuario, su aparato fonador, con el objetivo de identificarlo con una certeza, es capaza de identificar 100 parámetros físicos de la voz, la frecuencia vocal y la cavidad buco-nasal, de tal modo que el índice de certeza es bastante amplio, prácticamente similar a la huella dactilar; estas características pueden incluir el tono, el timbre, la entonación, la frecuencia o ritmo de la voz.

Generalmente se utiliza para fines de autenticación, es decir, para comprobar que un usuario es quién dice ser, y para tales efectos se utilizan dos mecanismos principales como son el uso de frases previamente grabadas o la interacción en una conversación con el sistema de validación a fin que, durante el transcurso de dicha plática se reconozcan los principales parámetros registrados para la persona; este sistema biométrico cuenta con una alta eficacia puesto que la combinación de características provocan que la identificación del usuario solamente pueda darse en altas grados de probabilidad, razón por la cual, se ha extendido su uso en el sector bancario.

Dadas las características de su uso, se vuelve un mecanismo bastante confiable en efectividad para acreditar la identidad de las personas, sin embargo, considerando los elementos que deben estar predefinidos para realizar la captura, la funcionalidad de este mecanismo constituye el principal inconveniente para su adopción fuera de entornos controlados, por lo que, si bien se observa que es un mecanismo de autenticación confiable para entornos como el bancario, todavía encuentra oportunidades importantes para su uso a través de aplicaciones de uso externo como en el caso de las aplicaciones comunes en los teléfonos inteligentes.

Como principal amenaza para dicho mecanismo se encuentran los programas de edición de voz manuales o con inteligencia artificial, que en virtud del tipo de funcionalidad esperada pudiera estar frente a una situación de riesgo en mayor o menor medida, particularmente frente al uso de sistemas de inteligencia artificial que de manera dinámica pudieran emular las características de una persona, situación con la cual, se complicaría su uso frecuente y extendido frente a la vulnerabilidad de un sistema que pudiera ser corrompido a través de una máquina, o mediante la intervención humana si se combina la interfaz de inteligencia artificial con la realidad aumentada, provocando que una persona utilizando su voz, mediante un sintetizador, pueda imitar las características de una persona, equilibrando los diversos picos dinámicos y equilibrándolos conforme la tendencia medible del comportamiento de una persona.

Hasta la próxima.

L	M	X	J	V	S	D
« Abr
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30	31