fbpx

Nuevo método detecta videos falsos con hasta un 99% de precisión

COMPARTE!

Los informáticos de UC Riverside pueden detectar expresiones faciales manipuladas en videos falsos con mayor precisión que los métodos actuales de vanguardia. El método también funciona como los métodos actuales en los casos en que se ha intercambiado la identidad facial, pero no la expresión, lo que lleva a un enfoque generalizado para detectar cualquier tipo de manipulación facial. El logro lleva a los investigadores un paso más cerca del desarrollo de herramientas automatizadas para detectar videos manipulados que contienen propaganda o información errónea.

Los desarrollos en el software de edición de video han facilitado el intercambio de la cara de una persona por otra y la alteración de las expresiones de las caras originales. A medida que líderes e individuos sin escrúpulos utilizan videos manipulados para influir en las opiniones políticas o sociales, muchos consideran que la capacidad de identificar estos videos es esencial para proteger las democracias libres. Existen métodos que pueden detectar con una precisión razonable cuando se han intercambiado rostros. Pero identificar caras en las que solo se han cambiado las expresiones es más difícil y, hasta la fecha, no existe una técnica fiable.

«Lo que hace que el área de investigación de deepfakes sea más desafiante es la competencia entre la creación y detección y prevención de deepfakes, que será cada vez más feroz en el futuro. Con más avances en los modelos generativos, los deepfakes serán más fáciles de sintetizar y más difíciles de distinguir de los reales. «, dijo el coautor del artículo Amit Roy-Chowdhury, profesor de ingeniería eléctrica e informática de la Facultad de Ingeniería de Bourns.

El método de UC Riverside divide la tarea en dos componentes dentro de una red neuronal profunda. La primera rama discierne las expresiones faciales y envía información sobre las regiones que contienen la expresión, como la boca, los ojos o la frente, a una segunda rama, conocida como codificador-descodificador. La arquitectura codificador-decodificador es responsable de la detección y localización de manipulaciones.

El marco, llamado Detección de Manipulación de Expresión, o EMD, puede detectar y localizar las regiones específicas dentro de una imagen que han sido alteradas.

«El aprendizaje multitarea puede aprovechar las características destacadas aprendidas por los sistemas de reconocimiento de expresiones faciales para beneficiar el entrenamiento de los sistemas de detección de manipulación convencionales. Este enfoque logra un rendimiento impresionante en la detección de manipulación de expresiones faciales», dijo el estudiante de doctorado Ghazal Mazaheri, quien dirigió la investigación.

Los conjuntos de datos de referencia para la manipulación facial se basan en el intercambio de expresión e identidad. Uno transfiere las expresiones de un video de origen a un video de destino sin cambiar la identidad de la persona en el video de destino. El otro intercambia dos identidades en un solo video.

Los experimentos en dos conjuntos de datos de manipulación facial desafiantes muestran que EMD tiene un mejor rendimiento en la detección no solo de manipulaciones de expresión facial sino también de cambios de identidad. EMD detectó con precisión el 99% de los videos manipulados.

El documento se titula «Detección y localización de manipulaciones de expresiones faciales» y se presentó en la Conferencia de invierno de 2022 sobre aplicaciones de visión artificial.


COMPARTE!

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *