Palestrante
Descrição
A geração de gestos co-verbais expressivos é fundamental para a Interação Humano-Robô (IHR), mas garantir a sua correspondência semântica e emocional com a fala em tempo real permanece um desafio complexo. Este trabalho apresenta um sistema modular que gera, a partir de um único texto, tanto fala expressiva como gestos humanos e coerentes. A nossa abordagem processa o texto em dois caminhos paralelos para gerar simultaneamente: (1) fala com a entoação emocional apropriada, via análise de sentimento; e (2) movimento 3D de corpo inteiro alinhado ao conteúdo, através de um modelo de IA avançado (Transformer-based diffusion). Estes movimentos são depois adaptados à morfologia do robô por um algoritmo de redirecionamento de movimento (motion retargeting). A validação do sistema, realizada através de um estudo de perceção com participantes e de métricas objetivas, confirma que os gestos gerados são percebidos como significativamente mais apropriados para a fala, validando a coerência semântica e a qualidade da transferência de movimento.