3 – 5 de dez. de 2025
FEEC / UNICAMP
Fuso horário America/Sao_Paulo
É com grande satisfação que convidamos toda a comunidade do DCA a participar da décima sétima edição do nosso tradicional encontro

Unificado ou Dual: Otimização de Aprendizado por Reforço Baseado em Drives para Robôs Cognitivos Autônomos

4 de dez. de 2025 14:34
12m
Sala da Congregação (FEEC / UNICAMP)

Sala da Congregação

FEEC / UNICAMP

Av. Albert Einstein, Nº 400
Trabalho consolidado ou em conclusão Sessões orais

Palestrante

Leonardo Rossi (FEEC / Unicamp / H.IAAC)

Descrição

Este resumo expandido sintetiza e adapta um estudo que compara duas estratégias de aprendizado por reforço (AR) para otimização de drives motivacionais em agentes cognitivos autônomos: (i) 1-LDO (Unified Learning for Drives Optimization), que utiliza um único learner (Q-Table/DQN) para todas as motivações, e (ii) 2-LDO ( Dual Learning for Drives Optimization), que desacopla o aprendizado por tipo de drive e prioriza, a cada passo, o mais ativo. As estratégias são ancoradas na Teoria da Redução de Drives de Hull e implementadas em uma arquitetura cognitiva com módulos sensoriais, atencionais, motivacionais e de aprendizado, em um ambiente simulado com a robô humanoide Marta. Os resultados indicam que: (a) DQN tende a reduzir o estresse (soma de ativações dos drives de curiosidade e sobrevivência) com maior estabilidade, especialmente em 2-LDO; (b) Q-Learning pode ser competitivo em cenários mais grosseiros (passos maiores de bateria); (c) a granularidade do ambiente influencia significativamente o aprendizado e a homeostase.

Autores

Leonardo Rossi (FEEC / Unicamp / H.IAAC) Dr. Letícia Mara Berto (University of Manchester)

Co-autores

Dr. Alexandre da Silva Simões (Unesp Sorocaba) Dr. Esther Luna Colombini (IC / Unicamp / H.IAAC) Dr. Paula Dornhofer Paro Costa (FEEC / Unicamp / H.IAAC) Dr. Ricardo Ribeiro Gudwin (FEEC / Unicamp / H.IAAC)

Materiais de apresentação