Ghouti L
A integração da aprendizagem por reforço (RL) e da robótica tem sido aplicada com sucesso em vários ambientes industriais. Uma dessas configurações envolve a implantação de sensores sísmicos em amplos campos de petróleo e gás. O problema de implantação de sensores pode ser formulado como um problema de otimização desafiante onde os processos de decisão de Markov (MDPs) podem ser utilizados de forma eficiente. O nosso robô baseado em RL pode implantar sensores sísmicos em áreas suaves e acidentadas, cobrindo amplos campos de petróleo/gás. O nosso protótipo de robô resultou de um trabalho de inovação que está atualmente protegido por duas patentes publicadas nos EUA [1, 2]. Uma demonstração das capacidades do robô pode ser encontrada em [3, 4].