O projeto "Aprendendo Algoritmos de Otimização Combinatória através de Aprendizagem por Reforço Profunda" buscou investigar o desempenho de métodos DRL em diferentes problemas de otimização combinatória e otimização global, para compreender as vantagens, desvantagens e limitações desses métodos. Durante o período de Maio/2021 a Agosto/2021, foi estudado o caso de otimização global.
Com esse intuito, o projeto foi divido em 4 etapas distintas: (1) Revisão da literatura; (2) Definição do arranjo experimental e escolha dos algoritmos DRL para testes; (3) Criação e organização dos códigos em repositório público; (4) Escrita do artigo e execução dos experimentos.
Durante a etapa (1), foram levantados os métodos DRL estado da arte e diferentes problemas clássicos de otimização global. Além disso, foram pontuados diferentes trabalhos que consideraram abordagens DRL para otimização global, demonstrando que esse é um tópico recente, animado e promissor. Todavia, foi-se verificado a existência de um cenário pouco estudado: alta dimensionalidade e os algoritmos de otimização aprendidos são de ordem zero (i. e., não dependem das derivadas da função a ser otimizada). Dessa forma, os experimentos foram realizados considerando esse cenário.
Já durante a etapa (2), foram definidos o arranjo experimental e os algoritmos DRL usados para os experimentos. Foram considerados 8 problemas de otimização global e 5 algoritmos DRL Policy Search (REINFORCE, SAC, TD3, PPO e TD3-IG, uma versão modificada do TD3 proposta neste trabalho). Os experimentos consistiam em 2 fases: (i) Uma fase de treinamento, onde os métodos escolhidos são utilizados para se aprender um algoritmo de otimização; (ii) Uma fase de avaliação, onde os algoritmos aprendidos são comparados entre si. Ademais, durante essa etapa também foram escolhidos os hiperparâmetros para cada um dos algoritmos.
Durante as etapas (3) e (4), foram implementados os algoritmos escolhidos e executados os códigos de treino e avaliação. Os resultados apontam que os métodos DRL Policy Search considerados conseguiram aprender algoritmos de otimização de ordem zero para grandes dimensões. Em especial, as adaptações incorporadas no TD3-IG permitiram aprender, de forma geral, algoritmos de otimização mais rápidos, robustos e precisos quando comparados aos demais. Todavia, são necessárias mais investigações considerando outros algoritmos e adaptações.
As apresentações ocorreram nos dias 06 e 07 de dezembro de 2021.
Comissão Organizadora
Congresso de Iniciação Cientifica - CIC
Comissão Científica
A comissão científica foi formada por mais de 400 avaliadores entre professores dos diferentes Departamentos e Unidades Acadêmicas da UFRPE e pesquisadores doutores de outras instituições do estado de Pernambuco
Para maiores informações e-mail: cic@ufrpe.br
Para certificado de apresentação e menção honrosa enviar e-mail: chamado.ipe@ufrpe.br, informando nome completo do autor principal, título do resumo e todos os co-autores.
Comissão Organizadora Executiva
Marcelo Brito Carneiro Leão – Reitor
Gabriel Rivas de Melo – Vice-Reitor
Ricardo André Cavalcante de Souza – Diretor do Instituto Ipê
Suzianny Maria Bezerra Cabral da Silva – Diretora do Núcleo de Pesquisa
Coordenação Geral
Fernando Antonio Aires Lins
Severino Henrique da Costa
Comissão Organizadora
Adeilson Pinheiro Sedrins
Adriana Guim
Amanda Brandão Araújo Moreno
Ana Cláudia Vaz De Araújo
Ana Paula Amazonas Soares
Antônio Samuel Alves da Silva
Breno Quintella Farah
Bruno Romero Ferreira Miranda
Carlos André De Carvalho Bosco
Cecília Maria Mota Silva Lins
Cristiane Soares De Mesquita
Eliane Cristina Sampaio de Freitas
Elma Machado Ataíde
Ericka Maria de Melo Rocha Calabria
Erika F. T. Samico Fernandes Cavalcanti
Evandro de Oliveira Cavalcanti
Ewerton Ávila Dos Anjos
Luna Francisco de Assis Leite Souza
Gílcia Aparecida de Carvalho
Gledson Luiz Pontes de Almeida
Joaquim Evêncio Neto
Jorge da Silva Correia
Jucleiton José Rufino De Freitas
Kátia Maria Oliveira de Souza
Luciana Felizardo Pereira Soares
Marcel Ayres De Araújo
Marcilio Martins de Moraes
Maria Ângela Caldas Didier
Maria Betânia De Queiroz Rolim
Maria de Fátima Silva dos Santos
Maria Emília Vasconcelos dos Santos
Maria do Rosário de Fátima Andrade Leitão
Maria Inês Sucupira
Maciel Mauricio Sardá de Faria
Millena de Andrade Almeida Gomes Cavalcanti
Mônica Calixto Ribeiro De Holanda
Natanael Duarte De Azevedo
Oscar Emerson Zúñiga Mosquera
Paula Braga Gomes
Paulo Roberto Campagnoli De Oliveira Filho
Rachel Costa de Azevedo Mello
Rafael Ferreira Leite De Mello
Rafael Miranda Tassitano
Ramón Enrique Ramayo González
Raquel de Aragão Uchôa Fernandes
Renata Barbosa Vicente
Rezilda Rodrigues Oliveira
Ricardo Gallo
Rita de Cássia da Silva L. Barreto
Rogéria Rodrigues
Severino Carlos Bezerra de Oliveira
Thamires Santos Cruz
Victor Wanderley Costa de Medeiros
Watson Arantes Gama Jr