Aprendendo Algoritmos de Otimização Combinatória através de Aprendizagem por Reforço Profunda

  • Autor
  • Moésio Wenceslau da Silva Filho
  • Co-autores
  • Rafael Ferreira Leite de Mello , Péricles Barbosa Cunha de Miranda
  • Resumo
  • O projeto "Aprendendo Algoritmos de Otimização Combinatória através de Aprendizagem por Reforço Profunda" buscou investigar o desempenho de métodos DRL em diferentes problemas de otimização combinatória e otimização global, para compreender as vantagens, desvantagens e limitações desses métodos. Durante o período de Maio/2021 a Agosto/2021, foi estudado o caso de otimização global.

    Com esse intuito, o projeto foi divido em 4 etapas distintas: (1) Revisão da literatura; (2) Definição do arranjo experimental e escolha dos algoritmos DRL para testes; (3) Criação e organização dos códigos em repositório público; (4) Escrita do artigo e execução dos experimentos. 

    Durante a etapa (1), foram levantados os métodos DRL estado da arte e diferentes problemas clássicos de otimização global. Além disso, foram pontuados diferentes trabalhos que consideraram abordagens DRL para otimização global, demonstrando que esse é um tópico recente, animado e promissor. Todavia, foi-se verificado a existência de um cenário pouco estudado: alta dimensionalidade e os algoritmos de otimização aprendidos são de ordem zero (i. e., não dependem das derivadas da função a ser otimizada). Dessa forma, os experimentos foram realizados considerando esse cenário. 

    Já durante a etapa (2), foram definidos o arranjo experimental e os algoritmos DRL usados para os experimentos. Foram considerados 8 problemas de otimização global e 5 algoritmos DRL Policy Search (REINFORCE, SAC, TD3, PPO e TD3-IG, uma versão modificada do TD3 proposta neste trabalho). Os experimentos consistiam em 2 fases: (i) Uma fase de treinamento, onde os métodos escolhidos são utilizados para se aprender um algoritmo de otimização; (ii) Uma fase de avaliação, onde os algoritmos aprendidos são comparados entre si. Ademais, durante essa etapa também foram escolhidos os hiperparâmetros para cada um dos algoritmos.

    Durante as etapas (3) e (4), foram implementados os algoritmos escolhidos e executados os códigos de treino e avaliação. Os resultados apontam que os métodos DRL Policy Search considerados conseguiram aprender algoritmos de otimização de ordem zero para grandes dimensões. Em especial, as adaptações incorporadas no TD3-IG permitiram aprender, de forma geral, algoritmos de otimização mais rápidos, robustos e precisos quando comparados aos demais. Todavia, são necessárias mais investigações considerando outros algoritmos e adaptações.

  • Palavras-chave
  • Aprendizado de Máquina, Inteligência Artificial, Aprendizagem por Reforço Profundo, Otimização;
  • Área Temática
  • Computação (SEDE)
Voltar

As apresentações ocorreram nos dias 06 e 07 de dezembro de 2021.

  • Administração (SEDE)
  • Agronomia (SEDE)
  • Biologia (SEDE)
  • Ciência Florestal (SEDE)
  • Ciências do Consumo (SEDE)
  • Ciências Sociais (SEDE)
  • Computação (SEDE)
  • Economia (SEDE)
  • Educação (SEDE)
  • Educação Física (SEDE)
  • Engenharia Agrícola (SEDE)
  • Estatística e Informática (SEDE)
  • Física (SEDE)
  • História (SEDE)
  • Letras (SEDE)
  • Matemática (SEDE)
  • Medicina Veterinária (SEDE)
  • Morfologia e Fisiologia Animal (SEDE)
  • Pesca e Aquicultura (SEDE)
  • Química (SEDE)
  • Tecnologia Rural (SEDE)
  • Zootecnia (SEDE)
  • UACSA - Engenharia Civil
  • UACSA - Engenharia de Materiais
  • UACSA - Engenharia Elétrica
  • UACSA - Engenharia Eletrônica
  • UACSA - Engenharia Mecânica
  • UAEADTEC - Administração Pública
  • UAEADTEC - Licenciatura em Artes Visuais com ênfase em Digitais
  • UAEADTEC - Licenciatura da Computação
  • UAEADTEC - Licenciatura em Física
  • UAEADTEC - Licenciatura em História
  • UAEADTEC - Licenciatura em Letras
  • UAEADTEC - Licenciatura em Pedagogia
  • UAEADTEC - Sistema de Informação
  • UAST - Administração
  • UAST - Agronomia
  • UAST - Ciências Biológicas
  • UAST - Ciências Econômicas
  • UAST - Engenharia de Pesca
  • UAST - Licenciatura em Letras
  • UAST - Licenciatura em Química
  • UAST - Sistema de Informação
  • UAST - Zootecnia
  • CODAI
  • Engenharia Ambiental (SEDE)

Comissão Organizadora

Congresso de Iniciação Cientifica - CIC

Comissão Científica

A comissão científica foi formada por mais de 400 avaliadores entre professores dos diferentes Departamentos e Unidades Acadêmicas da UFRPE e pesquisadores doutores de outras instituições do estado de Pernambuco

 

Para maiores informações e-mail: cic@ufrpe.br 

Para certificado de apresentação e menção honrosa enviar e-mail: chamado.ipe@ufrpe.br, informando nome completo do autor principal, título do resumo e todos os co-autores.

Comissão Organizadora Executiva

Marcelo Brito Carneiro Leão – Reitor

Gabriel Rivas de Melo – Vice-Reitor

Ricardo André Cavalcante de Souza – Diretor do Instituto Ipê

Suzianny Maria Bezerra Cabral da Silva – Diretora do Núcleo de Pesquisa

 

Coordenação Geral

Fernando Antonio Aires Lins

Severino Henrique da Costa

 

Comissão Organizadora

Adeilson Pinheiro Sedrins

Adriana Guim

Amanda Brandão Araújo Moreno

Ana Cláudia Vaz De Araújo

Ana Paula Amazonas Soares

Antônio Samuel Alves da Silva

Breno Quintella Farah

Bruno Romero Ferreira Miranda

Carlos André De Carvalho Bosco

Cecília Maria Mota Silva Lins

Cristiane Soares De Mesquita

Eliane Cristina Sampaio de Freitas

Elma Machado Ataíde

Ericka Maria de Melo Rocha Calabria

Erika F. T. Samico Fernandes Cavalcanti

Evandro de Oliveira Cavalcanti

Ewerton Ávila Dos Anjos

Luna Francisco de Assis Leite Souza

Gílcia Aparecida de Carvalho

Gledson Luiz Pontes de Almeida

Joaquim Evêncio Neto

Jorge da Silva Correia

Jucleiton José Rufino De Freitas

Kátia Maria Oliveira de Souza

Luciana Felizardo Pereira Soares

Marcel Ayres De Araújo

Marcilio Martins de Moraes

Maria Ângela Caldas Didier

Maria Betânia De Queiroz Rolim

Maria de Fátima Silva dos Santos

Maria Emília Vasconcelos dos Santos

Maria do Rosário de Fátima Andrade Leitão

Maria Inês Sucupira

Maciel Mauricio Sardá de Faria

Millena de Andrade Almeida Gomes Cavalcanti

Mônica Calixto Ribeiro De Holanda

Natanael Duarte De Azevedo

Oscar Emerson Zúñiga Mosquera

Paula Braga Gomes

Paulo Roberto Campagnoli De Oliveira Filho

Rachel Costa de Azevedo Mello

Rafael Ferreira Leite De Mello

Rafael Miranda Tassitano

Ramón Enrique Ramayo González

Raquel de Aragão Uchôa Fernandes

Renata Barbosa Vicente

Rezilda Rodrigues Oliveira

Ricardo Gallo

Rita de Cássia da Silva L. Barreto

Rogéria Rodrigues

Severino Carlos Bezerra de Oliveira

Thamires Santos Cruz

Victor Wanderley Costa de Medeiros

Watson Arantes Gama Jr