Sintonia QR do Regulador Linear Quadrático LQR Discreto e Programação Dinâmica Aproximada baseada em Ação-Estado para Aplicações Online do Projeto de Sistemas de Controle Ótimo

Autores

DOI:

https://doi.org/10.5540/tcam.2024.025.e01686

Palavras-chave:

Programação Dinâmica, Controle Ótimo, HDP, Q-Function, ADHDP, Sistemas Multivariáveis, Convergência, DLQR.

Resumo

Devido ao crescente desenvolvimento tecnol´ogico e `as  consequentes aplicaç˜oes industriais, novos m´etodos para o projeto de controle e Aprendizado por Reforço tem sido desenvolvidas, n˜ao apenas para resolver novos problemas de controle, mas tamb´em para melhorar o desempenho de controladores j´a implementados em sistemas do mundo real. As abordagens de Aprendizagem por Reforc¸o e Regulador Quadr´atico Linear Discreto s˜ao conectadas por m´etodos de Programaç˜ao Dinˆamica Adaptativa. Esses paradigmas s˜ao  orientados para o projeto de controladores ´otimos em  sistemas multivari´aveis. Para o caso do Regulador Quadr´atico Linear Discreto, AD-HDP, Aprendizado por Reforc¸o, Pol´ıtica de Iterac¸ ˜ao e Valor de Iterac¸ ˜ao, um m´etodo e um algoritmo s˜ao desenvolvidos e implementados para projeto de controle online. Com base na seleção das matrizes de ponderac¸ ˜ao Q e R, tamb´em ´e apresentado um m´etodo para ajustar controladores reguladores lineares quadr´aticos discretos. Este m´etodo fornece diretrizes para a construção de heur´ısticas para a seleç˜ao de matrizes de ponderaç˜ao, aspectos de convergˆencia relacionados `as variaç˜oes das matrizes de ponderaç˜ao s˜ao investigados. Para um sistema dinˆamico multivari´avel de terceira ordem, o algoritmo proposto e a heur´ıstica de ajuste s˜ao avaliados pela capacidade de estabelecer a pol´ıtica de controle ´otima

Biografia do Autor

M. Cerqueira, Universidade Federal do Maranhão

Possui graduação em Engenharia Elétrica pela Universidade Federal do Maranhão (2007) e mestrado em Engenharia de Eletricidade pela Universidade Federal do Maranhão (2010). Possui ainda especialidade em Engenharia de Segurança do trabalho pela universidade UNYLEYA de Brasília. Atualmente atua como professor na Universidade Federal do Maranhão - UFMA no curso de Engenharia de Computação. Encontra-se em doutoramento em Engenharia de Automação e Controle pela UFMA. Tem experiência na área de Engenharia Elétrica, com ênfase em Eletrônica Industrial, atuando principalmente nos seguintes temas: sensores, controlador lógico programável, automação industrial, PID e atuou na área da VALE no setor de expansão em redes de alta e baixa tensão.

L. Lopes, Universidade Federal do Maranhão

Possui  graduação em Engenharia Elétrica pela Universidade  Federal do  Maranhão (2008) e mestrado em Engenharia de Eletricidade pela Universidade federal do Maranhão (2011). Possui ainda especialidade em Engenharia Ferroviária em projeto de parceria VALE e UNDB (2011). Profissional com 12 anos de experiência na área de Manutenção Ferroviária. Habilidade com análise de dados e técnicas preditivas com base em estudos de confiabilidade. Atuou por 8 anos (2011 a 2019) na área de Manutenção Eletroeletrônica da Estrada de Ferro Carajás – EFC como Engenheiro de confiabilidade do sistema de Automação. Atualmente exerce a função de Engenheiro na Coordenação de Preditiva de Rodantes e Industrial tendo como desafio garantir os índices de confiabilidade, utilizando-se de dados de instrumentação de campo, para análises Vida Útil Remanenscente (Remaning Useful Life - RUL), elaboração de regras de negócio e alavancas de preditiva por meio de dados provindo de sensores.

J. V. Fonseca, Universidade Federal do Maranhão

É Professor titular da Universidade Federal do Maranhão. Possui graduação em Engenharia Elétrica pela Universidade Federal da Paraíba (1982), mestrado em Engenharia Elétrica pela Universidade Federal da Paraíba (1986), e doutorado em Engenharia Elétrica pela Universidade Estadual de Campinas (2000). Desenvolveu projetos de P&D em Modelagem e Controle para Indústria de Alumínio do Maranhão, Sistemas Inteligentes para Tomada de Decisão para Descarga e Estocagem de Minérios e para Sistemas de Distribuição de Energia Elétrica. Atualmente, desenvolve pesquisa em Inteligência Computacional com enfoque na fusão das abordagens de redes neuronais artifciais, computação evolutiva, lógica fuzzy para identicação e controle de sistemas dinâmicos do mundo real. A sua pesquisa está direcionada em sintonia online e seleção de controladores ótimos para sistemas MIMO. Também desenvolve métodos bayesianos para o treinamento da Recorrência de Riccati em Filtros Estocásticos dos tipos Kalman Padrão, EKF e Unscented. Tem experiência na área de Engenharia Elétrica, com ênfase em Controle de Processos Eletrônicos e Retroalimentação, atuando principalmente nos seguintes temas: modelos baseados em inteligência artificial para sistemas industriais, algoritmos genéticos, sintonia de controladores PID, medição indireta via Filtragem de Kalman, solução neuronal da equação algébrica de Riccati, recuperação inteligente da malha de controle LQR e Programação Dinâmica Aproximada para desenvolvimento de sistemas embarcados que realizam controle ótimo e robusto.

Downloads

Publicado

2024-11-27

Como Citar

Cerqueira, M., Lopes, L., & Fonseca, J. V. (2024). Sintonia QR do Regulador Linear Quadrático LQR Discreto e Programação Dinâmica Aproximada baseada em Ação-Estado para Aplicações Online do Projeto de Sistemas de Controle Ótimo. Trends in Computational and Applied Mathematics, 25(1), e01686. https://doi.org/10.5540/tcam.2024.025.e01686

Edição

Seção

Artigo Original