Este trabalho visa mostrar como um sistema inteligente de aprendizagem por reforço pode se utilizar de indicadores financeiros clássicos para superar várias estratégias clássicas de investimento na bolsa de valores. Devido à natureza não-linear, aleatória e não-estacionária dos mercados financeiros, várias estratégias clássicas deixam brechas onde poderiam comprar instrumentos financeiros e lucrar com eles. Para este fim, foi construído um sistema onde a estratégia de compra usa o algoritmo SARSA de aprendizagem por reforço enquanto a de venda é feita através de várias estratégias clássicas. Para testá-lo, foi feito um sistema que usa uma estratégia de venda idêntica enquanto a de compra é baseada em um indicador clássico. Resultados mostraram que o algoritmo inteligente conseguiu no final retornos mais estáveis e até seis vezes maiores que os das estratégias clássicas testadas.
Palavras-chave: Aprendizagem por Reforço, Aprendizagem de Máquina, Bolsa de valores, SARSA, day trade
Leia o trabalho completo.