Importei as bibliotecas apropriadas:
- Pandas, para dataframes;
- Matplotlib, para gráficos simples;
- Seaborn, para gráficos mais elaborados;
- Prophet, para previsões;
- Numpy, para operações matemáticas.
Li esse arquivo CSV e fiz as conversões de formatos necessárias: inflacao.csv
Abaixo, temos alguns resultados:
inflacao | |
---|---|
count | 354.000000 |
mean | 0.545254 |
min | -0.680000 |
25% | 0.260000 |
50% | 0.470000 |
75% | 0.740000 |
max | 3.020000 |
std | 0.464396 |
Temos 354 dados, cuja média é 0.55% A taxa mínima foi, na verdade, uma deflação de 0.68% em julho de 2022 e a máxima, de 3.02% em novembro de 2002. O desvio padrão é de 0.46%, muito alto considerando a média. A mediana é de 0.47%.
Podemos dizer que apenas 25% dos dados estão acima do terceiro quartil, que é 0.74%, e 25% abaixo de 0.26%, o primeiro quartil. Ou seja, a distância interquartil é 0.74-0.26, que é 0.48%.
Lembrando de que a média e o desvio padrão são aproximados, como pode ser visto na tabela ao lado.
Abaixo, a frequência da inflação. Grande parte das taxas acumuladas de inflação estão abaixo de 1%, enquanto temos alguma frequência de deflação acumulada. Como o terceiro quartil é de 0.74%, o gráfico está de acordo com as estatísticas.
Temos a série temporal da inflação acumulada mês a mês:
Transformando as datas em números, podemos fazer uma regressão. Não se espera um bom ajuste, na verdade esperamos não existir correlação. Temos praticamente nenhuma relação linear, como já esperávamos. Ajustando pelos mínimos quadrados, temos um péssimo coeficiente de correlação de 0.054. Ao menos temos p-valores nulos, existindo relevância estatística nos resultados da regressão.
Temos também a série temporal anual média. Perdemos dados demais, por isso não fiz a regressão usando tal dataframe. Pelo menos a visualização é bem mais clara.
Usei o Prophet para fazer a previsão das taxas até o fim de 2025. Peguei o primeiro método, das taxas acumuladas mês a mês.
Temos alguns outliers, como entre 1995 e 2003. A partir da pandemia, temos alguns valores acima ou abaixo do intervalo de confiança. Por se tratar de uma taxa que depende de muitos fatores, é normal a presença de vários outliers.
Nessa página HTML, temos um gráfico interativo da previsão criado usando a biblioteca Plotly. Ele funciona melhor em computadores: previsão.html
Dando um zoom nos dados estimados, não se espera uma grande variação na taxa de inflação, para mais ou para menos.
Temos também gráficos de tendências:
Temos sempre uma tendência de queda anualmente. Além disso, temos uma tendência acentuada de aumento em fevereiro, mas está estável a maior parte do ano, só tem uma tendência maior em agosto.
Obrigado pela leitura!
Notebook: inflação.ipynb