O Desafio do ‘Factor Zoo’
Em um endereçamento à Associação Americana de Finanças, John Cochrane, na época professor da Universidade de Chicago, cunhou o termo “factor zoo” para se referir à imensa quantidade de supostos fatores de risco – variáveis que carregam informação acerca do retorno de ações – existentes na literatura.
Para se ter uma noção, Harvey & Liu (2020) fazem um “censo” desse zoológico e mostram que, até 2020, mais de 400 fatores de risco foram publicados nas melhores revistas de finanças do mundo. Com base nessa informação, o leitor pode estar se perguntando como um número tão grande de variáveis pode, de forma significativa, estar afetando o retorno das ações ao mesmo tempo. A realidade é que não estão.
Análise Crítica dos Fatores de Risco
Em um artigo de 2022, Fabian Hollstein analisa 124 possíveis fatores de risco em 47 países. Os resultados indicam que apenas quinze sobrevivem a ajustes para múltiplos testes e a imposição de restrições relacionadas a papéis com uma capitalização de mercado muito pequena. Os resultados são similares quando a análise é feita por sub-regiões do planeta. Em consonância, McLean & Pontiff (2016) mostram que a performance de 97 fatores de risco é, na média, 26% menor fora da amostra original e 58% menor após a publicação.
Replicabilidade e Impacto dos Ratings nos Investimentos
Em contrapartida, em 2021, Jensen, Kelly & Pedersen apresentaram evidências de que a maioria dos fatores podem ser replicados e funcionam em um cenário out-of-sample. A base de dados utilizada cobre 94 mercados. Mais impressionante, talvez, eles mostram que a maioria dos fatores de risco tem evidências que se tornam mais fortes, e não mais fracas, na presença de outros fatores. Entretanto, por mais que a maioria possa ser replicada, os autores indicam que eles podem ser agrupados em treze temas apenas.
Elevando o Padrão e a Abordagem da Avantgarde
Mesmo com essa controvérsia na literatura, um questionamento que rapidamente vem à mente é o que pode ser feito para aumentar a probabilidade de que supostos novos fatores de risco sejam isso de fato e não meras aleatoriedades geradas por data mining e data snooping. Harvey, Liu & Zhu (2016) sugerem aumentar o limiar da estatística t de 2 para 3 para que uma hipótese possa ser rejeitada. De maneira mais efetiva, o pesquisador pode adotar uma estatística t de corte dinâmica, baseada no número de testes que foram realizados anteriormente.
Por fim, a mensagem que deve ficar é a de se ter atenção e cuidado quando resultados de backtests são apresentados. Por mais que a estratégia possa parecer uma grande vencedora, é sempre importante questionar o apresentador acerca da robustez dos resultados e de como o processo de pesquisa foi conduzido. Tal questionamento pode ser a diferença entre um investimento desastroso e um bem-sucedido.
Na Avantgarde, nós temos ciência da existência desses vieses e implementamos processos robustos para garantir que possíveis novas estratégias com desempenhos promissores não sejam frutos do acaso. Desse modo, o capital investido pelo cotista fica mais seguro e o objetivo da gestora de entregar resultados superiores com consistência fica mais próximo.
Os subtítulos foram adicionados para segmentar o texto e facilitar a leitura, mantendo cada bloco com um limite de palavras aproximado.