quinta-feira, 28 de junho de 2018

Explorando a correlação internacional entre homicídios e indicadores sócio econômicos.



Segundo os dados da UNODC, o Brasil é o país com maior número de homicídios absolutos no mundo, com mais de 60 mil mortes por ano, seguido pela Índia, México, África do Sul e Venezuela.  Em termos de taxa por 100 mil habitantes, somos o 12º lugar na lista de aproximadamente 230 países e territórios analisados, com média de 28:100 mil no período 2014 a 2016. (Dados originais podem ser explorados aqui: (https://public.tableau.com/profile/deolhonocrime#!/vizhome/UNODChomicides/correlation))

O que faz o Brasil estar no topo deste rol? Quais as características sociais e econômicas dos países que estão nos extremos da lista? Existem países com características sociais similares, mas que apresentam baixas taxas de homicídio, com os quais podemos aprender algumas lições? Este tipo de pergunta só pode ser respondida através da comparação internacional, uma vez que estudos de caso, mesmo que aprofundados, nem sempre permitem distinguir padrões gerais e especificidades locais.
Anos atrás os projetos comparativos em nível internacional eram difíceis de serem realizados, pois era difícil coletar dados padronizados para muitos indicadores e muitos países. Na última década, contudo, vimos um aumento considerável de projetos procurando coletar, padronizar, sistematizar e disponibilizar bases de dados mundiais, encabeçados principalmente por organizações multilaterais como a ONU e o Banco Mundial.

Assim, por exemplo, o Banco Mundial iniciou em 2010 o projeto WDI (World Development Indicators) que coleta séries históricas anuais retroativas a 1960, de centenas de indicadores sociais e econômicos, de 217 países.  Os tópicos abrangem, entre outros, a segurança alimentar e agricultura, mudança climática, crescimento econômico, educação, energia e extrativismo, meio ambiente e recursos naturais, setor financeiro, vulnerabilidade macro econômica e débito, pobreza, desenvolvimento do setor privado e público, desenvolvimento social, comércio e desenvolvimento urbano.

Esta abundância de dados e as novas ferramentas de análise permitem a realização de estudos exploratórios abrangente utilizando um grande número de variáveis, em busca de correlações e insights sobre os fenômenos. Neste tipo de abordagem “data driven” (orientada pelos dados), ao contrário da pesquisa acadêmica tradicional, parte-se dos dados, sem grandes elaborações a priori, para a teoria. Apesar de amplamente adotado no mundo empresarial, Data Science, como já discutimos alhures, é mais Data do que Science...

Os riscos desta abordagem simplista são muitos, como deparar-se com correlações espúrias enganosas. Encontramos na análise, por exemplo, uma correlação positiva e significativa entre taxa de homicídio e volume de precipitações anuais de chuva. Isto não de deve certamente à chuva em si, mas antes ao fato de que a maioria dos países com altas taxas de homicídio estão localizados na faixa tropical, onde é maior o volume de chuvas. Há que se tomar cuidado também do problema da causalidade inversa: homicídios aparentam ser maiores nos países com maiores gastos percentuais em educação (R2 = .34, T= 3,17, Prob = 0,0020), embora outros indicadores educacionais estejam ligados inversamente aos homicídios, como veremos abaixo. Não é que os países que gastam mais em educação piorem a violência, mas provavelmente a violência é pior, neste momento histórico, nos países que precisam ainda investir fatias consideráveis do seu orçamento em educação, replicando o que os países desenvolvidos fizeram décadas antes. Só um design de pesquisa mais sofisticado pode capturar estas sutilezas. Finalmente, é preciso lembrar que regressões e coeficientes de correlações lineares são boas medidas de fenômenos lineares mas não captam bem outras formas de associação entre as variáveis, que podem ser logarítmicas, exponenciais, em forma de U, de sino, potência, etc. A bem da verdade, uma curva em forma de potência descreve bem melhor a relação entre homicídios e os indicadores do WDI do que uma reta. [1]Em todos estes casos o coeficiente de correlação linear é enganoso e só o apresentamos porque é mais familiar e inteligível para os leitores.

De todo modo, como abordagem preliminar, as pesquisas exploratórias baseadas em correlações “data driven” tem gerado hipóteses relevantes que podem posteriormente ser aprofundadas em pesquisas mais robustas. Com este alerta em mente, o que encontramos quando correlacionamos as taxas de homicídio por 100 mil habitantes coletadas pela UNODC com as centenas de indicadores sociais e econômicos coletados pelo projeto WDI? Em outras palavras, que características sociais e econômicas estão correlacionadas com altas ou baixas taxas de homicídio nos países?

Nesta análise cross sectional (muitas unidades regionais num ponto no tempo), utilizamos as taxas médias de homicídio entre 2013 e 2016 e as taxas médias dos indicadores sociais e econômicos para o período 2010 a 2016. Selecionamos apenas os casos onde existiam dados para mais de 50 países e apenas aquelas correlações que se relevaram significativas (Prob < 0.0010)

Supondo que a relação entre as variáveis seja linear, de modo geral, a análise corrobora a importância da educação, pobreza, desigualdade e população jovem na “explicação” das taxas de homicídio, já identificada em outros estudos.




A tabela sugere que concentração de renda aumenta a taxa de homicídios, assim como uma grande proporção de jovens que não se encontra nem estudando nem trabalhando, conhecidos no Brasil como “nem-nem”. Os países com grande porcentagem de jovens na população também tem taxas maiores, assim como aqueles com elevada taxa de fertilidade na adolescência e elevada porcentagem de pobreza urbana. Menos óbvias são as associações com uma pauta de importação e exportação de e para países de renda média da América Latina e Caribe, o que é uma indicação indireta de baixa complexidade econômica. O pagamento de juros da dívida externa (como % das exportações) também está positivamente correlacionado a taxas de homicídio elevadas, uma indicação da precariedade econômica dos países violentos ou de que o ônus da dívida externa limita a capacidade de investimento social dos países endividados, contribuindo indiretamente para altas taxas de homicídio.

Por outro lado, encontramos associações negativas (associações inversas) das taxas de homicídio com o PIB per capita, enfermeiras por 1000 habitantes, renda per capita, gastos com pesquisa e desenvolvimento, gastos com saúde per capita, a porcentagem de população com serviços sanitários, número de pesquisadores e anos de educação secundária. Em outras palavras, quanto melhores e maiores estes indicadores, menores as taxas de homicídios.

Algumas associações são curiosas: por exemplo, observe-se que a porcentagem de imigrantes na população está associada à redução dos homicídios, ao contrário do que se imagina. Isto se deve provavelmente ao fato de que imigrantes são atraídos para países desenvolvidos e à grande quantidade de imigrantes nos países árabes, onde a criminalidade é baixa.

Muitas outras variáveis surgem como significativas com prob < 0,0005 se conjecturarmos que a associação entre as variáveis nem sempre é linear, mas antes uma curva em forma de potência. Neste cenário aumentam os homicídios: alta taxa de mortalidade infantil e mortalidade materna, prevalência de anemia nas crianças abaixo de 5 anos, razão aluno/professor primário, taxa de nascimentos por mil habitantes, porcentagem de alunos com atraso escolar no primário, prevalência de subnutrição na população, porcentagem de empregos na agricultura, porcentagem de empregos femininos vulneráveis e dezenas de outros. Inversamente, diminuem os homicídios um elevado PIB per capita, maiores gastos em saúde per capita, maior porcentagem de população madura, maior investimento estrangeiro direto como porcentagem do PIB e centenas de outros que não é possível descreve neste espaço. Nada menos que 471 indicadores do WDI relevaram-se significativos com probabilidade menor do que 0,0005 quando supomos uma associação em forma de potência, e correlacionamos de forma bivariada com a taxa de homicídios. Obviamente, muitos indicadores são redundantes e medem a mesma coisa (colineares) e é preciso verificar a contribuição específica de cada qual num modelo multivariado. (os dados completos podem ser consultados em https://public.tableau.com/views/correlaescomtaxadehomicidios/linear?:embed=y&:display_count=yes

Mas na maioria das vezes, as correlações e sinais fazem todo o sentido. Os países com menos homicídio são menos desiguais na distribuição da renda, os jovens estudam ou trabalham, a população é mais velha, tem economia complexa e sólida, tem menor pobreza urbana, população mais escolarizada, baixa taxa de gravidez na adolescência, PIB per capita elevado, investem em saúde, condições sanitárias e em pesquisa. É possível especular que estes mesmos indicadores expliquem em parte as diferenças nas taxas de homicídio observadas no Brasil entre o Sudeste e o Nordeste.

Sugerem, finalmente, quais as políticas públicas e investimentos que devem ser feitos para que o Brasil deixe a vergonhosa posição na lista de países mais violentos do mundo. Estas correlações e indícios precisam ser mais bem estudados, mas muitos deles são evidentes. Precisamos claro aperfeiçoar o sistema de justiça criminal, mas o contexto social e econômico brasileiro favorecem altas taxas de criminalidade e neste sentido o melhor sistema de justiça criminal não opera milagres. Existem exceções, mas em linhas gerais e em longo prazo, a redução da violência no país passa necessariamente pela melhoria das condições de vida da população. É o que sugere a experiência internacional dos países que controlaram suas taxas de homicídio. Crescimento econômico com distribuição mais equitativa da renda e investimentos sociais em saúde e educação, em longo prazo, são ainda as melhores políticas de prevenção.






[1] Para se ter uma ideia, um ajuste linear encontra 63 associações significativas entre taxa de homicídios e os indicadores do WDI com probabilidade menor ou igual a 0,0005. Este número de associações significativas sobe para 232 se ajustarmos uma curva polinomial de 2º ordem e para 471 se ajustarmos uma curva em forma de potência.

Nenhum comentário:

Postar um comentário

keepinhouse

Arquivo do blog

Seguidores