quinta-feira, 4 de abril de 2019

Polícia não tem medo de bandido. Mas ainda morre de medo de algoritmos




Bancos são organizações que não costumam jogar dinheiro pela janela. Se você que saber se alguma tecnologia ou metodologia funcionam, ver se os bancos as utilizam pode ser um bom critério para a replicação.

Há décadas o setor bancário utiliza algoritmos matemáticos para definir riscos individuais de crédito. Se vou pedir um empréstimo no banco eles verificam se já dei cheques sem fundo, se fui listado no Serasa, se estou empregado, minha renda, meus bens, idade, e dezenas de variáveis que ajudam a prever se vou ou não honrar o empréstimo. Estas variáveis são ponderadas e no final recebo um score e uma classificação como bom ou mau pagador. Não adianta culpar o gerente se o empréstimo não foi concedido...quem define isso é o algoritmo, com base nas estatísticas de milhares de casos passados.
Trata-se de um método probabilístico e falível pois há sempre o risco de recursar crédito a um bom pagador (falso negativo) ou conceder crédito para um caloteiro (falso positivo). Mas de modo geral, o algoritmo acerta ou pelo menos acerta bem mais do que o gerente do banco sozinho, com seus preconceitos e limites de memória e informação.





O setor público, quase sempre, anda a reboque quando se trata de utilizar novas metodologias e tecnologias. O sistema de justiça criminal, não obstante a existência de ricas e gigantescas bases de dados, faz ainda pouco uso dos algoritmos como ferramentas de apoio a decisão. Existem nas polícias crenças equivocadas, tais como “os casos de feminicídio e homicídios domésticos são difíceis de prevenir” pois acontecem dentro de casa, entre pessoas sem histórico criminal, etc. A ênfase na formação jurídica e o desprestígio das demais ciências explicam em parte o pouco uso destas metodologias no Brasil.

Uma exceção é o policiamento baseado em hot spots, adotado usualmente pelo policiamento ostensivo. É comum hoje o uso de um algoritmo que calcule a densidade de ocorrências numa determinada área, dia e hora. Na verdade, o algoritmo está prevendo – como o sistema de crédito bancário – que há grande probabilidade de que novos crimes ocorram naquela local e hora, de modo que o melhor “investimento” é alocar mais recursos policiais para aquele hot spot e hot time. Como os recursos policiais são escassos, ao invés de desperdiçar estes recursos em locais e horas de baixo risco, potencializo meus recursos alocando-o onde o crime é mais provável. Na área investigativa, algoritmos calculam a probabilidade de que um rosto detectado numa câmera seja ou não o de um criminoso procurado pela justiça. 

Esta lógica de alocação de recursos baseada em fatores de risco, algoritmos matemáticos e na epidemiologia poderia ser utilizada para a tomada de diversas outras decisões dentro do sistema de justiça criminal. Há diversos exemplos de utilização pelos países desenvolvidos. Nos EUA, por exemplo, o software COMPASS utiliza 137 variáveis para prever quais criminosos tem maior probabilidade de reincidência. Esta informação pode ser utilizada, por exemplo, para decidir quem deve receber maiores cuidados assistenciais pelos serviços de atendimento aos egressos. Para a Justiça juvenil, existe por exemplo o YLS/CMI (Youth Level of Service/Case Management Inventory), instrumento com 42 itens, cobrindo 8 diferentes domínios, para predizer a probabilidade de reincidência de jovens de 10 a 16 anos. O instrumento é capaz de prever razoavelmente não apenas quem irá reincidir, mas também em quanto tempo. Na Filadélfia, um software desenvolvido pelo departamento de condicional baseado em modelos de “randon forest” e 12 variáveis preditivas, classifica em segundos o grau de risco dos sentenciados a condicional.

Em todos estes casos, parte-se do conhecido fato criminológico de que apenas uma minoria dos ofensores é responsável por um grande número de crimes, de modo que é relevante identificar estes ofensores e oferecer a eles tratamentos mais longos e intensivos ou fiscalizá-los mais de perto. Para os de baixo risco, a proposta é procurar medidas alternativas e menos custosas e menos estigmatizantes do que o encarceramento.

Parte significativa dos assassinatos de mulheres tem precedentes de violência doméstica e registros policiais. A polícia Inglesa utiliza desde 2009 um questionário com cerca de 40 questões (DASH) para estabelecer quais mulheres têm maior risco de sofrer violência doméstica, criando classes de periculosidade. Os próprios policiais preenchem este formulário após cada atendimento de violência doméstica. Esta informação é utilizada pelo comitê multidisciplinar que monitora os casos e pode ser usada para direcionar o programa de patrulhamento preventivo ou decidir quando um agressor deve ser preso ou que vítima deve receber um celular de emergência ou ir para um abrigo governamental. Nos EUA existem vários instrumentos semelhantes para predizer violência doméstica, como o DA, DV-MOSAIC, DVSI ou K-SID, entre outros, enquanto o Canadá desenvolveu os instrumentos SARA e ODARA.

Em todos estes exemplos, existe um acumulado de conhecimento criminológico que norteia quais as variáveis relevantes do ponto de vista teórico e empírico. Sabe-se que envolvimento precoce com o crime, passagens anteriores pela justiça, uso de álcool e drogas, baixa escolaridade e baixa empregabilidade, bairro de moradia, período de tempo desde o último crime, etc. são preditores relevantes para reincidência. Uso de álcool e drogas, separação judicial do casal, histórico de agressões, disponibilidade de armas de fogo, histórico de destruição de propriedade, desemprego, baixo status sócio econômico, pouca idade, etc. são preditores consistentes de violência doméstica. Existem centenas de variáveis na literatura criminológica e psicológica já avaliadas como fatores de risco ou protetivos.

Utilizando julgamentos clínicos ou métodos atuarias, questionários são elaborados para investigar dados demográficos, histórico psiquiátrico, histórico de envolvimento com a justiça, informações sobre a infância do agressor, traumas físicos e dezenas de outras dimensões que impactam a disposição a delinquir e reincidir. Com base nestes questionários, o que os algoritmos fazem é testar quais são os melhores preditores, ponderá-los, computar uma nota de corte, fazer uma classificação que sirva de apoio à decisão. Os métodos estatísticos para fazer os cálculos são variados, como a regressão linear, regressões logísticas ou tree decision forest, entre outros.

É importante notar que enquanto alguns destes preditores são estáticos e não passiveis de modificação (sexo, traumas físicos) outros são dinâmicos e, portanto, potencialmente alteráveis por políticas públicas (tratamento para prevenir o uso drogas, aumentar a escolarização, terapias, etc.)

Existem dezenas de perguntas relevantes para a administração da justiça e gestão da polícia que poderiam ser respondidos da mesma maneira. Quem deve ser preso provisoriamente e quem pode ser liberado? Quem deve se beneficiar da saída temporária? Quem tem maior probabilidade de ser vitimizado ou revitimizado? Que policiais tem maior propensão ao suicídio? Que perfil de policial tem maior predisposição a se envolver com ocorrências de alto risco? Quem são aqueles com risco de se envolver em atividades desonestas caso sejam contratados? Podemos identificar os sinais de risco de feminicídios e intervir antes que ocorram? Na ausência de um critério jurídico, que deve ser classificado como usuário e quem como traficante?

Em todos estes casos, é provável que existam sinais que podem ser captados através de instrumentos adequados. As respostas são probabilísticas e é preciso decidir, para cada tema, quais os riscos dos chamados “falsos negativos” ou “falsos positivos” e estabelecer a priori uma “razão de custo”. (por exemplo, qual o custo de classificar um policial como potencial suicida e fornecer a ele um tratamento psicológico, quando na verdade ele não é. Existem recursos estatísticos, como as curvas ROC que ajudam a estimar este custo “ideal” mas a decisão final é sempre meta-estatística: por princípio, na dúvida, é melhor pecar por excesso e oferecer tratamento ao não suicida, do que pecar por falta).

É preciso cuidar também para que os algoritmos não sejam social ou racialmente enviesados. Regra geral, os algoritmos produzem resultados mais imparciais do que os humanos. Em suma, é preciso tratá-los como ferramentas de apoio à decisão e não como oráculos infalíveis. Por vezes será conveniente combinar os resultados do algoritmo com uma supervisão final “humana”.

Tomados os devidos cuidados, a literatura sugere – ainda mais agora em tempos de “big data” e “machine learnings” – que os algoritmos conseguem detectar correlações as vezes invisíveis a olho nu e tomar decisões mais acertadas e menos sujeitas à preconceitos do que os seres humanos. Este tratamento equânime dado pelo algoritmo a todos os casos é um elemento importante, depois que a economia comportamental descobriu que as sentenças judiciais podem ser afetadas por fatores totalmente espúrios, como a hora do julgamento ou se o juiz almoçou ou não. (Daniel Kahneman, Rápido e Devagar, etc.)

Quando os recursos são escassos e os atendimentos precisam ser priorizados – temos 700 mil presos no país, 40% deles “provisórios), os algoritmos de predição e classificação podem ser grandes aliados. Os bancos já sabem disso quando se trata de emprestar ou não dinheiro. Então pode acreditar que funciona.

Bibliografia

·         Craig Dowden & S. L. Brown (2002) The role of substance abuse factors in predicting recidivism: A Meta-analysis, Psychology, Crime and Law, 8:3, 243-264, DOI: 10.1080/10683160208401818
·         EYITAYO ONIFADE, WILLIAM DAVIDSON, CHRISTINA CAMPBELL, GARRETT TURKE, JILL MALINOWSKI, KIMBERLY TURNER. PREDICTING RECIDIVISM IN PROBATIONERS WITH THE YOUTH LEVEL OF SERVICE CASE MANAGEMENT INVENTORY (YLS/CMI). Article in Criminal Justice and Behavior · April 2008
·         J. Dressel, H. Farid, The accuracy, fairness, and limits of predicting recidivism. Sci. Adv.4, eaao5580 (2018).
·         Marcela Madalena, Lucas de Francisco Carvalho, Denise Falcke .Violência Conjugal: O Poder Preditivo das Experiências na Família de Origem e das Características Patológicas da Personalidade,. Trends in Psychology / Temas em Psicologia – Março 2018, Vol. 26, nº 1, 75-91
·         Ritter, Nancy. Predicting Recidivism Risk: New Tool in Philadelphia Shows Great Promise. NIJ JOURNAL / ISSUE NO. 271 - FEBRUARY 2013
·         Robert Chalkley & Heather Strang .Predicting Domestic Homicides and Serious Violence in Dorset: a Replication of Thornton’s Thames Valley.. Camb J Evid Based Polic (2017) 1:81–92
·         Ronzano, Gemma. FORECASTING DOMESTIC VIOLENCE. Degree: BSc Psychology
·         Author(s): Janice Roehl, Ph.D.; Chris O’Sullivan, Ph.D.; Daniel Webster, ScD; Jacquelyn Campbell, Ph.D. Intimate Partner Violence Risk Assessment Validation Study, Final Report. Document No.: 209731 Date Received: May 2005

Arquivo do blog

Follow by Email

Seguidores