terça-feira, 17 de março de 2015

Um exercício teórico sobre contagem de multidões



No exercício abaixo estimamos a população presente na manifestação da Av Paulista no dia 15/3 em cerca de 240 mil pessoas. Não contamos com fotos aéreas nem com pessoas em campo para fazer as medições empíricas. Partimos de um cálculo puramente teórico levando em conta os seguintes parâmetros:

-extensão da avenida: 2.700 mts
- largura: 27,6 mts (12,6 em cada pista e 2,4 do canteiro central)
- densidade: 3 faixas, seguindo os critérios de Jacobs. Uma mais densa (4,3 pessoas por metro) ao redor do Masp, decaindo para 2,4 e 1,08 nos extremos da avenida. A densidade média, conservadora, foi de 2,34 pessoas por metro.
- a avenida foi dividida em 28 fatias com 2760 metros cada (total 77.280 mts) e acrescentamos em cada faixa 10% de sua população estimada, de modo a incluir as pessoas nas áreas adjacentes, que se concentravam principalmente nas esquinas.
- como o evento dura várias horas, existe uma troca de participantes no decorrer do tempo. Estimamos uma taxa de turn over de 20% dos participantes.

Estes foram os parâmetros utilizados para chegar a uma estimativa conservadora de 238.520 participantes (próxima aos 210 estimados pelo Datafolha) no dia 15 de março. Usando os mesmos critérios, a manifestação da CUT/MST de sexta feira (3 blocos compactos, sem áreas adjacentes, sem turnover, usando apenas meia faixa, etc.) teria contado com 45.713 participantes.

Numa estimativa menos conversadora, vamos supor que a densidade em todas as faixas fosse de 4,3 pessoas/mt e que a taxa de turn over foi de 25% e não apenas 20%. Usando estes inputs mais otimistas, o cálculo é de 461.168 pessoas.

No gráfico abaixo estão representadas cada uma das 28 fatias da Paulista, tendo o MASP como marco zero, com suas respectivas densidades e estimativas de participantes:


Como argumentamos, estes são apenas exemplos teóricos sobre como realizar a contagem mas não é possível chegar a uma estimativa concreta sem as fotografias aéreas, levantamentos empíricos da densidade em cada faixa, turn over e outros dados que compõem a fórmula.

De todo modo, a estimativa de 1 milhão de pessoas parece exagerada, pois isto significaria algo em torno de 9 pessoas por metro (algo próximo a um ônibus lotado) por toda a extensão da Paulista, o que é improvável e não corroborado pelas fotografias. Imagino que para chegar a estimativa de 1 milhão de pessoas a PM tenha incluído uma grande área adjacente no cálculo e / ou adotado uma taxa de renovação maior do que a usada neste exercício. O Datafolha, por sua vez, parece não levar em conta as áreas adjacentes na sua metodologia. Seria interessante conhecer os respectivos cálculos.

Ps: organizadores da Parada Gay e de manifestações religiosas já falaram em 2,5 milhões e até 4 milhões de pessoas na Paulista, o que é impossível sem revogar as leis da física...

segunda-feira, 16 de março de 2015

Contando Multidões



Contar quantas pessoas comparecem a um evento pago, em recinto fechado ou espacialmente delimitado - como um show musical ou partida de futebol - é moleza. Basta contar os ingressos vendidos ou saber de antemão a capacidade de lugares disponíveis.

O procedimento fica algo mais complexo quando se trata de estimar o número de pessoas num evento em local aberto, com várias horas de duração, sem espaço delimitado. É preciso observar o epicentro da manifestação e as ruas adjacentes. Estimar quantos indivíduos chegam e quantos saem durante o evento. Calcular a extensão das áreas e as diversas densidades de ocupação. Descontar os vazios provocados por obstáculos naturais ou arquitetônicos. Acrescentar áreas cobertas ou sombreadas, etc.

Não se trata apenas de curiosidade ou de ter um número para esgrimir politicamente para inferir o sucesso ou fracasso do evento. Uma estimativa razoável do público é necessária para a alocação de recursos operacionais, como policiais, ambulâncias, banheiros, controlar o tráfico e diversos outros objetivos operacionais.

Assim, jornalistas, organizadores dos eventos e órgãos policiais procuram fazer suas estimativas do público. O problema é que elas raramente coincidem e frequentemente são bastante díspares. Não se trata apenas de distorções propositais politicamente motivadas mas do uso de diferentes métodos e critérios.

Assim, por exemplo, na manifestação de 15 de março na Av. Paulista em São Paulo a Polícia Militar estimou em mais de um milhão o número de presentes enquanto o Instituto Datafolha falou em 210 mil, uma diferença gritante, de quase 5:1. E não estamos aqui falando de estimativas produzidas pelos organizadores e seus opositores, que tendem a produzir números enviesados, mas de contagens feitas por instituições (teoricamente) neutras. Se tivéssemos algumas dezenas de estimativas, seria possível que a média nos fornecesse um parâmetro razoável mas não é o caso quando se trata de “crowd counting”, que exige recursos que o cidadão comum não dispõe.
Um dos métodos mais simples de contagem foi imaginado por um jornalista chamado Herbert Jacobs, que o criou para medir a quantidade de estudantes que compareciam aos eventos contra a guerra do Vietnam na Universidade de Berkley, nos anos 60. Como jornalista ele não contava com imagens de satélites e ainda não existiam os drones. A vantagem é que a área onde os estudantes se reuniam era demarcada com linhas que formavam grades. Assim, bastava saber a área de cada grade, multiplicar pelo número de estudantes em cada quadrado (densidade) e somar quantos quadrículos estavam ocupados. As densidades variavam ligeiramente de acordo com a distância do epicentro mas a matemática básica envolvida é primária.

Os recursos evoluíram desde então mas a lógica subjacente é basicamente a mesma. Como raramente o espaço é previamente quadriculado, esta grade é montada hoje digitalmente, superposta a fotografias aéreas provenientes de drones, aviões ou satélites, de preferência. Os passos são aproximadamente os seguintes, conforme sumarizado por Farouk El-Baz, do departamento de sensoriamento remoto da Universidade de Boston:

1. Sobrevoe a multidão no horário de pico utilizando uma aeronave de asa fixa (helicópteros chacoalham e borram as fotos, aumentando os esforços requeridos para analisá-las). A altitude deve ser de 2000 pés ou menos;
2. Fotografe a área em faixas usando uma câmera digital, com sobreposição de 60% entre sucessivas fotos para permitir uma visão estereoscópica (útil para esclarecer fotos ambíguas). A resolução deve ser de aproximadamente um pé por pixel (o artigo é de 2005, hoje pode ser maior);
3. Carregue as fotografias num programa de processamento de imagens e registre a resolução em torno de 1 metro utilizando ortho fotos do terreno, que corrigem a perspectiva das imagens áreas, levando em consideração a curvatura da terra;
4. Superponha uma grade sobre a imagem e classifique os quadrículos pela densidade aparente de pessoas por unidade. É possível também extrair amostras de diferentes áreas e utilizar as estimativas obtivas por estas amostras para calcular as densidades.
5. Insira um ponto para cada indivíduo ou ponto de sombra.
6 Conte ou estime o número de pessoas em casa unidade da grade e depois tabule os números.
7. Calcule o erro – basicamente o número de unidades da grade pelo grau de incerteza a respeito de quantas pessoas elas contem.

Não é possível fugir muito a este procedimento e as diversas mensurações deveriam levar a resultados aproximados ou dentro de margens de erro razoáveis, tal como ocorre nas pesquisas de opinião com base amostral.
Provavelmente o que ocorre é que as instituições estão lançando mão de critérios diferentes, que precisariam ser esclarecidos pois do contrário não são comparáveis. A medida foi feita no horário de pico ou levou-se em consideração o fluxo de entradas e saídas durante o dia? Como foram trabalhadas as sombras e acidentes urbanísticos? (por exemplo, área embaixo das marquises, área da construção da ciclovia, etc.). Como foram obtivas as estimativas de densidades? Áreas adjacentes ao epicentro foram incluídas? Quais os limites destas áreas?

Estudiosos do caos (estamos falando dos matemáticos, não dos profetas) mostraram como diferenças insignificantes nos cálculos iniciais podem gerar resultados finais drasticamente diferentes... Não é preciso que haja necessariamente uma unificação das metodologias mas pelo menos uma explicitação dos critérios empregados para não compararmos bananas e maças. Passado um certo patamar, o olho humano não consegue estimar quantidades com precisão e o olhar fica influenciado pelo véu da ideologia.

Chegar a um número confiável é relevante não apenas pelo aspecto político mas também para garantir a segurança e infraestrutura destes eventos que, aparentemente, pela dimensão demonstrada no final de semana, não se diluirão tão cedo...

keepinhouse

Arquivo do blog

Seguidores