Desafios para o Desafio da Natureza Urbana




Pra quem não conhece. O Desafio da Natureza Urbana (City Nature Challenge em inglês) é o evento que mais mobiliza o site do iNaturalist. O efeito dele é tamanho que ele é visível no gráfico anual do iNat ali em cima. O objetivo inicial do evento foi uma competição entre as cidades de Los Angeles e San Francisco, mas logo se disseminou por todo o mundo, gerando centenas de milhares de observações em um curto período de tempo nos últimos suspiros de Abril e primeiros respiros de Maio todos os anos.
O evento tem uma duração de 4 dias para a etapa de registros e depois 6 mais dias para identificações. Passado esse prazo tirasse um retrato dos resultados e esse retrato é considerado o resultado final do evento para cada cidade.
Só que como agora fazem parte do iNat, esses registros continuam tendo seus IDs corrigidos e melhorados após esse período e indefinidamente. É sobre esse aspecto do CNC, ou DNU como ficou conhecido no Brasil, que eu vou falar aqui.


Há uma semana foi feita uma postagem no forum do iNat sobre um código que analisa as observações de projetos e monta uma página com registros notáveis (primeiros registros para iNat, país, região, cidade, ou registros de alguma coisa com poucos registros no local feitos durante o evento).

Aplicando tal código nos projetos do City Nature Challenge do Brasil encontrei muitos registros mal identificados e ele auxiliou bastante nas correções além de cumprir seu papel original de encontrar registros realmente notáveis durante aquele evento.

Ainda assim isso levanta uma certa preocupação acerca dos dados gerados por eventos desse tipo. O intuito deles é sempre atrair mais usuários para a plataforma, mas isso acaba gerando uma quantidade de dados muito grande que leva meses e até anos para serem suficientemente revisadas pelos identificadores como você vai ver a seguir.

Para fins de exemplo apliquei o código no projeto de Curitiba desse ano e encontrei 47 erros. A maioria de espécies não encontradas na américa do sul ou no Brasil. Resolvi aplicar o código em anos anteriores no mesmo local e continuei encontrando erros que ficaram todo esse tempo sem correção... A maioria desses erros eram de observações de plantas e fungos, que são os táxons mais observados em comparação com os demais e os que tem o menor numero de especialistas, especialmente aqui na América do Sul.


Minha planilha de controle para todos os CNC de Curitiba




Exemplo de mapa de distribuição de uma espécie de líquen do hemisfério norte comumente identificado por engano por projetos CNC no hemisfério sul.

Acredito que muitos desses erros poderiam ser facilmente evitados se a equipe que organiza cada projeto fizesse um esclarecimento sobre 3 pontos importantes:

  • Sobre cuidados na hora da postagem das observações;
  • Sobre o que observar durante o evento;
  • Sobre repetições do mesmo organismo;

...entre outras coisas



Ajudando o Computer Vision a Te Ajudar

Os usuários, especialmente os mais novos, usam muito a Visão do Computador e concordam com a identificação fornecida por ele. Nessa etapa, ajudaria E MUITO se os usuários forem instruídos a primeiro colocar o local da observação e em seguida ver o que o computador sugere. As espécies sugeridas serão limitadas ao local e, na maioria das vezes, respeitarão a distribuição normal das espécies. Não quer dizer que estarão certas, mas já ajuda bastante e evita erros grosseiros de espécies que não deveriam estar ali.

Exemplo de como a Localização ajuda a inteligência artificial

Pode-se fazer também uma palestra curta sobre identificar a nível de família ou com identificações mais elevadas como "Planta", "Besouro", etc, quando não se tem certeza do que se está observando. Algumas pessoas acham que identificando com uma especie parecida, mesmo sabendo que nao ocorre ali, vai facilitar a identificação pois alguém vem logo em seguida e corrige. Mas nem sempre é o que ocorre. Sem falar que o seu ID ficará pesando para um lado, e serão necessários 3 IDs da espécie correta para se obter o Nível de Pesquisa almejado.

O que registrar

No ímpeto de obter o máximo de observadores eu vejo que as organizações desses projetos pecam um pouco na questão de explicar o que exatamente eles devem observar. O nome do evento sugere a natureza urbana, mas o que acabamos vendo são muitos registros em zoológicos, pets, animais de produção, e de plantas claramente cultivadas. Embora nada impeça que o usuário poste tais registros e as espécies no final acabam contando mesmo sendo cativas/cultivadas. Só que os participantes quase nunca marcam essas observações como tal, o que gera mais trabalho para o pessoal que identifica.

Enfim, na minha opinião vale mais a pena registrar plantas daninhas de um terreno baldio ou até mesmo às que crescem na calçada do que registrar o vasinho de flores da vovó. Muitos identificadores não se dão o trabalho de corrigir ou marcar o ID dessas observações até porque plantas e animais exóticos não fazem parte da sua rotina de IDs.

Repetição de registro de mesmo organismo

É normal em eventos como esse do pessoal ir junto aos parques ou fazer saídas em grupo e registrar as mesmas coisas. O resultado é uma profusão do mesmo cacto, inseto, etc, geralmente no mesmo ângulo. Embora isso não seja contra as regras e cada um acabou fazendo mesmo seu próprio registro, penso que poderíamos melhorar em dois sentidos:

Se é para tirar a foto do mesmo cacto, talvez cada pessoa fazendo isso poderia tentar um ângulo diferente para que a foto pelo menos não fique a mesma do colega. Isso pode até ajudar na identificação visto que na maioria das vezes as pessoas colocam apenas uma foto por observação. Então juntando todos os ângulos da galera podemos formar um belo booking to cacto que poderá ser identificado com mais facilidade.

A segunda abordagem seria dividir o grupo grande em grupos menores que irão cobrir uma área maior (ou até áreas específicas e diferentes dos outros grupos). A desvantagem desse método é que podem não haver veteranos suficientes para explicar e controlar os grupos.

Portanto, acredito que uma breve explicação sobre o que observar e como postar já seria de grande ajuda para que esses projetos gerem não só uma boa quantidade de dados, mas também dados que são realmente úteis e alinhados com o propósito da plataforma.



Queria também deixar registrado que sempre ocorrem casos lamentáveis de usuários novos que postam observações e as identificam a nivel de espécie com a ajuda de amigos ou contas falsas. Tudo para chegar a Nível de Pesquisa e ter mais espécies possíveis no evento. Isso geralmente acontece naqueles projetos que prometem um certificado ou prêmio para aquele usuário que fizer o maior número de registros.

Devemos lembrar que o iNaturalist é um site sério que que muitos pesquisadores o utilizam para pesquisas científicas. Nada contra o sistema de certificados, até porque é um bom atrativo para os jovens de universidades que precisam dos pontos. Só é preciso deixar claro que a participação deles gera dados importantes e duradouros, pois afinal o projeto segue sempre mudando com novas identificações sendo feitas com o passar do tempo.

Outras questões

Falando agora somente do CNC 2024; não entendi o porque de haverem três projetos no RJ que se sobrepõem em sua área. No fim os dados de um acabam refletidos no outro. Apesar de isso não afetar a contagem final, faz com que quem esteja revisando os projetos tenha que revisitar observações das outras áreas. Parece que em Brasília também temos a mesma situação. Dei uma olhada em outros projetos umbrella pelo mundo e não encontrei casos parecidos. Fica então o questionamento.

Como considerações finais só queria deixar claro que os problemas que listei não são exclusivos dos CNC do Brasil. Também não quero desmerecer todo o esforço que as equipes organizadoras fazem todos os anos para mobilizar o pessoal e fazer com que o Brasil seja notado lá fora com a grande participação que sempre temos. Espero que encarem minhas ressalvas levantadas aqui como criticas construtivas e que possamos todos usufruir de futuros CNCs de maneira mais agradável.

Para terminar deixo aqui o resultado daquele código de análise aplicado em cinco dos maiores projetos do CNC no Brasil (lembrando que é um retrato do momento atual e que os registros estão sempre mudando. O evento CNC acabou, mas ainda tem muita coisa para se consertar e aprimorar).

São Paulo
Curitiba
Vale do Itajaí - SC
Rio de Janeiro
Brasília

Posted on May 15, 2024 01:17 AM by fmiudo fmiudo

Comments

Oi Fernando, muito interessantes teus pensamentos a análises. Em vários deles penso o tempo tudo, especialmente quando organizo uma nova edição das maratonas (GBS ou DNU). É muito mais complicado do que pensas, precisaríamos, com este frio, de um bom vinho e várias horas de discussão kkkk.

Temos tentado algumas coisas, como, por ex., realizar oficinas e eventos para que às pessoas conheçam o objetivo dos eventos e como realizarem as observações, também sempre enfatizamos em checar o mapa antes de se decidirem por uma espécie, etc., etc. Algumas das oficinas estão disponibilizadas no YouTube de nosso projeto, da mesorregião Vale do Itajaí e de outras temos criado o acesso desde o Linktr.ee.

Também, neste edição as observações casuais foram excluídas para contar em nosso projeto, com o intuito de desestimular a realização delas... e me parece que deu resultado no nosso projeto, falo especificamente disso neste Boletim: https://www.inaturalist.org/projects/dnu2024-vale-do-itajai-e-regiao-sc-brasil/journal/94393-historico-resultados-gbs-e-dnu-mesorregiao-vale-do-itajai.

Com relação ao que falas de RJ... o certo é que oficialmente só um desses projetos estava inscrito, foi um erro nosso (de @ericfischerrempe e eu) se ficaram os três no Guarda-chuva, tentaremos na próxima maratona, a Grande Biobusca do Hemisfério Sul 2024, que acontecerá do 20-23 de setembro, ficarmos mais atentes disso.

Me parece muito interessante que mais pessoas estejam pensando em como resolver algumas das dificuldades e desafios que se nos apresentam em cada um dos eventos. Nós, no Vale do Itajaí, em cada maratona temos uns novos por resolver.... neste, por ex., se nos incorporou o de pessoas sem conhecimentos técnicos validando e identificando observações de outres usuáries..., no entanto, a mesma comunidade de iNaturalist rapidamente deu conta desse problema.

Abraços naturalistas!

Posted by liuid 8 days ago

Por certo, adorei conhecer a existência de um comando para identificar os registros notáveis!
Ajuda mesmo. Para mim é claro que sempre se requer fazer a revisão, a curadoria dos dados. Até o nome das espécies nos catálogos dos museus estão cheios de erros.... isso não significa que não ajuda. Ajuda muito, pois ao invés de ter 1500 espécies para revisar manualmente, com este código tenho que só revisar 78!!!

Posted by liuid 8 days ago

Liu, desde sempre incentivo que atividades locais sejam registradas em projetos e estes projetos sejam incluídos no projeto Umbrella-Brasil.
Basta olhar nos Umbrella do ano passado e anterior, que costumo incluir os projetos locais.
A questão é que vocês, Curitiba e São Paulo não aderiram a esta proposta, de incluir um bioblitz em um determinado parque e ter registrados os resultados num projeto específico.
Não foi ERRO, mas sim deliberado. O erro foi a não divulgação adequada.!
Mas podemos manter dois umbrella, um só com os oficiais e outro com todos os projetos participantes.

Posted by ericfischerrempe 8 days ago

Add a Comment

Sign In or Sign Up to add comments