Curitiba, PR – Há séculos, cientistas se dedicam a catalogar os seres vivos de forma sistemática. Em 1753, o sueco Carl Linnaeusconsolidou o método binomial, que nomeia cada espécie com duas palavras em latim modelo adotado até hoje. Com o avanço das expedições científicas e o crescimento do número de registros, o trabalho de classificação tornou-se mais complexo, seja pela dificuldade de acesso às amostras, seja pelo volume acumulado de informações.

Uma mudança significativa começou a se desenhar nas últimas três décadas, com o avanço das tecnologias digitais que transformaram a coleta, a organização e o compartilhamento de dados científicos. Atualmente, catálogos de espécies estão disponíveis online e podem receber contribuições de diferentes partes do mundo. Ainda assim, o desafio da comunidade científica passou a ser outro: como processar e analisar grandes volumes de dados de forma padronizada e confiável.

Foi nesse contexto que o pesquisador Weverton Carlos Ferreira Trindade, do Laboratório de Ecologia Funcional de Comunidades da Universidade Federal do Paraná (UFPR), desenvolveu o florabr, ferramenta que automatiza a organização de dados sobre plantas do Brasil e facilita o acesso a informações disponíveis em bases digitais.

Criado na linguagem R, amplamente utilizada na análise de grandes bases de dados, o florabr funciona como um pacote de comandos que executa tarefas antes realizadas manualmente, como correção de grafias, atualização de nomenclaturas e organização de mapas de distribuição. A ferramenta também permite verificar se o nome de uma espécie está correto, identificar duplicidades ou inconsistências geográficas e gerar listas organizadas por estado ou bioma.

Um dos marcos do mapeamento digital da biodiversidade foi a criação da Global Biodiversity Information Facility(GBIF), em 2001. A iniciativa integrou informações antes dispersas em coleções físicas e arquivos institucionais, ampliando o acesso em escala global. A popularização dos smartphones na década de 2010 intensificou esse processo, permitindo que qualquer pessoa registrasse e compartilhasse ocorrências de espécies com foto e localização.

No Brasil, o projeto Flora e Funga do Brasil, do Jardim Botânico do Rio de Janeiro, reúne desde 2020 a catalogação de plantas, algas e fungos registrados no país ao longo de séculos. Apesar do acesso público, pesquisadores relatam dificuldades na extração e padronização das informações disponíveis.

O principal obstáculo é o volume de registros. Bases com milhares de entradas podem conter nomes desatualizados, duplicações e erros de localização. Transformar esse material bruto em análises científicas exige tempo, revisão e padronização.

A ideia do florabr surgiu durante o doutorado de Trindade em Ecologia e Conservação na UFPR, realizado em parceria com a Universidade do Kansas. O pesquisador analisava 15 mil plantas catalogadas na Mata Atlântica e encontrou dificuldades para extrair manualmente as informações do Flora e Funga.

“Eu ia ter que digitar 15 mil vezes o nome da espécie, o que era inviável”, relata.

Diante do impasse, desenvolveu uma solução específica para integrar e organizar dados da plataforma brasileira. A ferramenta foi disponibilizada gratuitamente e os resultados do trabalho foram publicados em 2024 na revista científica Applications in Plant Sciences.

Segundo o pesquisador, a comunidade que utiliza a linguagem R opera de forma colaborativa, com compartilhamento aberto de códigos e aprimoramento contínuo de ferramentas.

“Esse modelo de desenvolvimento coletivo permite que os pacotes evoluam de forma contínua, o que é bom para todos”, afirma.

Apesar dos avanços tecnológicos, os desafios da taxonomia vão além da organização de dados. De acordo com Trindade, ainda há um número reduzido de especialistas diante da diversidade de espécies existentes.

“O GBIF é a maior plataforma mundial de biodiversidade e conta com 3,5 bilhões de ocorrências e mais de 1 bilhão de espécies registradas. Mas ainda estamos longe de conhecer toda a biodiversidade do planeta porque temos muitos dados dos mesmos tipos de organismos coletados nos mesmos lugares”, explica.

O pesquisador aponta que há maior volume de registros de aves em comparação a anfíbios, por exemplo, porque mais pessoas se dedicam a observar e registrar aves. Isso gera vieses nas bases de dados.

“Em países tropicais como o Brasil, há lugares de difícil acesso, em que plantas serão extintas antes de terem amostras coletadas. Muitas vezes, é preciso que tenhamos pelo menos 8 registros para incluir a espécie em estudos de ecologia e conservação e, em muitos casos, não temos registro algum. São espécies invisíveis para a ciência, e isso não ocorre apenas com as plantas”, diz.

Ele também destaca que a inteligência artificial pode auxiliar no processamento de informações, mas depende da existência prévia de dados consolidados.

“Se a gente não tem coleta e não tem material digitalizado o suficiente, a IA não vai bastar. O caminho é lutar para ter mais gente pesquisando”, conclui.

 

FICCO/PR prende homem com 10,5 kg de cocaína durante abordagem na BR-163