Polícia Federal precisa criar software para lidar com mais de 1 milhão de GB da Lava Jato

PF precisou se adaptar ao grande volume de dados gerado pela operação

Por | @Evilmaax Tecnologia

A Lava Jato completou recentemente 3 anos de investigação. Foram muitas prisões (quase todas revogadas pouco tempo depois), vários bilhões desviados que foram localizados (quase nenhum voltou aos cofres públicos), farras no exterior com grana pública (arquivados por falta de “provas”), entre outros temas polêmicos.

Mas ainda há assim há alguns motivos para comemorar como, por exemplo, o empenho da Polícia Federal, que embora tenha tido a verba reduzida quase à metade, segue buscando identificar, prender e levar à julgamento aqueles que merecem.

Frequentemente vemos nas notícias que a PF prendeu 30 computadores aqui, 74 notebooks ali, 125 servidores acolá, 658 smartphones e assim por diante. O que muitos não se dão conta é que não é só apreender estes itens, pois o crime investigado não é de furto ou roubo. Depois será preciso varrer cada uma dessas máquinas através de planilhas do Excel, extratos de transações, e-mails e tudo o mais que possa identificar o descaminho do dinheiro, propina, laranjas, etc.

Quanto você acha que representa, em volume de dados investigados, o tamanho da Lava Jato? A PF divulgou que até o final de 2016 haviam sido coletados mais de 1.2 milhão de gigabytes, ou, 1.200 terabytes, ou ainda, 1.2 petabytes, ou seja, são dados pra caramba; e repare que esses são os valores até o final de 2016. Hoje, agosto de 2017, novas fases da operação foram deflagradas, pc apreendidos, e muitos outros gigabytes foram adicionados ao total de data apreendida.

Luís Filipe da Cruz Nassif, o principal criador do sistemaLuís Filipe da Cruz Nassif, o principal criador do sistema

Ahh, e caso você algum dia tenha se perguntado porque a PF abre concurso para peritos em informação digital formados em ciências da computação, engenharia da computação, sistemas de segurança, etc. aí está sua resposta. Eles precisam de muita gente para processar (no sentido de processamento de dados mesmo) essas infos.

Até a deflagração da Lava Jato a PF nunca tinha tido que lidar com tanta informação em uma só operação e, embora todo mundo soubesse disso na prática, o sistema atual mostrou-se incrivelmente lento para a quantidade de trabalho demandada.

Por exemplo, para a análise de contratos que procuravam o superfaturamento de empreiteiras, com o método tradicional, seriam necessários 8 ANOS de investigação processando valores, ligando os pontos, apurando contratos, etc. Porém, com o sistema criado pela PF o trabalho foi realizado em 6 meses.

O principal responsável pela animadora notícia é o perito Luís Filipe da Cruz Nassif que vinha, desde 2012, desenvolvendo um programa para acelerar o processamento de dados da PF e por isso foi convocado a dar continuidade nos trabalhos lá em Curitiba, sede em que está sendo comandada a operação.

O programa que ele chama de IPED (Indexador e Processador de Evidências Digitais) passou então a ser adaptado ao grande fluxo de dados e demanda da Lava Jato. Uma destas ferramentas é um método de processamento simultâneo de arquivos que permite que dados de até 100 máquinas possam ser processados no espaço temporal de um dia para outro.

Entre as capacidades do IPED que contribuem para o tempo recorde nas investigações está a possibilidade de enfileirar tarefas, coisa que os softwares convencionais – e comercializáveis – não permitem. Pois se com os programas tradicionais é preciso fazer a troca de Hd’s manualmente, agora é possível montar uma fila e apurar os dados até nos finais de semana, quando não há ninguém por lá. A velocidade de processamento é de até 400 GB por hora, dependendo da capacidade do servidor, 10 vezes mais que o líder comercial de mercado.

Polícia Federal precisa criar software para lidar com mais de 1 milhão de GB da Lava Jato

O IPED vem somar a outros casos em que os peritos da PF abriram o CodeBlocks e foram programar: Entre as outras criações famosas está um detector de nudez usado em investigações sobre pedofilia, um sistema que identifica locais de fotos e vídeos através de georreferenciamento, uma ferramenta que encontra palavras em fotos e vídeos, recuperação de arquivos apagados em mais de 40 formatos, identificação de arquivos criptografados, etc.

Economia

Além de dar mais celeridade ao processo, o IPED vem gerando economia para o – ainda menor – orçamento da PF. Um software padrão de análise forense custa cerca de 30 mil reais por ano POR MÁQUINA. Ou seja, o escritório de Curitiba, que tem 10 pc’s, agora economiza 300 mil reais por ano. A novidade é tão boa que polícias civis de outros estados também passaram a usar o IPED.

Mais sobre: tecnologia softwares policia
Share Tweet
Recomendado
Comentários
Destaquesver tudo