Direto do cinema para a vida real. O Fotos de Câmera de Vigilância Melhorator Tabajara em versão mais crível.
Direto do cinema para a vida real. O Fotos de Câmera de Vigilância Melhorator Tabajara em versão mais crível.
Muitas vezes vemos filmes onde investigadores estão colados no ombro do técnico de informática do FBI/CSI/CIA/NSA/DEA (escolha uma agência) que, ao dar zoom em um rosto mal iluminado em uma imagem de baixa resolução, receber a ordem: "Enhance" (aprimorar).
Como mágica, o Photoshop da polícia/inteligência/Enterprise consegue produzir uma imagem nítida daquele ator que só faz papel de bandido. Mas isso é coisa de filme. Dá para tirar um pouco da tremida, realçar um pouco os vértices, interpolar outro tanto de pontos, aumentar o contraste/brilho. Dá até para obter uma imagem 3D de um foto 2D. Mas... Hollywood é Hollywood. Realidade é realidade. Treino é treino. Jogo é jogo.
Corta para a realidade
A Alphabet, com seu projeto de pesquisa de inteligência artificial Google Brain, fez o mais próximo que o algoritmo mágico das telinhas/telonas vive dizendo que é molezinha (aliás, esse é um algoritmo mais misterioso do que o programa para escolher o relator da Lava-Jato no Supremo). Pegou uma imagem de 8 x 8 pixels (meros 64 pixels) e tentouadivinhar reconstituir um rosto com base nessas pouquíssimas informações.
Usando inteligência artificial, eles até conseguiram resultados bem impressionantes dados os parcos retalhos de informação que foram fornecidos como entrada para o processo. Mas não chega a ser uma prova que possa ser usada diretamente em um tribunal.
Foram usadas duas redes neurais distintas:
A primeira é uma “rede de condicionamento” (conditioning network), que mapeia os pixels da imagem de 64 pixels tentando encontrar uma foto correspondente de alta resolução para servir de fonte para reconstituição. Para isso, submete-se cada imagem de alta resolução a um processo de degradação da qualidade criando uma miniatura de 64 pixels para fins de comparação.
O resultado do processamento das duas redes são mesclados, produzindo uma nova imagem artificial, que, em alguns casos, impressiona.
Muitas vezes vemos filmes onde investigadores estão colados no ombro do técnico de informática do FBI/CSI/CIA/NSA/DEA (escolha uma agência) que, ao dar zoom em um rosto mal iluminado em uma imagem de baixa resolução, receber a ordem: "Enhance" (aprimorar).
Como mágica, o Photoshop da polícia/inteligência/Enterprise consegue produzir uma imagem nítida daquele ator que só faz papel de bandido. Mas isso é coisa de filme. Dá para tirar um pouco da tremida, realçar um pouco os vértices, interpolar outro tanto de pontos, aumentar o contraste/brilho. Dá até para obter uma imagem 3D de um foto 2D. Mas... Hollywood é Hollywood. Realidade é realidade. Treino é treino. Jogo é jogo.
Corta para a realidade
A Alphabet, com seu projeto de pesquisa de inteligência artificial Google Brain, fez o mais próximo que o algoritmo mágico das telinhas/telonas vive dizendo que é molezinha (aliás, esse é um algoritmo mais misterioso do que o programa para escolher o relator da Lava-Jato no Supremo). Pegou uma imagem de 8 x 8 pixels (meros 64 pixels) e tentou
Usando inteligência artificial, eles até conseguiram resultados bem impressionantes dados os parcos retalhos de informação que foram fornecidos como entrada para o processo. Mas não chega a ser uma prova que possa ser usada diretamente em um tribunal.
Na imagem que ilustra a matéria, a foto da esquerda é a imagem de baixíssima resolução - 8 x 8 pixels - a ser "melhorada". A imagem produzida, ao centro, muitas vezes se parece com a versão da imagem original "piorada" (ground truth) para ficar na mesma relação de eixos da imagem produzida - 32 x 32 pixels.
Foram usadas duas redes neurais distintas:
A primeira é uma “rede de condicionamento” (conditioning network), que mapeia os pixels da imagem de 64 pixels tentando encontrar uma foto correspondente de alta resolução para servir de fonte para reconstituição. Para isso, submete-se cada imagem de alta resolução a um processo de degradação da qualidade criando uma miniatura de 64 pixels para fins de comparação.
A segunda (prior network, ou “rede anterior”, em tradução livre) analisa a foto e tenta adicionar detalhes baseado em outras fotos parecidas com pixels localizados em posições similares.
Por exemplo, se um pixel marron no alto da imagem a ser "melhorada" for associado a uma sobrancelha, quando a imagem melhorada (com mais pontos) for produzida, várias imagens de sobrancelhas que poderiam ser eleitas para ocupar aquela posição serão analisadas antes de se optar por uma delas. Não necessariamente será a sobrancelha da foto de alta resolução que serviu de base.
O resultado do processamento das duas redes são mesclados, produzindo uma nova imagem artificial, que, em alguns casos, impressiona.
Se quiser tentar entender a técnica com mais profundida, acesse o artigo neste link (em inglês e com uma linguagem só para iniciados).
Fonte: Olhar Digital, Ars Technica
[Visto no Brasil Acadêmico]
Fonte: Olhar Digital, Ars Technica
[Visto no Brasil Acadêmico]
Comentários