Inteligênica Artificial do Google faz o ''zoom e aprimoramento'' da imagem ser real

A velocidade de avanço e crescimento da tecnologia está muito rápida. A inteligência artificial (IA) é uma tecnologia que possibilita que máquinas adquiram conhecimentos por meio de experiências, se adaptem às condições e consigam desempenhar tarefas como os seres humanos. Parece uma ideia promissora. No entanto, assim como os robôs, ainda existe uma certa preocupação sobre o quanto esse tipo de tecnologia pode evoluir.

E por ser um tema tão interessante, se explora muito em filmes. Com certeza, você já viu algum filme de ficção científica em que o personagem pede para aumentar o zoom de uma imagem e melhorar os resultados. Com isso, aparece melhor um rosto de uma pessoa ou a placa de um carro.

Aprimoramento

Até algum tempo atrás isso era exclusividade dos filmes. Mas agora, uma inteligência artificial do Google consegue fazer essa mesma coisa se baseando nos modelos de difusão.

Esse processo é difícil de dominar porque, em sua essência, o que acontece é que os detalhes da imagem estão sendo adicionados. Ou seja, são coisas que a própria câmera não captou originalmente. Isso requer algumas suposições super inteligentes baseadas em outras imagens parecidas.

A técnica usada se chama síntese natural de imagem pelo Google. E nesse cenário, ela é usada para dar uma super resolução à uma imagem. Se começa com uma foto pequena, em blocos e pixelizada. E ao final, se tem uma imagem nítida, clara e de aparência natural. O resultado pode não ser exatamente igual ao original, mas é semelhante o suficiente para parecer real para uma pessoa.

Ferramentas

O Google revelou duas ferramentas novas de IA para esse trabalho. A primeira se chama SR3, ou Super-resolução via Refinamento Repetido. Ela funciona adicionando ruído ou imprevisibilidade a uma imagem e depois reverte esse processo e o remove assim como quando um editor de imagem tenta melhorar as fotos.

“Os modelos de difusão funcionam corrompendo os dados de treinamento adicionando progressivamente ruído gaussiano, apagando lentamente os detalhes dos dados até que se tornem ruído puro e, em seguida, treinando uma rede neural para reverter esse processo de corrupção”, explicaram o cientista pesquisador Jonathan Ho e o engenheiro de software Chitwan Saharia do Google Research.

Então, através de vários cálculos de probabilidade tendo um grande banco da dados de imagens e uma mágica de aprendizado da máquina, o SR3 consegue imaginar como seria uma versão da imagem em resolução boa.

A segunda ferramenta se chama CDM, ou Modelos de Difusão em Cascata. De acordo com o Google, ela é a ferramenta através da qual os modelos de difusão podem ser direcionados para atualizações de resolução de imagem de alta qualidade. Essa ferramenta pega os modelos de aprimoramento e os transforma em imagens maiores.

Resultados

Juntos, o SR3 e o CDM dão resultados impressionantes. Um teste padrão foi feito com 50 voluntários. Nele, as imagens de rostos geradas pelo SR3 foram confundidas com fotos reais aproximadamente 50% das vezes.

Embora as imagens aprimoradas não sejam correspondentes exatas das originais, elas são uma simulação calculada de forma bem cuidadosa baseada em uma matemática de probabilidade avançada.

“Estamos entusiasmados para testar ainda mais os limites dos modelos de difusão para uma ampla variedade de problemas de modelagem generativa”, concluíram os pesquisadores.

Fonte: https://www.sciencealert.com/google-s-latest-photo-ai-makes-zoom-and-enhance-a-reality

Inteligênica Artificial do Google faz o ”zoom e aprimoramento” da imagem ser real

Aprimoramento

Ferramentas

Resultados

Realmente existe muito ”tempo livre”, de acordo com a ciência

Essa lenda urbana pode te traumatizar

Comentários