Ao falar sobre visão noturna, todos imaginam que a imagem exibida ficará verde com preto, no entanto, isso está prestes a mudar. Pesquisadores descobriram uma maneira de as câmeras capturarem, mesmo à noite, uma imagem colorida, como se ela tivesse sido tirada durante o dia.
Em 6 de abril, a revista Plos One publicou um artigo americano onde pesquisadores apresentam a descoberta de um algoritmo otimizado com arquitetura de aprendizado profundo que consegue transformar o espectro visível de uma cena noturna para como uma pessoa pode vê-lo durante o dia.
À noite, as pessoas não conseguem ver cores e contrastes devido à falta de luz, para isso precisam iluminar a área ou usar viseiras noturnas, estas últimas dão uma imagem esverdeada. Ao resolver os espectadores monocromáticos, será possível que todos vejam e tirem fotos que parecem diurnas, o que será de grande ajuda no trabalho de reconhecimento militar tático, entre outros.
Para conseguir isso, os pesquisadores usaram uma câmera monocromática sensível à luz visível e infravermelha para adquirir o banco de dados de uma imagem impressa ou imagens de rostos sob iluminação multiespectral cobrindo o olho visível padrão.
Posteriormente, eles otimizaram uma rede neural convolucional (U-Net) para prever imagens do espectro visível a partir de imagens de infravermelho próximo. Seu algoritmo é impulsionado pelo aprendizado profundo usando luz espectral.
Para aprender o espectro de refletância espectral das tintas ciano, magenta e amarelo, eles imprimiram a paleta de cores Rainboy para registrar seus comprimentos de onda. Em seguida, imprimiram várias imagens e as colocaram sob iluminação multiespectral com uma câmera monocromática (preto e branco), montada em um microscópio de dissecação focado na imagem.
No total, eles imprimiram uma biblioteca de mais de 200 rostos humanos disponível na publicação “Labeled Faces in the Wild”, com uma impressora Canon e tinta MCYK. As imagens foram colocadas sob diferentes comprimentos de onda e, em seguida, usadas no treinamento de aprendizado de máquina focado na previsão de imagens coloridas (RGB) a partir de imagens iluminadas de um comprimento de onda único ou combinado.
Para todos os experimentos, eles seguiram o modelo prático de aprendizado de máquina: dividiram o banco de dados em 3 partes, reservando 140 imagens para treinamento, 40 para validação e 20 para testes. Para comparar o desempenho entre diferentes modelos, eles avaliaram várias métricas para a reconstrução da imagem.
Os pesquisadores apontaram que este estudo serve como um passo para a previsão de cenas no espectro visível humano a partir de iluminação imperceptível no infravermelho próximo.
Eles disseram que “sugere que a previsão de imagens de alta resolução depende mais do contexto de treinamento [da Máquina] do que das assinaturas espectroscópicas de cada tinta” e que esse trabalho deve ser um passo para vídeos de visão noturna, dos quais dependerá o número de quadros que processa por segundo.
CONTINUE LENDO: