Compressao de Imagens com controle de taxa baseado em Autoencoders
image coding; neural networks; rate-distortion; rate control; neural compres-
sion; reinforcement learning; loss-adaptive parameters
A compressão de imagens baseada em aprendizagem está emergindo como uma alternativa competitiva às técnicas convencionais de codificação de imagens. A codificação de imagens neurais avançou significativamente, evoluindo de uma dificuldade para corresponder aos codecs clássicos para agora superá-los frequentemente. Técnicas como autoencoders variacionais e redes neurais recorrentes têm se mostrado promissoras na otimização do equilíbrio entre taxa e distorção, preservando ao mesmo tempo o conteúdo da imagem. O controle de taxa é um recurso crítico, muitas vezes um requisito, para diversas aplicações de codificação de imagens estáticas. Alcançar o controle de taxa para cada entrada com impacto mínimo no desempenho de distorção de taxa continua sendo um desafio. Normalmente, os codecs com perdas baseados em aprendizagem precisam de vários modelos treinados para diferentes requisitos de qualidade. Embora as iniciativas tenham como objetivo aumentar a flexibilidade do modelo incorporando vários pontos de distorção de taxa, o problema do controle de taxa consistente – onde um modelo atinge uma taxa específica em todas as imagens compactadas – permanece subexplorado e pouco compreendido. Este trabalho propõe uma solução não restrita para o problema restrito de treinar um codec de imagem baseado em aprendizagem para uma taxa de bits específica. A solução envolve modificar a função de perda para otimização do autoencoder. Além disso, inspirada na Aprendizagem por Reforço, é introduzida uma abordagem adaptativa temporal, que incorpora o comportamento temporal na função de perda, tornando o processo de treinamento mais robusto contra desafios de otimização. Experimentos conduzidos nos conjuntos de dados Kodak e JPEG AI demonstram que codificadores automáticos treinados com as funções de perda propostas podem alcançar codificação com restrição de taxa com perdas insignificantes em SSIM (Medida de Índice de Similaridade Estrutural)