Un vieux film de 1896 transformé en 4K…. grâce à l’intelligence artificielle

En 1896, la projection en salle d’une des premières œuvres cinématographiques, « L’arrivée d’un train en gare de La Ciotat », a provoqué une panique générale. Certains spectateurs se sont précipités vers les portes de sortie, croyant que le train allait sortir de l’écran. Pourtant à l’époque, la qualité d’image du court-métrage de 50 secondes était floue, et la résolution basse. En 2020, une version en 4K du même film vient d’être présentée par Denis Shiryaev. Cette prouesse a vu le jour grâce à l’intelligence artificielle, et plus spécifiquement avec l’utilisation de 2 programmes, DAIN et Gigapixel AI, de Topaz Labs. En combinant leurs capacités, Denis Shiryaev a obtenu un nouveau film en 4K 60FPS à partir de l’original. Gigapixel AI utilise un algorithme d’interpolation, dont la principale fonction est d’analyser une image, reconnaître sa structure et compléter les manques. Cette intelligence artificielle est capable d’affiner la précision des images même agrandies jusqu’à 600 %. Pour sa part, DAIN est capable d’insérer des images entre les séquences clés d’un film existant à la manière d’un processus de lissage de mouvements sur un téléviseur 4K.

Dans le détail, ce type de processus n’est pas aussi simple qu’on ne le croit. Rien que pour agrandir une image de qualité HD pour qu’elle tienne sur un écran 4K, il faut ajouter 6 millions de pixels supplémentaires. Ce procédé doit faire appel à une opération spécifique : l’interpolation. Cette dernière consiste à déterminer ce que les nouveaux pixels doivent afficher en fonction des autres pixels qui sont autour d’eux. Pour cela, il existe plusieurs méthodes. Tout d’abord, il a celle du « plus proche voisin ». Elle consiste à remplir les pixels vides par de nouveaux de la même couleur que leurs plus proches voisins. L’image qui en résulte est par contre assez dentelée. L’autre méthode dite de l’interpolation bilinéaire nécessite une puissance de traitement plus élevée, mais le téléviseur sera capable d’analyser chaque pixel vierge à partir de ses deux voisins les plus proches. Un gradient sera ensuite généré, rendant l’image plus nette. Une troisième méthode, l’interpolation cubique, adopte la même méthode, mais se base sur les 16 pixels les plus proches du pixel vierge. Le résultat est une meilleure coloration de l’image. En combinant les trois méthodes d’interpolation, il est possible d’obtenir un film d’une meilleure qualité que l’original.

Les résultats ne sont pas encore parfaits, car des artefacts visuels subsistent sur le produit fini, surtout lorsqu’un film présente un mouvement complexe comme l’ondulation. Néanmoins, cette technique faisant appel à l’IA est très prometteuse. Certains spécialistes spéculent déjà sur la renaissance des anciens film du cinéma muets.