La deuxième transformation, notée sur la figure 2 relie le repère caméra au repère capteur (plan rétinien). C'est une projection perspective (matrice 3×4, notée ) qui transforme un point 3D en un point-image (en unité métrique).
où désigne la focale de l'objectif utilisé.
L'équation (2) qui traduit la projection perspective s'écrit :
Ces équations sont non-linéaires.
L'utilisation des coordonnées homogènes permet d'écrire la projection perspective (et le modèle sténopé complet) sous forme linéaire (cf. équation (2)).