L'espace tridimensionnel de la scène est muni de son référentiel orthonormé . Chacune des deux caméras possède son propre référentiel orthonormé : nous les appellerons repère caméra gauche et repère caméra droite . La figure 12 illustre ces trois référentiels ainsi que les transformations rigides permettant d'exprimer un point dans un autre référentiel.
Avec ces conventions, nous pouvons écrire les relations suivantes :
Ces équations nous montrent que les trois transformations ne sont pas indépendantes puisque nous pouvons déterminer l'une d'entre elles en fonction des deux autres :
Lorsqu'un point de la scène est visible simultanément par les deux caméras, ces dernières nous donnent deux points : pour la caméra gauche, et pour celle de droite. En utilisant le modèle géométrique de caméra et la relation de dépendance entre les trois repères et , nous pouvons écrire les équations de et en fonction de :