La structure de la matrice est directement liée à son application. Les systèmes à transfert de bloc (frame « fr ») complet ou partiel, tendent à être utilisés pour les applications scientifiques. Les systèmes à transfert interligne sont utilisés pour les caméscopes grand-public et les systèmes de télévision professionnels. Les capteurs linéaires, à balayage progressif et ceux avec retard temporel et intégration (TDI) sont utilisés pour des applications industrielles. Le balayage progressif signifie simplement que l'image est balayée séquentiellement ligne par ligne (non entrelacée). Ceci est important pour la vision artificielle car il fournit un chronométrage précis et il possède un format simple. Toute application qui requiert de la numérisation et une interface avec un ordinateur fonctionnera probablement mieux avec de l'imagerie balayée progressivement. Toutefois, peu de moniteurs peuvent directement afficher ce type d'imagerie et une interface est requise. Les cartes de capture de bloc peuvent fournir cette interface.
Des matrices de grade scientifique peuvent être aussi étendues que 5120 x 5120 éléments voire plus (On arrive à plus de 9000 x 9000 ...). Tandis que les matrices grand format offrent les résolutions les plus élevées, leur utilisation est restreinte par leurs limitations en vitesse de lecture.
Un caméscope grand-public opérant à une cadence de 30 bloc/s (fr/s) possède une vitesse de transfert de donnée en pixel ("pixel data rate") d'environ 10 Mpixels/s. Une matrice de 5120 x 5120 éléments opérant à 30 fr/s aura une vitesse de transfert de donnée en pixel d'environ 768Mpixels/s.
Des grandes matrices peuvent réduire les vitesses de lecture des sous-matrices en ayant des ports parallèles multiples affectés aux sous-matrices. Un compromis existe entre la vitesse de transfert de bloc et le nombre de ports parallèles (complexité du CCD) et de l'interfaçage avec l'électronique en aval. Comme chaque sous-matrice est traitée par des amplificateurs différents, que ce soit sur le chip ou en dehors, l'image peut présenter des variations locales en contraste et en niveau. Ceci est provoqué par des différences d'ajustement des niveaux et des gains de chacun des amplificateurs (Le paroxysme étant atteint pour les capteurs CMOS, où chaque pixel possède son propre amplificateur, cf. infra). Actuellement, on peut également disposer d'association de grandes matrices afin d'obtenir ce qu'on appelle des réseaux de matrices pour plan focal (« Focal Plane Array »). Ceci est principalement utilisé pour des images très étendues et plus particulièrement pour des applications en astronomie.
La résolution spatiale est souvent présentée comme le nombre de pixels dans une matrice. La perception commune veut que « le plus grand est le mieux », tant en terme de taille qu'en dynamique. Des matrices peuvent atteindre 9216 x 9216 avec une dynamique de 16 bits. Cette matrice requiert 9216 x 9216 x 16 soit 1.36Gbits de stockage par image. La compression de ce type d'image peut s'avérer nécessaire si l'espace disque est limité. Pour perdre le moins de résolution possible, d'énormes progrès des algorithmes de compression ont été et sont encore réalisés.
Pour augmenter la résolution temporelle de la séquence d'images, on tend vers une accélération de la fréquence d'acquisition et de la vitesse de transfert des images (On arrive à des fréquences d'acquisition de 5400fr/s pour 1Megapixel, avec un capteur CMOS!!!). Toutefois, l'utilisateur de ce type d'acquisition devra décider quelles images sont significatives et via des algorithmes de réduction de données, enregistrer celles qui ont de la valeur. A défaut, il risque d'être submergé par des montagnes de données à traiter.