Un moderno sistema de visión industrial consta de:
Un sistema de iluminación.
Una buena iluminación es especialmente importante para la toma de imágenes de los productos en una línea rápida de producción, aunque algunas aplicaciones pueden utilizar la luz ambiente.
La lente de la cámara.
La correcta selección de lentes es importante para alcanzar una solución óptima.
Una o más cámaras para adquirir las imágenes.
Las cámaras pueden ser analógicas, pero el precio de la cámaras digitales está disminuyendo, de modo que éstas se están usando más a menudo.
Un dispositivo de interfaz para transferir las imágenes al ordenador.
Un procesador de imagen, ordenador o cámara inteligente.
Una opción es utilizar cámaras inteligentes que integran el procesamiento de imágenes dentro de la propia cámara, evitando la necesidad de transferir imágenes a un ordenador externo. La velocidad de proceso de estas cámaras es inferior a la de un ordenador y existen aplicaciones en las que éstas no son adecuadas.
Una interfaz para notificar el resultado del análisis a un operador.
Se puede notificar de este resultado mediante una señal electrónica que opera un mecanismo de rechazo.
La imagen de entrada -una matriz bidimensional de niveles energéticos (por ejemplo, luz)- se divide en elementos de imagen, conocidos como píxeles. Estos forman filas y columnas que abarcan toda la zona de la imagen y representan los niveles de gris en una imagen monocromática o la codificación de color en una imagen en color. Un píxel no puede ser subdividido en regiones de menor nivel de gris o color. Este proceso es un tipo de digitalización espacial. Para cada píxel, la información del nivel de energía también debe ser digitalizado, es decir, los niveles analógicos (variable continua) producidos por la cámara deben ser representados por un número finito de pasos. En muchas aplicaciones es suficiente digitalizar una imagen monocroma con 8 bits por píxel, lo que equivale a 256 pasos, para representar el nivel de gris de cada píxel. En aplicaciones más exigentes puede ser necesario digitalizar a 14 bits (o 16384 niveles). Las imágenes en color son más complejas y pueden ser representados en diferentes formatos. La imágenes en color normalmente contienen tres veces más información que una imagen monocromática.
Algunos sistemas de visión no utilizan una cámara matricial, en su lugar se usa una cámara lineal que produce una sola línea o fila de píxeles. La imagen bidimensional se genera a medida que el objeto pasa bajo la cámara lineal, aprovechando su movimiento, normalmente generado por una cinta transportadora. Uniendo las distintas filas de píxeles obtenidas a diferentes intervalos de paso, se obtiene una imagen bidimensional.