Umbralización
El objetivo de la umbralización es obtener una imagen binaria con los folículos aislados. Podemos dividir este proceso en dos partes, la preparación para la umbralización y el algoritmo de umbralización en sí. La primera de ellas consta de procesamientos sencillos que tienen como objetivo resaltar las estructuras de interés para luego facilitar al algoritmo la correcta aislación de las mismas. Las tres etapas de procesamiento son las siguientes:
- Reescalado: disminución del tamaño de la imagen.
- Transformación de intensidad: transformación logarítmica píxel a píxel.
- Suavizado: filtro de media.
La transformación de intensidad se aplica para obtener un mejor contraste en la imagen. Las zonas de los bigotes de los gatos suelen ser oscuras (píxeles con valores bajos), por lo que la transformación logarítmica resulta útil para obtener una mayor dispersión de intensidades en estos casos.
Las otras dos etapas, el reescalado y el suavizado, se basan en la idea de que las estructuras de interés son "grandes". Es decir, nos interesan los folículos, que en comparación a los bigotes o los pelos, son más gruesas. El reescalado se hace principalmente para ahorrar costo computacional en las etapas posteriores, mientras que el suavizado sí busca eliminar las estructuras y detalles finos ya mencionadas, además de posible ruido.
Una vez procesada la imagen, se aplica un algoritmo de umbralización adaptiva iterativa. Por un lado, la umbralización adaptiva "simple" es un algoritmo que utiliza información de conjuntos de píxeles vecinos para adaptarse a variaciones de iluminación u otras características en una misma imagen. Es adaptivo respecto a diferentes zonas de la imagen. La umbralización adaptiva iterativa por otro lado busca adaptarse a cada imagen diferente. La estrategia consta de iterar en los valores de umbralización hasta obtener una cantidad fija de píxeles negros.
La primera adaptación mencionada es necesaria porque no podemos asumir que las fotografías con las que trabajamos tienen buenas condiciones de iluminación. A simple vista es fácil distinguir los folículos, pero sabemos que esto se debe en gran parte debido a la interpretación interna que tenemos de las fotografías. Nosotros vemos "círculos negros", pero la información guardada en las imágenes bien puede diferir y puede haber variaciones de intensidad inesperadas.
La segunda adaptación es necesaria porque las características de cada fotografía son muy distintas entre sí. Están obtenidas con distintas cámaras, en distintos ambientes, etc. El algoritmo iterativo es útil porque luego de estandarizar las imágenes, es razonable esperar que las estructuras sean aproximadamente del mismo tamaño. Dicho de otro modo, se espera que sean representadas con la misma cantidad de píxeles.