Clasificación

Luego de realizado el estudio de distintas métricas, decidimos apoyarnos en chamfer distance como métrica capaz de discriminar si las fotos ingresadas pertenecen o no al mismo individuo, dado que mostró ser capaz de capturar la similitud de las estructuras de los folículos en su totalidad, haciendo que para imágenes de los mismos folículos se obtuvieran valores consistentemente cercanos a cero.

En este punto, para determinar el mejor umbral posible decidimos graficar la curva de precision vs recall en los casos en que chamfer distance es calculada usando el valor de mediana para determinar los píxeles más cercanos entre las imágenes y en el que se usa el valor del cuantil 0.7, con el fin de entender si haciendo más permisiva la métrica lográbamos mejores resultados. En la siguiente figura presentamos las curvas mencionadas, donde la subfigura 1 corresponde a chamfer distance usando el cuantil 0.5 y la subfigura 2 corresponde a la métrica usando el cuantil 0.7.

PR_0.5
Figure 1: Chamfer distance usando cuantil 0.5
PR_0.7
Figure 2: Chamfer distance usando cuantil 0.7

A su vez, como contamos con dos imágenes de bigotes por cada gato podemos hacer una validación estricta, exigiendo que ambos bigotes cumplan la condición de correspondencia o de forma más permisiva, aceptando como válida la correspondencia de solo un lado.

Al evaluar las curvas presentadas nos planteamos cómo valoraríamos la detección de falsos positivos y falsos negativos y decidimos setear dos umbrales posibles, donde cada uno pueda adaptarse mejor a la aplicación que se le quiera dar a la herramienta. Por ejemplo, en casos donde sea imperioso hacer una correcta clasificación de los gatos y no sea tan importante si se dan algunos falsos positivos, podemos plantear un umbral más permisivo y aceptar como válida la correspondencia de un solo lado de los bigotes. En nuestro caso elegimos 4.25 usando chamfer distance con el cuantil 0.7, resultando en la siguiente matriz de confusión y rendimiento:

Fotografías del mismo gato Fotografías de gatos distintos
Es el mismo gato 42 805
No es el mismo gato 8 856

En otro tipo de aplicación puede ser más relevante no tener ningún falso positivo, exigiendo que ambos bigotes se correspondan y en caso de que se tengan falsos negativos podemos, por ejemplo, usar otra métrica como segunda validación, como puede ser IoU. En este caso proponemos el umbral 2 usando chamfer distance con el cuantil 0.5, obteniendo:

Fotografías del mismo gato Fotografías de gatos distintos
Es el mismo gato 25 231
No es el mismo gato 25 1430

links

social