304 views
## Réponse CAF demande communication code source algorithme de profilage des allocataires à des fins de contrôle Cher Monsieur, Je fais suite à la demande de La Quadrature du Net de communication de documents administratifs relatifs à "/l'algorithme de scoring (profilage) utilisé par la CAF dans le cadre de sa politique de contrôle/", au titre de la loi Cada, en date du 11 août 2022. A titre liminaire, la Cnaf souhaite rappeler que les prestations versées par les Caf sont servies principalement sur un modèle déclaratif. Parmi les éléments déclarés par les allocataires figurent les ressources, la composition du foyer, la situation professionnelle. Ces données génèrent des risques d’erreur déclarative qu’il convient de couvrir par des actions de contrôle. Dans tous les cas, le contrôle est réalisé par un humain. Le modèle datamining sert uniquement à identifier les profils qui, au regard de leurs caractéristiques, ont le plus de risque de commettre une erreur dans leurs déclarations et par la suite d’occasionner un indu (trop versé). Les contrôles permettent également d’identifier des rappels (pas assez versé). Il s’agit donc d’un outil au service du paiement du juste droit. Vous trouverez ci-joint le code source du logiciel utilisé actuellement par la Cnaf - expurgé des mentions qui si elles étaient communiquées pourraient donner des indications aux fraudeurs pour tromper l'algorithme - qui vous permettra de comprendre le modèle. "L/es variables utilisées lors de la phase d'entraînement du modèle/" ne sont pas communicables dans la mesure où (i) elles sont le résultat d'un savoir-faire et (ii) pourraient donner des indications aux fraudeurs pour tromper l'algorithme. Par ailleurs, nous vous précisons que : ·le score de risque est conservé en archives 6 ans après la fin de la relation de l'allocataire avec la branche Famille ; en cas de contentieux, le score de risque est conservé pendant la durée de la procédure jusqu’à ce que les voies de recours ordinaires et extraordinaires ne soient plus possibles contre la décision rendue ; ·la Cnaf n'a pas eu d'échanges récents avec la Commission nationale de l'informatique et des libertés au sujet de l'outil de datamining ; ·aucune entreprise privée ou administration publique n'a contribué au développement de l'algorithme et la Cnaf n'a pas eu d'échange avec des entreprises privées ou des administrations publiques au sujet de l'outil de datamining. ·pour la fréquence de mise à jour de ce "score de risque" ; le score de risque est recalculé mensuellement, avec la même formule de calcul (modèle), il varie donc en fonction des variables utilisées dans le modèle qui peuvent changer pour chaque foyer ; ·les réunions techniques n’ont pas fait l’objet de compte-rendu. Enfin, des documents internes non rendus publics au sujet du modèle datamining vous seront communiqués ultérieurement, leur communication nécessitant un travail d'anonymisation des données à caractère personnel qu'ils contiennent concernant nos agents notamment. Je vous prie d'agréer, Cher Monsieur, mes salutations distinguées.