Il arrive souvent qu’une liste de données Excel contienne des doublons. Afin de nous aider à gérer cela, Microsoft a réuni une équipe de spécialistes et a développé la commande Supprimer les doublons. Super!! Plus besoin de chercher « à la mitaine » pour savoir si la liste contient des doublons.
L’équipe de Microsoft a malheureusement un peu bâclé le travail : une fois que les doublons sont identifiés, Excel garde la première occurrence et efface systématiquement les suivantes sans permettre un regard ou une sélection manuelle.
En d’autres mots, le choix de l’enregistrement à garder est fait par Excel sans aucun regard par l’utilisateur. Plutôt risqué… Si le bon enregistrement est le second ou encore s’il faut combiner les valeurs de deux enregistrements pour obtenir la bonne information, on vient de fausser les données.
À tout problème il existe une solution! Voici celle que je propose. Il faut voir l’outil développé par l’équipe de Microsoft comme un simple vérificateur. On lance la commande Supprimer les doublons avec les champs requis pour identifier les doublons et on se rend à la fin du processus.
S’il n’y a pas de doublons, pas besoin d’aller plus loin. On sait que la liste de données est correcte et ne contient pas d’enregistrement répété.
On sait qu’il y a un ou des doublons dans la liste. On doit, maintenant les identifier et les faire ressortir du lot.
Dans un premier temps, utiliser la commande Annuler (Ctrl + Z) pour retrouver la liste à son état initial. Ensuite, il faut suivre les étapes ci-dessous :
=NB.SI([Validation];[@Validation])
Et voilà! Tous les doublons s’affichent maintenant devant vous. Vous pouvez choisir l’action à prendre pour éliminer les données non pertinentes.
Avec de la pratique, vous pourrez combiner les deux colonnes en une seule étape.
About the author