Les doublons

Les doublons

Les doublons

Il arrive souvent qu’une liste de données Excel contienne des doublons. Afin de nous aider à gérer cela, Microsoft a réuni une équipe de spécialistes et a développé la commande Supprimer les doublons. Super!! Plus besoin de chercher « à la mitaine » pour savoir si la liste contient des doublons.

L’équipe de Microsoft a malheureusement un peu bâclé le travail : une fois que les doublons sont identifiés, Excel garde la première occurrence et efface systématiquement les suivantes sans permettre un regard ou une sélection manuelle.

En d’autres mots, le choix de l’enregistrement à garder est fait par Excel sans aucun regard par l’utilisateur. Plutôt risqué… Si le bon enregistrement est le second ou encore s’il faut combiner les valeurs de deux enregistrements pour obtenir la bonne information, on vient de fausser les données.

La solution

À tout problème il existe une solution! Voici celle que je propose. Il faut voir l’outil développé par l’équipe de Microsoft comme un simple vérificateur. On lance la commande Supprimer les doublons avec les champs requis pour identifier les doublons et on se rend à la fin du processus.

  1. Option 1

S’il n’y a pas de doublons, pas besoin d’aller plus loin. On sait que la liste de données est correcte et ne contient pas d’enregistrement répété.

  1. Option 2

On sait qu’il y a un ou des doublons dans la liste. On doit, maintenant les identifier et les faire ressortir du lot.

Dans un premier temps, utiliser la commande Annuler (Ctrl + Z) pour retrouver la liste à son état initial. Ensuite, il faut suivre les étapes ci-dessous :

  1. Convertir la liste en Tableau Excel (facultatif mais ça simplifie le travail)
  2. Ajouter une colonne nommée « Validation » qui va assembler les colonnes à considérer pour déterminer s’il s’agit d’un doublon. La fonction CONCATENER permettra l’assemblage. =CONCATENER([@colonne1];[@colonne2];[@colonne3]).  Biensûr, vous avez compris que «colonne1», «colonne2″,»colonne3» représentent les entêtes de colonnes. Vous devez remplacer celles-ci par les colonnes réelles de votre tableau.
  • Ajouter une colonne nommée « Nombre » qui comptera le nombre d’occurrences pour chaque valeur de la colonne qui contient la fonction CONCATENER. On utilisera la fonction NB.SI pour vérifier

=NB.SI([Validation];[@Validation])

  1. Filtrer la colonne Nombre pour enlever toutes les valeurs « 1 »

Et voilà! Tous les doublons s’affichent maintenant devant vous. Vous pouvez choisir l’action à prendre pour éliminer les données non pertinentes.

Avec de la pratique, vous pourrez combiner les deux colonnes en une seule étape.

About the author

Monsieur Excel administrator

Je suis utilisateur d'Excel depuis 2000 et formateur depuis 2012. Excel, j'en mange! Je crois que toutes les entreprises devraient avoir leur "spécialiste" Excel pour permettre d'analyser, manipuler, transformer et améliorer les données rapidement et efficacement. Trop de temps est perdu chaque jour à faire ces opérations de façon manuelle. La solution : Monsieur Excel!