Rechercher des doublons dans une liste de données peut être une corvée sans valeur ajoutée dont on se passerait bien. C’est pourtant bien souvent un prérequis pour éliminer les erreurs. Comme d’habitude, nous allons voir ensemble comment automatiser cette tâche pour pouvoir mettre notre énergie sur les sujets qui en valent vraiment la peine.
Nombreux sont ceux qui trieraient les données par ordre croissant et parcourraient la liste à la recherche de doublons. Dans le pire des cas, on s’arrache les yeux sur une liste plus ou moins interminable tout en jouant avec sa souris. Au mieux, on rajoute une formule dans une colonne adjacente avec une formule de test du type : si égal cellule du dessus alors « ok » sinon « doublon ».
La mise en forme conditionnelle d’Excel pour identifier facilement les doublons
Le moyen le plus simple pour identifier des doublons est d’utiliser une mise en forme conditionnelle.
Pour cela, il faut commencer par sélectionner la plage de données dans laquelle vous recherchez des doublons. Cliquez ensuite sur le bouton « Mise en forme conditionnelle » dans le menu « Accueil », puis sélectionnez « Valeurs en double » dans les « Règles de surbrillance des cellules ».
Vous obtenez alors une boîte de dialogue pour définir le format à appliquer aux cellules présentant des valeurs en doublons. Avant de cliquer sur OK, la mise en forme sélectionnée s’applique déjà aux éventuels doublons présents dans vos données. Cela permet de prévisualiser le format qui doit vous alerter !
On voit déjà clairement que le Cambodge et la Chine sont en double dans notre liste.
Bien évidemment cette solution ne traite pas que les doublons au sens strict, mais toute valeur se répétant plusieurs fois. Pour le dire autrement, seuls les contenus uniques ne sont pas mis en forme.
Les avantages de l’identification des doublons avec la mise en forme conditionnelle d’Excel
Chasser les doublons avec la mise en forme conditionnelle est une solution :
- très simple dans sa mise en œuvre. Quelques clics suffisent !
- très visuelle. Les doublons apparaissent clairement
- qui a le grand avantage d’être dynamique ! En effet, si votre plage de données à contrôler contient des formules, la mise en forme conditionnelle s’appliquera dynamiquement aux résultats obtenus.
Les points de vigilance dans la chasse aux doublons… et surtout comment les dépasser !
Des plages de données trop longues pour voir les doublons
Lorsque vous cherchez à chasser des doublons sur une plage de données de plusieurs centaines de lignes, l’avantage d’une détection visuelle n’a plus beaucoup d’intérêt.
Solution : doubler le contrôle visuel par une cellule calculée ! Utilisez la fonction NB.SI() pour dénombrer les cellules dont la valeur se répète. Il suffit pour cela d’indiquer la plage de donnée à contrôler dans les deux arguments de la formule. Voir ci-dessous :
Les références de la mise en forme conditionnelle peuvent facilement devenir obsolètes
Les listes évoluent bien souvent dans le temps. On rajoute des lignes, on en supprime, en haut, en bas, au milieu, on trie par ordre alphabétique etc… Il se peut que les références initialement sélectionnées lors du paramétrage de la mise en forme conditionnelle ne suivent pas toutes ces évolutions. Un paramétrage devenu obsolète et des doublons ont alors vite fait de passer inaperçus !
Voici 3 solutions pour y remédier, de la plus basique à la plus aboutie :
Solution 1 : Lorsque vous retravaillez « sévèrement » vos listes, avec de nombreux ajouts/suppressions, ayez le réflexe de vérifier à quelles plages de données votre mise en forme conditionnelle se réfère. Mieux vaut prévenir que guérir !
Solution 2 : Exploitez les moyens listés dans un précédent article pour éviter les erreurs de références. Il est en effet préférable sécuriser au mieux les références utilisées en les délimitant clairement ou en les nommant.
Solution 3 : Pour en venir à la conclusion de l’article précédemment cité (3 moyens d’éviter les erreurs de références), l’idéal reste de travailler avec des tableaux (voir notre article consacré aux Tableaux). Vous pourrez alors appliquer la mise en forme conditionnelle d’identification des doublons à une colonne. Le format conditionnel s’appliquera alors à cette colonne quelle qu’en soit la hauteur, par exemple lors que l’on importe de nouvelles données avec un filtre élaboré. L’usage des tableaux est le meilleur moyen d’éviter l’obsolescence de la mise en forme conditionnelle.
Dans de prochains articles, nous verrons :
- comment facilement supprimer des doublons (voir l’article) maintenant que nous savons les identifier
- comment utiliser d’autres mises en forme conditionnelles d’Excel permettant de gagner du temps.
D’ici là abonnez-vous ci-dessous pour en être informé et ne rater aucune de nos bonnes pratiques !