Accueil > Système > 4 outils utiles pour rechercher et supprimer des fichiers en double sous Linux

4 outils utiles pour rechercher et supprimer des fichiers en double sous Linux

14/10/2023 Categories: Système Tags: , , ,
Print Friendly, PDF & Email

L’organisation de votre répertoire personnel ou même de votre système peut être particulièrement difficile si vous avez l’habitude de télécharger toutes sortes de choses sur Internet.

Souvent, vous constaterez que vous avez téléchargé le même mp3, pdf, epub (et toutes sortes d’autres extensions de fichiers) et que vous l’avez copié dans différents répertoires. Cela peut encombrer vos répertoires de toutes sortes de choses dupliquées inutiles.

Dans ce didacticiel, vous allez apprendre à rechercher et à supprimer des fichiers en double sous Linux à l’aide des outils de ligne de commande rdfind et fdupes, ainsi qu’à l’aide d’outils d’interface graphique appelés DupeGuru et FSlint.

Une note de prudence – faites toujours attention à ce que vous supprimez sur votre système car cela peut entraîner une perte de données indésirable. Si vous utilisez un nouvel outil, essayez-le d’abord dans un répertoire de test où la suppression de fichiers ne posera pas de problème.

Rdfind – Trouve les fichiers en double sous Linux

Rdfind provient de la recherche de données redondantes. C’est un outil gratuit utilisé pour trouver des fichiers en double dans ou dans plusieurs répertoires. Il utilise la somme de contrôle et trouve les doublons basés sur le fichier contient non seulement des noms.

Rdfind utilise un algorithme pour classer les fichiers et détecte lequel des doublons est le fichier d’origine et considère le reste comme des doublons. Les règles de classement sont :

  • Si A a été trouvé lors de l’analyse d’un argument d’entrée antérieur à B, A est mieux classé.
  • Si A a été trouvé à une profondeur inférieure à B, A est mieux classé.
  • Si A a été trouvé avant B, A est mieux classé.

La dernière règle est notamment utilisée lorsque deux fichiers se trouvent dans le même répertoire.

Lire aussi:  compgen: An Awesome Command To List All Linux Commands

Pour installer rdfind sous Linux, utilisez la commande suivante selon votre distribution Linux.

$ sudo apt-get install rdfind     [On Debian/Ubuntu]
$ sudo yum install epel-release && $ sudo yum install rdfind    [On CentOS/RHEL]
$ sudo dnf install rdfind         [On Fedora 22+]
$ sudo pacman -S rdfind   [On Arch Linux]

Pour exécuter rdfind sur un répertoire, tapez simplement rdfind et le répertoire cible. Voici un exemple:

$ rdfind /home/user

Comme vous pouvez le voir, rdfind enregistrera les résultats dans un fichier appelé results.txt situé dans le même répertoire à partir duquel vous avez exécuté le programme. Le fichier contient tous les fichiers en double que rdfind a trouvés. Vous pouvez examiner le fichier et supprimer manuellement les fichiers en double si vous le souhaitez.

Une autre chose que vous pouvez faire est d’utiliser l’option -dryrun qui fournira une liste des doublons sans prendre aucune action :

$ rdfind -dryrun true /home/user

Lorsque vous trouvez les doublons, vous pouvez choisir de les remplacer par des liens physiques.

$ rdfind -makehardlinks true /home/user

Et si vous souhaitez supprimer les doublons, vous pouvez exécuter.

$ rdfind -deleteduplicates true /home/user

Pour vérifier d’autres options utiles de rdfind, vous pouvez utiliser le manuel rdfind avec.

$ man rdfind

Fdupes – Rechercher les fichiers en double sous Linux

Fdupes est un autre programme qui vous permet d’identifier les fichiers en double sur votre système. Il est gratuit et open-source et écrit en C. Il utilise les méthodes suivantes pour déterminer les fichiers en double :

  • Comparaison de signatures md5sum partielles
  • Comparaison des signatures md5sum complètes
  • vérification de la comparaison octet par octet

Tout comme rdfind, il a des options similaires :

  • Recherche récursive
  • Exclure les fichiers vides
  • Affiche la taille des fichiers en double
  • Supprimer immédiatement les doublons
  • Exclure les fichiers avec un propriétaire différent
Lire aussi:  Zsync HTTP-based File Transfer Utility Transfers Large Files Efficiently

Pour installer fdupes sous Linux, utilisez la commande suivante selon votre distribution Linux.

$ sudo apt-get install fdupes     [On Debian/Ubuntu]
$ sudo yum install epel-release && $ sudo yum install fdupes    [On CentOS/RHEL]
$ sudo dnf install fdupes         [On Fedora 22+]
$ sudo pacman -S fdupes   [On Arch Linux]

La syntaxe Fdupes est similaire à rdfind. Tapez simplement la commande suivie du répertoire que vous souhaitez analyser.

$ fdupes <dir>

Pour rechercher des fichiers de manière récursive, vous devrez spécifier le -r une option comme celle-ci.

$ fdupes -r <dir>

Vous pouvez également spécifier plusieurs répertoires et spécifier un répertoire à rechercher de manière récursive.

$ fdupes <dir1> -r <dir2>

Pour que fdupes calcule la taille des fichiers en double, utilisez l’option -S.

$ fdupes -S <dir>

Pour rassembler des informations résumées sur les fichiers trouvés, utilisez l’option -m.

$ fdupes -m <dir>

Enfin, si vous souhaitez supprimer tous les doublons, utilisez le -d une option comme celle-ci.

$ fdupes -d <dir>

Fdupes demandera lequel des fichiers trouvés supprimer. Vous devrez entrer le numéro de dossier :

Une solution absolument déconseillée consiste à utiliser l’option -N qui aura pour effet de ne conserver que le premier fichier.

$ fdupes -dN <dir>

Pour obtenir une liste des options disponibles à utiliser avec fdupes, consultez la page d’aide en exécutant.

$ fdupes -help

dupeGuru – Trouver des fichiers en double dans un Linux

dupeGuru est un outil open source et multiplateforme qui peut être utilisé pour trouver des fichiers en double dans un système Linux. L’outil peut analyser les noms de fichiers ou le contenu d’un ou plusieurs dossiers. Il vous permet également de trouver le nom de fichier similaire aux fichiers que vous recherchez.

Lire aussi:  How to secure an Ubuntu 12.04 LTS server - Part 2 The GUI installer script

dupeGuru est disponible en différentes versions pour les plates-formes Windows, Mac et Linux. Sa fonction d’algorithme de correspondance floue rapide vous aide à trouver les fichiers en double en une minute. Il est personnalisable, vous pouvez extraire les fichiers en double exacts que vous souhaitez et effacer les fichiers indésirables du système.

Pour installer dupeGuru sous Linux, utilisez la commande suivante selon votre distribution Linux.

--------------- On Debian/Ubuntu/Mint --------------- 
$ sudo add-apt-repository ppa:dupeguru/ppa
$ sudo apt-get update
$ sudo apt-get install dupeguru
--------------- On Arch Linux --------------- 
$ sudo pacman -S dupeguru

FSlint – Recherche de fichiers en double pour Linux

FSlint est un utilitaire gratuit utilisé pour rechercher et nettoyer diverses formes de peluches sur un système de fichiers. Il signale également les fichiers en double, les répertoires vides, les fichiers temporaires, les noms (binaires) en double/conflictuels, les liens symboliques incorrects et bien d’autres. Il a à la fois des modes de ligne de commande et d’interface graphique.

Pour installer FSlint sous Linux, utilisez la commande suivante selon votre distribution Linux.

$ sudo apt-get install fslint     [On Debian/Ubuntu]
$ sudo yum install epel-release && $ sudo yum install fslint    [On CentOS/RHEL]
$ sudo dnf install fslint         [On Fedora 22+]
$ sudo pacman -S fslint   [On Arch Linux]

Conclusion

Ce sont des outils très utiles pour trouver des fichiers en double sur votre système Linux, mais vous devez être très prudent lorsque vous supprimez de tels fichiers.

Si vous ne savez pas si vous avez besoin d’un fichier ou non, il serait préférable de créer une sauvegarde de ce fichier et de mémoriser son répertoire avant de le supprimer. Si vous avez des questions ou des commentaires, veuillez les soumettre dans la section des commentaires ci-dessous.

Categories: Système Tags: , , ,
Les commentaires sont fermés.