4 Nützliche Tools zum Suchen und Löschen doppelter Dateien unter Linux

Das Organisieren Ihres Home-Verzeichnisses oder sogar Ihres Systems kann besonders schwierig sein, wenn Sie die Gewohnheit haben, alle möglichen Dinge aus dem Internet herunterzuladen.

Oft stellen Sie fest, dass Sie dieselbe MP3-, PDF-, Epub- (und alle möglichen anderen Dateierweiterungen) heruntergeladen und in verschiedene Verzeichnisse kopiert haben. Dies kann dazu führen, dass Ihre Verzeichnisse mit allen Arten von nutzlosem dupliziertem Material überfüllt sind.

In diesem Tutorial erfahren Sie, wie Sie doppelte Dateien unter Linux mithilfe von finden und löschen rdfind und fdupes Befehlszeilentools sowie die Verwendung von aufgerufenen GUI-Tools DupeGuru und FSlint.

Ein Hinweis zur Vorsicht – seien Sie immer vorsichtig, was Sie auf Ihrem System löschen, da dies zu unerwünschten Datenverlusten führen kann. Wenn Sie ein neues Tool verwenden, versuchen Sie es zunächst in einem Testverzeichnis, in dem das Löschen von Dateien kein Problem darstellt.

1. Rdfind – Findet doppelte Dateien unter Linux

Rdfind kommt von redundanten Daten zu finden. Es ist ein kostenloses Tool, mit dem Sie doppelte Dateien in oder innerhalb mehrerer Verzeichnisse finden können. Es verwendet eine Prüfsumme und findet Duplikate, die auf Dateien basieren, die nicht nur Namen enthalten.


Rdfind verwendet einen Algorithmus zum Klassifizieren der Dateien und erkennt, welches der Duplikate die Originaldatei ist, und betrachtet den Rest als Duplikate. Die Regeln für das Ranking sind:

  • Wenn EIN wurde beim Scannen eines Eingabearguments früher als gefunden B., EIN ist höher eingestuft.
  • Wenn EIN wurde in einer Tiefe gefunden, die niedriger als ist B., EIN ist höher eingestuft.
  • Wenn EIN wurde früher als gefunden B., EIN ist höher eingestuft.

Die letzte Regel wird insbesondere verwendet, wenn sich zwei Dateien im selben Verzeichnis befinden.

Installieren rdfind Verwenden Sie unter Linux den folgenden Befehl gemäß Ihrer Linux-Distribution.

$ sudo apt-get install rdfind     [On Debian/Ubuntu]
$ sudo yum install epel-release && $ sudo yum install rdfind    [On CentOS/RHEL]
$ sudo dnf install rdfind         [On Fedora 22+]
$ sudo pacman -S rdfind   [On Arch Linux]

Laufen rdfind Geben Sie in ein Verzeichnis einfach ein rdfind und das Zielverzeichnis. Hier ist ein Beispiel:

$ rdfind /home/user
Suchen Sie nach doppelten Dateien unter Linux
Suchen Sie nach doppelten Dateien unter Linux

Wie du siehst rdfind speichert die Ergebnisse in einer aufgerufenen Datei results.txt befindet sich in demselben Verzeichnis, in dem Sie das Programm ausgeführt haben. Die Datei enthält alle doppelten Dateien, die rdfind gefunden hat. Sie können die Datei überprüfen und die doppelten Dateien manuell entfernen, wenn Sie möchten.

Eine andere Sache, die Sie tun können, ist die Verwendung der -dryrun Eine Option, die eine Liste von Duplikaten bereitstellt, ohne Maßnahmen zu ergreifen:

$ rdfind -dryrun true /home/user

Wenn Sie die Duplikate finden, können Sie sie durch feste Links ersetzen.

$ rdfind -makehardlinks true /home/user

Und wenn Sie die Duplikate löschen möchten, können Sie ausführen.

$ rdfind -deleteduplicates true /home/user

Um andere nützliche Optionen von zu überprüfen rdfind du kannst den … benutzen rdfind Handbuch mit.

$ man rdfind 

2. Fdupes – Unter Linux nach doppelten Dateien suchen

Fdupes ist ein weiteres Programm, mit dem Sie doppelte Dateien auf Ihrem System identifizieren können. Es ist kostenlos und Open Source und in C geschrieben. Es verwendet die folgenden Methoden, um doppelte Dateien zu bestimmen:

  • Vergleichen von partiellen md5sum-Signaturen
  • Vergleich der vollständigen md5sum-Signaturen
  • Überprüfung des Byte-für-Byte-Vergleichs

So wie rdfind es hat ähnliche Optionen:

  • Rekursiv suchen
  • Leere Dateien ausschließen
  • Zeigt die Größe doppelter Dateien an
  • Duplikate sofort löschen
  • Dateien mit einem anderen Eigentümer ausschließen

Installieren fdupes Verwenden Sie unter Linux den folgenden Befehl gemäß Ihrer Linux-Distribution.

$ sudo apt-get install fdupes     [On Debian/Ubuntu]
$ sudo yum install epel-release && $ sudo yum install fdupes    [On CentOS/RHEL]
$ sudo dnf install fdupes         [On Fedora 22+]
$ sudo pacman -S fdupes   [On Arch Linux]

Fdupes Syntax ist ähnlich wie rdfind. Geben Sie einfach den Befehl gefolgt von dem Verzeichnis ein, das Sie scannen möchten.

$ fdupes 

Um Dateien rekursiv zu durchsuchen, müssen Sie die angeben -r eine Option wie diese.

$ fdupes -r 

Sie können auch mehrere Verzeichnisse angeben und a angeben dir rekursiv gesucht werden.

$ fdupes  -r 

Um fdupes die Größe der doppelten Dateien berechnen zu lassen, verwenden Sie die -S Möglichkeit.

$ fdupes -S 

Um zusammengefasste Informationen zu den gefundenen Dateien zu sammeln, verwenden Sie die -m Möglichkeit.

$ fdupes -m 
Doppelte Dateien unter Linux scannen
Doppelte Dateien unter Linux scannen

Wenn Sie alle Duplikate löschen möchten, verwenden Sie die -d eine Option wie diese.

$ fdupes -d 

Fdupes fragt, welche der gefundenen Dateien gelöscht werden sollen. Sie müssen die Dateinummer eingeben:

Löschen Sie doppelte Dateien unter Linux
Löschen Sie doppelte Dateien unter Linux

Eine Lösung, die definitiv nicht empfohlen wird, ist die Verwendung von -N Option, die dazu führt, dass nur die erste Datei erhalten bleibt.

$ fdupes -dN 

Um eine Liste der verfügbaren Optionen zu erhalten, mit denen Sie arbeiten können fdupes Überprüfen Sie die Hilfeseite, indem Sie ausführen.

$ fdupes -help

3. dupeGuru – Finden Sie doppelte Dateien unter Linux

dupeGuru ist ein Open Source- und plattformübergreifendes Tool, mit dem doppelte Dateien in einem Linux-System gefunden werden können. Das Tool kann entweder Dateinamen oder Inhalte in einem oder mehreren Ordnern scannen. Außerdem können Sie den Dateinamen finden, der den gesuchten Dateien ähnelt.

dupeGuru gibt es in verschiedenen Versionen für Windows-, Mac- und Linux-Plattformen. Mit der Funktion des schnellen Fuzzy-Matching-Algorithmus können Sie innerhalb einer Minute doppelte Dateien finden. Es ist anpassbar, Sie können genau die doppelten Dateien abrufen, die Sie möchten, und unerwünschte Dateien aus dem System löschen.

Installieren dupeGuru Verwenden Sie unter Linux den folgenden Befehl gemäß Ihrer Linux-Distribution.

--------------- On Debian/Ubuntu/Mint --------------- 
$ sudo add-apt-repository ppa:dupeguru/ppa
$ sudo apt-get update
$ sudo apt-get install dupeguru
--------------- On Arch Linux --------------- 
$ sudo pacman -S dupeguru
DupeGuru - Doppelte Dateien unter Linux suchen
DupeGuru – Doppelte Dateien unter Linux suchen

4. FSlint – Duplicate File Finder für Linux

FSlint ist ein kostenloses Dienstprogramm, mit dem verschiedene Formen von Flusen in einem Dateisystem gefunden und gereinigt werden. Es werden auch doppelte Dateien, leere Verzeichnisse, temporäre Dateien, doppelte / widersprüchliche (binäre) Namen, schlechte symbolische Links und vieles mehr gemeldet. Es hat sowohl Befehlszeilen- als auch GUI-Modi.

Installieren FSlint Verwenden Sie unter Linux den folgenden Befehl gemäß Ihrer Linux-Distribution.

$ sudo apt-get install fslint     [On Debian/Ubuntu]
$ sudo yum install epel-release && $ sudo yum install fslint    [On CentOS/RHEL]
$ sudo dnf install fslint         [On Fedora 22+]
$ sudo pacman -S fslint   [On Arch Linux]
FSlint - Duplicate File Finder für -Linux
FSlint – Duplicate File Finder für -Linux
Fazit

Dies sind die sehr nützlichen Tools, um doppelte Dateien auf Ihrem Linux-System zu finden. Sie sollten jedoch beim Löschen solcher Dateien sehr vorsichtig sein.

Wenn Sie sich nicht sicher sind, ob Sie eine Datei benötigen oder nicht, sollten Sie vor dem Löschen eine Sicherungskopie dieser Datei erstellen und deren Verzeichnis speichern. Wenn Sie Fragen oder Kommentare haben, senden Sie diese bitte im Kommentarbereich unten.

Similar Posts

Leave a Reply

Your email address will not be published. Required fields are marked *