在 Linux 中查找和删除重复文件的 5 个最佳工具

文件管理本身就是一项复杂的任务。再加上通常会占用存储空间的大量重复文件,这个过程变得越来越困难。

而处理重复文件的标准方法是手动定位和删除它们。但是,使用专用的重复文件查找程序可以显着加快该过程。

因此,如果您打算删除重复文件并清理您的计算机,这里列出了一些用于在 Linux 中查找和删除重复文件的最佳工具。

1.弗林特

Fslint 是一个基于 GUI 和 CLI 的实用程序,用于清除系统中的各种混乱。它将这种混乱称为“lint”并提供多种工具来帮助您执行大量任务,包括查找重复文件、空目录和有问题的文件名。

通过同时具有图形和命令行操作模式,fslint 使 Linux 新用户可以更轻松地从各种系统 lint 中释放他们的计算机存储空间。

要通过 GUI 访问 fslint,您需要做的就是打开终端并运行fslint-gui命令。

就高级功能而言,该程序在 CLI 模式下提供了 10 种不同的功能,例如 findup、findu8、findnl、findtf 和 find。使用这些,您可以优化搜索结果,以增加在系统上找到特定类型的重复文件的机会。

如何安装 fslint

在像 Ubuntu 这样基于 Debian 的发行版上:

 sudo apt install fslint

在 CentOS 和 Fedora 等基于 RHEL 的发行版上:

 sudo yum install fslint
sudo dnf install fslint

在 Arch Linux 和 Manjaro 上:

 sudo pacman -S fslint

2. Fdupes

Fdupes 是识别和删除驻留在目录中的重复文件的最简单的程序之一。在 GitHub 上根据 MIT 许可证发布,它是免费和开源的。

该程序通过使用md5sum签名和逐字节比较验证来确定目录中的重复文件。如果需要,您还可以执行递归搜索、过滤搜索结果并获取发现的重复文件的汇总视图。

一旦您确定了目录中的重复文件,您就可以使用 fdupes 删除这些文件或将它们替换为指向原始文件的链接。

Fdupes 安装

在基于 Debian 的发行版上:

 sudo apt install fdupes

在基于 RHEL 的发行版上:

 sudo yum install fdupes
sudo dnf install fdupes

在 Arch Linux 和 Manjaro 上安装:

 sudo pacman -S fdupes

相关:如何使用 fdupes 在 Linux 上查找和删除重复文件

3.查找

Rdfind 是另一个 Linux 实用程序,可帮助您跨不同目录查找计算机上的冗余文件。它依赖于根据内容(而不是名称)比较文件来识别重复项,从而提高工作效率。

为了实现这一点,该程序通过对目录中的相等文件进行排名并确定原始文件和重复文件来工作:选择排名最高的文件作为原始文件,而其余文件则是重复文件。

此外,rdfind 还可以在需要时计算校验和以比较文件。最好的部分是它将扫描结果保存到主目录中的results.txt文件中,因此您可以在要删除重复项时参考它以确保不会删除错误的。

当然,与大多数其他重复文件查找器一样,rdfind 还提供了一些预处理器来对文件进行排序、忽略空文件或设置符号链接。最后但并非最不重要的是,还有一个选项可以删除重复的文件。

相关: 什么是符号链接(Symlink)?如何在 Linux 中创建一个

如何安装rdfind

在 Debian/Ubuntu 上:

 sudo apt install rdfind

在 Fedora/CentOS 上:

 sudo dnf install rdfind

4. DupeGuru

DupeGuru 是一个跨平台工具,用于查找和删除机器上的重复文件。它的最佳特性之一是可以选择自定义匹配引擎以满足您的喜好,从而增加在目录中找到正确类型的重复文件的机会。与其他一些重复查找程序类似,它还提供了一个 GUI 以方便操作。

谈到功能,dupeGuru 利用其模糊匹配算法来扫描文件名或文件内容,并快速有效地找到重复项。

此外,它还擅长处理音乐和图片特定信息,这使其比其他重复文件查找器更具优势。此外,如果需要,您可以选择调整其匹配引擎以准确定位要消除的重复文件类型。

DupeGuru 还允许您删除重复文件。为此,它有一个参考目录系统,可以防止您意外删除错误的文件。除了删除之外,还可以选择将它们移动或复制到其他地方。

DupeGuru 安装

在基于 Debian 的发行版上:

 sudo add-apt-repository ppa:dupeguru/ppa
sudo apt-get update
sudo apt-get install dupeguru

在 Arch Linux 上:

 sudo pacman -S dupeguru

5.林林特

Rmlint 是另一个用于 Linux 的 lint(而不仅仅是重复文件)查找器和删除器。它可以免费使用,并且可以非常快速地识别系统上的重复文件和目录。您还可以获得对 Btrfs 存储格式的支持,这使其在此列表中的其他工具中脱颖而出。

说到 rmlint 胜过其他竞争性重复文件删除工具的其他一些方面,包括能够根据特定时间范围搜索文件、查找用户/组 ID 损坏的文件以及查找占用大量资源的未剥离二进制文件的空间。此外,与其他一些程序类似,它还将扫描结果保存到rmlint.jsonrmlint.sh文件中,这在删除操作时会派上用场。

但是,请注意,与其他工具不同,rmlint 并不是最容易使用的:它会生成一个用于删除重复项的脚本,这需要一定程度的理解才能有效使用。

如何安装 rmlint

在基于 Debian 的发行版上:

 sudo apt install rmlint

在 Fedora 和 CentOS 上:

 sudo yum install rmlint
sudo dnf install rmlint

在像 Manjaro 这样的基于 Arch 的发行版上:

 sudo pacman -S rmlint

在 Linux 上避免重复文件

使用上面列出的重复文件查找程序,您可以轻松识别可能占用计算机空间的重复文件并将其完全删除。但是,在使用此类工具时,有一条建议是要格外小心您的操作,以免最终删除系统上的重要文件和文档。

如果您对删除哪些文件和保留哪些文件有点怀疑,请确保备份系统上的整个数据以确保安全。