硬件检查清单

在为生产级分布式 MinIO 部署规划硬件配置时，请使用以下检查清单。

考虑因素

在为 MinIO 选型硬件时，请考虑以下因素：

上线时预计需要存储的数据量（tebibyte）
至少未来两年内数据规模的预期增长
对象数量以及平均对象大小
数据的平均保留时长（年）
计划部署的站点数量
预期的存储桶数量

生产硬件建议

以下检查清单遵循 MinIO 面向生产部署的 Recommended Configuration。这里提供的指导仅作为基线，不能替代 MinIO SUBNET Performance Diagnostics、Architecture Reviews 以及 direct-to-engineering 支持。

与其他分布式系统一样，MinIO 在同一服务器池内的所有节点都使用相同配置时，通常能获得更好的效果。请确保 pool 内各节点的硬件（CPU、内存、主板、存储适配器）和软件（操作系统、内核设置、系统服务）选择保持一致。

如果节点的硬件或软件配置不一致，部署可能表现出不可预测的性能。对于适合将陈旧数据放在低成本硬件上的工作负载，应改为部署专用的“温”或“冷”MinIO 部署，并将数据转移到该层级。

MinIO 不提供托管服务或硬件销售

如需查看硬件合作伙伴提供的服务器与存储组件精选清单，请参见我们的 Reference Hardware 页面。

Kubernetes

说明	最低	推荐
专用于承载 MinIO Tenant 的 Kubernetes worker 节点。	每个 Tenant 4 个 worker	每个 Tenant 8 个以上 worker
为 MinIO Tenant 配置专用 Persistent Volume。	每个 MinIO Server pod 4 个 PV	每个 MinIO Server pod 8 个以上 PV
高速网络基础设施。	25GbE	100GbE
支持现代 SIMD 指令（AVX-512）的服务器级 CPU，例如 Intel® Xeon® Scalable 或更高规格。	每个 MinIO Pod 4 个 vCPU	每个 MinIO Pod 8 个以上 vCPU
可用内存应在每台服务器使用量的基础上保留合理余量，并满足或超过该值。	每个 worker 节点 32GB 可用内存	每个 worker 节点 128GB 以上可用内存

裸金属

说明	最低	推荐
专用裸机或虚拟主机（“主机”）。	4 台专用主机	8 台以上专用主机
为每台主机配置专用本地直连驱动器。	每个 MinIO Server 4 块驱动器	每个 MinIO Server 8 块以上驱动器
高速网络基础设施。	25GbE	100GbE
支持现代 SIMD 指令（AVX-512）的服务器级 CPU，例如 Intel® Xeon® Scalable 或更高规格。	每台主机 8 个 CPU/socket 或 vCPU	每台主机 16 个以上 CPU/socket 或 vCPU
可用内存应在每台服务器使用量的基础上保留合理余量，并满足或超过该值。	每台主机 32GB 可用内存	每台主机 128GB 以上可用内存

Important

以下领域对 MinIO 性能影响最大，重要性从高到低依次如下：

网络基础设施	吞吐量不足或受限会约束性能
存储控制器	固件过旧、吞吐量有限或硬件故障会约束性能并影响可靠性
存储（驱动器）	固件过旧，或硬件过慢、老化、故障，会约束性能并影响可靠性

在关注计算类约束等其他硬件资源之前，请优先确保这些领域的关键组件到位。

上述最低建议体现了 MinIO 在协助企业客户部署到多种 IT 基础设施、同时保持目标 SLA/SLO 方面的实践经验。虽然 MinIO 可能在低于最低建议的拓扑上运行，但任何潜在的成本节省都要以可靠性、性能或整体功能下降为代价。

网络

MinIO 建议使用高速网络，以支撑所连接存储（聚合驱动器、存储控制器和 PCIe 总线）的最大可能吞吐量。下表给出了不同物理或虚拟网络接口可支撑的最大存储吞吐量的一般参考值。该表假设所有网络基础设施组件（例如路由器、交换机和物理线缆）同样支持对应的 NIC 带宽。

NIC 带宽（Gbps）	估算聚合存储吞吐量（GBps）
10Gbps	1.25GBps
25Gbps	3.125GBps
50Gbps	6.25GBps
100Gbps	12.5GBps

网络对 MinIO 性能影响最大，较低的单主机带宽会人为限制存储的潜在性能。以下网络吞吐受限示例假设机械盘可提供约 100MB/S 的持续 I/O：

1GbE 网络链路最多可支撑 125MB/s，大约相当于一块机械盘
10GbE 网络大约可支撑 1.25GB/s，理论上可支撑 10 到 12 块机械盘
25GbE 网络大约可支撑 3.125GB/s，理论上可支撑约 30 块机械盘

内存

内存主要限制每个节点可同时处理的并发连接数。

你可以使用以下公式计算每个节点的最大并发请求数：

\(totalRam / ramPerRequest\)

若要计算每个请求使用的 RAM，请使用以下公式：

\(((2MiB + 128KiB) * driveCount) + (2 * 10MiB) + (2 * 1 MiB)\)

10MiB 是默认的 erasure block size v1。 1 MiB 是默认的 erasure block size v2。

下表根据主机驱动器数量和系统可用 RAM，列出节点上的最大并发请求数：

驱动器数量	32 GiB RAM	64 GiB RAM	128 GiB RAM	256 GiB RAM	512 GiB RAM
4 Drives	1,074	2,149	4,297	8,595	17,190
8 Drives	840	1,680	3,361	6,722	13,443
16 Drives	585	1,170	2.341	4,681	9,362

下表根据节点本地存储总量，给出为 MinIO 分配内存的一般建议：

主机总存储量	建议的主机内存
不超过 1 Tebibyte (Ti)	8GiB
不超过 10 Tebibyte (Ti)	16GiB
不超过 100 Tebibyte (Ti)	32GiB
不超过 1 Pebibyte (Pi)	64GiB
超过 1 Pebibyte (Pi)	128GiB

Important

从 RELEASE.2024-01-28T22-35-53Z 开始，MinIO 在分布式部署中会为每个节点预分配 2GiB 内存，在单节点部署中会预分配 1GiB 内存。

存储

磁盘独占访问

MinIO 要求对用于对象存储的磁盘或卷拥有独占访问权限。任何其他进程、软件、脚本或人员都不应直接对提供给 MinIO 的磁盘或卷，或 MinIO 在其上放置的对象或文件执行任何操作。

除非得到 MinIO Engineering 的明确指示，否则不要使用脚本或工具直接修改、删除或移动这些磁盘上的任何数据分片、校验分片或元数据文件，包括在磁盘或节点之间迁移这些文件。这类操作极有可能导致大范围损坏和数据丢失，超出 MinIO 的自愈能力。

优先使用直连“本地”存储（DAS）

DAS，例如本地直连的 JBOD 阵列，相比网络存储（NAS、SAN、NFS）在性能和一致性方面具有显著优势。

Kubernetes

虽然 MinIO Tenant 可以使用远程 Persistent Volume (PV) 资源，但通过网络执行 I/O 的成本通常会限制整体性能。

MinIO 强烈建议使用能够将存储配置到 Kubernetes 调度 MinIO pods 所在 worker 节点上的 CSI，例如 MinIO DirectPV。

在其他场景中，也应尽可能选择能让 MinIO 像访问本地挂载文件系统一样访问存储的 CSI。在 MinIO 与操作系统级存储访问 API 之间增加软件层或转换层的 CSI，必然会增加系统复杂度，并可能带来意料之外或不期望的行为。

裸金属

请将 JBOD 阵列配置为无 RAID、无 pooling 或其他类似的软件层，使存储可以直接呈现给 MinIO。

对于虚拟机或需要以虚拟卷形式提供存储的系统，MinIO 只建议使用 thick LUN。

使用 XFS 格式化驱动器并保持一致挂载

Kubernetes

MinIO 建议将 MinIO Persistent Volumes 底层驱动器格式化为 xfs。

如果使用 CSI，请查阅对应 CSI 的文档，并确保其支持指定 xfs 文件系统。 MinIO 强烈建议避免使用会将驱动器格式化为 ext4、btrfs 或其他文件系统的 CSI。

MinIO 预期所有已配置的 Persistent Volumes (PV) 都专供自身使用，且底层存储介质能够在指定挂载路径上保证对已存储数据的访问。对底层存储介质的修改，包括但不限于外部或第三方应用干预，或对本地直连存储进行任意重新挂载，都可能导致异常行为或数据丢失。

裸金属

请将驱动器格式化为 XFS，并以无 RAID 或其他 pooling 配置的 JBOD 阵列形式提供给 MinIO。使用其他类型的后端存储（SAN/NAS、ext4、RAID、LVM）通常会降低性能、可靠性、可预测性和一致性。

格式化 XFS 驱动器时，请为每块驱动器设置唯一标签。例如，以下命令会将四块驱动器格式化为 XFS，并为其设置对应标签。

mkfs.xfs /dev/sdb -L MINIODRIVE1
mkfs.xfs /dev/sdc -L MINIODRIVE2
mkfs.xfs /dev/sdd -L MINIODRIVE3
mkfs.xfs /dev/sde -L MINIODRIVE4

MinIO 要求驱动器在重启后仍保持其挂载位置上的顺序不变。 MinIO 不支持 将已有 MinIO 数据的驱动器任意迁移到新的挂载位置，无论这是人工操作还是操作系统行为导致。

你**必须**使用 /etc/fstab 或类似的挂载控制系统，将驱动器挂载到固定路径。例如：

$ nano /etc/fstab

# <file system>        <mount point>    <type>  <options>         <dump>  <pass>
LABEL=MINIODRIVE1      /mnt/drive-1     xfs     defaults,noatime  0       2
LABEL=MINIODRIVE2      /mnt/drive-2     xfs     defaults,noatime  0       2
LABEL=MINIODRIVE3      /mnt/drive-3     xfs     defaults,noatime  0       2
LABEL=MINIODRIVE4      /mnt/drive-4     xfs     defaults,noatime  0       2

在初始设置期间，你可以使用 mount -a 将这些驱动器挂载到这些路径。否则，操作系统应在节点启动过程中自动完成这些驱动器的挂载。

MinIO 强烈建议 使用基于标签的挂载规则，而不是基于 UUID 的规则。基于标签的规则允许你用格式和标签相同的替换盘，替换不健康或损坏的驱动器。基于 UUID 的规则则要求编辑 /etc/fstab 文件，用新驱动器的 UUID 替换原有映射。

Note

依赖挂载外部存储的云环境实例，如果一个或多个远程文件挂载返回错误或失败，可能在启动时直接失败。例如，挂载持久化 EBS 卷的 AWS ECS 实例，如果一个或多个 EBS 卷挂载失败，可能无法按照标准 /etc/fstab 配置正常启动。

你可以设置 nofail 选项，在启动时静默这些错误并允许实例在存在一个或多个挂载问题时继续启动。

但对于使用本地直连磁盘的系统，不应使用该选项，因为静默驱动器错误会阻止 MinIO 和操作系统以正常方式响应这些错误。

禁用 XFS 的出错重试

MinIO 强烈建议 通过 max_retries 配置禁用 retry-on-error 行为，至少针对以下错误类别：

EIO 读或写时发生错误
ENOSPC 设备空间不足错误
default 其他所有错误

默认的 max_retries 设置通常会让文件系统在出错后无限重试，而不是将错误向上传递。 MinIO 可以正确处理 XFS 错误，因此 retry-on-error 行为最多只会引入不必要的延迟或性能下降。

Kubernetes

关于如何配置文件系统级设置，请以所选 CSI 或 StorageClass 的文档为准。

裸金属

以下脚本会遍历指定挂载路径下的所有驱动器，并将推荐错误类别对应的 XFS max_retries 设置为 0，即“出错立即失败”。该脚本会忽略所有未挂载的驱动器，无论它们是手动未挂载，还是未通过 /etc/fstab 挂载。请将 /mnt/drive 这一行修改为符合你 MinIO 驱动器路径模式的值。

#!/bin/bash

for i in $(df -h | grep /mnt/drive | awk '{ print $1 }'); do
      mountPath="$(df -h | grep $i | awk '{ print $6 }')"
      deviceName="$(basename $i)"
      echo "Modifying xfs max_retries and retry_timeout_seconds for drive $i mounted at $mountPath"
      echo 0 > /sys/fs/xfs/$deviceName/error/metadata/EIO/max_retries
      echo 0 > /sys/fs/xfs/$deviceName/error/metadata/ENOSPC/max_retries
      echo 0 > /sys/fs/xfs/$deviceName/error/metadata/default/max_retries
done
exit 0

你必须在所有 MinIO 节点上运行此脚本，并将其配置为在重启后重新执行，因为 Linux 操作系统通常不会持久保存这些修改。你可以使用 @reboot 时机的 cron 任务，在节点每次重启时运行上述脚本，以确保所有驱动器都禁用了 retry-on-error。使用 crontab -e 创建以下任务，并将脚本路径修改为各节点上的实际路径：

@reboot /opt/minio/xfs-retry-settings.sh

统一驱动器类型与容量

请确保 MinIO 部署底层存储的驱动器类型（NVMe、SSD、HDD）一致。 MinIO 不区分存储类型，也不支持在单一部署内部配置“热”或“温”驱动器。混用不同驱动器类型通常会导致性能下降，因为无论更快驱动器能力如何，部署中最慢的驱动器都会成为瓶颈。

请在每个 MinIO 服务器池的所有节点上使用相同容量和类型的驱动器。 MinIO 会将每块驱动器的最大可用容量限制为部署中最小的那块驱动器容量。例如，如果某个部署中有 15 块 10TB 驱动器和 1 块 1TB 驱动器，MinIO 会将每块驱动器的可用容量限制为 1TB。

适用于 MinIO 订阅的推荐工具

Important

本节提到的工具需要 MinIO 订阅。 MinIO 强烈建议所有生产部署结合其 SUBNET 许可证使用 AIStor Object Store。更多信息请参见 MinIO AIStor pricing page。

健康诊断工具

生成部署健康状态摘要。如果你可以访问 SUBNET，可以将结果上传到那里。
```
mc support diag ALIAS --airgap
```
请将 ALIAS 替换为该部署中定义的 alias。
网络测试

对 alias 为 minio1 的集群运行网络吞吐测试。
```
mc support perf net minio1
```
驱动器测试

对 alias 为 minio1 的集群，在所有节点上的所有驱动器执行读写性能测量。该命令使用默认的 4MiB blocksize。
```
mc support perf drive minio1
```
对象测试

对 alias 为 minio1 的对象执行 S3 读写性能测量。 MinIO 会自动调优并发度，以获得最大吞吐量和 IOPS（Input/Output Per Second）。
```
mc support perf object minio1
```

`dd`	用于复制和粘贴数据的命令
`if=/dev/zero`	从 `/dev/zero` 读取，这是一种系统生成的、无限输出 0 字节的数据流，可用于创建指定大小的文件
`of=/mnt/driveN/testfile`	写入到 `/mnt/driveN/testfile`
`bs=128k`	每次最多写入 128,000 字节
`count=80000`	最多写入 80000 个数据块
`oflag=direct`	使用 direct I/O 写入，避免数据被缓存
`conv=fdatasync`	在结束前将输出文件数据物理写入磁盘
`> dd-write-drive1.txt`	将操作输出内容写入当前工作目录下的 `dd-write-drive1.txt`

`dd`	用于复制和粘贴数据的命令
`if=/mnt/driveN/testfile`	从 `/mnt/driveN/testfile` 读取；请替换为用于测试驱动器读取性能的文件路径
`of=/dev/null`	写入 `/dev/null`，这是一个在操作完成后不会保留内容的虚拟文件
`bs=128k`	每次最多写入 128,000 字节
`count=80000`	最多写入 80000 个数据块
`iflag=direct`	使用 direct I/O 读取，避免数据被缓存
`> dd-read-drive1.txt`	将操作输出内容写入当前工作目录下的 `dd-read-drive1.txt`

`-s 1g`	每个文件大小为 1G
`-r`	4m，即 4MB 块大小
`-i #`	0=write/rewrite，1=read/re-read，2=random-read/write
`-I`	使用 Direct-IO 模式
`-t N`	线程数（\(numberOfDrives * 16\)）
`-F <>`	文件列表（上述命令按每块驱动器 16 个文件进行测试）

文档

硬件检查清单

考虑因素

生产硬件建议

网络

内存

存储

推荐的存储介质

优先使用直连“本地”存储（DAS）

使用 XFS 格式化驱动器并保持一致挂载

禁用 XFS 的出错重试

统一驱动器类型与容量

推荐的硬件测试

操作系统诊断工具

第三方诊断工具

适用于 MinIO 订阅的推荐工具