OctaneRender 硬件指南之组件深入研究（2）

pc8888888 发表于 2022-10-23 16:13

现在您已经熟悉了基础知识，让我们深入了解每个组件，以便您真正了解它们的测量方式以及影响因素。
图形处理器

就 Octane 而言，计算机中最重要的组件无疑是 GPU。
截至目前，Windows 上的 Octane Render 仅通过 CUDA 支持各种最新的 NVIDIA GPU（~2012 年至今）。在 macOS 上，Octane 通过 Metal 支持更新的 AMD GPU，甚至一些 Intel GPU。Octane 本身支持 Mac 上的 CUDA，但 macOS 在 High Sierra 之后切断了官方的 NVIDIA 兼容性，因此只有运行 High Sierra 或更早版本的旧 NVIDIA 卡 Mac 仍然可以使用。
处理能力

任何给定的 GPU 都有许多内核和标准时钟速度，类似于 CPU。这两件事以及其他一些因素（如架构本身和 VRAM 速度）共同构成了处理能力。在最近的 NVIDIA GPU 中，RT 内核还有助于处理某些计算并添加到此。在所有其他条件相同的情况下（这很重要，因为其他因素会对整体性能产生很大影响），这就是 GPU 渲染场景的速度。
AMD 和 NVIDIA 使用不同类型的内核，它们以不同的速度运行，因此无法在规格表上相互比较数量。您如何才能很好地了解 GPU 在 Octane 中的表现？
Otoy 创建了一个出色的基准系统来做这件事。它被称为Octanebench，它几乎是 GPU 处理能力比较的黄金标准。分数是线性的，因此 OB200 (OctaneBench 200) 评级的 GPU 的速度大约是得分为 100 的 GPU 的两倍，因此将在大约一半的时间内渲染相同的场景。
截至撰写本文时（2020 年 11 月），Octanebench 仅适用于 NVIDIA GPU，但最终将扩展到 AMD、英特尔和任何其他运行 Octane 的架构。AMD 卡有一些初步分数（在下面的 AMD 部分中列出）。
还需要注意的是，NVIDIA 的 RTX 技术对某些场景的 OB 分数有影响。在官方的结果中，你可以打开和关闭 RTX，看看卡在 RTX 没有贡献的场景下会怎么做。
关于超频的快速说明 - 是的，它会稍微加快渲染速度。不，不建议这样做，因为它是以稳定性为代价的。
显存

VRAM 是一种集成到显卡本身的特殊高速 RAM，它决定了可以将多少纹理和场景几何图形加载到内存中，以供 Octane 一次操作。一个完全适合 VRAM 的场景将比一个不适合 VRAM 的场景更快、更稳定。如果你的卡支持 RTX，如果场景不能完全适应 VRAM，它实际上会被关闭，从而进一步降低性能。
每个 GPU 都有一个固定的数量（例如，每个 RTX 3080 有 10GB，每个 Vega 20 有 4GB，无论品牌如何）。某些 GPU（例如 gtx 1060）附带 3GB 或 6GB。VRAM 本身的速度也有助于提高卡的性能。
如前所述，您的工作风格和项目类型决定了您需要多少 VRAM，如果您正在处理非常繁重的场景，您可能必须牺牲处理能力和/或成本才能在 GPU 上拥有更多 VRAM 才能工作有效。如果您非常高效且优化良好，并且/或者在不占用太多 VRAM 的较小场景上工作，您可以使用实际上可以更快渲染的低成本显卡。
那么是什么占用了 VRAM 呢？

[*]许多高分辨率和/或高位深度纹理或 HDRI。
[*]大量几何体（数百万个多边形）——未经优化的 3D 扫描是出了名的糟糕。
[*]高分辨率卷或具有多个通道的卷 - 这些卷包含必须加载到卡上的大量数据
如果您要使用多个 GPU，这部分很重要。在撰写本文时，在大多数情况下，Octane 不会从多张卡中汇集（或组合）VRAM。它以最少的数量使用卡中的 VRAM ，然后将任何额外的纹理或几何图形加载到系统 RAM 中（这称为核外内存，或 OoC）。例如，如果您要放入一张 24GB 卡和一张 4GB 卡，则在溢出到系统 RAM 之前，您只能使用 4GB 的 VRAM（除非您在 Octane 设置中禁用了 4GB 卡）。此外，加载到 OoC 内存中的场景目前无法使用 RTX 加速。
幸运的是，有一些解决方法（例如，您可以禁用较小的卡而只使用较大的卡），这将在多 GPU 部分进行更深入的讨论，但请注意这一点。
冷却

值得重申的是，热量是 GPU 世界中的第一大公敌。GPU 是热节流的，因此当它们上升到一定温度以上时，性能开始下降以减少产生的热量，因此芯片不会自行烧毁。通过适当的冷却，即使在全速运行时，GPU 也可以保持在合理的温度，因此不会发生这种情况。
有几种不同的方式可以冷却视频卡。像其他任何事情一样，总会有取舍。这里的主要因素是成本、噪音和多 GPU 的适用性。下面是最常见的冷却系统如何工作的高级示例。

露天卡。它们通过金属散热器与散热片的组合工作，然后是一个或多个风扇，保持气流通过散热器以冷却它。露天卡通常是最丰富的冷却系统类型。它还具有相当安静的优点，因为有几个大风扇不必非常快速地旋转以保持卡凉爽。主要缺点是这些卡不应该堆叠起来（否则位于正下方的卡会阻挡风扇并使其无法发挥作用），因此这将典型的系统限制为两个此类卡（彼此间隔尽可能远）。开放式空气卡还将废气热量吹入机箱，并依靠机箱气流将产生的热空气排出，因此整个系统不会过热。
鼓风机式卡片。它们的工作原理类似于具有金属散热器的开放式空气卡，但它们只有一个较小的进气风扇，可将热空气直接吹过 gpu 散热器并从机箱背面吹出。由于较小的风扇必须旋转得更快，因此在负载下它们往往会更嘈杂。它们通常在成本方面与露天卡相当。最大的优点是它们可以相互堆叠，允许一个普通大小的盒子容纳四张卡片。机箱气流和环境室温在这里非常重要，因为鼓风机式卡比大多数其他类型的卡运行得更热、更响亮。
混合卡。这些卡带有一个 AIO（一体式）液体冷却单元，可将水通过一个闭环来冷却卡。水将产生的热量带到卡外的散热器，再通过一个风扇对其进行冷却，然后将热量从机箱中排出。与风冷卡相比，这些类型的卡价格昂贵且不太常见，并且您的机箱中需要足够的安装点来连接每张卡的风扇/散热器组件，但它们非常安静和高效，并且可以保持卡运行很酷。
自定义循环。这些显卡的整个冷却系统已被移除，取而代之的是带有端口的 GPU 冷却块，可连接到贯穿整个机箱的定制液体冷却回路。这是一种冷却系统的昂贵方法，需要进行一些维护和规划，但它非常安静且非常高效。在这样的设置中可以轻松堆叠四张或更多卡，而不会影响性能。另一个很大的优势是，由于水冷卡的硬件比风冷的硬件小得多，通常占用两个或三个插槽的卡可以缩小到只有一个或两个插槽，并且可以堆叠更多插槽。相同的物理空间。这也开辟了更多的主板系列，它们的插槽更紧密地排列在一起。
机箱冷却。除了只是冷却卡之外，整个机箱的气流必须良好（尤其是风冷卡），以驱散机箱内部的热量。这意味着整理电缆并确保没有任何东西阻碍气流。
NVIDIA 特定信息（仅限 Windows）

本部分主要面向 Windows 用户，因为 Windows 版 Octane 目前不支持 AMD 卡。从技术上讲，较旧版本的 NVIDIA 卡可以在较旧版本的 macOS 上运行，但设置可能很繁琐且困难，并且不受官方支持。如果您在 Mac 上查看 Octane，强烈建议您使用 Octane X 并选择兼容的 AMD GPU。
GeForce 与 Quadro

NVIDIA 将他们的 GPU 分为几个系列，但 GeForce（游戏）和 Quadro（专业）是最常用于渲染的两个。越来越多的 NVIDIA 不再用这些姓氏来称呼他们的牌，取而代之的是“RTX 3090”或“RTX 5000”之类的名字
RT 核心

从 2018 年底的 2000 系列开始，NVIDIA 发布了除标准内核外还具有 RT 内核的 GPU。RT 内核有助于某些类型的计算，并且可以极大地加速使用这些计算的场景（从 1 到 30 倍）。在撰写本文时，除非您的整个场景适合卡上的 VRAM（或支持 NVLink 的卡），否则无法使用 RTX 加速
NVLink 和 SLI

SLI是一种较旧的、已弃用的技术，可以将多个 GPU 同步在一起。如果您有这样的设置，建议您将其关闭，因为它不会汇集 VRAM，不会提高性能，而且实际上会导致不稳定。
NVLink是一种较新的链接技术，可在某些 RTX2000 系列卡以及 RTX 3090 和大多数较新的 Quadro 卡中找到。NVLink 的美妙之处在于它实际上可以结合 VRAM，这将在下面的多 GPU 部分中进行更详细的讨论。
AMD 特定信息（仅限 Mac）

在撰写本文时，Octane 不支持 Windows 中的 AMD 卡，因此本节主要面向 Mac 用户。2020 年，Octane X 可用于 Apple 的 Metal 架构，用于 macOS 中较新的 AMD GPU。对于许多无法轻松访问现代 GPU 渲染引擎的 Mac 用户来说，这确实令人兴奋。与 Windows 计算机相比，Mac 的可定制性和多样化程度要低得多，因此在选择 GPU 时无需考虑太多事情。
支持的架构

AMD 也将他们的显卡划分为不同的家族，但品牌的宣传不如 NVIDIA 的那么简单。我们现在关心的是 Radeon 或 Radeon Pro 品牌。目前（截至 Octane X PR4，2020 年 11 月）支持三种架构 - Vega、Navi 和 Polaris。这些主要存在于 2016 年之后制造的 Mac 中。
基于 Vega 的卡片很容易被发现，因为它们通常带有这样的品牌（Vega 20、Vega 56、Vega 64 等）。有趣的事实 - “Vega”一词后面的数字是指计算单元的数量（见上文），所以通常数字越大，卡在 Octane 中的速度就越快。
在 2016 年底之后生产的 Mac 中可以找到基于 Navi 和 Polaris 的卡。不幸的是，这些卡不被称为“Navi 64”之类的东西。相反，它们被称为“Radeon Pro 5600M Graphics”或 Radeon“RX 5700 XT”。需要稍微挖掘一下才能确定哪张卡具有 Navi 或 Polaris 架构，
兼容的 Vega 和 Navi Mac 列表

这是当前受支持的 Vega 和 Navi AMD GPU 列表（2020 年 11 月更新）。请注意，这些 GPU 通常是可配置选项，无法手动升级，因此请检查特定机器以查看其是否具有正确的 GPU。

我的 Mac 受支持吗？

使用上述信息，您可以确定 Mac 是否可配置内置 GPU 以运行 Octane。为了查看您的 Mac 是否包含正确的卡，您需要深入了解系统信息（Apple Menu>About this Mac）。某些 Mac（例如 MacBook Pro）将有两个 GPU——一个 Intel 芯片和一个 AMD 芯片。但是，当您转到“关于此 Mac”时，它只会显示 Intel 芯片。为了查看 Mac 是否也有 Vega 或 Radeon Pro，您需要点击 System Report 按钮，向下滚动到 Graphics/Displays，然后查看它是否列在此处。

如果不支持怎么办？如果 Mac 是在 2016 年或之后制造的，那么很有可能它会有一个 Thunderbolt 3 端口。如果是这种情况，您可以连接与 Octane 兼容的外部 GPU。在 eGPU 部分中有更多关于此的信息。如果您的 Mac Pro（2009 “cheesegrater” 塔式）运行较旧版本的 MacOS（High Sierra 或更早版本），您可以尝试在其中放入 900 或 1000 系列 NVIDIA 卡，但这会更有趣项目而不是一个严肃的工作站。
Apple Silicon 特定信息（仅限 Mac）

这是一个快速发展的话题，因此请务必定期查看。Octane X 现在支持 Apple M1 处理器中的集成 GPU。但是，在撰写本文时，带有 Apple Silicon 的 Mac 不支持 eGPU。
其他组件

正如我们之前所了解的，在构建用于 3D 渲染的计算机时，GPU 是明星，所有其他组件几乎都可以支持它。让我们深入研究每一个。在大多数情况下，我们将在这里讨论具有 1-2 个显卡的系统，然后在多 GPU 部分讨论具有 3 个或更多显卡的高端系统的特殊注意事项。
中央处理器

时钟速度和内核：截至目前，大多数 3D DCC 和其他图形软件从更高的时钟速度中受益比更多的内核更多。这种情况正在改变，但不会很快。值得注意的例外是像 Houdini 这样的模拟软件。Octane 看到更高的时钟速度带来了一点性能提升，它还有助于 CPU 密集型任务，例如 AOV 创建。
芯片组：当您搜索 CPU 时，您会看到诸如 x299 或 z490 (Intel) 或 B550 或 X570 (AMD) 之类的术语。这是指芯片组，它决定了哪个 CPU 与哪个主板兼容。某些芯片组还支持比其他芯片组更多的 PCIe 通道和更多 RAM。当您设置预算并开始缩小组件列表时，您将开始了解您的目标是哪个芯片组。
PCIe 通道：这可能是最难理解的事情之一。如果您正在构建一个包含一两个 GPU 的系统，则不必担心。当有两张以上的卡时，问题就变得更大了。
本质上，这是 CPU 必须同时与所有 PCIe 设备通信的带宽量。GPU 是 PCIe 设备，因此这对我们来说很重要。每个 CPU 都有一定数量的 PCIe 通道，这些通道通过主板上的 PCIe 插槽与卡接口。当前一代 (PCIe Gen3) 显卡需要 8 个通道才能以最高效率运行。大多数中低端 CPU 都有 16 个 PCIe 通道，这足以让两个显卡保持满意。这就是为什么如果您不打算拥有超过两张卡，那么大多数 CPU 和主板现在都是公平的游戏。
PCIe 代：截至 2020 年 11 月，大多数组件都在使用 PCIe 第 3 代。随着第 4 代的推出，每个通道的带宽增加了一倍。
系统内存

如前所述，一旦具有最低 VRAM 量的 GPU 填满，Octane 就可以开始使用系统 RAM。根据您打开的其他内容，这也可能很快用完，因此如果您的卡具有少量 VRAM（例如，低于 8），并且您倾向于制作具有数百万多边形和/或大量大型的更大场景纹理，您将需要足够的 RAM 用于溢出。
在撰写本文时，通常推荐 32GB 的最低容量，而 64GB 对于大多数单 GPU 系统来说相当舒适。一个好的经验法则是，您的 RAM 应该是 GPU 内存的三到四倍，这样系统才能高效运行。范围的原因是并非每个场景都需要相同数量的 RAM 使用量，并且您还需要一些额外的 RAM 用于系统上运行的其他进程。
请务必检查您打算购买的主板，并确保它支持您认为根据您现在或不久的将来计划购买的 GPU 所需的 RAM 量。
母板

首先，主板需要为您要使用的 CPU 配备正确的芯片组/插槽，否则系统根本无法工作。幸运的是，大多数站点构建器或类似pcpartpicker 的工具都会让您知道您选择的内容是否无法协同工作。
看看它是否支持你想要的 RAM 量也是一个好主意（大多数会做 64GB，有些会做 128GB 或更高）。
如果您正在构建一个多 GPU 系统，那么了解有多少 PCIe 插槽、每个插槽支持多少条通道以及它们之间的物理距离也很重要。我们将在多 GPU 部分更详细地介绍插槽间距。
贮存

对于标准的动态图形系统，建议通常配备一个快速启动驱动器 (SSD)、一个可用于模拟和后期制作的快速缓存驱动器 (NVME)，以及一个或多个用于存储文件的大型存储驱动器。Octane 本身对驱动速度并不挑剔，因此如果您的构建目的是专用渲染工作站，请将资金投入到 GPU 中。
电源 (PSU)

如顶部所述，PSU 需要提供足够的电力来运行您选择的所有组件。这将是您研究或购买的最后一个组件之一。查看像Seasonic这样的功率计算器，它允许您配置您的系统并查看估计的功耗。如果可以的话，然后将其加倍，或者为了稳定起见，至少留出 20% 的额外开销。
这可能是您清单上的最后一件事。冷却在上面的 GPU 部分中进行了介绍，因此只需确保机箱足够大以容纳所有组件并具有良好的气流（或者如果您沿着这条路走，可以采用液体冷却设置）。除此之外，一切都与风格、降噪和外形有关。如果您选择安静的外壳，请确保它不会阻碍气流。
重要提示：

Octane项目渲染慢，本地硬件资源不够，想提高渲染速，最快最节省成本的方式是使用渲云云渲染，渲云云渲染，在云端批量渲染，批量出结果，支持CPU和GPU渲染，极速渲染，不耽误本地电脑做其他的工作，渲染完成自动回传到本地，享受高配置、高内存、高性能服务器带来极致的渲染速度，节省渲染时间，提高工作效率。
渲云拥有超强的分布式渲染技术，可利用海量的节点弹性扩展，一键加载各种渲染环境以满足各种渲染任务的完成。同时资深强大的研发团队产品团队，根据软件、插件更新情况，快速完成支持服务。并不断研究更符合设计师工作使用的渲染方式。

页: [1]

Unity开发者联盟's Archiver

OctaneRender 硬件指南之组件深入研究（2）