找回密码
 立即注册
查看: 246|回复: 0

OctaneRender 硬件指南之组件深入研究(2)

[复制链接]
发表于 2022-10-23 16:13 | 显示全部楼层 |阅读模式
现在您已经熟悉了基础知识,让我们深入了解每个组件,以便您真正了解它们的测量方式以及影响因素。
图形处理器

就 Octane 而言,计算机中最重要的组件无疑是 GPU。
截至目前,Windows 上的 Octane Render 仅通过 CUDA 支持各种最新的 NVIDIA GPU(~2012 年至今)。在 macOS 上,Octane 通过 Metal 支持更新的 AMD GPU,甚至一些 Intel GPU。Octane 本身支持 Mac 上的 CUDA,但 macOS 在 High Sierra 之后切断了官方的 NVIDIA 兼容性,因此只有运行 High Sierra 或更早版本的旧 NVIDIA 卡 Mac 仍然可以使用。
处理能力

任何给定的 GPU 都有许多内核和标准时钟速度,类似于 CPU。这两件事以及其他一些因素(如架构本身和 VRAM 速度)共同构成了处理能力。在最近的 NVIDIA GPU 中,RT 内核还有助于处理某些计算并添加到此。在所有其他条件相同的情况下(这很重要,因为其他因素会对整体性能产生很大影响),这就是 GPU 渲染场景的速度。
AMD 和 NVIDIA 使用不同类型的内核,它们以不同的速度运行,因此无法在规格表上相互比较数量。您如何才能很好地了解 GPU 在 Octane 中的表现?
Otoy 创建了一个出色的基准系统来做这件事。它被称为Octanebench,它几乎是 GPU 处理能力比较的黄金标准。分数是线性的,因此 OB200 (OctaneBench 200) 评级的 GPU 的速度大约是得分为 100 的 GPU 的两倍,因此将在大约一半的时间内渲染相同的场景。
截至撰写本文时(2020 年 11 月),Octanebench 仅适用于 NVIDIA GPU,但最终将扩展到 AMD、英特尔和任何其他运行 Octane 的架构。AMD 卡有一些初步分数(在下面的 AMD 部分中列出)。
还需要注意的是,NVIDIA 的 RTX 技术对某些场景的 OB 分数有影响。在官方的结果中,你可以打开和关闭 RTX,看看卡在 RTX 没有贡献的场景下会怎么做。
关于超频的快速说明 - 是的,它会稍微加快渲染速度。不,不建议这样做,因为它是以稳定性为代价的。
显存

VRAM 是一种集成到显卡本身的特殊高速 RAM,它决定了可以将多少纹理和场景几何图形加载到内存中,以供 Octane 一次操作。一个完全适合 VRAM 的场景将比一个不适合 VRAM 的场景更快、更稳定。如果你的卡支持 RTX,如果场景不能完全适应 VRAM,它实际上会被关闭,从而进一步降低性能。
每个 GPU 都有一个固定的数量(例如,每个 RTX 3080 有 10GB,每个 Vega 20 有 4GB,无论品牌如何)。某些 GPU(例如 gtx 1060)附带 3GB 或 6GB。VRAM 本身的速度也有助于提高卡的性能。
如前所述,您的工作风格和项目类型决定了您需要多少 VRAM,如果您正在处理非常繁重的场景,您可能必须牺牲处理能力和/或成本才能在 GPU 上拥有更多 VRAM 才能工作有效。如果您非常高效且优化良好,并且/或者在不占用太多 VRAM 的较小场景上工作,您可以使用实际上可以更快渲染的低成本显卡。
那么是什么占用了 VRAM 呢?

  • 许多高分辨率和/或高位深度纹理或 HDRI。
  • 大量几何体(数百万个多边形)——未经优化的 3D 扫描是出了名的糟糕。
  • 高分辨率卷或具有多个通道的卷 - 这些卷包含必须加载到卡上的大量数据
如果您要使用多个 GPU,这部分很重要。在撰写本文时,在大多数情况下,Octane 不会从多张卡中汇集(或组合)VRAM。它以最少的数量使用卡中的 VRAM ,然后将任何额外的纹理或几何图形加载到系统 RAM 中(这称为核外内存,或 OoC)。例如,如果您要放入一张 24GB 卡和一张 4GB 卡,则在溢出到系统 RAM 之前,您只能使用 4GB 的 VRAM(除非您在 Octane 设置中禁用了 4GB 卡)。此外,加载到 OoC 内存中的场景目前无法使用 RTX 加速。
幸运的是,有一些解决方法(例如,您可以禁用较小的卡而只使用较大的卡),这将在多 GPU 部分进行更深入的讨论,但请注意这一点。
冷却

值得重申的是,热量是 GPU 世界中的第一大公敌。GPU 是热节流的,因此当它们上升到一定温度以上时,性能开始下降以减少产生的热量,因此芯片不会自行烧毁。通过适当的冷却,即使在全速运行时,GPU 也可以保持在合理的温度,因此不会发生这种情况。
有几种不同的方式可以冷却视频卡。像其他任何事情一样,总会有取舍。这里的主要因素是成本、噪音和多 GPU 的适用性。下面是最常见的冷却系统如何工作的高级示例。


露天卡。它们通过金属散热器与散热片的组合工作,然后是一个或多个风扇,保持气流通过散热器以冷却它。露天卡通常是最丰富的冷却系统类型。它还具有相当安静的优点,因为有几个大风扇不必非常快速地旋转以保持卡凉爽。主要缺点是这些卡不应该 堆叠起来(否则位于正下方的卡会阻挡风扇并使其无法发挥作用),因此这将典型的系统限制为两个此类卡(彼此间隔尽可能远)。开放式空气卡还将废气热量吹入机箱,并依靠机箱气流将产生的热空气排出,因此整个系统不会过热。
鼓风机式卡片。它们的工作原理类似于具有金属散热器的开放式空气卡,但它们只有一个较小的进气风扇,可将热空气直接吹过 gpu 散热器并从机箱背面吹出。由于较小的风扇必须旋转得更快,因此在负载下它们往往会更嘈杂。它们通常在成本方面与露天卡相当。最大的优点是它们可以相互堆叠,允许一个普通大小的盒子容纳四张卡片。机箱气流和环境室温在这里非常重要,因为鼓风机式卡比大多数其他类型的卡运行得更热、更响亮。
混合卡。这些卡带有一个 AIO(一体式)液体冷却单元,可将水 通过一个闭环来冷却卡。水将产生的热量带到卡外的散热器,再通过一个风扇对其进行冷却,然后将热量从机箱中排出。与风冷卡相比,这些类型的卡价格昂贵且不太常见,并且您的机箱中需要足够的安装点来连接每张卡的风扇/散热器组件,但它们非常安静和高效,并且可以保持卡运行很酷。
自定义循环。这些显卡的整个冷却系统已被移除,取而代之的是带有端口的 GPU 冷却块,可连接到 贯穿整个机箱的定制液体冷却回路。这是一种冷却系统的昂贵方法,需要进行一些维护和规划,但它非常安静且非常高效。在这样的设置中可以轻松堆叠四张或更多卡,而不会影响性能。另一个很大的优势是,由于水冷卡的硬件比风冷的硬件小得多,通常占用两个或三个插槽的卡可以缩小到只有一个或两个插槽,并且可以堆叠更多插槽。相同的物理空间。这也开辟了更多的主板系列,它们的插槽更紧密地排列在一起。
机箱冷却。除了只是冷却卡之外,整个机箱的气流必须良好(尤其是风冷卡),以驱散机箱内部的热量。这意味着整理电缆并确保没有任何东西阻碍气流。
NVIDIA 特定信息(仅限 Windows)

本部分主要面向 Windows 用户,因为 Windows 版 Octane 目前不支持 AMD 卡。从技术上讲,较旧版本的 NVIDIA 卡可以在较旧版本的 macOS 上运行,但设置可能很繁琐且困难,并且不受官方支持。如果您在 Mac 上查看 Octane,强烈建议您使用 Octane X 并选择兼容的 AMD GPU。
GeForce 与 Quadro

NVIDIA 将他们的 GPU 分为几个系列,但 GeForce(游戏)和 Quadro(专业)是最常用于渲染的两个。越来越多的 NVIDIA 不再用这些姓氏来称呼他们的牌,取而代之的是“RTX 3090”或“RTX 5000”之类的名字
RT 核心

从 2018 年底的 2000 系列开始,NVIDIA 发布了除标准内核外还具有 RT 内核的 GPU。RT 内核有助于某些类型的计算,并且可以极大地加速使用这些计算的场景(从 1 到 30 倍)。在撰写本文时,除非您的整个场景适合卡上的 VRAM(或支持 NVLink 的卡),否则无法使用 RTX 加速
NVLink 和 SLI

SLI是一种较旧的、已弃用的技术,可以将多个 GPU 同步在一起。如果您有这样的设置,建议您将其关闭,因为它不会汇集 VRAM,不会提高性能,而且实际上会导致不稳定。
NVLink是一种较新的链接技术,可在某些 RTX2000 系列卡以及 RTX 3090 和大多数较新的 Quadro 卡中找到。NVLink 的美妙之处在于它实际上可以结合 VRAM,这将在下面的多 GPU 部分中进行更详细的讨论。
AMD 特定信息(仅限 Mac)

在撰写本文时,Octane 不支持 Windows 中的 AMD 卡,因此本节主要面向 Mac 用户。2020 年,Octane X 可用于 Apple 的 Metal 架构,用于 macOS 中较新的 AMD GPU。对于许多无法轻松访问现代 GPU 渲染引擎的 Mac 用户来说,这确实令人兴奋。与 Windows 计算机相比,Mac 的可定制性和多样化程度要低得多,因此在选择 GPU 时无需考虑太多事情。
支持的架构

AMD 也将他们的显卡划分为不同的家族,但品牌的宣传不如 NVIDIA 的那么简单。我们现在关心的是 Radeon 或 Radeon Pro 品牌。目前(截至 Octane X PR4,2020 年 11 月)支持三种架构 - Vega、Navi 和 Polaris。这些主要存在于 2016 年之后制造的 Mac 中。
基于 Vega 的卡片很容易被发现,因为它们通常带有这样的品牌(Vega 20、Vega 56、Vega 64 等)。有趣的事实 - “Vega”一词后面的数字是指计算单元的数量(见上文),所以通常数字越大,卡在 Octane 中的速度就越快。
在 2016 年底之后生产的 Mac 中可以找到基于 Navi 和 Polaris 的卡。不幸的是,这些卡不被称为“Navi 64”之类的东西。相反,它们被称为“Radeon Pro 5600M Graphics”或 Radeon“RX 5700 XT”。需要稍微挖掘一下才能确定哪张卡具有 Navi 或 Polaris 架构,
兼容的 Vega 和 Navi Mac 列表

这是当前受支持的 Vega 和 Navi AMD GPU 列表(2020 年 11 月更新)。请注意,这些 GPU 通常是可配置选项,无法手动升级,因此请检查特定机器以查看其是否具有正确的 GPU。


我的 Mac 受支持吗?

使用上述信息,您可以确定 Mac 是否可配置内置 GPU 以运行 Octane。为了查看您的 Mac 是否包含正确的卡,您需要深入了解系统信息(Apple Menu>About this Mac)。某些 Mac(例如 MacBook Pro)将有两个 GPU——一个 Intel 芯片和一个 AMD 芯片。但是,当您转到“关于此 Mac”时,它只会显示 Intel 芯片。为了查看 Mac 是否也有 Vega 或 Radeon Pro,您需要点击 System Report 按钮,向下滚动到 Graphics/Displays,然后查看它是否列在此处。


如果不支持怎么办?如果 Mac 是在 2016 年或之后制造的,那么很有可能它会有一个 Thunderbolt 3 端口。如果是这种情况,您可以连接与 Octane 兼容的外部 GPU。在 eGPU 部分中有更多关于此的信息。如果您的 Mac Pro(2009 “cheesegrater” 塔式)运行较旧版本的 MacOS(High Sierra 或更早版本),您可以尝试在其中放入 900 或 1000 系列 NVIDIA 卡,但这会更有趣项目而不是一个严肃的工作站。
Apple Silicon 特定信息(仅限 Mac)

这是一个快速发展的话题,因此请务必定期查看。Octane X 现在支持 Apple M1 处理器中的集成 GPU。但是,在撰写本文时,带有 Apple Silicon 的 Mac 不支持 eGPU。
其他组件

正如我们之前所了解的,在构建用于 3D 渲染的计算机时,GPU 是明星,所有其他组件几乎都可以支持它。让我们深入研究每一个。在大多数情况下,我们将在这里讨论具有 1-2 个显卡的系统,然后在多 GPU 部分讨论具有 3 个或更多显卡的高端系统的特殊注意事项。
中央处理器

时钟速度和内核:截至目前,大多数 3D DCC 和其他图形软件从更高的时钟速度中受益比更多的内核更多。这种情况正在改变,但不会很快。值得注意的例外是像 Houdini 这样的模拟软件。Octane 看到更高的时钟速度带来了一点性能提升,它还有助于 CPU 密集型任务,例如 AOV 创建。
芯片组:当您搜索 CPU 时,您会看到诸如 x299 或 z490 (Intel) 或 B550 或 X570 (AMD) 之类的术语。这是指芯片组,它决定了哪个 CPU 与哪个主板兼容。某些芯片组还支持比其他芯片组更多的 PCIe 通道和更多 RAM。当您设置预算并开始缩小组件列表时,您将开始了解您的目标是哪个芯片组。
PCIe 通道:这可能是最难理解的事情之一。如果您正在构建一个包含一两个 GPU 的系统,则不必担心。当有两张以上的卡时,问题就变得更大了。
本质上,这是 CPU 必须同时与所有 PCIe 设备通信的带宽量。GPU 是 PCIe 设备,因此这对我们来说很重要。每个 CPU 都有一定数量的 PCIe 通道,这些通道通过主板上的 PCIe 插槽与卡接口。当前一代 (PCIe Gen3) 显卡需要 8 个通道才能以最高效率运行。大多数中低端 CPU 都有 16 个 PCIe 通道,这足以让两个显卡保持满意。这就是为什么如果您不打算拥有超过两张卡,那么大多数 CPU 和主板现在都是公平的游戏。
PCIe 代:截至 2020 年 11 月,大多数组件都在使用 PCIe 第 3 代。随着第 4 代的推出,每个通道的带宽增加了一倍。
系统内存

如前所述,一旦具有最低 VRAM 量的 GPU 填满,Octane 就可以开始使用系统 RAM。根据您打开的其他内容,这也可能很快用完,因此如果您的卡具有少量 VRAM(例如,低于 8),并且您倾向于制作具有数百万多边形和/或大量大型的更大场景纹理,您将需要足够的 RAM 用于溢出。
在撰写本文时,通常推荐 32GB 的最低容量,而 64GB 对于大多数单 GPU 系统来说相当舒适。一个好的经验法则是,您的 RAM 应该是 GPU 内存的三到四倍,这样系统才能高效运行。范围的原因是并非每个场景都需要相同数量的 RAM 使用量,并且您还需要一些额外的 RAM 用于系统上运行的其他进程。
请务必检查您打算购买的主板,并确保它支持您认为根据您现在或不久的将来计划购买的 GPU 所需的 RAM 量。
母板

首先,主板需要为您要使用的 CPU 配备正确的芯片组/插槽,否则系统根本无法工作。幸运的是,大多数站点构建器或类似pcpartpicker 的工具都会让您知道您选择的内容是否无法协同工作。
看看它是否支持你想要的 RAM 量也是一个好主意(大多数会做 64GB,有些会做 128GB 或更高)。
如果您正在构建一个多 GPU 系统,那么了解有多少 PCIe 插槽、每个插槽支持多少条通道以及它们之间的物理距离也很重要。我们将在多 GPU 部分更详细地介绍插槽间距。
贮存

对于标准的动态图形系统,建议通常配备一个快速启动驱动器 (SSD)、一个可用于模拟和后期制作的快速缓存驱动器 (NVME),以及一个或多个用于存储文件的大型存储驱动器。Octane 本身对驱动速度并不挑剔,因此如果您的构建目的是专用渲染工作站,请将资金投入到 GPU 中。
电源 (PSU)

如顶部所述,PSU 需要提供足够的电力来运行您选择的所有组件。这将是您研究或购买的最后一个组件之一。查看像Seasonic这样的功率计算器,它允许您配置您的系统并查看估计的功耗。如果可以的话,然后将其加倍,或者为了稳定起见,至少留出 20% 的额外开销。
这可能是您清单上的最后一件事。冷却在上面的 GPU 部分中进行了介绍,因此只需确保机箱足够大以容纳所有组件并具有良好的气流(或者如果您沿着这条路走,可以采用液体冷却设置)。除此之外,一切都与风格、降噪和外形有关。如果您选择安静的外壳,请确保它不会阻碍气流。
重要提示:

Octane项目渲染慢,本地硬件资源不够,想提高渲染速,最快最节省成本的方式是使用渲云云渲染,渲云云渲染,在云端批量渲染,批量出结果,支持CPU和GPU渲染,极速渲染,不耽误本地电脑做其他的工作,渲染完成自动回传到本地,享受高配置、高内存、高性能服务器带来极致的渲染速度,节省渲染时间,提高工作效率。
渲云拥有超强的分布式渲染技术,可利用海量的节点弹性扩展,一键加载各种渲染环境以满足各种渲染任务的完成。同时资深强大的研发团队产品团队,根据软件、插件更新情况,快速完成支持服务。并不断研究更符合设计师工作使用的渲染方式。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
懒得打字嘛,点击右侧快捷回复 【右侧内容,后台自定义】
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Unity开发者联盟 ( 粤ICP备20003399号 )

GMT+8, 2024-11-24 21:51 , Processed in 0.094691 second(s), 26 queries .

Powered by Discuz! X3.5 Licensed

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表