Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我的问题很简单:如果机器的 CPU/OS 发生故障,它的内存是否仍然可以通过远程机器的远程直接内存访问 (RDMA) 使用?
这实际上取决于系统正在经历的故障类型。如果操作系统出现故障,实现 RDMA 的 HCA 可能会继续代表远程请求执行 DMA。如果没有操作系统和操作系统驱动程序的合作,注册新内存是不可能的。
如果 CPU 发生故障,HCA 可能无法访问内存,因为所有内存访问都通过 PCIe 根联合体和 CPU 上的内存控制器。