,," /> " />

目 录CONTENT

文章目录

阅读:AI服务器主流技术简介

Administrator
2024-08-29 / 0 评论 / 0 点赞 / 3 阅读 / 2862 字

以下是对该网页内容的总结:

  1. AI时代的算力需求
    • GPU成为核心处理器,大模型复杂度提升,单卡GPU显存有限,无法满足训练需求,分布式训练成为核心训练方式。
  2. 网络连接在分布式系统中的角色
    • 网络连接根据层级可分为单卡、多卡、多机互联,单卡内为计算用神经网,多卡之间连接通常采用PCIe或其他高带宽通信网络,多机之间连接通常采用RDMA网络。
  3. 多卡互联
    • PCIe:最普及的总线协议,用于连接CPU与其他高速设备,PCIe Switch可解决通道数量和速度限制问题。
    • 百家争鸣
      • CXL协议:英特尔提出的开放性互联协议,建立在PCIe物理层之上,可实现设备之间的缓存和内存一致性,但可用性存在问题,英伟达GPU不支持,AMD部分产品理论上支持但无详细描述。
      • NVLINK协议:英伟达提出的高速GPU互联协议,支持网状拓扑、统一内存和直接内存访问,还引入NVSwitch创建高带宽多节点GPU集群。
      • HCCS:华为在昇腾Ascend 910B中定义的高速通信接口,采用对等拓扑。
      • Infinity Fabric:由传输数据的Infinity Scalable Data Fabric和负责控制的Infinity Scalable Control Fabric组成,AMD Instinct MI300X GPU使用第4代Infinity Fabric高速总线互联。
      • 其他AI芯片厂家也有各自的芯片间高速互联技术,如寒武纪MLU - LINK、燧原GCU - LARE、壁仞B - LINK等。
  4. 多机互联
    • RDMA网络成为分布式训练的最佳选择,包括IB网络和以太网络,可直接远程访问内存数据,无需操作系统内核介入,降低延迟。
    • 目前有三种RDMA:Infiniband(专为RDMA设计,成本高)、RoCE(基于以太网,成本较低)、iWARP(基于TCP)。
    • UCE是为打破英伟达垄断而创立的组织,认为通过调整以太网架构可让下一代高速以太网性能像InfiniBand网络一样好,但规范仍在制定中,从规范到应用还有很长路要走。

0
  1. 支付宝打赏

    qrcode alipay
  2. 微信打赏

    qrcode weixin

评论区