数据并行

将训练数据进行切分

梯度聚合

  • Param Server
  • All-Reduce

模型并行

将大模型的权重进行切分