McMahan, H. B., et al. (2017). "Communication-Efficient Learning of Deep Networks from Decentralized Data."这篇论文详细探讨了分布式训练中的通信效率问题,特别是同步和异步训练模式在处理大规模数据时的表现。
Zhang, W., et al. (2015). "Deep Learning over Multi-Processor Systems."该文分析了在不同处理器架构下,同步和异步训练方法的性能差异。
技术报告
Google AI. (2019). "Distributed Training in TensorFlow: Synchronous vs. Asynchronous."这份报告由Google AI团队发布,提供了在TensorFlow框架下进行同步和异步训练的实际案例和性能对比。
Microsoft Research. (2020). "Efficient Distributed Training Strategies for Deep Learning Models."该报告探讨了在Azure平台上进行分布式训练的最佳实践,包括同步和异步方法的优劣。
在线教程
Coursera. (2021). "Distributed Machine Learning with Apache Spark."这门课程由斯坦福大学提供,涵盖了分布式机器学习的基本概念,包括同步和异步训练的原理和应用。