Latest Posts
Scaling Book Part 12: 关于 GPU 的一切 (How to Think About GPUs)
这是 DeepMind Scaling Book 系列的第 12 部分(额外章节)。
关于 GPU 的一切 (How to Think About GPUs)
How To Scale Your Model Part 12
(Part 11: Conclusion | The End)
在...
December 13, 2025
scaling-book
Scaling Book Part 11: 总结与延伸阅读 (Conclusions and Further Reading)
这是 DeepMind Scaling Book 系列的第 11 部分。
总结 (Conclusions)
How To Scale Your Model Part 11
(Part 10: JAX | Part 12: GPUs)
我们已经走过了漫长的道路,从简单的矩阵乘法 Roofli...
December 13, 2025
scaling-book
Scaling Book Part 10: JAX TPU 编程指南 (Programming TPUs in JAX)
这是 DeepMind Scaling Book 系列的第 10 部分。
在 JAX 中对 TPU 编程 (Programming TPUs in JAX)
How To Scale Your Model Part 10
(Part 9: Profiling | Part 11: Concl...
December 13, 2025
scaling-book
Scaling Book Part 9: 如何分析 TPU 程序性能 (How to Profile TPU Programs)
这是 DeepMind Scaling Book 系列的第 9 部分。
如何分析 TPU 程序 (How to Profile TPU Programs)
How To Scale Your Model Part 9
(Part 8: Serving LLaMA | Part 10: Pro...
December 13, 2025
scaling-book
Scaling Book Part 8: LLaMA 3 在 TPU 上的服务实战 (Serving LLaMA 3 on TPUs)
这是 DeepMind Scaling Book 系列的第 8 部分。
在 TPU 上服务 LLaMA 3 (Serving LLaMA 3 on TPUs)
How To Scale Your Model Part 8
(Part 7: Inference | Part 9: Profil...
December 13, 2025
scaling-book