mirror of
https://github.com/datawhalechina/llms-from-scratch-cn.git
synced 2026-05-03 13:02:35 +00:00
Update README.md
This commit is contained in:
@@ -13,7 +13,21 @@
|
|||||||
[](https://github.com/datawhalechina/llms-from-scratch-cn/blob/main/LICENSE.txt)
|
[](https://github.com/datawhalechina/llms-from-scratch-cn/blob/main/LICENSE.txt)
|
||||||
|
|
||||||
|
|
||||||
🤗GitHub上的"rasbt/LLMs-from-scratch"项目是一个关于如何从头开始实现类似ChatGPT的大语言模型(LLM)的教程。这个项目包含了编码、预训练和微调GPT-like LLM的代码,并且是《Build a Large Language Model (From Scratch)》这本书的官方代码库。书中详细介绍了LLM的内部工作原理,并逐步指导读者创建自己的LLM,包括每个阶段的清晰文本、图表和示例。这种方法用于训练和开发自己的小型但功能性的模型,用于教育目的,与创建大型基础模型(如ChatGPT背后的模型)的方法相似,翻译后的版本可以服务于国内的开发者。🎉
|
📘 **项目介绍**: "rasbt/LLMs-from-scratch"是一个GitHub项目,提供了一个如何从头开始实现类似ChatGPT的大语言模型(LLM)的详细教程。
|
||||||
|
|
||||||
|
👨💻 **代码实现**: 该项目包含了创建GPT-like大语言模型的全部代码,涵盖了编码、预训练和微调过程。
|
||||||
|
|
||||||
|
📚 **官方教程书籍**: 这是《Build a Large Language Model (From Scratch)》书籍的官方代码库。书中深入解析了LLM的内部工作原理,并提供了逐步的指导。
|
||||||
|
|
||||||
|
📖 **逐步学习**: 教程通过清晰的文本、图表和示例,分步骤教授如何创建自己的LLM。
|
||||||
|
|
||||||
|
💡 **教育目的**: 该方法主要用于教育,帮助学习者训练和开发小型但功能性的模型,这与创建像ChatGPT这样的大型基础模型的方法相似。
|
||||||
|
|
||||||
|
🔧 **简洁易懂的代码**: 利用简洁且可运行的notebook代码,即使只有PyTorch基础,也能完成大模型的构建。
|
||||||
|
|
||||||
|
🤔 **深入理解模型原理**: 通过本教程,读者可以深入理解大型语言模型的工作原理。
|
||||||
|
|
||||||
|
🌏 **适合国内开发者**: 翻译后的版本可以服务于中国国内的开发者,使其受益。
|
||||||
|
|
||||||
| 章节标题 | 主要代码(快速访问) | 所有代码 + 补充 |
|
| 章节标题 | 主要代码(快速访问) | 所有代码 + 补充 |
|
||||||
|------------------------------------------------|---------------------------------------------------------------------------------------------------------------------------------|-------------------------------|
|
|------------------------------------------------|---------------------------------------------------------------------------------------------------------------------------------|-------------------------------|
|
||||||
@@ -70,9 +84,9 @@
|
|||||||
| 张友东 | 第3章贡献者 | ||
|
| 张友东 | 第3章贡献者 | ||
|
||||||
| 邹雨衡 | 第3章贡献者 | ||
|
| 邹雨衡 | 第3章贡献者 | ||
|
||||||
| 陈嘉诺 | 第4章贡献者 | ||
|
| 陈嘉诺 | 第4章贡献者 | ||
|
||||||
| 高立业 | 第4章贡献者 | ||
|
| 高立业 | 第4章贡献者 | |[@Tangent-90C](https://github.com/Tangent-90C)|
|
||||||
| 周景林 | 附录贡献者 | ||
|
| 周景林 | 附录贡献者 | |[@Beyondzjl](https://github.com/Beyondzjl)|
|
||||||
| 陈可为 | 附录贡献者 | ||
|
| 陈可为 | 附录贡献者 | |[@Ethan-Chen-plus](https://github.com/Ethan-Chen-plus)|
|
||||||
|
|
||||||
|
|
||||||
## 关注我们
|
## 关注我们
|
||||||
|
|||||||
Reference in New Issue
Block a user