极客日报 #1974

极客日报#1974

本期收录 3 条社区推荐,涉及 从零开始构建大型语言模型、大型语言模型完整实战课程、神经网络从零到封神。

2026年6月23日

本期编辑:Jiayi

1.从零开始构建大型语言模型
2.大型语言模型完整实战课程
3.神经网络从零到封神

本期推荐

#1

从零开始构建大型语言模型

推荐人:murphy

开源LLM从零手写实现教程,配套《Build a Large Language Model (From Scratch)》书籍,step-by-step用纯PyTorch实现ChatGPT风格大模型;全程手写Tokenizer、注意力机制、多头/分组查询注意力、GPT架构、预训练、指令微调(含LoRA、DPO)、KV缓存等;Jupyter Notebook + Python代码,每章产出可直接运行的模型与文本生成器,支持普通笔记本(GPU自动加速),完整覆盖LLM训练、微调、优化全流程,MIT协议免费自学,真正从数学与代码底层理解大模型,告别只会调用API。

#2

大型语言模型完整实战课程

推荐人:murphy

开源大型语言模型完整学习课程,80k+ stars,提供清晰路标与Colab notebooks;分为LLM基础(数学/Python/神经网络)、LLM科学家(构建优化大模型)、LLM工程师(应用与部署)三大模块,覆盖架构设计、预训练、SFT、偏好对齐、量化、RAG、高级Agents、推理优化到生产部署全流程;手把手实战产出真实LLM应用与工具,支持开源模型微调与部署,免费开源协议自学,全面掌握AI工程实战能力。

#3

神经网络从零到封神

推荐人:murphy

Andrej Karpathy经典神经网络零基础教程,从手写micrograd自动微分引擎与反向传播开始,到构建makemore字符级语言模型,最终完整手写GPT模型与BPE Tokenizer;系列YouTube视频讲座 + Jupyter notebooks,深度讲解底层数学原理与代码实现,每讲附练习巩固;覆盖从MLP、BatchNorm到Transformer/GPT全流程,MIT协议免费自学,结合视频与代码彻底掌握神经网络与大模型底层,告别黑盒使用。

Rebase 极客日报由社区志愿者共同维护,持续整理值得关注的技术内容与行业信号。