cyoubytes

Pytorch 原理 – 张量存储及访问

By cyoubytes May 28, 2025pytorch

本文重点探讨，Pytorch 中张量在内存中的存储布局以及对应的若干变换操作…

9 – 训练策略优化

By cyoubytes May 21, 2025LLM

与传统神经网络模型的训练类似，大语言模型的通常也会使用批次梯度下降进行模型参数的训练，同时为保证训练的稳定性和效果，还会针对学习率、优化器参数等超参数进行调整。本文就针对这些策略做一篇小结。 …

8 – 数据集加载

By cyoubytes May 14, 2025LLM

在第6部分，模型训练章节，代码段6-1展示了数据集(Dataset)和数据加载器(DataLoader)的配合示例，本文详细拆解一下二者的工作机制，下面是代码段6-1，这里再贴出来，代码段8-1。 import…

当大语言模型的基础架构搭建后，如何高效释放其理论潜能成为新的攻坚方向。前几章我们系统剖析了从零构建大语言模型的核心技术路径——这类以Transformer为骨架的深度神经网络，最初专攻自然语言理解与生成，如今已加速向多模态形态演进。然而，当模型规模突破百亿参数量级时，工程层面的挑战已跃升为制约模型效能释放的关键瓶颈。从本章开始，我们将深入大模型工业化落地的工程实践，工程能力是将学术论文中的SOTA指标转化为产业生产力的关键密钥，这些内容涉及数据收集与处理、并行策略、计算优化、内存管理、稳定训练技术、容错机制等内容。…