标签 AI 下的文章

预训练-2D图像训练3D网络

暂时无可提供的摘要

2024 年 04 月 16 日

843

神经网络层-Normalization

前言Normalization Layer在现代深度神经网络中是不可或缺的部分, 特别对于深层或者大规模...

2024 年 04 月 09 日

1728

从零开始实现BERT

前言如果你是一个自然语言处理的爱好者，那么你可能听说过 BERT。在这篇文章中，我们将探索 BERT：它...

2024 年 04 月 09 日

2171

从零开始实现 LoRA

前言LoRA，即低秩适应)，是一种更高效地微调LLMs的流行技术。与调整深度神经网络的所有参数不同，Lo...

2024 年 04 月 08 日

2325

如何在多GPU上训练真大模型

前言近年来，我们在许多自然语言处理基准任务上取得了更好的结果，这得益于更大的预训练语言模型。如何训练大型...

2024 年 04 月 08 日

1957