2024年

Your description here.

损失计算(持续更新)

前言这里用来记录下使用过的部分损失的计算过程以及含义.交叉熵损失交叉熵损失（Cross-Entropy ...

2024 年 04 月 16 日

2042

预训练-2D图像训练3D网络

暂时无可提供的摘要

2024 年 04 月 16 日

843

神经网络层-Normalization

前言Normalization Layer在现代深度神经网络中是不可或缺的部分, 特别对于深层或者大规模...

2024 年 04 月 09 日

1622

从零开始实现BERT

前言如果你是一个自然语言处理的爱好者，那么你可能听说过 BERT。在这篇文章中，我们将探索 BERT：它...

2024 年 04 月 09 日

2060

从零开始实现 LoRA

前言LoRA，即低秩适应)，是一种更高效地微调LLMs的流行技术。与调整深度神经网络的所有参数不同，Lo...

2024 年 04 月 08 日

2215