人工智能

当前位置:

大模型中的“RL（Reinforcement Learning）”是什么？

358 阅读

KV Cache 在训练和推理中的差异是什么?

450 阅读

挑一个你深入研究过的模型（比如 DeepSeek‑R1/Llama/Mistral/Qwen），聊聊架构特性、训练技巧和使用心得。

603 阅读

你在线上或离线训练时，过拟合怎么系统性处理？直接说你最有效的三个方法和拿到的收益。

450 阅读

把 Transformer / Decoder‑only 的整体结构过一遍，各个组件分别在干什么，有哪些常见变体。

458 阅读

1 2 3 4 5 6 7 8 9 10 11