当前位置:

人工智能

大模型中的“RL(Reinforcement Learning)”是什么?
192 阅读
KV Cache 在训练和推理中的差异是什么?
285 阅读
挑一个你深入研究过的模型(比如 DeepSeek‑R1/Llama/Mistral/Qwen),聊聊架构特性、训练技巧和使用心得。
380 阅读
你在线上或离线训练时,过拟合怎么系统性处理?直接说你最有效的三个方法和拿到的收益。
287 阅读
把 Transformer / Decoder‑only 的整体结构过一遍,各个组件分别在干什么,有哪些常见变体。
313 阅读