当前位置:

人工智能

大模型中的“微调”是什么?
125 阅读
大模型中的“CoT(Chain of Thought)”是什么?
195 阅读
大模型中的“RL(Reinforcement Learning)”是什么?
73 阅读
KV Cache 在训练和推理中的差异是什么?
155 阅读
挑一个你深入研究过的模型(比如 DeepSeek‑R1/Llama/Mistral/Qwen),聊聊架构特性、训练技巧和使用心得。
171 阅读
你在线上或离线训练时,过拟合怎么系统性处理?直接说你最有效的三个方法和拿到的收益。
161 阅读
把 Transformer / Decoder‑only 的整体结构过一遍,各个组件分别在干什么,有哪些常见变体。
163 阅读