人工智能 - 嘀嗒文库-高质量数字化解决方案下载、技术架构开发、职场PPT、数字化转型与与创业文档资料下载网站

什么是 Self-Attention？

351 阅读

为什么要使用多头注意力（Multi-head Attention）？

342 阅读

大模型基础面试题：什么是 Attention 机制？

294 阅读

大模型基础面试题：什么是 Prompt？为什么提示词能影响模型回答？

465 阅读

大模型基础面试题：什么是 Embedding？

443 阅读

大模型与传统机器学习模型的区别是什么？

293 阅读

为什么 Transformer 能取代 RNN？

321 阅读

什么是 Transformer 架构？

364 阅读

大模型基础面试题：什么是预训练？

358 阅读

什么是参数量，比如7B、13B是什么意思？

334 阅读

大模型中的“泛化（Generalization）”是什么？

461 阅读

大模型中的“温度（Temperature）”是什么？

333 阅读

大模型中的“对齐（Alignment）”是什么？

330 阅读

什么是大语言模型（LLM）？.docx

339 阅读

大模型中的“上下文窗口（Context Window）”是什么？

336 阅读

大模型中的“GRPO（Generative Rejection Preference Optimization）”是什么？

348 阅读

大模型中的“Scaling（扩展规律）”是什么？

338 阅读

大模型中的“MOE（Mixture of Experts）”是什么？

282 阅读

大模型中的“噪声（Noise）”是什么？

316 阅读

大模型中的“软标签（Soft Label）”是什么？

364 阅读

大模型中的“SFT”是什么？

322 阅读

大模型中的“RAG（Retrieval-Augmented Generation）”是什么？

322 阅读

大模型中的“微调”是什么？

316 阅读

大模型中的“CoT（Chain of Thought）”是什么？

564 阅读