📓 个人学习笔记 · 持续沉淀 · 硬核干货
1. 大模型本质:基于Transformer架构的自回归模型,通过海量文本训练,学习概率分布,实现“下一个词预测”。涌现能力来自规模效应+思维链。
2. 提示词黄金结构:角色 + 任务 + 细节约束 + 输出格式,例如:「你是资深HR,帮我优化简历,突出项目成果,用Markdown列表呈现」。
3. AI学习三阶路径:工具使用者 → 提示工程艺术家 → 轻量级AI应用开发(API调用/ RAG原型)。当前处于第二阶段深耕中⚡
4. 关键术语速解:Token(最小语义单元)、Embedding(向量化)、RAG(检索增强生成)、SFT(监督微调)、MoE(混合专家)。
📊 自测:提示词工程熟练度 68% | 持续打磨中
📖 必看文档
• OpenAI Cookbook (提示工程经典)
• 通义千问/文心一言官方Prompt指南
• LangChain 中文文档 + DeepLearning.AI 课程
🧰 效率工具集
• 笔记+AI联动:Obsidian + Copilot
• 聚合AI测试台: Poe / ChatHub
• 代码助手: Cursor / Continue 插件
🎯 学习方向优先级:RAG检索增强 → 提示工程 → Agent基础 → 轻量微调。 目前已实现个人知识库问答Demo。
🎯 当前里程碑:正在构建「个人学术助手」,实现PDF文档智能问答 ✔️ 下一目标:基于开源模型部署本地API。
📌 模板1:代码解释专家
你是一名资深开发工程师,请用通俗语言解释以下代码逻辑,并指出潜在性能问题。代码:[粘贴代码块]
📌 模板2:结构化内容总结
请总结下文,输出格式:核心观点|关键论据|待讨论点。用列表呈现,不超过300字。[长文本内容]
📌 模板3:角色扮演教学
模拟历史老师角色,生动讲解Transformer注意力机制,穿插比喻,末尾出2道自测题。
💡 小贴士:每次使用后根据返回结果微调“约束条件”,两周后你会拥有一套专属高效prompt库。
GPT-4o : 综合能力最强,代码/推理T0,多模态优秀,适合复杂任务。
Claude 3.5 Sonnet : 长文本理解极佳,代码生成细腻,适合文档分析。
DeepSeek V3 / R1 : 中文友好,推理性价比王者,开源可本地部署。
通义千问2.5 : 中文任务稳定,商业场景合规性强,具有长上下文能力。
✍️ 个人日常组合:复杂逻辑/编程 → GPT-4o + DeepSeek交叉验证;长文档摘要 → Claude;中文创作 → 通义千问。各有所长灵活搭配。
✨ 笔记习惯:每看完一节会整理demo代码和踩坑记录,开源在我的GitHub仓库(建设中)。
📌 2025.03 踩坑:构建RAG问答系统时,未对文档进行合理分块导致检索不全,后采用语义分块+重排模型(ReRank),准确率提升42%。
📌 2025.02 突破:利用Few-shot提示让大模型按照JSON Schema输出,直接对接前端表格,开发效率翻倍。
📌 2025.01 里程碑:搭建本地知识库Demo (Ollama + nomic-embed-text + Qwen2:7B),实现完全离线问答,总耗时约3晚。
🎯 下一步计划:学习Agent核心概念,尝试用LangGraph构建研究助理,自动联网检索+总结。
📖 持续整理术语库,每周新增3-5个概念,建议收藏笔记!