AI学习笔记 | 个人知识库 · 技术成长记录

📘 AI 基础干货 · 核心认知

1. 大模型本质：基于Transformer架构的自回归模型，通过海量文本训练，学习概率分布，实现“下一个词预测”。涌现能力来自规模效应+思维链。

2. 提示词黄金结构：角色 + 任务 + 细节约束 + 输出格式，例如：「你是资深HR，帮我优化简历，突出项目成果，用Markdown列表呈现」。

3. AI学习三阶路径：工具使用者 → 提示工程艺术家 → 轻量级AI应用开发（API调用/ RAG原型）。当前处于第二阶段深耕中⚡

4. 关键术语速解：Token(最小语义单元)、Embedding(向量化)、RAG(检索增强生成)、SFT(监督微调)、MoE(混合专家)。

✅ 实用学习技巧 · 即学即用

🔹 CoT思维链：提问时加入“请一步步推理”，复杂数学/逻辑任务准确率提升35%+。
🔹 任务拆解法：将多步需求拆成原子步骤，分别对话后再整合，输出质量飞跃。
🔹 提示词版本迭代：建立自己的prompt模板库，每次优化后存档，复用率提升2倍。
🔹 利用否定指令：明确“不要输出多余解释，只返回代码”等约束，避免幻觉。
🔹 Few-shot示范：给1-3个完美示例，AI风格将严格对齐。

📊 自测：提示词工程熟练度 68% ｜持续打磨中

🔍 优质学习资源 · 自用整理

📖 必看文档
• OpenAI Cookbook (提示工程经典)
• 通义千问/文心一言官方Prompt指南
• LangChain 中文文档 + DeepLearning.AI 课程

🧰 效率工具集
• 笔记+AI联动：Obsidian + Copilot
• 聚合AI测试台: Poe / ChatHub
• 代码助手: Cursor / Continue 插件

🎯 学习方向优先级：RAG检索增强 → 提示工程 → Agent基础 → 轻量微调。目前已实现个人知识库问答Demo。

#Prompt工程 #RAG实战 #AI工作流 #多模态入门

🗺️ AI 成长路线图 · 2025版

🔹 阶段一（1~30天） —— 熟练使用主流大模型(chatgpt/kimi/deepseek)，掌握提示词设计逻辑，能完成文案/总结/代码辅助。

🔹 阶段二（31~90天） —— 深入学习提示工程(链式/树状/自我一致性)、掌握RAG理论，动手搭建本地知识库( Chroma + embedding )。

🔹 阶段三（91~180天） —— 学习LangChain / LlamaIndex，开发简单AI应用 (自动化报告生成/智能客服原型)，了解Function Calling。

🔹 阶段四（长期） —— 关注Agent、工作流编排、模型评估及微调入门，保持论文阅读与社区贡献。

🎯 当前里程碑：正在构建「个人学术助手」，实现PDF文档智能问答 ✔️ 下一目标：基于开源模型部署本地API。

⚡ 提示词模板库 · 即拿即用

📌 模板1：代码解释专家
你是一名资深开发工程师，请用通俗语言解释以下代码逻辑，并指出潜在性能问题。代码：[粘贴代码块]

📌 模板2：结构化内容总结
请总结下文，输出格式：核心观点|关键论据|待讨论点。用列表呈现，不超过300字。[长文本内容]

📌 模板3：角色扮演教学
模拟历史老师角色，生动讲解Transformer注意力机制，穿插比喻，末尾出2道自测题。

💡 小贴士：每次使用后根据返回结果微调“约束条件”，两周后你会拥有一套专属高效prompt库。

🧠 主流AI模型对比 · 个人评测

GPT-4o : 综合能力最强，代码/推理T0，多模态优秀，适合复杂任务。

Claude 3.5 Sonnet : 长文本理解极佳，代码生成细腻，适合文档分析。

DeepSeek V3 / R1 : 中文友好，推理性价比王者，开源可本地部署。

通义千问2.5 : 中文任务稳定，商业场景合规性强，具有长上下文能力。

✍️ 个人日常组合：复杂逻辑/编程 → GPT-4o + DeepSeek交叉验证；长文档摘要 → Claude；中文创作 → 通义千问。各有所长灵活搭配。

📚 深度学习书单 & 优质课程

📖 《动手学深度学习》(PyTorch版) —— 李沐等，打好代码和理论基础
📖 《提示工程指南》 —— OpenAI官方最佳实践 + Prompt Engineering Guide
📖 《LangChain简明实战》 —— 快速构建LLM应用原型
🎓 课程: Andrew Ng “Prompt Engineering for Developers” (DeepLearning.AI)
🎓 课程: “Building Systems with the ChatGPT API” 掌握对话流设计

✨ 笔记习惯：每看完一节会整理demo代码和踩坑记录，开源在我的GitHub仓库（建设中）。

📝 个人学习记录 · 踩坑与成长

📌 2025.03 踩坑：构建RAG问答系统时，未对文档进行合理分块导致检索不全，后采用语义分块+重排模型(ReRank)，准确率提升42%。

📌 2025.02 突破：利用Few-shot提示让大模型按照JSON Schema输出，直接对接前端表格，开发效率翻倍。

📌 2025.01 里程碑：搭建本地知识库Demo (Ollama + nomic-embed-text + Qwen2:7B)，实现完全离线问答，总耗时约3晚。

🎯 下一步计划：学习Agent核心概念，尝试用LangGraph构建研究助理，自动联网检索+总结。

🌱 每日AI习惯：写日报/周报用AI润色；代码遇到bug先用自定义prompt debug；阅读论文时让AI生成TL;DR；保持人机协作，持续复盘。

🧩 AI 术语速查 · 新手友好

Token — 大模型计价与理解的最小单元，1000 token ≈ 700~800英文单词。

Embedding — 将文本转为向量，相似度计算用于检索和RAG。

RAG — 检索增强生成，让大模型引用外部知识库回答，缓解幻觉。

System Prompt — 系统级指令，设定全局行为风格，优先级最高。

Temperature — 控制输出随机性，0确定性最高，1+创造性增强。

CoT — 思维链，引导模型展示推理步骤，显著提升逻辑正确率。

📖 持续整理术语库，每周新增3-5个概念，建议收藏笔记！

📌 本周学习进度 · 打卡与产出

✅ 完成《LangChain 文档加载器》模块学习，实现5种格式解析器。
✅ 输出一篇“AI+论文阅读”工作流博客草稿，沉淀提示词设计心得。
🔄 进行中：Multi-Agent 基础概念学习，计划周末跑通CrewAI示例。
💡 笔记量累计：42篇原创笔记，28个可直接复用代码片段。

⭐ 本月小目标：完成“手把手搭建RAG知识库”系列图文教程，帮助更多初学者。