🤖 AI 学习分享站

📓 个人学习笔记 · 持续沉淀 · 硬核干货

📅 更新至2025年4月 · 深度学习实践手记

📘 AI 基础干货 · 核心认知

1. 大模型本质:基于Transformer架构的自回归模型,通过海量文本训练,学习概率分布,实现“下一个词预测”。涌现能力来自规模效应+思维链。

2. 提示词黄金结构角色 + 任务 + 细节约束 + 输出格式,例如:「你是资深HR,帮我优化简历,突出项目成果,用Markdown列表呈现」。

3. AI学习三阶路径:工具使用者 → 提示工程艺术家 → 轻量级AI应用开发(API调用/ RAG原型)。当前处于第二阶段深耕中⚡

4. 关键术语速解:Token(最小语义单元)、Embedding(向量化)、RAG(检索增强生成)、SFT(监督微调)、MoE(混合专家)。

✅ 实用学习技巧 · 即学即用

📊 自测:提示词工程熟练度 68% | 持续打磨中

🔍 优质学习资源 · 自用整理

📖 必看文档
OpenAI Cookbook (提示工程经典)
• 通义千问/文心一言官方Prompt指南
• LangChain 中文文档 + DeepLearning.AI 课程

🧰 效率工具集
• 笔记+AI联动:Obsidian + Copilot
• 聚合AI测试台: Poe / ChatHub
• 代码助手: Cursor / Continue 插件

🎯 学习方向优先级:RAG检索增强 → 提示工程 → Agent基础 → 轻量微调。 目前已实现个人知识库问答Demo。

#Prompt工程 #RAG实战 #AI工作流 #多模态入门

🗺️ AI 成长路线图 · 2025版

🔹 阶段一(1~30天) —— 熟练使用主流大模型(chatgpt/kimi/deepseek),掌握提示词设计逻辑,能完成文案/总结/代码辅助。
🔹 阶段二(31~90天) —— 深入学习提示工程(链式/树状/自我一致性)、掌握RAG理论,动手搭建本地知识库( Chroma + embedding )。
🔹 阶段三(91~180天) —— 学习LangChain / LlamaIndex,开发简单AI应用 (自动化报告生成/智能客服原型),了解Function Calling。
🔹 阶段四(长期) —— 关注Agent、工作流编排、模型评估及微调入门,保持论文阅读与社区贡献。

🎯 当前里程碑:正在构建「个人学术助手」,实现PDF文档智能问答 ✔️ 下一目标:基于开源模型部署本地API。

⚡ 提示词模板库 · 即拿即用

📌 模板1:代码解释专家
你是一名资深开发工程师,请用通俗语言解释以下代码逻辑,并指出潜在性能问题。代码:[粘贴代码块]

📌 模板2:结构化内容总结
请总结下文,输出格式:核心观点|关键论据|待讨论点。用列表呈现,不超过300字。[长文本内容]

📌 模板3:角色扮演教学
模拟历史老师角色,生动讲解Transformer注意力机制,穿插比喻,末尾出2道自测题。

💡 小贴士:每次使用后根据返回结果微调“约束条件”,两周后你会拥有一套专属高效prompt库。

🧠 主流AI模型对比 · 个人评测

GPT-4o : 综合能力最强,代码/推理T0,多模态优秀,适合复杂任务。

Claude 3.5 Sonnet : 长文本理解极佳,代码生成细腻,适合文档分析。

DeepSeek V3 / R1 : 中文友好,推理性价比王者,开源可本地部署。

通义千问2.5 : 中文任务稳定,商业场景合规性强,具有长上下文能力。

✍️ 个人日常组合:复杂逻辑/编程 → GPT-4o + DeepSeek交叉验证;长文档摘要 → Claude;中文创作 → 通义千问。各有所长灵活搭配。

📚 深度学习书单 & 优质课程

✨ 笔记习惯:每看完一节会整理demo代码和踩坑记录,开源在我的GitHub仓库(建设中)。

📝 个人学习记录 · 踩坑与成长

📌 2025.03 踩坑:构建RAG问答系统时,未对文档进行合理分块导致检索不全,后采用语义分块+重排模型(ReRank),准确率提升42%。

📌 2025.02 突破:利用Few-shot提示让大模型按照JSON Schema输出,直接对接前端表格,开发效率翻倍。

📌 2025.01 里程碑:搭建本地知识库Demo (Ollama + nomic-embed-text + Qwen2:7B),实现完全离线问答,总耗时约3晚。

🎯 下一步计划:学习Agent核心概念,尝试用LangGraph构建研究助理,自动联网检索+总结。

🌱 每日AI习惯:写日报/周报用AI润色;代码遇到bug先用自定义prompt debug;阅读论文时让AI生成TL;DR;保持人机协作,持续复盘。

🧩 AI 术语速查 · 新手友好

Token — 大模型计价与理解的最小单元,1000 token ≈ 700~800英文单词。
Embedding — 将文本转为向量,相似度计算用于检索和RAG。
RAG — 检索增强生成,让大模型引用外部知识库回答,缓解幻觉。
System Prompt — 系统级指令,设定全局行为风格,优先级最高。
Temperature — 控制输出随机性,0确定性最高,1+创造性增强。
CoT — 思维链,引导模型展示推理步骤,显著提升逻辑正确率。

📖 持续整理术语库,每周新增3-5个概念,建议收藏笔记!

📌 本周学习进度 · 打卡与产出

⭐ 本月小目标:完成“手把手搭建RAG知识库”系列图文教程,帮助更多初学者。