风雪围城

RAG 技术演进：从朴素检索到智能代理增强

2025-07-21

LLM 具备强大的分析能力、推理能力、生成能力，但它仍然无法记得上个月的今天发生了什么，哪怕你曾经在上个月告诉过它。

究其原因，是因为 LLM 基于静态语料库训练，你的个人经历并不在其中。它只具备短期记忆，这种记忆依靠一次对话的上下文维持（历史信息会被携带到下一次对话），当你换个对话窗口，它就忘记了。

当然，现在的诸多协议已经能够为 LLM 提供很多”外挂”，比如 MCP 协议、A2A 协议，它们在不断扩展 LLM 的认知边界，让 LLM 能够跳出其固有的知识范围。但是，RAG 仍然是一个重要方向，为 LLM 提供长期记忆、让它能够将神经元触达到你的个人数据。

...More

AI AI RAG Agentic

从单体智能到群体智慧：A2A 协议解析

2025-06-22

AI模型已然从文字走向多模态，能力边界不断拓展。从斯坦福小镇到 ChatDev，再到 AutoGen 和 LangGraph，多 Agent 协作模式也在不断发展。
个体越聪明，协作越复杂，群体智慧越强大——人类如此，AI亦然。
当个体 LLM 成熟到一定程度，协作复杂度达到新的临界点，A2A（Agent to Agent）协议的出现，为智能体互联提供标准化规范。

...More

AI AI A2A

MCP 协议完全指南：架构设计

2025-06-15

Host 就像是一个作战大厅，大厅里主要有三种角色：

LLM Client 扮演者将军的角色，负责作战计划的制定。
Orchestrator 扮演着作战参谋的角色，负责协调各个 MCP Client 的行动。
MCP Client 扮演者通信兵的角色，负责与外部 MCP Server 进行通信。
...More

AI AI MCP 架构

解码器：Transformer 模型的核心设计(四)

2025-05-22

编码器是’理解者’，解码器是’表达者’。解码器不仅依赖编码器的输出，还因其自回归特性需要理解已生成内容，才能生成下一个token。

...More

AI AI Transformer Decoder

前馈神经网络：Transformer 模型的核心设计（三）

2025-03-28

计算机世界需要用数学语言来描述和拟合现实世界的规律。某种程度上，这些规律本身就像是一个待我们去发现的复杂函数。

...More

AI AI Transformer 前馈神经网络 FNN

多头注意力机制：Transformer 模型的核心设计(二)

2025-03-16

词语的语义受其上下文影响。例如，”model”一词在”machine learning model”与”fashion model”中表达完全不同的概念。
这种影响因素的计算和捕捉，正是 transformer 模型中 self-attention 机制的核心功能之一。

...More

AI AI attention 注意力集中

三角函数与位置编码：Transformer 模型的核心设计

2025-03-11

词语的位置决定其语义功能，这是 seq2seq 模型必须解决的核心问题。比如，I saw a saw，两个 saw 在不同位置含义完全不同。

Transformer 模型并行处理所有输入词汇，失去了序列的内在顺序。位置编码通过将位置信息注入输入表示来解决这一问题。理想的位置编码应具备两个数学特性：位置的唯一性（不同位置有不同编码）和相对位置的可学习性（位置间的关系可被模型捕捉）。

...More

AI AI PE 位置编码

ResNet 残差神经网络

2025-02-20

神经网络的学习过程，亦如我们设置了一系列的函数，通过学习，让参数更加合理化，从而拟合从输入到输出的映射关系。
下面，通过 ResNet 结构，来理解神经网络的学习过程。

...More

AI AI 卷积归一化池化 ResNet 残差连接

卷积、归一化和池化

2025-02-17

卷积可以用于特征提取，归一化可以用于提高模型的泛化能力，池化可以用于减少特征的维度。

...More

AI AI 卷积归一化池化

进程，是程序运行时的实例，是操作系统分配资源的基本单位。确保了程序运行的独立性。
线程，是进程中的执行单元，是操作系统调度的最小单位。线程共享进程的内存空间，可以访问进程的资源。
协程，是一种用户态的轻量级”线程”，这种机制的关键在于 Python 中的事件循环。事件循环维护着一个就绪队列，通过不断轮询来检查和调度可以执行的协程。所有的协程都在同一个线程中执行，它们通过主动交出控制权来实现任务切换。

...More

Python Python 进程线程协程