agent模型如何判断需要使用工具 agent模型如何判断需要使用工具模型判别是否需要调用工具Function Calling,主要经历以下三个核心阶段: 1. 语义匹配与意图识别 (Semantic Matching)当你向模型提供工具时,你实际上是把工具的 Schema(结构定义) 放入了上下文(Context)中。 工具描述的重要性: 每个工具都有名称和详细描述(例如:get_weather 的描述是“获取特定城市的实时天气 2026-04-03 AI
Transformer长文本遗忘根源 Transformer长文本遗忘根源1. 物理层面的“硬限制”:Context Window(上下文窗口)Transformer 模型在设计时,必须预先定义一个最大序列长度(Max Sequence Length)。 定额容器: 想象对话是一个杯子,Transformer 的上下文窗口就是杯子的容量(比如 4k、32k 或 128k tokens)。当对话内容超过这个容量时,为了存入新的话语,系 2026-04-03 AI
大模型上下文窗口对agent系统的影响 大模型上下文窗口对agent系统的影响随着模型上下文从几千 token 扩展到百万级别,Agent 的设计模式发生了显著变化 正面影响 更强大的“原生”长期记忆 深度对话保留: Agent 可以记住更长的对话历史,无需复杂的总结(Summarization)或截断策略,能够更好地维持角色的连贯性和任务的一致性。 跨文档关联: 在处理复杂任务(如代码库重构或长篇法律分析)时,Agent 可以将整个项 2026-04-03 AI
大模型微调Fine-tuning 大模型微调Fine-tuning大模型微调(Fine-tuning) 是指在一个已经预训练好的大语言模型(Base Model)基础上,使用特定领域的数据集进行二次训练,以调整模型的参数,使其在特定任务或特定领域表现得更好。 什么是大模型微调?如果把预训练(Pre-training)比作一个学生在学校接受通识教育(学习各科知识,具备理解语言、逻辑推理的能力),那么微调(Fine-tuning)就是 2026-04-03 AI
Transformer Transformer1. 从整体宏观来理解Transformer首先,我们将整个模型视为黑盒。在机器翻译任务中,接收一种语言的句子作为输入,然后将其翻译成其他语言输出。 中间部分的 Transformer 可以拆分为 2 部分:左边是编码部分(encoding component),右边是解码部分(decoding component)。 其中编码部分是多层的编码器(Encoder)组成(T 2026-04-03 AI
为什么mysql默认隔离级别是RR而不是RC 为什么mysql默认隔离级别是RR而不是RC在 MySQL 的早期版本中,Binlog只有一种格式:statement,即记录 SQL 语句本身。 1. RC 级别下的“幻读”导致主从数据不一致在 RC 隔离级别下,Binlog 记录的顺序是按照事务提交的先后顺序排列的,而不是 SQL 执行的先后顺序。 假设有两个事务同时操作: 事务 A:DELETE FROM users WHERE age 2026-04-01 MySQL
从输入网址到网页呈现的全过程 从输入网址到网页呈现的全过程当你在浏览器输入一个网址并回车,背后会经历一系列网络通信与数据处理步骤,最终将网页呈现出来。 1. 解析域名(DNS解析) 浏览器首先检查本地缓存和 hosts 文件,若无匹配记录,则向本地DNS服务器发起查询。若本地DNS无缓存,会依次向根DNS服务器、顶级域DNS服务器、权威DNS服务器查询,最终获得目标服务器的 IP地址。此过程可能经过 递归查询 与 迭代查询,并 2026-03-25 计算机网络
SSE与WebSocket SSE与WebSocket 引用:https://www.cnblogs.com/1314520xh/p/18805931 1. WebSocketWebSocket 是 HTML5 引入的 全双工通信协议,允许客户端和服务器之间保持持久连接,实现低延迟的双向通信 WebSocket特点: 全双工通信:客户端和服务器都可以主动发送数据 低延迟::连接建立后,数据交换无需额外的 HTTP 头部, 2026-03-25 计算机网络
BM25算法原理 BM25算法原理BM25(Best Matching 25)是信息检索领域用来计算查询(Query)与文档(Document)之间相关性的核心算法。BM25 是在经典的 TF-IDF 基础上改进而来的,它主要解决了 TF-IDF 中的两个痛点:词频饱和度和文档长度归一化 1. TF-IDF1.1 TF-IDF 的两个核心组件TF-IDF 是由两部分相乘得来的: TF (Term Frequency 2026-03-24 AI
近似最近邻ANN算法技术总结 近似最近邻ANN算法技术总结 参考: https://zhuanlan.zhihu.com/p/1975285032437433794 https://zhuanlan.zhihu.com/p/677789496 近似最近邻 (Approximate Nearest Neighbor, ANN) 算法是一类用于在高维空间中快速查找与查询点最相似数据点的算法。相比精确的最近邻搜索 (KNN),AN 2026-03-24 AI