DC娱乐网

deephub的文章

推理 、 行动、 观察:用 LangChain和Python 实现一个智能体循环

推理 、 行动、 观察:用 LangChain和Python 实现一个智能体循环

推理 、 行动、 观察:用 LangChain和Python 实现一个智能体循环
TraceML:用三行代码为训练循环加入 step 级诊断

TraceML:用三行代码为训练循环加入 step 级诊断

TraceML:用三行代码为训练循环加入 step 级诊断
告别脆弱的单体应用,用多智能体网络构建稳定的生产力工具

告别脆弱的单体应用,用多智能体网络构建稳定的生产力工具

告别脆弱的单体应用,用多智能体网络构建稳定的生产力工具
​2026 年面向 LLM 的 RL方法总结:从 PPO 到 DPO 到 GRPO,再到多智能体 R

​2026 年面向 LLM 的 RL方法总结:从 PPO 到 DPO 到 GRPO,再到多智能体 R...

​2026 年面向 LLM 的 RL方法总结:从 PPO 到 DPO 到 GRPO,再到多智能体 RL
构建一个可自我改进的多 Agent RAG 系统:架构、评估,以及带人工审核的 Prompt 反馈闭

构建一个可自我改进的多 Agent RAG 系统:架构、评估,以及带人工审核的 Prompt 反馈闭...

构建一个可自我改进的多 Agent RAG 系统:架构、评估,以及带人工审核的 Prompt 反馈闭环
Agent = Model + Harness:模型决定上限Harness 决定下限

Agent = Model + Harness:模型决定上限Harness 决定下限

Agent = Model + Harness:模型决定上限Harness 决定下限
HyDE :让 RAG 检索从"匹配关键词"升级到"理解意图"

HyDE :让 RAG 检索从"匹配关键词"升级到"理解意图"

HyDE :让 RAG 检索从"匹配关键词"升级到"理解意图"
让机器学习 Pipeline 更稳的 5 个 Python 装饰器代码

让机器学习 Pipeline 更稳的 5 个 Python 装饰器代码

让机器学习 Pipeline 更稳的 5 个 Python 装饰器代码
Feature Engineering 实战:Pandas + Scikit-learn的机器学习特

Feature Engineering 实战:Pandas + Scikit-learn的机器学习特...

Feature Engineering 实战:Pandas + Scikit-learn的机器学习特征工程的完整代码示例
2026 RAG 选型指南:Vector、Graph、Vectorless 该怎么挑

2026 RAG 选型指南:Vector、Graph、Vectorless 该怎么挑

2026 RAG 选型指南:Vector、Graph、Vectorless 该怎么挑
三个工具,让 agent 在一次对话里完成研究、写码、调试与保存

三个工具,让 agent 在一次对话里完成研究、写码、调试与保存

三个工具,让 agent 在一次对话里完成研究、写码、调试与保存
用 Playwright 和 LLM 实现自愈测试自动化

用 Playwright 和 LLM 实现自愈测试自动化

用 Playwright 和 LLM 实现自愈测试自动化
为什么 MCP 在协议层会有 prompt injection的问题:工具描述如何劫持 agent

为什么 MCP 在协议层会有 prompt injection的问题:工具描述如何劫持 agent ...

为什么 MCP 在协议层会有 prompt injection的问题:工具描述如何劫持 agent 上下文
BM25 + Vectors:为什么真实 RAG 系统通常两者都需要

BM25 + Vectors:为什么真实 RAG 系统通常两者都需要

BM25 + Vectors:为什么真实 RAG 系统通常两者都需要
从无状态到有状态:长时运行 Agent 的 5 种架构模式

从无状态到有状态:长时运行 Agent 的 5 种架构模式

从无状态到有状态:长时运行 Agent 的 5 种架构模式