AI Agent· 第一讲 AI Agent 原理

AI Agent工作流

  • RL(Reinforcement Learning):Learn to Maximize Reward

  • 局限:要为了每一个任务用不同的RL训练模型

  • 从LLM角度看Agent的问题:依靠现有的模型反复做observation和action接龙,利用LLM来连接

LLM运行AI Agent优势

  • 传统 agent:只能使用事先设定好的行为,需要reward【尝试不同的值,玄】和Compile Error做回馈(alpha Go)
  • LLM agent:可以对不同的action有近乎无限的回答,还可以使用工具。Compile Error通过Log传输。

AI Agent关键能力

  1. 根据过去经验调整行为(非调参)

    不断回忆整个Agent一生记忆,但是可能会导致超常自缚式记忆/超忆症(难完成思考)

    解决方案:用Read模组从Memory里面调用有用的相关经验(从database里面检索相关信息,做查询)【本质RAG】

    负面的经验对实际的调整几乎没有帮助,告诉他要做什么而是不要做什么

    Write:利用Write模组来选择需要放入Memory的信息(可用另一个LLM)

    Reflection:把记忆中的资料重新整理(可用另一个LLM)

    Knowledge graph:知识图谱,让知识查询更简单

    参考论文

    MemGPT、Agent Workflow Memory、A-MEM: Agentic Memory for LLM Agents

    经验调整行为
  2. 语言模型常用工具(Function,Function Call)

    • 优先级是System Prompt更高
    • 语音转文字(调用工具)再输入只可读文字的模型
    • tool Selection:工具选择模组,对多个工具情况处理(把多个工具的使用存入Memory)
    • LLM自己也可以写工具
    • 什么样的外部知识容易说服ai:越接近本身信念差距小越容易被说服,更相信同类ai的话,更相信发布时间更新的文章
    • 就算找到所有材料都对,但是也不能保证答案对
    • 用工具不一定就比不用快

    参考论文:TroVE, LATM,CREATOR,CRAFT

  3. AI 能不能做计划

    • 计划是不断变化的,预期不同导致原计划不行。

      • 改进:每一个observation不同来改变计划
    • Benchmark

      • 普通方块世界
      • 神秘方块世界
    • 强化AI Agent的规划能力

      • 和想象环境(World Model)互动,每一条路径都尝试:对每一个新路径先判断是否有希望
    • 想象的能力–Reasoning的能力(可能想太多)

      想象自己做尝试,猜测结果,找到成功最佳solution

Ting WeChat PayWeChat Pay
0%