## Custom agent

不管是任意的大模型，我们都可以根据大模型的特性来打造智能体。这通常是创建代理的最可靠方法。

我们将首先在没有历史记录的情况下创建它，但随后我们将展示如何添加历史记录。需要历史记录才能启用对话。

## 加载LLM

首先，让我们加载将用于控制代理的语言模型。

In [2]:
from langchain_openai import ChatOpenAI, OpenAI

openai_api_key = "EMPTY"
openai_api_base = "http://127.0.0.1:1234/v1"
model = ChatOpenAI(
    openai_api_key=openai_api_key,
    openai_api_base=openai_api_base,
    temperature=0.3,
)
llm = model

## 定义工具

接下来，让我们定义一些要使用的工具。让我们编写一个非常简单的 Python 函数来计算传入的单词的长度。

请注意，这里我们使用的函数文档字符串非常重要。在此处阅读有关为什么会这样的更多信息

In [13]:
from langchain.agents import tool


@tool
def get_word_length(word: str) -> int:
    """Returns the length of a word."""
    return len(word)


get_word_length.invoke("abc")

3

In [18]:
import requests

@tool
def get_weather(location):
    """根据城市获取天气数据"""
    api_key = "SKcA5FGgmLvN7faJi"
    url = f"https://api.seniverse.com/v3/weather/now.json?key={api_key}&location={location}&language=zh-Hans&unit=c"
    response = requests.get(url)
    #print(location)
    if response.status_code == 200:
        data = response.json()
        #print(data)
        weather = {
            'description':data['results'][0]["now"]["text"],
            'temperature':data['results'][0]["now"]["temperature"]
        }
        return weather
    else:
        raise Exception(f"失败接收天气信息：{response.status_code}")
            
get_weather.invoke("广州")

{'description': '多云', 'temperature': '23'}

In [201]:
import requests
import json
# SearXNG 的实例 URL，你可以使用官方实例或自托管实例
@tool
def searxng_search(query):
    """输入搜索内容，使用 SearXNG 进行搜索。"""
    SEARXNG_URL = 'http://127.0.0.1:6688'
    SEARXNG_ENGINE_TOKEN = '123456789'
    params = {}
    # 设置搜索参数
    params['q'] = query
    params['format'] = 'json'  # 返回 JSON 格式的结果
    params['token'] = SEARXNG_ENGINE_TOKEN  # 加入引擎令牌
    # 发送 GET 请求
    response = requests.get(SEARXNG_URL, params=params)
    #return response.text
    # 检查响应状态码
    if response.status_code == 200:
        res = response.json()
        #print(res)
        resList = []
        for item in res['results']:
            resList.append({
                "title":item['title'],
                "content":item['content'],
                "url":item['url']
            })
            if len(resList) >= 3:
                break
        return resList 
    else:
        response.raise_for_status()
        
searxng_search.invoke("郭德纲")

[{'title': '郭德纲_百度百科',
  'content': 'October 31, 2016 - 郭德纲，1973年1月18日出生于中国天津市，祖籍中国山西省，中国内地相声演员、导演、编剧、歌手、演员、主持人、北京德云社创始人。1979年，开始学艺。1989年，到红桥文化馆工作。1998年，创办北京相声大会（德云社前...',
  'url': 'https://baike.baidu.com/item/郭德纲/175780'},
 {'title': '郭德纲- 维基百科，自由的百科全书',
  'content': 'February 9, 2024 - 郭德纲（1973年1月18日—），天津人，祖籍山西汾阳，中国相声演员，亦曾出演影视剧，以及多档电视节目主持人，北京德云社创始人之一。2004年冬天起受到媒体关注。曾长期自称“非著名相声演员”，其相声爱好者自称“...',
  'url': 'https://zh.wikipedia.org/zh-hans/郭德纲'},
 {'title': '郭德纲- 维基百科，自由的百科全书',
  'content': '郭德纲（1973年1月18日—），天津人，祖籍山西汾阳，中國相声演员，亦曾出演影视剧，以及多档电视节目主持人，北京德云社创始人之一。2004年冬天起受到媒体关注。',
  'url': 'https://zh.wikipedia.org/wiki/%E9%83%AD%E5%BE%B7%E7%BA%B2'}]

In [144]:
from langchain_community.utilities import SearxSearchWrapper
search = SearxSearchWrapper(
    searx_host="http://127.0.0.1:6688",
    k = 5,
)
search.run("蔡徐坤")

"蔡徐坤（KUN），1998年8月2日出生于浙江省温州市，户籍湖南省吉首市，中国内地男歌手、演员、原创音乐制作人、MV导演。2012年8月，蔡徐坤参演的偶像剧《童话二分之一》播出，由此开始步入大众视线。2018年1月，参加竞演类综艺节目《偶像练习生》并以总票数第一正式出道，成为限定男团NINE PERCENT ...\n\n蔡徐坤（1998年8月2日 — ），浙江 温州人 ，中国大陆 歌手、原创音乐制作人及演员。 2012年通过参加综艺节目《向上吧!少年》进入中国内地娱乐圈 。 2015年参加中韩真人秀节目《星动亚洲》第一季和第二季，并于2016年10月成功通过10人男子组合swin正式出道。 在与依海文化提请解约后，他以个人 ...\n\nVideos · Play all · KUN - Spotlight (Documentary Film) · 蔡徐坤KUN 2023 WORLD TOUR「 KUALA LUMPUR」-《Spotlight》live · 蔡徐坤KUN 2023 WORLD TOUR 「 HONG KONG」.\n\nThere's an issue and the page could not be loaded. Reload page. 3M Followers, 37 Following, 243 Posts - See Instagram photos and videos from KUN (@caixukun)\n\nJuly 16, 2023 - We cannot provide a description for this page right now"

In [190]:
tools = [get_word_length,get_weather,searxng_search]

## 创建提示

现在让我们创建提示。由于 OpenAI 函数调用针对工具使用进行了微调，因此我们几乎不需要任何关于如何推理或如何输出格式的说明。我们将只有两个输入变量： input 和 agent_scratchpad 。 input 应为包含用户目标的字符串。 agent_scratchpad 应该是包含先前代理工具调用和相应工具输出的消息序列。

In [169]:
promptTemplate = """尽可能的帮助用户回答任何问题。

您可以使用以下工具来帮忙解决问题，如果已经知道了答案，也可以直接回答：

{tools}

回复格式说明
----------------------------

回复我时，请以以下两种格式之一输出回复：

选项 1：如果您希望人类使用工具，请使用此选项。
采用以下JSON模式格式化的回复内容：

```json
{{
    "reason": string, \\ 叙述使用工具的原因
    "action": string, \\ 要使用的工具。 必须是 {tool_names} 之一
    "action_input": string \\ 工具的输入
}}
````

选项2：如果您认为你已经有答案或者已经通过使用工具找到了答案，想直接对人类做出反应，请使用此选项。 采用以下JSON模式格式化的回复内容：

```json
{{
  "action": "Final Answer",
  "answer": string \\最终答复问题的答案放到这里！
}}
````

用户的输入
--------------------
这是用户的输入（请记住通过单个选项，以JSON模式格式化的回复内容，不要回复其他内容）：

{input}

"""

In [170]:
from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder

prompt = ChatPromptTemplate.from_messages(
    [
        (
            "system",
            "你是非常强大的助手，你可以使用各种工具来完成人类交给的问题和任务。",
        ),
        ("user", promptTemplate),
        MessagesPlaceholder(variable_name="agent_scratchpad"),
    ]
)

In [171]:
from langchain.tools.render import  render_text_description

prompt = prompt.partial(
        tools=render_text_description(list(tools)),
        tool_names=", ".join([t.name for t in tools]),
)
prompt

ChatPromptTemplate(input_variables=['agent_scratchpad', 'input'], input_types={'agent_scratchpad': typing.List[typing.Union[langchain_core.messages.ai.AIMessage, langchain_core.messages.human.HumanMessage, langchain_core.messages.chat.ChatMessage, langchain_core.messages.system.SystemMessage, langchain_core.messages.function.FunctionMessage, langchain_core.messages.tool.ToolMessage]]}, partial_variables={'tools': 'get_word_length: get_word_length(word: str) -> int - Returns the length of a word.\nget_weather: get_weather(location) - 根据城市获取天气数据\nsearxng_search: searxng_search(query) - 输入搜索内容，使用 SearXNG 进行搜索。', 'tool_names': 'get_word_length, get_weather, searxng_search'}, messages=[SystemMessagePromptTemplate(prompt=PromptTemplate(input_variables=[], template='你是非常强大的助手，你可以使用各种工具来完成人类交给的问题和任何。')), HumanMessagePromptTemplate(prompt=PromptTemplate(input_variables=['input', 'tool_names', 'tools'], template='尽可能的帮助用户回答任何问题。\n\n您可以使用以下工具来帮忙解决问题，如果已经知道了答案，也可以直接回答：\n\n{tools}\n\n回复格式说明\n------

In [198]:
render_text_description(list(tools))

# get_word_length: get_word_length(word: str) -> int - Returns the length of a word.
# get_weather: get_weather(location) - 根据城市获取天气数据
# searxng_search: searxng_search(query) - 输入搜索内容，使用 SearXNG 进行搜索。

'get_word_length: get_word_length(word: str) -> int - Returns the length of a word.\nget_weather: get_weather(location) - 根据城市获取天气数据\nsearxng_search: searxng_search(query) - 输入搜索内容，使用 SearXNG 进行搜索。'

## 将工具绑定到LLM

在这种情况下，我们依赖于 OpenAI 工具调用 LLMs，它将工具作为一个单独的参数，并经过专门训练，知道何时调用这些工具。

要将我们的工具传递给代理，我们只需要将它们格式化为 OpenAI 工具格式并将它们传递给我们的模型。（通过 bind 对函数进行 -ing，我们确保每次调用模型时都传入它们。

## 创建代理

将这些部分放在一起，我们现在可以创建代理。我们将导入最后两个实用程序函数：一个用于格式化中间步骤（代理操作、工具输出对）以输入可发送到模型的消息的组件，以及一个用于将输出消息转换为代理操作/代理完成的组件。

In [173]:
from langchain.agents.json_chat.prompt import TEMPLATE_TOOL_RESPONSE

TEMPLATE_TOOL_RESPONSE

"TOOL RESPONSE: \n---------------------\n{observation}\n\nUSER'S INPUT\n--------------------\n\nOkay, so what is the response to my last comment? If using information obtained from the tools you must mention it explicitly without mentioning the tool names - I have forgotten all TOOL RESPONSES! Remember to respond with a markdown code snippet of a json blob with a single action, and NOTHING else - even if you just want to respond to the user. Do NOT respond with anything except a JSON snippet no matter what!"

In [174]:
TEMPLATE_TOOL_RESPONSE = """工具响应：
---------------------
{observation}

用户的输入：
---------------------
请根据工具的响应判断，是否能够回答问题：

{input}

请根据工具响应的内容，思考接下来回复。回复格式严格按照前面所说的2种JSON回复格式，选择其中1种进行回复。请记住通过单个选项，以JSON模式格式化的回复内容，不要回复其他内容。"""

In [175]:
from langchain_core.messages import AIMessage, BaseMessage, HumanMessage
def format_log_to_messages(
    query,
    intermediate_steps,
    template_tool_response,
):
    """Construct the scratchpad that lets the agent continue its thought process."""
    thoughts: List[BaseMessage] = []
    for action, observation in intermediate_steps:
        thoughts.append(AIMessage(content=action.log))
        human_message = HumanMessage(
            content=template_tool_response.format(input=query,observation=observation)
        )
        thoughts.append(human_message)
    return thoughts

In [176]:
from langchain.agents.agent import AgentOutputParser
from langchain_core.output_parsers.json import parse_json_markdown
from langchain_core.exceptions import OutputParserException
from langchain_core.agents import AgentAction, AgentFinish
class JSONAgentOutputParser(AgentOutputParser):
    """Parses tool invocations and final answers in JSON format.

    Expects output to be in one of two formats.

    If the output signals that an action should be taken,
    should be in the below format. This will result in an AgentAction
    being returned.

    ```
    {
      "action": "search",
      "action_input": "2+2"
    }
    ```

    If the output signals that a final answer should be given,
    should be in the below format. This will result in an AgentFinish
    being returned.

    ```
    {
      "action": "Final Answer",
      "answer": "4"
    }
    ```
    """

    def parse(self, text):
        try:
            response = parse_json_markdown(text)
            if isinstance(response, list):
                # gpt turbo frequently ignores the directive to emit a single action
                logger.warning("Got multiple action responses: %s", response)
                response = response[0]
            if response["action"] == "Final Answer":
                return AgentFinish({"output": response["answer"]}, text)
            else:
                return AgentAction(
                    response["action"], response.get("action_input", {}), text
                )
        except Exception as e:
            raise OutputParserException(f"Could not parse LLM output: {text}") from e

    @property
    def _type(self) -> str:
        return "json-agent"

In [177]:
# from langchain.agents.output_parsers import JSONAgentOutputParser
from langchain_core.runnables import Runnable, RunnablePassthrough


agent = (
        RunnablePassthrough.assign(
            agent_scratchpad=lambda x: format_log_to_messages(
                x["input"],
                x["intermediate_steps"], 
                template_tool_response=TEMPLATE_TOOL_RESPONSE
            )
        )
        | prompt
        | llm
        | JSONAgentOutputParser()
    )

In [178]:
from langchain.agents import AgentExecutor

agent_executor = AgentExecutor(agent=agent, tools=tools, verbose=True)

In [179]:
agent_executor.invoke({"input": "广州的天气如何？"})



[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3m{
  "action": "get_weather",
  "action_input": "广州"
}[0m[33;1m[1;3m{'description': '阴', 'temperature': '19'}[0m[32;1m[1;3m{
  "action": "Final Answer",
  "answer": "广州的天气是阴天，温度为19摄氏度。"
}[0m

[1m> Finished chain.[0m


{'input': '广州的天气如何？', 'output': '广州的天气是阴天，温度为19摄氏度。'}

In [165]:
agent_executor.invoke({"input": "刘德华的老婆是谁？"})



[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3m{
  "action": "searxng_search",
  "action_input": "刘德华老婆"
}[0m[38;5;200m[1;3m[{'title': '刘德华54岁老婆朱丽倩近照,身体发福胖成大妈,女儿漂亮可爱像她_工作_鲜肉_成功', 'content': 'March 4, 2023 - 原标题：刘德华54岁老婆朱丽倩近照,身体发福胖成大妈,女儿漂亮可爱像她 · 人生如戏，我们上演着悲欢离合，试过欢声笑语，也试过痛哭流涕;人生如戏，我们经历过顺境逆境，尝过成功的甜，也尝过失败的苦。当中的滋...', 'url': 'https://www.sohu.com/a/649370669_121142690'}, {'title': '朱丽倩- 维基百科，自由的百科全书', 'content': 'November 7, 2023 - 朱丽倩（英语：Carol Chu，1966年4月6日—，本名朱丽卿），马来西亚华裔模特、艺人，祖籍福建漳州诏安，生于马来西亚槟城。舅舅是大马商人陈志远。2008年与香港知名艺人刘德华结婚。 · 朱丽倩为闽南人，生于马来西亚槟...', 'url': 'https://zh.wikipedia.org/zh-hans/朱麗倩'}, {'title': '朱丽蒨- 维基百科，自由的百科全书', 'content': '朱丽蒨（英语：Carol Chu，1966年4月6日—，旧误作朱丽倩），本名朱丽卿，马来西亚华裔模特、艺人，祖籍福建漳州诏安，生于马来西亚槟城。香港艺人刘德华妻子。 朱丽蒨.', 'url': 'https://zh.wikipedia.org/zh-hans/%E6%9C%B1%E9%BA%97%E8%92%A8'}][0m------------------
刘德华的老婆是谁？
[{'title': '刘德华54岁老婆朱丽倩近照,身体发福胖成大妈,女儿漂亮可爱像她_工作_鲜肉_成功', 'content': 'March 4, 2023 - 原标题：刘德华54岁老婆朱丽倩近照,身体发福胖成大妈,女儿漂亮可爱像她 · 人生如戏，我们上演着悲欢离合，试过欢声笑语，也试过痛哭流

{'input': '刘德华的老婆是谁？', 'output': '刘德华的老婆是朱丽倩（Carol Chu）。'}

## 添加历史记录

这太棒了 - 我们有一个代理！但是，此代理是无状态的 - 它不记得有关先前交互的任何信息。这意味着你不能轻易地提出后续问题。让我们通过添加内存来解决这个问题。

为此，我们需要做两件事：

1. 在提示符中为内存变量添加一个位置
2. 跟踪聊天记录

首先，让我们在提示中添加一个内存位置。为此，我们通过为带有 键 "chat_history" 的消息添加一个占位符 .请注意，我们将其放在新用户输入的上方（以遵循对话流）。

In [192]:
from langchain.prompts import MessagesPlaceholder


prompt = ChatPromptTemplate.from_messages(
    [
        (
            "system",
            "你是非常强大的助手，你可以使用各种工具来完成人类交给的问题和任何。",
        ),
        MessagesPlaceholder(variable_name="chat_history"),
        ("user", promptTemplate),
        MessagesPlaceholder(variable_name="agent_scratchpad"),
    ]
)

In [193]:
from langchain_core.messages import AIMessage, HumanMessage

chat_history = []

In [196]:
prompt = prompt.partial(
        tools=render_text_description(list(tools)),
        tool_names=", ".join([t.name for t in tools]),
)

agent = (
        RunnablePassthrough.assign(
            agent_scratchpad=lambda x: format_log_to_messages(
                x["input"],
                x["intermediate_steps"], 
                template_tool_response=TEMPLATE_TOOL_RESPONSE,
            )
        )
        | prompt
        | llm
        | JSONAgentOutputParser()
    )
agent_executor = AgentExecutor(agent=agent, tools=tools, verbose=True)

In [197]:


chat_history.extend(
    [
        HumanMessage(content="你好，我是老陈"),
        AIMessage(content="你好，老陈。很高兴认识你！"),
    ]
)
agent_executor.invoke({"input": "我叫什么名字？", "chat_history": chat_history})



[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3m{
  "action": "Final Answer",
  "answer": "你的名字是老陈。"
}[0m

[1m> Finished chain.[0m


{'input': '我叫什么名字？',
 'chat_history': [HumanMessage(content='你好，我是老陈'),
  AIMessage(content='你好，老陈。很高兴认识你！'),
  HumanMessage(content='你好，我是老陈'),
  AIMessage(content='你好，老陈。很高兴认识你！')],
 'output': '你的名字是老陈。'}

In [199]:
chat_history.extend(
    [
        HumanMessage(content="刘德华的老婆是谁？"),
        AIMessage(content="刘德华的老婆是朱丽倩（Carol Chu）。"),
    ]
)
agent_executor.invoke({"input": "刘德华老婆有演过电影吗", "chat_history": chat_history})



[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3m{
  "action": "Final Answer",
  "answer": "是的，朱丽倩曾出演过电影。她曾在1984年上映的马来西亚电影《神雕侠侣》中饰演小龙女一角。"
}[0m

[1m> Finished chain.[0m


{'input': '刘德华老婆有演过电影吗',
 'chat_history': [HumanMessage(content='你好，我是老陈'),
  AIMessage(content='你好，老陈。很高兴认识你！'),
  HumanMessage(content='你好，我是老陈'),
  AIMessage(content='你好，老陈。很高兴认识你！'),
  HumanMessage(content='刘德华的老婆是谁？'),
  AIMessage(content='刘德华的老婆是朱丽倩（Carol Chu）。')],
 'output': '是的，朱丽倩曾出演过电影。她曾在1984年上映的马来西亚电影《神雕侠侣》中饰演小龙女一角。'}