Langchain在阿里云与树莓派边缘计算环境中的集成实践

First Post:

2025-10-01

Last Update:

2025-10-14

Word Count:

2.6k

Read Time:

12 min

Chat-Zenith是一个部署在树莓派边缘设备上的智能对话系统，通过Langchain框架整合DeepSeek大语言模型，能够搜索并理解博客内容，为用户提供精准的技术问答服务。项目采用混合云架构，结合阿里云ECS网关与本地边缘计算，实现了低成本、高可用的AI服务部署方案。

核心特性

智能对话: 基于DeepSeek模型的自然语言理解
博客搜索: 自动检索RSS feed，精准匹配相关文章
边缘计算: 在树莓派本地运行，降低云端成本
全链路HTTPS: Let’s Encrypt证书保障通信安全
内网穿透: FRP实现无公网IP访问
中文优化: Jieba分词提升中文搜索准确度

系统架构

架构图

用户浏览器

HTTPS请求

阿里云ECS (API Gateway)

Nginx
- SSL/TLS终止
- 反向代理
- CORS处理
FRP Server
内网穿透服务端

树莓派 (边缘计算节点)

FRP Client
Flask Web服务
- Langchain Agent
  - DeepSeek Chat
  - RSS搜索工具
  - 文章抓取工具
  - Jieba中文分词

配置流程

首先由于没有公网ip，我们不得不使用内网穿透，我们可以参考基于华为云服务器与frp实现内网穿透连接树莓派这篇文章实现内网穿透，首先是将ssh映射到云服务器上，后面就都可以使用ssh远程配置树莓派了。接下来配置树莓派本地服务是本篇博客的重点。

配置树莓派本地服务，在树莓派上按照以下步骤配置

madir chat-zenith
cd chat-zenith
python3 -m venv venv
source venv/bin/activate
vim chat-zenith.py

然后在chat-zenith.py中写入如下程序：

import os
import re
import feedparser
import urllib.parse
import requests
from bs4 import BeautifulSoup
from flask import Flask, request, jsonify
from flask_cors import CORS
from langchain_tavily import TavilySearch
from langchain.agents import AgentExecutor, create_tool_calling_agent, tool
from langchain_core.prompts import ChatPromptTemplate
from langchain.chat_models import init_chat_model
import jieba
import jieba.analyse
from dotenv import load_dotenv
import logging
from datetime import datetime

load_dotenv(override=True)

logging.basicConfig(
    level=logging.INFO,
    format='%(asctime)s - %(name)s - %(levelname)s - %(message)s'
)
logger = logging.getLogger(__name__)

app = Flask(__name__)

CORS(app, origins=[
    "http://smallgoodgood.top",
    "https://smallgoodgood.top",
    "http://www.smallgoodgood.top",
    "https://www.smallgoodgood.top",
    "http://localhost:*"
])

search = TavilySearch(max_results=3)

jieba.initialize()

def fetch_blog_content(url):
    try:
        headers = {
            'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36'
        }
        response = requests.get(url, headers=headers, timeout=10)
        response.raise_for_status()
        
        soup = BeautifulSoup(response.content, 'html.parser')
        
        content_selectors = [
            'article',
            '.post-content',
            '.entry-content',
            '.blog-content',
            'div[class*="content"]',
            'main'
        ]
        
        content = None
        for selector in content_selectors:
            content_element = soup.select_one(selector)
            if content_element:
                content = content_element.get_text(strip=False)
                break
        
        if not content:
            body = soup.find('body')
            if body:
                for element in body(['nav', 'footer', 'header', 'aside', 'script', 'style']):
                    element.decompose()
                content = body.get_text(strip=False)
        
        if content:
            content = re.sub(r'\n\s*\n', '\n\n', content)
            content = re.sub(r'^\s+', '', content, flags=re.MULTILINE)
            return content[:10000]
        
        return "无法提取文章内容"
    
    except Exception as e:
        return f"抓取文章内容时出错: {str(e)}"

@tool
def search_blog_rss(query: str):
    try:
        feed = feedparser.parse("https://smallgoodgood.top/rss.xml")
        
        chinese_keywords = jieba.analyse.extract_tags(query, topK=5, withWeight=False)
        english_words = set(re.findall(r'[a-zA-Z0-9]{3,}', query.lower()))
        
        query_terms = set(chinese_keywords) | english_words
        query_lower = query.lower()
        
        results = []
        for entry in feed.entries:
            title = entry.title
            description = entry.get('description', '')
            if description:
                description = re.sub(r'<[^>]+>', '', description)
            
            search_text = f"{title} {description}".lower()
            title_lower = title.lower()
            
            score = 0
            
            if any(term in title_lower for term in query_terms if len(term) > 1):
                score += 20
            elif any(term in search_text for term in query_terms if len(term) > 1):
                score += 10
            
            if query_lower in search_text:
                score += 15
            
            content_keywords = set(jieba.analyse.extract_tags(
                f"{title} {description}", topK=10, withWeight=False
            ))
            keyword_match = len(query_terms & content_keywords)
            score += keyword_match * 3
            
            if score > 0:
                published = entry.get('published', entry.get('pubDate', '未知日期'))
                full_content = fetch_blog_content(entry.link)
                
                results.append({
                    'title': title,
                    'link': entry.link,
                    'published': published,
                    'summary': description[:200] + '...' if description else "暂无摘要",
                    'full_content': full_content,
                    'score': score
                })
        
        results.sort(key=lambda x: x['score'], reverse=True)
        
        if results:
            response = f"在博客中找到 {len(results)} 篇相关文章:\n\n"
            for i, art in enumerate(results[:3], 1):
                response += f"{i}. **{art['title']}** (相关度: {art['score']})\n"
                response += f"   发布时间: {art['published']}\n"
                response += f"   摘要: {art['summary']}\n"
                response += f"   链接: {art['link']}\n\n"
                if len(art['full_content']) > 500:
                    response += f"   内容预览: {art['full_content'][:500]}...\n\n"
                else:
                    response += f"   内容: {art['full_content']}\n\n"
            return response
        else:
            return "在博客中没有找到相关文章。您可以尝试使用其他关键词搜索。"
    
    except Exception as e:
        return f"读取博客RSS时出错: {str(e)}"

@tool
def get_blog_article(url: str):
    try:
        content = fetch_blog_content(url)
        return f"文章内容:\n\n{content}"
    except Exception as e:
        return f"获取文章内容时出错: {str(e)}"

tools = [search_blog_rss, get_blog_article]

prompt = ChatPromptTemplate.from_messages([
    ("system", """你是一名助人为乐的助手，可以搜索smallgoodgood.top博客的内容来获取信息。

重要指令：
1. 当用户询问技术问题时，先使用search_blog_rss搜索博客中是否有相关文章
2. 找到相关文章后，使用get_blog_article获取文章的完整内容
3. 基于文章的完整内容进行详细回答，不要只依赖摘要
4. 引用具体的技术细节和方法
5. 如果文章内容不够详细，可以补充一般性的技术知识

请确保基于真实内容提供准确的回答。"""),
    ("human", "{input}"),
    ("placeholder", "{agent_scratchpad}"),
])

model = init_chat_model("deepseek-chat", model_provider="deepseek")

agent = create_tool_calling_agent(model, tools, prompt)
agent_executor = AgentExecutor(agent=agent, tools=tools, verbose=True)

@app.route('/health', methods=['GET'])
def health_check():
    return jsonify({
        "status": "healthy",
        "service": "Chat Zenith Langchain Service",
        "timestamp": datetime.now().isoformat()
    })

@app.route('/chat', methods=['POST', 'OPTIONS'])
def chat():
    if request.method == 'OPTIONS':
        return '', 204
    
    try:
        data = request.get_json()
        
        if not data or 'messages' not in data:
            return jsonify({
                "error": "请求格式错误，需要包含messages字段"
            }), 400
        
        messages = data['messages']
        
        user_message = None
        for msg in reversed(messages):
            if msg.get('role') == 'user':
                user_message = msg.get('content', '')
                break
        
        if not user_message:
            return jsonify({
                "error": "没有找到用户消息"
            }), 400
        
        logger.info(f"收到用户消息: {user_message}")
        
        result = agent_executor.invoke({"input": user_message})
        
        response_data = {
            "choices": [{
                "message": {
                    "content": result['output'],
                    "role": "assistant"
                }
            }],
            "model": "langchain-deepseek"
        }
        
        logger.info(f"生成回复: {result['output'][:100]}...")
        
        return jsonify(response_data)
    
    except Exception as e:
        logger.error(f"处理请求时出错: {str(e)}", exc_info=True)
        return jsonify({
            "error": f"服务器内部错误: {str(e)}"
        }), 500

@app.errorhandler(404)
def not_found(error):
    return jsonify({
        "error": "端点不存在"
    }), 404

@app.errorhandler(500)
def internal_error(error):
    logger.error(f"内部服务器错误: {str(error)}")
    return jsonify({
        "error": "内部服务器错误"
    }), 500

if __name__ == '__main__':
    logger.info("启动Chat Zenith Web服务...")
    app.run(
        host='0.0.0.0',
        port=5000,
        debug=False
    )

注意，此处需要配置.env文件还需要提前安装一些必要的库文件，具体可以参考LangChain入门基础教程这篇教程，然后在本地运行

1 2	`chmod +x chat-zenith.py python3 chat-zenith.py`

也可以让程序在后台运行：

1	`nohup python3 chat-zenith.py > output.log 2>&1 &`

使用如下命令查看是否运行成功：

1	`ps aux \| grep python3`

服务启动后，可以在树莓派本地使用curl命令测试：

curl http://localhost:5000/health

curl +X POST http://localhost:5000/chat \
	+H "Content-Type: application/json" \
	+d '{"messages":[{"role":"user","content":"你好"}]}'

如果收到了 json 返回内容说明本地部署成功了。

接下来需要使用阿里云服务器进行端口转发，这里还是使用frp进行端口转发，在frpc.toml中加入一条新的端口转发将本地的5000端口（按照你自己配置的端口来）转发到服务器上的端口（按照你自己配置的端口来），并在阿里云安全组中开放对应的端口入口

配置参考如下：

serverAddr = "你的服务器的IP地址"
serverPort = 你的服务器开放的端口

[[proxies]]
name = "ssh"
type = "tcp"
localIP = "127.0.0.1"
localPort = 本地开放的端口
remotePort = 服务器转发到的端口


[[proxies]]
name = "langchain"
type = "tcp"
localIP = "127.0.0.1"
localPort = 本地开放的端口(5000)
remotePort = 服务器转发到的端口(不能与已开放的端口重复)

配置完成后在阿里云服务器测试：

1	`curl http://localhost:你配置的转发到的云服务器上langchain对应的端口号/health`

如果收到了json返回内容说明阿里云frp端口转发配置成功了。

你也可以参考基于华为云服务器与frp实现内网穿透连接树莓派这篇文章进行配置 frpc.service 使 frpc 服务开机自启。

接下来是在阿里云上配置Nginx反向代理，因为直接暴露端口服务会存在安全性问题，并且Nginx可以处理SSL证书，提供HTTPS加密、访问控制、性能优化等功能，所以我们让Nginx将特定路径的请求转发到本地配置的端口

这里可以参考我之后发布的博客文章进行配置，不是本文的重点，这里先略过。

注意此处也需要在阿里云安全组开放对应的端口。并且要注意我的Flask应用中已经配置了CORS，此处Nginx只做代理转发，不处理CORS逻辑，而是由Flask处理所有的CORS逻辑。

在Nginx反向代理配置完成后修改前端js代码，改为连接阿里云服务器上的Nginx反向代理。

在配置完成后可能会遇到HTTPS/HTTP混合内容问题，因为我的博客是使用HTTPS会阻止所有HTTP的请求，防止中间人攻击和数据泄露。使用Let’s Encrypt免费SSL证书，通过Certbot工具自动配置。配置完成后就能在网页上进行对话啦~

reward

微信 | Wechat

≡