[NS : mengta] 基于 OpenWebUI Pipeline 做了一个最小化 Agent Runtime:支持历史压缩、附件按需读取、会话恢复

这几天基于OpenWebUIPipeline做了一个最小化AgentRuntime,把长上下文管理这件事做得更工程化一些。ps:主要还是因为自部署的模型会因为一些原因(显存不够),上下文不能达到模型原生支持的长度,以致于不能对长文本进行分析,故弄了这个小玩意,不过有点已知bug(不是向量形式的语义召回,会导致历史聊
 
 
Back to Top