[NS :
用过小龙虾、Hermes的都懂,Token费用真的是无底洞。最近发现一个开源项目OpenSquilla,专门解决这个问题,核心就两招:智能路由:简单问题走便宜模型,复杂任务才调强模型,全自动判断,不用你动手增量传输+缓存命中:每轮只发变化部分,实测Token消耗直接砍掉90%+记忆系统也做得很扎实,上下文快满了会自
No1] OpenSquilla-省token项目用过小龙虾、Hermes的都懂,Token费用真的是无底洞。最近发现一个开源项目OpenSquilla,专门解决这个问题,核心就两招:智能路由:简单问题走便宜模型,复杂任务才调强模型,全自动判断,不用你动手增量传输+缓存命中:每轮只发变化部分,实测Token消耗直接砍掉90%+记忆系统也做得很扎实,上下文快满了会自