自适应分类器:通过智能查询路由降低 LLM 成本(已证明可以节省成本)
大家好!我们很高兴向大家介绍一个新的开源库,它能有效降低LLM部署成本。这个自适应分类器库能够学习如何在不同模型之间路由查询,并根据复杂度进行智能选择,从而在实际应用中不断优化成本。
我们在arena-hard-auto数据集上进行了测试,该数据集包含高成本和低成本模型(成本差异2倍)。测试结果非常令人满意:
此库非常适合同时运行多个LLama模型(例如Llama-3.1-70B和Llama-3.1-8B)并希望在不影响性能的前提下优化成本的用户。该库易于与任何基于Transformer的模型集成,并具有内置的状态持久性功能。
欢迎访问我们的代码库了解更多实施细节和基准测试结果。如果您尝试使用该库,我们非常期待听到您的使用体验!
代码库 - https://www.php.cn/link/18dabb99ce171ea5a317521425d5c206
文章推荐
-
在Ubuntu上安装Pytorch和Jupyterlab
请我喝杯咖啡☕第一步,更新您的Ubuntu系统:sudo apt update && sudo apt...
Python
8小时前 5 -
分布式系统:设计可扩展的Python后端
现代互联网应用几乎都是分布式系统,由多台协同工作的计算机或服务器组成。这种架构能够有效应对高并发用户访问,避免单机服务器...
Python
8小时前 3 -
[python] 如何在不使用pytz、dateutil的情况下转换不同时区的日期和时间
tl;tr使用datetime模块的astimezone方法。 from datetime import d...
Python
8小时前 3 -
如何编写你的第一个人工智能:初学者指南
人工智能(AI)正在彻底改变各行各业,而创建您的第一个AI项目将是一个令人兴奋的里程碑。本指南将引导您逐步创建一个简单的...
Python
8小时前 3 -
Smolagents简介
Smolagents:简化AI代理开发Hugging Face推出的Smolagents,让AI代理开发变得前所未有的轻...
Python
8小时前 3
最新文章
- 在Ubuntu上安装Pytorch和Jupyterlab 8小时前
- 分布式系统:设计可扩展的Python后端 8小时前
- [python] 如何在不使用pytz、dateutil的情况下转换不同时区的日期和时间 8小时前
- 如何编写你的第一个人工智能:初学者指南 8小时前
- Smolagents简介 8小时前
- 建立抵押计算器:一个教育项目 8小时前
- 在代码出现第13天应用Cramer的规则 8小时前
- 如何在Docker文件中从GCP Artifact注册表中安装Python软件包 8小时前
- python函数类型参数 8小时前
- 开始为流行的开源项目做出贡献 8小时前