提供商 | 大模型 | 免费版本 | 模型说明 | 免费限制 | 控制台 | 价格说明 |
---|---|---|---|---|---|---|
智谱 | ChatGLM | glm-4-flash | 支持网页搜索、工具调用、支持128K上下文 支持包括汉语、英语、日语、韩语、德语在内的26种语言 | tokens:总量无限 QPS:2 有效期:不限 | 链接 | |
讯飞 | 星火 | spark-lite | tokens:总量无限 QPS:2 有效期:不限 | 链接 | ||
百度 千帆 | ERNIE Speed | Speed-8K、Speed-AppBuilder、Speed-128K | Speed-128K:RPM = 1000,TPM = 400000 Speed-8K: RPM = 600,TPM = 600000 Speed-AppBuilder RPM = 120,TPM = 120000 | 链接 | 链接 | |
百度 千帆 | ERNIE Lite | Lite-8K Lite-8K-0922 | Lite-8K: RPM = 600,TPM = 600000 Lite-8K-0922 RPM = 10000,TPM = 800000 | 链接 | 链接 | |
百度 千帆 | ERNIE Tiny | Tiny-8K | RPM = 10000,TPM = 800000 | 链接 | 链接 | |
百度 千帆 | 01-ai | Yi-34B-Chat | 限时免费,每个账号每天包含500次调用额度(按调用总次数统计,包括但不限于调用成功的次数)。 | 链接 | 链接 | |
百度 千帆 | Fuyu-8B | 限时免费,每个账号每天包含500次调用额度(按调用总次数统计,包括但不限于调用成功的次数)。 | 链接 | 链接 | ||
腾讯 | 混元 | hunyuan lite | 限制并发数为 5 路 | 链接 | 链接 | |
Cloudflare | Workers | 所有模型 | 免费可以每天使用1万次,一个月可以30万次;测试版本本的模型无限制 | |||
字节 火山方舟 | doubao系列 Moonshot系列等 | 每个模型免费提供5亿tokens的权益。 | ||||
Gemini | 15RPM;100万 TPM;1500 RPD(每天请求数) |
字节扣子(coze.cn 8) 豆包·Function call模型(32K)、通义千问-Max(8K)、MiniMax 6.5s(245K)、Moonshot(8K)、Moonshot(32K)、Moonshot(128K) 链接 8 链接 7 QPS (每秒发送的请求数):2 QPM (每分钟发送的请求数):60 QPD (每天发送的请求数):3000
Llama Family “Atom-13B-Chat”,“Atom-7B-Chat”,“Atom-1B-Chat”,“Llama3-Chinese-8B-Instruct” 链接 8 链接 7 1.每天 8-22 点:接口限速每分钟 20 次并发 2.每天 22-次日 8 点:接口限速每分钟 50 次并发
groq gemma-7b-it、mixtral-8x7b-32768、llama3-70b-8192、llama3-8b-8192 链接 8 链接 3 rpm为30,rpd为14400,TOKENS PER MINUTE也有限制
groq https://console.groq.com/playground
together https://api.together.xyz/models
siliconflow https://cloud.siliconflow.cn/playground/chat