提供商大模型免费版本
模型说明
免费限制
控制台价格说明
智谱ChatGLMglm-4-flash 支持网页搜索、工具调用、支持128K上下文
支持包括汉语、英语、日语、韩语、德语在内的26种语言
tokens:总量无限 QPS:2 有效期:不限 链接
讯飞星火spark-lite tokens:总量无限 QPS:2 有效期:不限 链接
百度
千帆
ERNIE
Speed
Speed-8K、Speed-AppBuilder、Speed-128K Speed-128K:RPM = 1000,TPM = 400000
Speed-8K: RPM = 600,TPM = 600000
Speed-AppBuilder RPM = 120,TPM = 120000
链接链接
百度
千帆
ERNIE
Lite
Lite-8K
Lite-8K-0922
Lite-8K: RPM = 600,TPM = 600000
Lite-8K-0922 RPM = 10000,TPM = 800000
链接链接
百度
千帆
ERNIE
Tiny
Tiny-8KRPM = 10000,TPM = 800000链接链接
百度
千帆
01-aiYi-34B-Chat限时免费,每个账号每天包含500次调用额度(按调用总次数统计,包括但不限于调用成功的次数)。链接链接
百度
千帆
Fuyu-8B限时免费,每个账号每天包含500次调用额度(按调用总次数统计,包括但不限于调用成功的次数)。链接链接
腾讯混元hunyuan
lite
限制并发数为 5 路链接链接
CloudflareWorkers所有模型免费可以每天使用1万次,一个月可以30万次;测试版本本的模型无限制
字节
火山方舟
doubao系列
Moonshot系列等
每个模型免费提供5亿tokens的权益。
GoogleGemini 15RPM;100万 TPM;1500 RPD(每天请求数)

字节扣子(coze.cn 8) 豆包·Function call模型(32K)、通义千问-Max(8K)、MiniMax 6.5s(245K)、Moonshot(8K)、Moonshot(32K)、Moonshot(128K) 链接 8 链接 7 QPS (每秒发送的请求数):2 QPM (每分钟发送的请求数):60 QPD (每天发送的请求数):3000

Llama Family “Atom-13B-Chat”,“Atom-7B-Chat”,“Atom-1B-Chat”,“Llama3-Chinese-8B-Instruct” 链接 8 链接 7 1.每天 8-22 点:接口限速每分钟 20 次并发 2.每天 22-次日 8 点:接口限速每分钟 50 次并发
groq gemma-7b-it、mixtral-8x7b-32768、llama3-70b-8192、llama3-8b-8192 链接 8 链接 3 rpm为30,rpd为14400,TOKENS PER MINUTE也有限制

groq https://console.groq.com/playground

together https://api.together.xyz/models
siliconflow https://cloud.siliconflow.cn/playground/chat