免费的大模型API清单（最新更新：2024年8月28日）

提供商	大模型	免费版本	模型说明	免费限制	控制台	价格说明
智谱	ChatGLM	glm-4-flash	支持网页搜索、工具调用、支持128K上下文支持包括汉语、英语、日语、韩语、德语在内的26种语言	tokens：总量无限 QPS：2 有效期：不限	链接
讯飞	星火	spark-lite		tokens：总量无限 QPS：2 有效期：不限	链接
百度千帆	ERNIE Speed	Speed-8K、Speed-AppBuilder、Speed-128K		Speed-128K：RPM = 1000，TPM = 400000 Speed-8K： RPM = 600，TPM = 600000 Speed-AppBuilder RPM = 120，TPM = 120000	链接	链接
百度千帆	ERNIE Lite	Lite-8K Lite-8K-0922		Lite-8K： RPM = 600，TPM = 600000 Lite-8K-0922 RPM = 10000，TPM = 800000	链接	链接
百度千帆	ERNIE Tiny	Tiny-8K		RPM = 10000，TPM = 800000	链接	链接
百度千帆	01-ai	Yi-34B-Chat		限时免费，每个账号每天包含500次调用额度(按调用总次数统计，包括但不限于调用成功的次数)。	链接	链接
百度千帆	Fuyu-8B			限时免费，每个账号每天包含500次调用额度(按调用总次数统计，包括但不限于调用成功的次数)。	链接	链接
腾讯	混元	hunyuan lite		限制并发数为 5 路	链接	链接
Cloudflare	Workers	所有模型		免费可以每天使用1万次，一个月可以30万次；测试版本的模型无限制
字节火山方舟		doubao系列 Moonshot系列等	每个模型免费提供5亿tokens的权益。
Google	Gemini			15RPM;100万 TPM;1500 RPD（每天请求数）

字节扣子(coze.cn 8) 豆包·Function call模型(32K)、通义千问-Max(8K)、MiniMax 6.5s(245K)、Moonshot（8K）、Moonshot（32K）、Moonshot（128K）链接 8 链接 7 QPS (每秒发送的请求数)：2 QPM (每分钟发送的请求数)：60 QPD (每天发送的请求数)：3000

Llama Family “Atom-13B-Chat”,“Atom-7B-Chat”,“Atom-1B-Chat”,“Llama3-Chinese-8B-Instruct” 链接 8 链接 7 1.每天 8-22 点：接口限速每分钟 20 次并发 2.每天 22-次日 8 点：接口限速每分钟 50 次并发
groq gemma-7b-it、mixtral-8x7b-32768、llama3-70b-8192、llama3-8b-8192 链接 8 链接 3 rpm为30，rpd为14400，TOKENS PER MINUTE也有限制

groq https://console.groq.com/playground

together https://api.together.xyz/models
siliconflow https://cloud.siliconflow.cn/playground/chat

本文采用署名-非商业性使用-相同方式共享 4.0 国际许可协议，转载请注明出处。