API 服务

API	免费类型	每日/月配额	速率限制	OpenAI 兼容
Google AI Studio	永久免费	免费使用	因模型而异	❌
Groq	免费服务	约 14,400 req/天	约 30 req/min	✅
OpenRouter	免费增值	50-1,000 req/天	20 req/min	✅
DeepSeek	试用积分	¥5 (7天)	按用量	✅
Cohere	免费试用	1,000/月	10-20 req/min	❌
Vertex AI	试用积分	$300 (91天)	按配置	❌
Anthropic	预付费	最低 $5	根据账户等级	❌
Mistral	免费试用	Experiment 计划	受限速率	✅
NVIDIA NIM	免费试用	约 1,000 积分	视模型而定	✅
Vercel AI Gateway	免费试用	$5/月	上游决定	✅
Cerebras	免费服务	100万 tokens/天	合理范围	✅
GitHub Models	免费服务	50-150 req/天	10-15 req/min	✅
Cloudflare Workers AI	免费服务	10,000 神经元/天	合理范围	部分
Baidu 千帆	永久免费	不限量（QPS 50）	50 req/s	✅

按特色功能

API	推理速度	中文性能	上下文	特色
Google AI Studio	快	优秀	最高2M	多模态、高配额
Groq	🏆 极快	良好	128K	速度王者
OpenRouter	快	视模型	视模型	🏆 25+ 模型
DeepSeek	快	🏆 顶尖	128K	超低价、思维链
Cohere	快	优秀	128K	🏆 RAG、Embed
Vertex AI	快	优秀	🏆 2M	企业级
Anthropic	快	优秀	🏆 200K	AI安全、推理
Baidu 千帆	快	🏆 顶尖	8K	🏆 永久免费、中文优化
Mistral	快	优秀	128K	🏆 欧洲AI、开源
NVIDIA NIM	快	优秀	128K	🏆 GPU加速、自托管
Vercel AI Gateway	快	优秀	视模型	🏆 统一接口、零加价
Cerebras	🏆 极快	优秀	128K	🏆 极速推理、晶圆级引擎
Cloudflare Workers AI	快	优秀	视模型	🏆 边缘部署、低延迟

🎯 选择指南

我需要高免费配额

→ Google AI Studio API - 免费使用

我需要极快的推理速度

→ Cerebras API - 2,600+ tokens/s（最快） → Groq API - 800+ tokens/s

我需要 OpenAI 兼容性

→ Groq API → OpenRouter API → DeepSeek API

我需要尝试多种模型

→ OpenRouter API - 25+ 模型

我需要中文优化

→ DeepSeek API - 中文顶尖 → Baidu 千帆 API - 国产领先，永久免费

我需要 RAG 功能

→ Cohere API - Embed + Rerank

我需要超长上下文

→ Google AI Studio API - 最高2M → Vertex AI API - 最高2M

我需要企业级部署

→ Vertex AI API - 完整 MLOps

我需要AI安全和强推理

→ Anthropic API - 200K 上下文，安全可靠

我需要 GPU 加速和自托管

→ NVIDIA NIM API - 企业级推理微服务

我需要统一接口访问多个提供商

→ Vercel AI Gateway API - 零加价聚合

我需要边缘 AI 推理

→ Cloudflare Workers AI API - 全球 300+ 数据中心，低延迟

我需要永久免费的 API

→ Baidu 千帆 API - ERNIE-3.5-8K 永久免费不限量

💡 开发建议

快速开始

选择合适的 API
- 个人项目：Google AI Studio 或 Groq
- 企业项目：Vertex AI
- 多模型测试：OpenRouter
- 中文应用：DeepSeek
- RAG 应用：Cohere
获取 API 密钥
- 按照提供者文档注册
- 保存 API 密钥

安装 SDK

# OpenAI 兼容
pip install openai

# 或使用官方 SDK
pip install google-cloud-aiplatform
pip install groq
pip install cohere

编写代码
- 参考各 API 文档
- 从简单示例开始
- 逐步增加功能

最佳实践

安全管理 API 密钥

import os
from dotenv import load_dotenv

load_dotenv()
api_key = os.getenv('API_KEY')

实现错误处理和重试

import time

def call_with_retry(func, max_retries=3):
    for i in range(max_retries):
        try:
            return func()
        except Exception as e:
            if i < max_retries - 1:
                time.sleep(2 ** i)
            else:
                raise

监控使用情况
- 定期检查配额
- 设置使用警报
- 记录 API 调用
优化成本
- 使用缓存
- 批量处理
- 选择合适模型

📚 学习资源

文档

每个 API 都有详细文档
包含快速开始
提供代码示例
最佳实践指南

代码示例

查看各 API 文档中的完整示例：

基础对话
流式输出
多模态输入
函数调用
RAG 应用

🔗 相关资源

Chatbot 服务 - 网页对话界面
提供者目录 - 按提供者浏览
贡献指南 - 帮助改进文档

最后更新于 January 28, 2026