具体价格以Azure OpenAI官网为准。
【旧版语言模型】
模型 |
上下文 |
输入 (每百万Tokens) |
输出 (每百万Tokens) |
GPT-3.5-Turbo-0301 |
4K |
$1.50 |
$2 |
GPT-3.5-Turbo-0613 |
4K |
$1.50 |
$2 |
GPT-3.5-Turbo-0613 |
16K |
$3 |
$4 |
GPT-3.5-Turbo-1106 |
16K |
$1 |
$2 |
GPT-3.5-Turbo-0125 |
16K |
$0.50 |
$1.50 |
GPT-3.5-Turbo-Instruct |
4K |
$1.50 |
$2 |
GPT-4-Turbo |
128K |
$10 |
$30 |
GPT-4-Turbo-Vision |
128K |
$10 |
$30 |
GPT-4 |
8K |
$30 |
$60 |
GPT-4 |
32K |
$60 |
$120 |
【嵌入模型】
模型 |
价格(每千Tokens) |
Ada |
$0.0001 |
text-embedding-3-large |
$0.00013 |
text-embedding-3-small |
$0.00002 |
【GTP-4o】
GPT-4o是最先进的多模态模型,比GPT-4 Turbo更快、更便宜,具有更强的视觉功能。该模型具有128 K上下文和2023年10月的知识截止。
模型 |
价格 (每百万Tokens) |
Batch API价格 (每百万Tokens) |
GPT-4o-2024-08-06 Global |
输入: $2.50 缓存输入: $1.25 输出: $10 |
输入: $1.25 输出: $5 |
US/EU – Data Zones |
输入: $2.75 缓存输入: $1.375 输出: $11 |
不适用 |
Regional |
输入: $2.75 缓存输入: $1.513 输出: $11 |
不适用 |
GPT-4o-0513 Global |
输入: $5 输出: $15 |
输入: $2.50 输出: $7.50 |
US/EU – Data Zones |
输入: $5.50 输出: $16.50 |
不适用 |
Regional |
输入: $5 输出: $15 |
不适用 |
【GPT-4o mini】
GPT-4o mini 是最具成本效益的小型型号,具有视觉功能。该模型具有 128K 的上下文和 2023 年 10 月的知识截止值。
模型 |
价格 (每百万Tokens) |
Batch API价格 (每百万Tokens) |
Global |
输入: $0.15 缓存输入: $0.075 输出: $0.60 |
输入: $0.075 输出: $0.30 |
US/EU – Data Zones |
输入: $0.165 缓存输入: $0.083 输出: $0.66 |
不适用 |
Regional |
输入: $0.165 缓存输入: $0.091 输出: $0.66 |
不适用 |
【o1 Preview】
o1是新的复杂任务推理模型系列。 该模型具有128K上下文和2023年10月的知识截止。
模型 |
价格(每百万Tokens) |
Global |
输入: $15 缓存输入: $7.50 输出: $60 |
US/EU – Data Zones |
输入: $16.50 缓存输入: $8.25 输出: $66 |
Regional |
输入: $16.50 缓存输入: $9.075 输出: $66 |
【o1 Mini】
o 1-mini是一个快速,经济高效的推理模型,专为编码,数学和科学用例而量身定制。 该模型具有128 K上下文和2023年10月的知识截止。
模型 |
价格(每百万Tokens) |
Global |
输入: $3 缓存输入: $1.50 输出: $12 |
US/EU – Data Zones |
输入: $3.30 缓存输入: $1.65 输出: $13.20 |
Regional |
输入: $3.30 缓存输入: $1.815 输出: $13.20 |
【Realtime API】
在新的Realtime API中,型号GPT-4 o-Realtime-Preview支持音频/语音功能,包括多语言语音到语音。
模型 |
价格(每百万Tokens) |
GPT-4o-Realtime-Preview-Global |
Text 输入: $5 输出: $20 Audio 输入: $100 输出: $200 |
【基本模型】
模型 |
价格(每千Tokens) |
Babbage-002 |
$0.0004 |
Davinci-002 |
$0.002 |
【微调模型】
模型 |
每千Tokens的训练 |
每小时托管 |
每千Tokens的输入使用 |
每千Tokens的输出使用 |
Babbage-002 |
$0.0004 |
$1.70 |
$0.0004 |
$0.0004 |
Davinci-002 |
$0.006 |
$1.70 |
$0.002 |
$0.002 |
GPT-3.5-Turbo (4K) |
$0.008 |
$1.70 |
$0.0005 |
$0.0015 |
GPT-3.5-Turbo (16K) |
$0.008 |
$1.70 |
$0.0005 |
$0.0015 |
GPT-4 (8K) |
$0.08 |
$5 |
$0.03 |
$0.06 |
GPT-4o |
$0.0275 |
$1.70 |
$0.0028 |
$0.011 |
GPT-4o-mini |
$0.0033 |
$1.70 |
$0.000165 |
$0.00066 |
【图像模型】
模型 |
质量 |
分辨率 |
价格 (每100张图像) |
Dall-E-3 |
标准 |
1024 * 1024 |
$4 |
标准 |
1024 * 1792, 1792 * 1024 |
$8 |
|
Dall-E-3 |
HD |
1024 * 1024 |
$8 |
HD |
1024 * 1792, 1792 * 1024 |
$12 |
|
Dall-E-2 |
标准 |
1024 * 1024 |
N/A |
【语音模型】
模型 |
价格 |
Whisper |
N/A/小时 |
TTS (Text to Speech) |
$15/百万字符 |
TTS HD |
$30/百万字符 |