主要な各LLMサービスの料金とその推移をまとめてみた
入力トークン1Mあたりの料金(USD)
入力トークン1Mあたりの料金(USD)をまとめた。
- 色:各社提供のサービスで分類
- マーク:各モデルのリリース当時の位置付けを主観で以下のように分類
- ◆:ハイエンド
- ●:通常版
- ▲:廉価版
USDあたり処理可能な入力トークン量
トークンあたりの料金だと直感的に分かりづらいため、1USDでどれだけの入力トークンが処理できるのかをまとめた。
Gemini 1.5 Flash
とGemini 1.5 Flash 8B
が圧倒的。
150円で約15M〜25Mの入力トークン、1円あたり100K〜150Kの入力トークンを処理できる。
トークン単価はどれくらい下落しているのか
比較対象 | 下落率 | 下落率/月 | 比較理由 |
---|---|---|---|
2024/5 GPT-4o 2024/8 GPT-4o |
3ヶ月で、×0.5倍(2.5/5) | ×0.794 | 値下げ |
2024/5 Gemini 1.5 Pro 2024/10 Gemini 1.5 Pro |
5ヶ月で、×0.357倍(1.25/3.5) | ×0.814 | 値下げ |
2024/5 Gemini 1.5 Flash 2024/10 Gemini 1.5 Flash |
5ヶ月で、×0.214倍(0.075/0.35) | ×0.735 | 値下げ |
2024/3 Claude 3 Opus 2024/11 Claude 3.5 Haiku |
8ヶ月で、×0.0667倍(1/15) | ×0.679 | 同程度の性能とされている |
月あたりの下落率を約20〜30%程度とすると、これがずっと続くと3ヶ月で約半額、1年経てば1/8となる計算。