主要な各LLMサービスの料金とその推移をまとめてみた

入力トークン1Mあたりの料金(USD)

入力トークン1Mあたりの料金(USD)をまとめた。

  • 色:各社提供のサービスで分類
  • マーク:各モデルのリリース当時の位置付けを主観で以下のように分類
    • ◆:ハイエンド
    • ●:通常版
    • ▲:廉価版

1Mトークンあたりの料金

高価格帯のものを除くと、最近の価格競争がよくわかる。 1Mトークンあたりの料金

USDあたり処理可能な入力トークン量

トークンあたりの料金だと直感的に分かりづらいため、1USDでどれだけの入力トークンが処理できるのかをまとめた。 1USDで処理可能な入力トークン量

Gemini 1.5 FlashGemini 1.5 Flash 8Bが圧倒的。
150円で約15M〜25Mの入力トークン、1円あたり100K〜150Kの入力トークンを処理できる。

2024年の廉価版を除くと以下の通り。 1Mトークンあたりの料金

トークン単価はどれくらい下落しているのか

比較対象 下落率 下落率/月 比較理由
2024/5 GPT-4o
2024/8 GPT-4o
3ヶ月で、×0.5倍(2.5/5) ×0.794 値下げ
2024/5 Gemini 1.5 Pro
2024/10 Gemini 1.5 Pro
5ヶ月で、×0.357倍(1.25/3.5) ×0.814 値下げ
2024/5 Gemini 1.5 Flash
2024/10 Gemini 1.5 Flash
5ヶ月で、×0.214倍(0.075/0.35) ×0.735 値下げ
2024/3 Claude 3 Opus
2024/11 Claude 3.5 Haiku
8ヶ月で、×0.0667倍(1/15) ×0.679 同程度の性能とされている

月あたりの下落率を約20〜30%程度とすると、これがずっと続くと3ヶ月で約半額、1年経てば1/8となる計算。

関連記事


  1. 生成AIの現状を踏まえ、社内活用と未来を考えてみる
  2. 生成AIで、開発はどのように変わるのかを考える
  3. Ollamaを使ってMac上でLLMを実行してみた
  4. LLM活用法:コードを指定のプログラミング言語で書き換え
  5. GenUのRAGにおけるクエリ・応答生成の仕組みを調べてみた
  6. Google検索とChatAIにみる、エンタープライズサーチとRAGの未来

comments powered by Disqus