LLMの提供は、長らく「月額定額+実質使い放題(暗黙の制限あり)」が主流でした。しかし、推論モデルとエージェント機能の普及で計算コストの振れ幅が爆発的に拡大し、定額モデルは限界を迎えています。GitHub Copilotは2026年6月1日に「プレミアムリクエスト」を廃止し、トークン課金(GitHub AI Credits)へ完全移行。Cursorは2025年6月、Windsurfは2026年3月にすでに同様の転換を済ませました。本記事では、GitHub Copilotの設計変更を題材に、業界横断で起きている課金モデル転換の構造、各プランへの具体的影響、そして開発・調達・運用で押さえるべき実務ポイントを整理します。
何が起きているか
2025年から2026年にかけて、AIコーディングツール各社が一斉に課金モデルを「定額・リクエスト数ベース」から「使用量・トークンベース」へと切り替えています。Cursor(2025年6月)、Windsurf(2026年3月)、そしてGitHub Copilot(2026年6月予定)。これは個別企業の値上げ騒動ではなく、LLM提供ビジネスの構造的な転換点です。
GitHub Copilotは当初、ユーザー体験としては「月額で使える」プロダクトでした。一方で裏側では、モデル選択や機能(チャット、エージェント、コードレビュー等)によってコスト構造が大きく異なります。そこでGitHubは段階的に、(1) 高コスト機能を切り出して計測し、(2) 上限を設定し、(3) 超過分を従量課金に寄せる、という設計へ舵を切ってきました。同じ流れは、Cursor・Windsurf・Claude Codeなど他のAIコーディングツールにも共通しています。
GitHubのMario Rodriguez氏(Chief Product Officer)は2026年4月の発表で、「現在は、簡単なチャットでの質問と数時間に及ぶ自動コーディングセッションで、ユーザーに同じ料金が発生する場合がある。GitHubはこれまで膨れ上がる推論コストの大部分を吸収してきたが、現在のプレミアムリクエストモデルはもはや持続可能ではない」と説明しています。
押さえておきたい要点
- 「定額=無制限」は技術的に成立しなくなりつつある
- 制限は「月次の量(予算)」と「短時間のレート制限(混雑・容量)」が別物
- 各社が同じ方向(トークン課金・quota制)に収束しており、2026年は業界全体の転換点
- GitHub Copilotは2026年6月1日にプレミアムリクエストを廃止し、GitHub AI Credits(1 credit = $0.01 USD)へ移行
Copilotの課金単位
Premium requestsとは
GitHub Copilotでは、ベースとなる体験(例:コード補完)と、コストが高くなりやすい体験(例:Copilot Chatの高度モデル、エージェント系機能)を分け、「Premium requests」という単位で計測・課金する仕組みを導入しました。公式ドキュメントでも、プレミアムリクエストの課金開始時期が明示されています(GitHub.comでは2025年6月18日から、GHE.comでは2025年8月1日から)。
Premium requestsの消費量はモデルによって異なる「倍率」で決まります。標準モデルが1倍だとすると、Claude Opus 4.6は3倍、Opus 4.6 Fastは30倍、といった具合です。この設計により、ユーザーは「どの機能・どのモデルがコストを多く使うか」を把握しやすくなった一方、月次枠と倍率の組み合わせを理解する必要が生まれ、計算が複雑化していました。
公式ドキュメントによると、GitHub.com上の有償Copilotプランでは、Premium requestsの課金が2025年6月18日から開始されています。
超過課金の考え方
組織向けのCopilot(Business / Enterprise)では、月額の席課金に加え、含まれる枠を超えたPremium requestsを追加購入できる設計が示されています。GitHub Docsでは、追加分の単価として「$0.04 USD per request」が記載されています(プラン・契約形態や設定により、超過課金を許可しない運用も可能です)。なお、Copilot Freeおよび一部のモバイル経由サブスクライバーは超過課金の対象外です。
注意
Premium requestsの残量があるのに「使えない」ことがあります。これは多くの場合、月次の枠(予算)ではなく、短時間あたりのレート制限に該当します。運用側は「課金(予算)」と「可用性(レート制限)」を分けて監視する必要があります。
なぜ定額が崩れる
コストの振れ幅が桁違いに広がった
同じ「1回の対話」に見えても、裏側の計算量は一定ではありません。推論(Reasoning)を強く使うモデル、長いコンテキスト、マルチステップのエージェント実行、コードベース全体を横断する解析などは、リクエストあたりのコストが桁違いに跳ね上がります。結果として、固定料金で重い使い方をされると、提供側は赤字になりやすい構造です。
The Registerの報道によれば、推論を多用する複雑なプロンプトは、ユーザーがサブスクリプションで支払う金額をしばしば超えるコストをGitHubに発生させていたとされます。「複雑なプロンプトが要求する大量の『思考』は、サブスクリプション料金の収益を超えるコストになる」という構造は、定額制ビジネスとして致命的です。
エージェント機能が決定打になった
近年の「コーディングエージェント」は、単発の生成ではなく、計画→実行→検証→修正を繰り返します。つまり、ユーザーの体感は「1タスク」でも、内部では数十〜数百回のモデル呼び出しが起きえます。Premium requestsやモデル別倍率の導入は、このギャップを料金へ反映する狙いだと解釈できます。
GitHubが2026年4月20日に個人向けプラン(Pro / Pro+ / Student)の新規受付を一時停止した背景にも、報道では「Copilotの週次運用コストが2026年1月以降ほぼ倍増」した事実が指摘されています。エージェントAIの普及がSaaSの原価計算を根本から壊しつつあり、新規受付停止は既存ユーザーへの提供品質を維持するための緊急措置でした。
公平性と濫用対策
定額での「実質無制限」は、ヘビーユースの一部ユーザーがコストの大半を消費する状態を招きます。課金単位を細分化し、上限と超過課金を用意するのは、コスト回収だけでなく、濫用対策や品質維持(混雑回避)の意味合いも持ちます。LLM提供ビジネスは、SaaSの「LTV最大化のための定額制」というロジックから、クラウドコンピューティング的な「使った分だけ課金」のロジックへと、構造そのものが移行しつつあります。
業界全体で起きている同じ転換
これはGitHub Copilotだけの話ではありません。主要なAIコーディングツールが揃って同じ方向に動いています。各社で計測単位の名前は異なる(credits / quotas / premium requests)ものの、本質は「トークン量に応じた課金」へと収束しています。
Cursor:2025年6月にトークン課金へ転換
Cursorは2025年6月、月額固定の「fast requests」枠を廃止し、実際のAPI消費に応じたクレジット制へ移行しました。Pro $20/月の枠内に$20分のクレジットプールが含まれ、選択するモデルやコンテキスト長に応じてクレジットが消費される設計です。Pro+は3倍、Ultra ($200/月) は20倍の消費倍率を持ちます。
導入時にはヘビーユースのユーザーに想定外の請求が発生し、コミュニティが大きく反発。同社は2025年7月4日に公式謝罪を出し、変更直後の期間(6月中旬〜7月初め)に発生した予期せぬ請求の返金対応を実施しました。Cursorの事例は、料金体系の急な変更がもたらすリスクを示す重要な参照点です。
Windsurf:2026年3月にquota制へ
Windsurfは2026年3月19日、credit制からquota制(日次・週次の利用枠)へ転換。同時にPro価格を$15から$20に引き上げ、新たに$200/月のMaxティアを追加しました。Cursor・Claude Codeと同じ$20 / $200の構図に揃えた形です。既存ユーザーは猶予なく自動移行され、グランドファザリング(旧プラン継続)は提供されていません。長期ユーザーには善意(goodwill)として1ヶ月分のクレジット付与にとどまりました。
Claude Code:階層的quota制で同水準に
Claude Codeも、Max 5x($100/月)/ Max 20x($200/月)の階層的quota制を採用しています。ヘビーユーザーは上位ティアで実質的なトークン枠を購入する形です。Anthropicの自社モデル提供であるため、トークン効率の最適化が深く、ヘビーユースではAPI直接利用より割安になるケースも多いとされます。
注目すべき価格の収束
Pro $20 / Max $200 という価格構造が、Cursor・Windsurf・Claude Codeで揃って成立しています。各社が独自の計測単位(credits、quotas、premium requests)を使いつつ、実質的なコスト構造は同じ場所に着地しつつあるのです。GitHub Copilotも2026年6月の移行で、この潮流に合流する形になります。AIコーディングツール市場は、「Pro $20で月数百ドルの実コストを賄えなくなった」という共通の現実に直面しているわけです。
2026年の転換点
Usage-basedへの完全移行
GitHub Docsの「Models and pricing for GitHub Copilot」および公式ブログによれば、2026年6月1日からすべてのCopilotプランが「request-based」から「usage-based」へ移行します。Premium requestsは廃止され、すべてのプランに毎月の GitHub AI Credits 枠が付与され、超過分は各モデルのAPIレートに基づいてトークン単位で課金されます。
使用量は、入力トークン・出力トークン・キャッシュ済みトークンの合計に、各モデルの公開APIレートを乗じて計算されます。1 GitHub AI Credit = $0.01 USD という固定レートで、トークン消費がクレジットへ換算される仕組みです。
各プランに付与されるAI Credits枠
移行後、各プランの月額料金とAI Credits枠は以下のとおりです。月額料金そのものは据え置きですが、その料金分がそのままAI Credits枠として付与される形に変わります。
| プラン | 月額 | 含まれるAI Credits | 備考 |
|---|---|---|---|
| Copilot Pro | $10 | 1,000 credits($10相当) | 個人向け |
| Copilot Pro+ | $39 | 3,900 credits($39相当) | 個人向け上位 |
| Copilot Business | $19/user | 1,900 credits(6〜8月は3,000) | 組織向け、初期3ヶ月は増量 |
| Copilot Enterprise | $39/user | 3,900 credits(6〜8月は7,000) | 大企業向け、初期3ヶ月は増量 |
BusinessおよびEnterpriseの既存顧客には、移行緩和措置として2026年6月1日〜9月1日のあいだ増量されたAI Credits枠が自動付与されます。促進期間後は標準枠に戻ります。
既存契約の取り扱い
月額契約のPro / Pro+ユーザーは、2026年6月1日にusage-based課金へ自動移行されます。一方、年額契約のPro / Pro+ユーザーは、契約期限まで既存のプレミアムリクエストベース料金が維持されますが、6月1日からモデル倍率が引き上げられ、より多くのプレミアムリクエストを消費する形になります。年額契約は満了時に自動更新されず、Copilot Freeにダウングレードされます(その後、月額有料プランへの再加入は可能)。途中で月額に切り替える場合は、残存期間に応じた日割りクレジットが提供されます。
低コストモデルへのフォールバック廃止
現行の仕組みでは、プレミアムリクエストを使い切った後でも、より低コストなモデルで作業を継続できることがありました。新しい課金体系への移行後は、このフォールバックは利用できなくなります。AI Creditsを使い切ると、(1) 追加利用予算を設定して継続するか、(2) 翌月の枠リセットを待つか、(3) プランをアップグレードするか――の3択です。ユーザー単位の予算上限を超えた場合、組織のプール残高にかかわらずそのユーザーのアクセスは停止されます。
コードレビューはGitHub Actions分課金へ
もう一つ重要な変更として、Copilot Code Reviewが2026年6月1日からGitHub Actionsの実行時間(分)を消費するようになります。コードレビュー1回ごとに、(1) AI Credits(usage-basedモデル)と、(2) GitHub Actionsの分(プライベートリポジトリの場合)の両方が課金される二重構造です。パブリックリポジトリでは引き続きActions分は無料です。Copilotライセンスを持たないユーザーがレビューを実行した場合も、組織のActions分から消費されます。
ここが肝心
Premium requestsは「機能単位の荒い計測」でした。一方、usage-based(トークン課金)は「計算量に近い粒度」で、提供側の原価により整合しやすいモデルです。つまり、LLMの課金は今後、SaaSというよりクラウド(CPU/ストレージ課金)に近づきます。usage-based billingは本質的に非決定的(non-deterministic)で、ユーザーは「特定のプロンプトに対してモデルがどれだけ時間とトークンを消費するか」を事前に正確に知ることはできません。これは予算管理の発想転換を求められるポイントです。
なお、GitHubは2026年5月初旬に「プレビュー請求書」体験を提供する予定です。6月1日の本移行前に、Billing Overviewページから移行後の予測コストを確認できる仕組みです。実際の使い方でどの程度のコストになるかを把握しておくチャンスです。
比較で理解する
課金モデルの違いは、意思決定(導入・予算・ガバナンス)に直結します。代表的なパターンを整理します。
| モデル | 課金単位 | 提供側の狙い | 利用側の注意点 |
|---|---|---|---|
| 定額(実質無制限) | 月額 | 導入障壁を下げる | ヘビーユースで制限が出やすい/持続性が弱い |
| 定額+上限(quota制) | 月額+日次/週次の枠 | コスト予測可能性 | 枠の定義が機能・モデル別で複雑化しやすい |
| 定額+超過課金 | 月額+従量 | コスト回収と公平性 | 予算超過リスク/設定ミスで請求が膨らむ |
| 従量(usage-based) | トークン/クレジット | 原価に近い課金 | 非決定的で事前見積が困難/可視化・統制が必須 |
各社の動きを見ると、定額(実質無制限)から始まり、定額+上限または定額+超過課金を経て、従量制に近づくパスを共通して辿っています。GitHub Copilotは「定額+超過課金」(Premium requests)を経て、2026年6月に「従量制」へ完全移行する形です。Cursorは中間段階を飛ばして一気に従量制へ、Windsurfはcredit制(実質的に従量制)からquota制(定額+上限)へと若干揺り戻している、という違いはあるものの、全体としては「実コストへの整合」という方向性で揃っています。
導入判断の視点
席課金から価値課金へ
定額が崩れる局面では、「席数」より「どの工程で価値が出るか」が重要です。例えば、PRレビュー要約でレビュー工数が減るのか、エージェントで定型改修が減るのか。価値の出る工程が明確なら、従量課金でもROIを説明しやすくなります。逆に「とりあえず全員に席を配る」運用は、従量制との相性が最悪です。使わない人にも枠は付与され、使う人は超過する――結果、コスト・効果ともに最悪になりがちです。
2026年6月以降のGitHub Copilotでは、Pro $10にAI Credits $10が含まれる形です。週次の運用コストが2026年1月以降ほぼ倍増したという背景から、「席数×月額」での予算予測モデルは限界を迎えています。むしろ「タスク種別×想定トークン量×単価」という、クラウドコスト的な発想で予算を組むべき時代に入りました。
調達で見るべき項目
- 含まれる利用枠(何が対象で、どの程度か。月次か週次か日次か)
- 超過時の単価(トークン/クレジット、またはリクエスト)と上限設定の柔軟性
- レート制限とSLA的な扱い(業務影響の大きさ)
- BYOK(Bring Your Own Key)の可否(ヘビーユース時の選択肢)
- ログと監査(誰が何を使ったか、APIで取り出せるか)
- 急な料金体系変更への対応(過去事例:Cursor 2025年6月、Windsurf 2026年3月、GitHub 2026年6月)
- フォールバック有無(GitHub Copilot 6月以降は廃止)
- 関連サービスとの連動課金(GitHub Actions分など)
なお、GitHub Copilotのプラン概要は公式ページでも随時更新されます。購買判断の前に、社内の想定ユースケースと照らし合わせて最新情報を確認してください。2026年5月初旬から提供されるプレビュー請求書を活用すれば、本移行前に自社の利用パターンでのコスト感を把握できます。
まとめ
LLMの課金は、推論・長文コンテキスト・エージェント実行といった「重い使い方」が増えたことで、定額一本では成立しなくなっています。GitHub Copilotは、Premium requestsによる段階的な計測・制限を経て、2026年6月1日からusage-based(GitHub AI Credits/1 credit = $0.01 USD)へ移行する方針を公式に発表しました。月額料金そのものは据え置きですが、その料金分がそのままAI Credits枠として付与される形になり、超過分はトークン消費に応じて従量課金されます。低コストモデルへのフォールバックは廃止され、コードレビューはGitHub Actions分も消費するようになります。
そしてこの動きは、Cursor(2025年6月)、Windsurf(2026年3月)と同様に、AIコーディングツール業界全体で起きている構造変化です。Pro $20 / Max $200という価格構造に各社が収束しつつあり、計測単位こそ違えど、トークン課金・quota制という方向性は共通しています。Cursorが2025年6月の急な変更で公式謝罪に追い込まれた事例は、料金変更時のコミュニケーションリスクを示す重要な参照点です。
利用側は、(1) 課金単位の理解、(2) 超過課金の統制、(3) レート制限の運用、(4) 価値が出る工程の特定、をセットで設計することが重要です。定額の終焉はコスト増だけを意味しません。価値の出る使い方を絞り込めば、従量課金でも十分に投資対効果を作れます。むしろ「全員に席を配る」段階を卒業し、AIを真に活用する組織への転換点と捉えるべきでしょう。