LLMを「使う側」から「動かす側」へ——AIスキルの次のステージが見えてきた

2026年6月5日

当ページのリンクには広告が含まれています。

AI活用が当たり前になる中で、「ChatGPTを使いこなせる」だけでは差がつきにくくなってきた。Andrew Ng（ディープラーニング教育の第一人者）がRed Hatと組んで公開した新しい短期コースは、LLMをいかに多くのユーザーに低遅延・低コストで提供するかというテーマを扱っている。エンジニア向けに聞こえるかもしれないが、実はこの「動かす側」の視点こそ、これからのAIキャリアで差をつける鍵になる可能性がある。この記事では、そのコースの内容と背景、そして30〜40代の会社員にとって何が変わるのかを整理します。

なぜ「使う」だけでは足りなくなってきたのか

ここ2年で、社内でChatGPTを使う人は劇的に増えた。マーケターが文章を書かせる、営業が提案書のドラフトを作らせる、経理がExcelのマクロを生成させる——そういった「使う」フェーズは、多くの企業でもはや当然のこととして定着しつつある。ところが、その一歩先で起きていることはまだほとんど可視化されていない。それは「自社専用のAIをどう運用するか」という問題だ。

クラウドAPIを通じてOpenAIやAnthropicのモデルを呼び出している間は、裏側の仕組みを気にしなくて済む。しかし、コスト管理やセキュリティ、社内データの保護を考えると、自社インフラ上でLLMを動かすという選択肢が現実味を帯びてくる。そこに立ちはだかるのがメモリと速度の問題だ。たとえば70億パラメータ規模のモデルを動かすだけで140GB超のGPUメモリが必要になる。さらに同時に複数ユーザーがリクエストを投げれば、それぞれが専用のメモリ領域（KVキャッシュ）を消費する。このボトルネックを無視したまま「社内AI導入」を進めると、応答が遅くなるかコストが跳ね上がるか、あるいは両方が同時に起きる。

KVキャッシュとメモリ管理——技術の中身を噛み砕くと

専門用語が並んだが、概念自体は難しくない。LLMは文章を生成するとき、「ここまで読んだ文脈」を一時的にメモリに保存しながら次のトークン（単語のかたまり）を予測する。この一時保存領域がKVキャッシュだ。利用者が1人なら問題ないが、100人が同時にアクセスしたら100人分の文脈データがメモリを圧迫する。

Andrew Ngのコースが扱うのは、このKVキャッシュをどう効率的に管理するか、という話だ。具体的にはvLLMというオープンソースのフレームワークを使い、ページング（メモリをブロック単位で動的に割り当てる技術）を活用することで同時処理能力を大幅に向上させる手法が学べる。加えて、推論を高速化するための量子化（モデルの数値精度を下げてサイズを縮小する手法）や投機的デコーディング（先読みして推論をショートカットする技術）なども扱われている。

これらをすべて実装できるエンジニアになれ、という話ではない。ただ、概念として知っておくと、「うちの社内AIが重い」「APIコストが想定より高い」という状況で、何が原因で何を改善できるのかについて、技術担当者と話せるようになる。それだけで意思決定の質は変わる。

「動かす側」を知る人材は、まだ圧倒的に少ない

国内のAI関連求人を横断的に見ると、プロンプトエンジニアリングや生成AIを活用した業務改善の経験を求めるポジションは急増しているが、LLM自体の運用・最適化ができる人材は依然として希少だ。以下は、現時点で企業が求めているAI人材像をスキルレベル別に整理したものだ。

スキルレベル	求められる知識	市場の供給状況
入門（使う）	プロンプト作成、ツール活用	供給過多になりつつある
中級（つなぐ）	API連携、RAG構築、LangChain等	需要に対して不足気味
上級（動かす）	LLM推論最適化、インフラ設計	深刻な不足

この表が示しているのは、「使う」レベルは市場に溢れはじめており、差別化が難しくなっているという現実だ。一方で「つなぐ」「動かす」レベルは学習コストが高い分、まだ希少価値が保たれている。30代後半のエンジニアや、40代でシステム担当を兼ねているビジネス職の人にとっては、今がこのギャップに入り込めるタイミングかもしれない。

実際にどんな場面で使えるのか

仮に、社内向けのAIチャットボットを導入しようとしているプロジェクトマネージャーがいるとする。ベンダーから「月額コストが想定の3倍になりました」と報告を受けたとき、「それはなぜか」を問える人と問えない人では、判断の精度がまったく違う。KVキャッシュの問題を理解していれば、「同時ユーザー数の設計が甘かったのか」「量子化の設定は見直せるか」という具体的な問いを立てられる。これはエンジニアリングの問題ではなく、プロジェクト管理の問題だ。

もう少し身近な例を挙げると、ドキュメント管理部門で社内ナレッジの検索AIを試験導入している企業の話がある。検索精度は良かったのに、社員100人が朝一番に一斉アクセスすると数十秒のタイムラグが出てしまい、使われなくなってしまったケースだ。原因はメモリの同時処理限界だったが、担当者はその診断ができず、「AIは実用的でない」という結論に至ってしまった。LLMサービングの基礎を知っている人が一人いれば、問題は別の形で解決できた可能性がある。

プロンプトの書き方ガイドが扱う「AIをうまく使う」スキルと、今回紹介するような「AIをうまく動かす」スキルは、実はセットで身につけることで初めて、現場での発言力につながる。

どう学ぶか——コース選びの現実的な視点

Andrew NgのDeepLearning.AIが提供するこのコースは短期形式（数時間〜十数時間程度）で、英語が読めれば無料または低額で受講できる。技術的な下地がまったくない状態から始めるには少し急勾配かもしれないが、Pythonの基礎とクラウドの概念が分かる人なら十分着いていける内容だ。

日本語コンテンツを優先したい場合、完全に同等の内容はまだ少ない。ただ、vLLMやLLMの推論最適化に関しては技術ブログや国内のAI勉強会での発信が増えており、英語のコースと組み合わせて理解を深める方法が現実的だ。ChatGPTの使い方ガイドのような入門レベルを一通り終えた人が、次のステップとして検討するのにちょうど良いタイミングにある。

学習の順番としては、まず「APIで何かを動かした経験」を作ることが先決だ。その経験がベースにあると、メモリやレイテンシの概念がグッと具体的に感じられるようになる。

まとめ

「AIを使いこなす」という言葉の意味は、すでに2〜3段階に分かれてきている。ツールとして使うフェーズ、組み合わせてサービスをつくるフェーズ、そして効率的に動かすフェーズだ。どのレベルを目指すかは個人のキャリア設計によって異なるが、「動かす側」の知識は今後ますます価値を持つと考えられる。あなたの職場でAIが「重い」「コストがかかる」という話が出たとき、その原因について一歩踏み込んで考えられる人間になれるかどうか——そこに、次の3年でキャリアの差がついてくる可能性がある。