海外のSNSで、あるコンテンツ形式が静かに爆発している。人生哲学を語る僧侶や賢者キャラが、短い動画でひたすら格言を語り続けるアカウントだ。見た目はリアルな人物、語り口は落ち着いていて説得力がある。ところがその正体は、Claude・Nano Banana Pro・InfiniteTalkという3つのAIツールを組み合わせて量産されたコンテンツだった。この記事では、その具体的な仕組みと、日本の会社員が自分のコンテンツ制作に応用できる視点を整理します。
なぜ「語る賢者」コンテンツが200万フォロワーを集めるのか

SNSのアルゴリズムは、視聴完了率と保存数を強く評価する傾向にある。短い動画の中に「うまい言葉」が凝縮されていれば、ユーザーは最後まで見て、スクリーンショットを撮り、シェアする。人生アドバイスや哲学的な一言は、その条件を満たしやすいコンテンツ形式だ。加えて、「実在しそうだけど実在しない人物」という設定は、著作権や肖像権のリスクを回避しながら強いキャラクター性を演出できる。海外では仏教の僧侶、古代の哲学者、謎めいた老賢者といったキャラクターで展開されるアカウントが急増しており、なかには200万フォロワーを超えたケースも報告されている。コンテンツ自体の品質よりも、「キャラクターの一貫性」と「言葉の刺さり方」が評価されているのが実態で、これはAIツールが最も得意とする領域と重なっている。
4ステップで動画ができる仕組みを理解する
この手法の核心は、ClaudeをJSONプロンプトジェネレーターとして使う点にある。Claudeに画像をアップロードし、「この人物像に合ったキャラクター設定と、画像生成AIに渡すためのJSONプロンプトを作って」と依頼すると、次のステップで使える構造化された指示文を出力してくれる。JSONという形式は、Nano Banana Proのような画像生成AIが読み取りやすいフォーマットであり、人間が一から書くよりも精度が安定しやすい。
ステップ1:Claudeに参照画像をアップロードする
キャラクターの雰囲気を決める画像(フリー素材でも、自分でラフに描いたスケッチでも構わない)をClaudeに渡す。「この画像をベースに、穏やかで知性的な東アジア系の僧侶キャラクターを作りたい。Nano Banana Proに渡すためのJSONプロンプトを生成してほしい」という形で依頼する。
ステップ2:JSONプロンプトを生成・調整する
Claudeが出力するJSONには、キャラクターの外見・表情・背景・照明といった要素が構造化されて入っている。ここで重要なのは、一発で完成させようとしないことだ。「もう少し年齢を上げて」「背景をもっと自然光にして」と会話を続けることで、理想のキャラクター設定に近づけていく。このプロセスは5〜10分程度で完了することが多い。
ステップ3:Nano Banana Proで画像を生成する
生成されたJSONプロンプトをNano Banana Proに入力し、キャラクター画像を出力する。Nano Banana Proはキャラクターの一貫性を保ちながら複数パターンの画像を生成できる点が強みで、シリーズコンテンツに使う「同一人物の複数表情・アングル」を揃えるのに向いている。
ステップ4:InfiniteTalkでリップシンク動画を生成する
生成した画像に、InfiniteTalkで音声を当てて口の動きを同期させる。音声はテキスト読み上げでも、自分の声の録音でも対応可能だ。ここまでの工程で、文字通り「語る人物」の動画が完成する。慣れれば1本あたり3〜5分というのは誇張でなく、テンプレート化すればさらに短縮できる。
日本の会社員が使える場面はどこか
この手法を「フォロワーを稼ぐための手口」と捉えると応用範囲が狭くなる。もう少し視野を広げると、さまざまな業務シーンで活用できる可能性がある。
たとえば、社内研修用の動画コンテンツを作る担当者を想像してほしい。毎回「話す人」を手配して撮影するコストは小さくない。AIキャラクターを使った短い説明動画なら、内容を更新するたびに撮り直す必要がない。コンプライアンス研修や業務フロー説明など、「内容は変わるが形式は同じ」コンテンツに特に向いている。
あるいは、個人でSNS発信を始めたい30代のマーケターを考えてみる。顔出しへの抵抗感は多くの人が持っている。AIキャラクターを「自分の代理人」として使えば、自分の言葉や知識をコンテンツにしながら、顔を出さずに発信を続けることができる。発信したい内容(たとえばマーケティングの知識やキャリア論)を短い格言的な言葉に編集し、キャラクターに語らせる形だ。
ChatGPTの使い方ガイドでも触れているように、AIツールの価値は単体の機能よりも「組み合わせ方」にある。このワークフローはまさにその典型例だ。
ツール選定で見ておくべき現実的な視点
以下は、このワークフローを試す前に把握しておいたほうがいい情報を整理したものだ。感触をつかむために実際のコストや制限を確認しておく価値がある。
| ツール | 主な用途 | 費用感 | 日本語対応 |
|---|---|---|---|
| Claude (Anthropic) | JSONプロンプト生成・テキスト編集 | 無料プランあり、Pro月$20 | ◎ |
| Nano Banana Pro | キャラクター画像生成 | 有料プラン中心(要確認) | △(英語UI) |
| InfiniteTalk | リップシンク動画生成 | 従量制または月額 | △(英語UI) |
日本語UIへの対応が弱いツールが含まれているため、英語のインターフェースに対する心理的ハードルが実際の導入コストになる場合がある。ただし操作自体は視覚的でシンプルなので、使い始めれば慣れる範囲に収まることが多い。Claudeについては日本語で完全に操作できるため、プロンプト生成の部分は日本語のまま進められる点は大きい。
プロンプトの精度を上げるためのコツは、プロンプトの書き方ガイドが参考になる。特に「Claude向けのプロンプト構造」の節は、JSONプロンプト生成依頼に直接応用できる内容を扱っている。
量産できることと「価値を出す」は別問題
技術的なワークフローを理解した上で、もう一段踏み込んで考えたいことがある。動画を量産できる環境が整ったとして、その中身をどうするかという問いだ。
海外で伸びているアカウントを分析すると、「言葉のクオリティ」がエンゲージメントを左右している。ビジュアルの完成度よりも、「なるほど」「保存しておきたい」と思わせる言葉の密度のほうが再生数と保存数に影響している。この点は、AIが自動生成したテキストをそのまま使うと弱くなりやすい部分でもある。自分の経験・視点・業界知識を言葉に変換するプロセスを省くと、見た目だけ整ったコンテンツになってしまう。
AIを「制作コストを下げるツール」として使いつつ、コンテンツの核になる「何を語るか」は自分で磨くという分業が、長く発信を続けるための現実的な構造ではないだろうか。AIを使った副業・発信の考え方についてはAI副業ガイドにも視点を整理しているので、組み合わせて読むと判断の幅が広がる。
まとめ
Claude・Nano Banana Pro・InfiniteTalkの3ツール連携は、AI動画コンテンツの制作コストを大幅に下げる手法として海外で実績が出ている。仕組みは理解しやすく、工程もシンプルだ。ただし、英語UIのツールへの慣れや、コンテンツの「中身」をどう設計するかという問いは、ツールが解決してくれるわけではない。このワークフローをそのまま真似ることよりも、自分の業務や発信の文脈に「どのステップを組み込めるか」を考えるほうが、実際に使い続けられる形に落ち着くことが多い。あなたの伝えたいことを語らせるキャラクターは、どんな姿をしているだろうか。

