このガイドのゴール
読み終えると、クライアントから問い合わせを受けて、短尺AI動画を納品するまでの一本道を自分でなぞれます。所要時間の目安:初案件は半日〜1日(慣れれば2〜3時間)。「動画が作れる」だけでなく「受注して納品できる」状態を目指します。情報は2026年6月時点のものです。
前提・準備:Veo 3.1またはKling 3.0のアカウント、ChatGPT(無料枠可)、Canva(無料枠可)。案件を取ってくる前にこのワークフローを1回通しで試作しておくことを強く推奨します。
目次
- 全体像(4フェーズの概要)
- フェーズ1|ヒアリング→台本作成(ChatGPT)
- フェーズ2|動画生成(Veo 3.1 / Kling 3.0)
- フェーズ3|編集・仕上げ(Canva)
- フェーズ4|納品・著作権・商用確認
- ツール使い分け表(Veo / Kling / Runway)
- 相場と月額保守(目安・注意事項)
- 案件の取り方(受注ガイドへ)
- つまずきと注意点
- 完成チェックリスト(納品前)
- FAQ
- まとめ:次の一歩
全体像(4フェーズの概要)
AI動画の受注〜納品は以下の4フェーズで完結します。各フェーズで使うツールと目安時間を把握してから動きましょう。
| フェーズ | 作業内容 | 主なツール | 目安時間(慣れた後) |
|---|---|---|---|
| 1. ヒアリング→台本 | 目的・ターゲット・ゴールを聞き出し、動画の設計図(台本・絵コンテメモ)を作る | ChatGPT、ヒアリングシート | 30〜60分 |
| 2. 動画生成 | 英語プロンプトを作り、Veo/Klingで映像を生成・反復 | Veo 3.1 / Kling 3.0 | 30〜60分 |
| 3. 編集・仕上げ | テロップ・ロゴ・音楽・カット編集 | Canva(動画機能) | 30〜60分 |
| 4. 納品・確認 | 形式変換・商用確認・ファイル共有 | Google Drive等 | 15〜30分 |
初案件は各フェーズで迷う時間が入るので半日見てください。ワークフローが固まれば2本目以降は大幅に短縮できます。
フェーズ1|ヒアリング→台本作成(ChatGPT)
動画の品質はヒアリングの深さで8割決まります。以下の5項目をクライアントから引き出してください。
- 目的:何のために動画を使うか(SNS集客・LP埋め込み・広告・説明用等)
- ターゲット:誰に見せるか(年齢層・性別・課題・嗜好)
- ゴール:動画を見た人にどう動いてほしいか(来店・問い合わせ・購買等)
- 素材:使いたい既存の写真・ロゴ・色・キャッチコピーはあるか
- 制約:尺・形式・NGワード・ブランドガイドライン
ヒアリング後の台本生成プロンプト(ChatGPTにコピペ):
あなたは動画ディレクターです。以下のヒアリング情報をもとに、SNS用15秒動画の台本を作ってください。構成:[シーン番号+画面に映るもの+ナレーション or テロップ+時間]の表形式で。目的:[記入] ターゲット:[記入] ゴール:[記入] ブランドカラー:[記入] NGワード:[記入]。誇大表現は避けてください。
出てくるもの(例):
| シーン | 映像 | テロップ | 秒数 |
|---|---|---|---|
| 1 | カフェのカウンター、ラテアートのクローズアップ | (なし) | 0〜4秒 |
| 2 | 窓から差し込む朝の光、ゆったりした店内 | 「日常に、ひと息の陽だまりを。」 | 4〜10秒 |
| 3 | スタッフがカップを渡す手元 | 「陽だまり珈琲 / ○○駅徒歩2分」 | 10〜15秒 |
台本をクライアントに確認してもらい、GOをもらってから生成フェーズへ進みます。台本段階で修正するのが最もコストが低い。
フェーズ2|動画生成(Veo 3.1 / Kling 3.0)
台本の各シーンをAI動画で生成します。基本フローは「シーン単位でプロンプトを作る→生成→反復→採用」です。
- シーンごとに英語プロンプトを作る:ChatGPTを使って台本の各シーン記述を英語プロンプトに変換。スタイル定義文(色調・雰囲気・カメラ感)を全シーン共通で先頭に付ける。
- ツールを選ぶ(次章の使い分け表を参照):音声込み高品質→Veo 3.1、映像のみで量産→Kling 3.0。
- 核シーンから生成:最も重要なシーン(FVや決め画)を先に1本出す。品質を確認してから残りのシーンへ。
- 反復:Draft→Review→Tweak→Re-generate。1回の修正指示は1〜2要素。
- 採用したシーンを保存:MP4で手元にDL。ファイル名は「scene01_cafe-counter_v3.mp4」のように管理する。
実プロンプトの例(シーン1・Kling 3.0用):
Cinematic warm-tone, film grain, shallow DOF, soft backlight. Extreme close-up of a latte art cup on a wooden cafe counter. Camera static. Soft warm light from the side, gentle steam rising. Intimate, slow. 4 seconds.
各ツールの詳細な操作はVeo 3.1の使い方・Kling 3.0の使い方を参照してください。
フェーズ3|編集・仕上げ(Canva)
Canvaの動画編集機能を使って、生成した複数シーンを繋ぎ、テロップ・ロゴ・音楽を加えます。
- Canvaで「動画」プロジェクトを新規作成。サイズはSNS用途に合わせる(Reels/TikTok=1080×1920、YouTube=1920×1080等)。
- シーンを順番にアップロードし、台本の時間割に合わせてタイムライン上に並べる。
- テロップを追加:台本のテロップ欄のテキストを入力。ブランドフォント・サイズ・色をクライアントのブランドガイドに合わせる。
- ロゴを挿入:クライアントのロゴファイルをアップロードし、末尾シーンに配置。
- 音楽・音声を付ける:CanvaのBGMライブラリ(商用利用可のものを選ぶ)またはVeo 3.1で生成した音声を使用。BGMは映像より音量を下げる(映像の内容が聞き取れる水準に)。
- 書き出し:MP4、1080p以上。容量が大きければCanvaのダウンサイズ機能で調整。
Canvaの注意点:無料プランはBGMの商用利用に制限がある場合があります。クライアント納品用にはCanva Proまたはロイヤリティフリー音源を別途用意することを推奨します。
フェーズ4|納品・著作権・商用確認
納品前に必ず以下を確認してから渡してください。後から問題が出ると信頼を失います。
- 商用利用確認:使用したVeo/Kling/Canvaのプランが商用利用を許可しているか規約で確認。
- AI生成物の開示:クライアントに「AI動画ツールで生成した素材を使用しています」と事前に説明・合意を取る(トラブル防止)。
- 権利の所在確認:クライアントが二次利用(SNS掲載・広告入稿等)できる状態か確認。各ツールの利用規約を根拠に説明できるようにしておく。
- 納品形式の確認:尺・形式(MP4/MOV)・解像度・ファイルサイズの上限をクライアントに事前確認。
- ファイル共有:Google Drive等で共有フォルダを作り、ファイル名・バージョンを整理して渡す。
ツール使い分け表(Veo 3.1 / Kling 3.0 / Runway)
案件の要件によってメインツールを変えると原価と品質のバランスが最適化されます。
| 要件 | 推奨ツール | 理由 |
|---|---|---|
| 音声(環境音・ナレーション)込みで一発生成したい | Veo 3.1 | ネイティブ音声生成が唯一級。API $0.09〜$0.18/秒 |
| コスパ重視・映像を量産したい | Kling 3.0 | API約$0.03/秒〜。液体・布・照明の表現強い |
| カメラ移動・キャラ一貫性など細かい制御が必要 | Runway | モーションブラシ・カメラ制御がプロ向け |
| テロップ・ロゴ・BGM合成・最終仕上げ | Canva | UI直感的。無料〜Pro。SNS書き出し対応 |
| 台本・プロンプト生成・ヒアリング整理 | ChatGPT | 日本語→英語プロンプト変換に必須 |
予算と要件が決まれば、上の表でツールを選んで組み合わせましょう。Veo/Klingの詳しい比較はAI動画ツール比較(Sora終了後)へ。
相場と月額保守(目安・注意事項)
重要:以下はあくまで目安です。実際の単価はクライアントの規模・修正回数・納期・あなたの実績によって大きく変わります。断定できる数字はありません。
| サービス内容 | 単価目安 | 備考 |
|---|---|---|
| 15〜30秒SNS動画 1本制作 | 2万〜8万円(規模・クオリティによる) | 実績ゼロの初案件は低め設定→事例を作る |
| 月10〜20本の動画パッケージ | 月5万〜20万円(提供量・対応範囲による) | 継続契約。ツール原価を引いた利益率に注意 |
| 広告用動画(Meta広告・YouTube等) | 5万円〜(品質・修正対応による) | 広告成果責任を求められる場合あり→要確認 |
| 月額保守(軽微な修正・更新) | 月1万〜5万円(作業量による) | 継続収益の柱として設計する |
原価の把握が重要:Veo Standard(15秒×$0.18/秒≒$2.70)を月20本なら約$54(≒約8,000円)。Kling APIなら約$9(≒約1,400円)。原価を把握した上で利益率を設計してください。案件の取り方・価格交渉の具体的な方法は受注ガイドへ。
案件の取り方(受注ガイドへ)
ワークフローが整っても、案件がなければ動きません。案件獲得の経路と具体的な動き方は受注ガイド(LP/HP・AI動画共通)で詳しく扱っています。ここではポイントだけ:
- まず1本「試作」を作る:架空の陽だまり珈琲のような題材で自主制作し、ポートフォリオにする。「作れる証拠」がないと受注につながりにくい。
- 発信が入口:X(旧Twitter)やInstagramで制作物を見せると問い合わせが来やすい。
- 知人の店舗・事業者に初案件を打診:実績ゼロなら低単価〜無料で1本作って事例にする、というルートが現実的です。
- クラウドソーシングの活用:ランサーズ・クラウドワークス等でAI動画制作案件を検索。初期の受注経路として活用できます。
テンプレ一式(提案文・ヒアリングシート・契約書ひな形等)は実践パッケージに収録予定です。
つまずきと注意点
- 台本なしで生成を始める→ 後から方向性がブレて修正地獄に。必ずフェーズ1を先に完結させる。
- クライアントへの「AI使用の説明」を省く→ 後からトラブルになるリスク。納品前に必ず説明・同意を得る。
- 商用利用確認を後回しにする→ 納品直前に規約問題が発覚して詰む。ツール選定時に同時確認する習慣を。
- 修正回数を無制限にしてしまう→ 利益が吹き飛びます。事前に「修正○回まで・追加は別途」と明記した契約書またはメール合意を取る。
- ファイル管理がバラバラ→ バージョン違いの混乱で誤納品になります。scene番号+バージョン番号のファイル命名規則を最初に決める。
- 音声の品質差を説明していない:KlingはVeoより音声生成が弱い。音声込みの成果物を期待されているなら事前にVeoを使うか音声は別途処理することを伝える。
完成チェックリスト(納品前)
- ☐ 台本をクライアントに確認してもらい、GOを得ている
- ☐ 全シーンが台本の内容と一致している
- ☐ テロップの誤字・誤表記がない
- ☐ ロゴ・ブランドカラーがクライアント指定どおり
- ☐ BGM・音声の音量バランスが取れている
- ☐ 動画の尺・形式・解像度がクライアント要件を満たしている
- ☐ AI生成使用をクライアントに説明・合意済み
- ☐ 商用利用の規約確認済み(全使用ツールで)
- ☐ 修正回数・権利範囲を事前合意済み
- ☐ ファイル名・バージョンを整理してから共有
FAQ
動画編集ソフトが使えなくてもできる?
Canvaの動画機能はブラウザで完結し、操作が直感的なため動画編集未経験でも取り組めます。本格的なカット編集・色調補正が必要な案件はCapCut(無料)やDaVinci Resolve(無料枠あり)も候補ですが、短尺SNS動画ならCanvaで十分なケースが多いです。
1本目から有料案件を取っていい?
可能ですが、まず自主制作で1本通してからの方が安全です。工程を把握せずに受注すると、想定外の時間がかかり結果的に低時給になります。試作1本→SNSで公開→問い合わせ受付、の順が再現性が高いです。
ツールの月額コストはどう管理する?
Veo(Pro/Ultra)、Kling(有料プラン)、Canva Pro、ChatGPT Plus…と積み上がると月数万円になります。最初はKlingの無料クレジット+ChatGPT無料枠+Canva無料枠で1本作り、受注が見込めてから有料化する順序がリスク低いです。
複数クライアントを同時に持てる?
ワークフローが固まれば可能です。ポイントはファイル管理とクライアント別フォルダの徹底。混同が一番のリスク。2〜3件が慣れてきたら自動化(APIバッチ生成・テンプレ流用)でスケールできます。
情報はいつのもの?
2026年6月時点です。各ツールの料金・機能・規約は変わります。重要な判断は常に公式で最新情報を確認してください。
まとめ:次の一歩
AI動画の受注ワークフローは「ヒアリング→台本→生成→編集→納品」の4フェーズで完結します。最初は1本作り切ることに集中してください。ツールの選び方はVeo 3.1(音声・品質重視)・Kling 3.0(コスパ・量産重視)の各ガイドで、受注の取り方・単価交渉は受注ガイドへ。テンプレ一式(ヒアリングシート・提案文・プロンプト集)は実践パッケージとAI動画プランにまとめています。出典:Google DeepMind Veo公式、Kling公式、OpenAI Sora終了アナウンス。情報は2026年6月時点のものです。