画像・動画の生成ツールをまとめました。
自分の仕事に合うツールを選んでください!
表の下には表をPDFにしたものもあります。
| ツール名 | 概要・優位性 | 主なメリット | 主なデメリット | 料金体系 | おすすめ度 | 向いている人 |
| Krea.ai | 画像・動画・デザインをリアルタイムで生成・編集できるAIスタジオ。プロンプト変更をリアルタイム反映でき、直感的なクリエイティブ作業に最適。 | ●画像・動画をリアルタイム生成 ●編集・強化・構図調整を同一画面で可能 ●多数のスタイル・モデルを統合 ●WebUIが軽量で快適 ●デザイン制作・広告素材制作が超高速化 | ●英語プロンプトの方が精度が高い ●無料枠の出力制限あり ●高品質モデルは時間がかかる ●商用利用は有料プラン必須 ●UIが英語中心 | 無料プランあり Pro:約US$15=約2,250円/月 チームプラン:US$30=約4,500円/月 | ⭐⭐⭐⭐☆ | デザイナー SNS運用者 広告制作担当 |
| Jasper.ai | マーケティング・コピー・SNS文章生成に特化したライティングAI。ブランドトーンを学習し、チームで一貫した出力が可能。 | ●広告・LP・SNS投稿を一括生成 ●ブランドボイス機能で統一感ある文章 ●多言語対応で海外展開も◎ ●構成テンプレが豊富 ●GoogleDocs風エディタで編集しやすい | ●日本語の自然さは英語に劣る ●無料プランなし ●価格がやや高め ●短文生成にはオーバースペック ●ChatGPTより柔軟性が低い | Creator:US$39=約5,850円/月 Pro:US$59=約8,850円/月 年契約割引あり | ⭐⭐⭐⭐☆ | マーケター コピーライター 企業広報 |
| Tenak.ai | 日本語対応のマルチメディアAI。文章・画像・音声・動画をワンストップで生成可能。 | ●複数メディア形式を一括生成 ●ブログ記事→動画変換なども可能 ●UIがシンプルで初心者でも扱いやすい ●AI音声・映像連携がスムーズ ●日本語入力に最適化されている | ●情報が少なく信頼性が未知数 ●出力品質が安定しない ●無料版の制限が厳しい ●商用条件が未整備 ●海外での認知度が低い | 無料プランあり 有料プラン価格非公開(想定:月2,000〜5,000円) | ⭐⭐⭐☆☆ | クリエイター AIを試したい個人ユーザー |
| PolloAI | テキストや画像から高品質ショート動画を生成。SNS向け映像制作を効率化。 | ●テキスト→動画生成が高速 ●多彩なモデル(Veo,Kling系統)選択可 ●SNSサイズ対応(9:16,16:9) ●モーション・音声対応 ●商用利用も可能 | ●無料枠が少ない ●長尺動画には不向き ●クレジット制で消費が早い ●出力品質がモデル依存 ●UIが英語中心 | 無料 有料:US$20=約3,000円/月 企業向けカスタムプランあり | ⭐⭐⭐⭐☆ | SNSマーケター 広告動画制作者 |
| TopazVideoAI | 動画の高画質化・ノイズ除去・スロー化に特化。既存映像のリマスターAIとして業界トップ。 | ●旧映像を高品質に復元 ●手ブレ・ノイズ・ボケを自動補正 ●AIアップスケール(HD→4K,8K) ●色・コントラストの最適化 ●プロ品質のリマスター実現 | ●高スペックPCが必須 ●処理に時間がかかる ●高価格 ●モデル選択に知識が必要 ●クラウド非対応(ローカル処理のみ) | 買切:約US$299=約45,000円 (1年更新)/年更新:US$99=約15,000円 | ⭐⭐⭐⭐⭐ | 映像編集者 映画制作者 動画アーカイブ担当 |
| FeloAI | 多言語検索&自動要約AI。ChatGPT+Web検索の融合。 | ●日本語→英語資料検索が得意 ●出典付き要約で信頼性◎ ●資料や論文を一瞬で要約 ●プレゼン資料生成も可能 ●マインドマップ表示あり | ●新興で精度が不安定 ●UIが簡素 ●PDF解析が重い ●出典URLが途切れる場合あり ●ChatGPTより柔軟性に欠ける | 無料プランあり Pro:US$15=約2,250円/月 | ⭐⭐⭐⭐☆ | 研究者 学生 ビジネスリサーチャー |
| LeonardoAI | 高品質画像生成AI。多様なスタイルとImage-to-Image編集が強み。 | ●フォトリアル・アニメ・イラスト対応 ●参照画像による再現性が高い ●無料枠でも高品質 ●自分のスタイルモデルを保存可 ●商用ライセンス対応 | ●日本語プロンプトは不安定 ●生成に時間がかかる ●一部モデルは有料限定 ●Web接続必須 ●無料ユーザーの待機が長い | 無料 Pro:US$24=約3,600円/月 商用OK | ⭐⭐⭐⭐☆ | デザイナー アーティスト イラスト制作者 |
| MeshyAI | テキスト・画像から3Dモデルを生成。PBRテクスチャ付き出力可。 | ●テキストから立体モデルを生成 ●FBX,OBJ,GLBなど多形式出力 ●ゲーム開発に即利用可 ●STL形式で3Dプリントも可 ●無料で試せる | ●細部修正は人の手が必要 ●高ポリゴンだと処理が重い ●無料枠の制限が厳しい ●英語UIのみ ●高精度モデルは有料限定 | 無料 Pro:US$16=約2,400円/月 Studio:US$48=約7,200円 | ⭐⭐⭐⭐☆ | ゲーム開発者 3Dデザイナー 建築CG制作者 |
| Fal.ai | APIで画像・音声・動画を生成できる開発者向けAI基盤。 | ●AI機能を自社サービスに統合可能 ●高速推論・高スケーラビリティ ●Python/JS対応SDKあり ●商用ライセンス付き ●多メディア対応 | ●開発知識が必須 ●UIツールがない ●英語ドキュメントのみ ●トライアル制限あり ●コスト試算が複雑 | 従量課金制:API利用1回あたり¥0.5〜¥10程度 | ⭐⭐⭐⭐☆ | エンジニア 企業開発担当 スタートアップ |
| Flow(Google) | GoogleVeo/Imagen/Geminiを統合した映像生成AI。映画的表現に対応。 | ●ストーリー性のある動画生成 ●ライティング・カメラ制御もAI化 ●セリフ・BGM付き映像を自動生成 ●Googleモデルで安定性高い ●クリエイター支援重視設計 | ●β版でアクセス制限あり ●実験機能多く安定性に欠ける ●商用条件未確定 ●長尺映像には非対応 ●処理が重い | 現在無料(正式リリース予定) | ⭐⭐⭐⭐⭐ | 映像作家 企画・広告制作者 映像研究者 |
| D-ID | 静止画を「話すアバター」に変えるAI。自分の写真から自然な口パク・表情でプレゼン動画を自動生成。 | ●自分の顔で動画を作れる ●多言語TTS(120言語対応) ●撮影不要でプレゼン動画作成 ●表情・口の動きが自然 ●教育・営業・採用動画にも活用 | ●無料プランは15〜30秒制限 ●無料版に透かし入り ●声の自然さは設定次第 ●長尺動画には不向き ●商用ライセンス要確認 | 無料 Pro:US$49=約7,350円/月 Enterprise応相談 | ⭐⭐⭐⭐⭐ | 教育者 営業担当 SNS動画制作者 |
| DiffusersOutpaint | StableDiffusionを利用した画像“拡張”AI。画像の外側を自然に描き足して構図を広げる。 | ●画像の外側を高精度に描写 ●背景を自然に補完可能 ●写真や構図を拡張できる ●無料で試せる(OSS) ●HuggingFace上でも利用可能 | ●専門的知識が必要 ●人物・手の精度が低い場合あり ●設定に時間がかかる ●商用利用はモデル依存 ●UIが英語中心 | 無料(HuggingFace上で実行可) 自前環境構築費約0〜5,000円 | ⭐⭐⭐⭐☆ | 写真家 デザイナー 構図編集を行う制作者 |
| NoLang | 日本発のAI動画生成ツール。テキストやURLを入れるだけで、ナレーション付き動画を自動生成。 | ●日本語特化で操作簡単 ●テキスト→動画変換が数分で完了 ●Web記事や資料も動画化可能 ●SNSや教育用途に最適 ●自動BGM・字幕付き | ●編集自由度が低い ●同じテンプレートが多い ●長尺対応なし ●高画質は有料限定 ●生成スピードがネット依存 | 無料 Pro:月¥2,200〜¥4,800(年契約割引あり) | ⭐⭐⭐⭐☆ | SNS担当 講師 情報発信者 |
| SeaArtAI | 画像・動画・音声・チャットを一体で扱えるAIコミュニティ。初心者でも多機能生成を体験可能。 | ●オールインワンの生成環境 ●コミュニティ投稿で作品共有可 ●モデル・スタイル豊富 ●スマホアプリ対応 ●無料で画像生成体験可 | ●UIが煩雑 ●サブスク解約がわかりにくい ●クレジット消費が早い ●高解像度は有料限定 ●日本語サポートが弱い | 無料 有料:月US$9.9=約1,480円〜 | ⭐⭐⭐☆☆ | 初心者クリエイター AI体験をしたい個人 |
| KLINGAI | 中国Kuaishou社の最新AI動画生成。実写品質・リアルな動きで注目。 | ●実写レベルの動画生成 ●光・影・動きが自然 ●人物の一貫性が高い ●カメラワークが滑らか ●映画クオリティの表現力 | ●現状は中国国内中心 ●公開版アクセス制限あり ●UIが中国語中心 ●処理に時間がかかる ●英語資料が少ない | 無料β 正式版はAPI課金予定(数円/秒単位) | ⭐⭐⭐⭐⭐ | プロ映像制作者 映像研究者 |
| RunwayML | 映像生成・編集を統合したプロ向けAIスタジオ。背景除去・テキスト→動画生成も可能。 | ●映像生成+編集が1つで完結 ●自動マスク・人物切抜き精度高い ●テキストから映像を直接生成 ●モーショングラフィックス対応 ●プロ向けVFX制作も可能 | ●高度機能は有料のみ ●レンダリングに時間がかかる ●無料枠が少ない ●日本語UI非対応 ●チーム共有がやや複雑 | Freeあり Standard:US$15=約2,250円/月 Pro:US$35=約5,250円/月 | ⭐⭐⭐⭐⭐ | 映像編集者 広告制作者 VFXアーティスト |
| Heygen | 顔写真からリアルな「話すアバター動画」を生成。自然な口元と音声が特徴。 | ●自分の写真でリアルな動画生成 ●声と口の同期が自然 ●多言語対応(40言語以上) ●顔や衣装の変更が自由 ●SNS・教育・営業に最適 | ●無料版に透かしあり ●長尺動画は不可 ●音声精度は言語差あり ●日本語ナレーションに若干の不自然さ ●商用はPro契約必要 | Freeあり Pro:US$48=約7,200円/月 企業プランあり | ⭐⭐⭐⭐⭐ | 教育者 プレゼン担当 マーケター |
| Midjourney | 芸術性・構図美が際立つ画像生成AI。Discord上で操作。 | ●圧倒的な画質と構図美 ●アート・広告に最適 ●自然で芸術的な色彩表現 ●スタイル統一性が高い ●世界的クリエイターが利用 | ●Discord操作が必要 ●プロンプトが英語中心 ●精密な修正は不可 ●商用条件がやや複雑 ●無料枠なし | Basic:US$10=約1,500円/月 Pro:US$30=約4,500円/月 Mega:US$60=約9,000円/月 | ⭐⭐⭐⭐⭐ | アーティスト 広告デザイナー イラスト制作者 |
| Veo3 (GoogleDeepMind) | Google最新の映像生成AIモデル。映画レベルのリアル映像を自動生成。 | ●自然なカメラワーク ●光・質感・動きが超リアル ●ストーリー構成まで自動生成 ●Google研究陣による高精度モデル ●プロ映像品質 | ●一般公開前(招待制) ●商用利用不可(現時点) ●計算リソース大 ●日本語情報が少ない ●出力時間が長い | 非公開(企業向けライセンス交渉中) | ⭐⭐⭐⭐⭐ | 映像監督 制作会社 研究機関 |
| NanoBanana | Googleが社内で開発した生成AIツール群の一部。動画・画像・3D・音声などを統合的に扱う次世代実験プラットフォーム。クリエイティブ制作とAI研究の中間に位置する。 | ●画像・音声・映像を同時生成可能 ●GoogleDeepMind技術をベースに超高速処理 ●Geminiとの連携でマルチモーダル解析可能 ●モーション・構図・照明までAI制御 ●プロトタイプ用途でも高精度 | ●一般公開が限定的(研究段階) ●商用利用不可 ●日本語情報がほぼない ●操作が英語UIのみ ●生成時間がやや長い | 現時点:無料βテスト 商用ライセンス非公開(推定年契約50万円〜) | ⭐⭐⭐⭐☆ | 映像・AI研究者 R&D部門 AI映像スタートアップ |
| Whisk | OpenAI傘下のレシピ特化AIプラットフォーム。食材・好み・時間を入力すると自動で料理レシピや動画形式のクッキングガイドを生成。 | ●テキストや画像からレシピ生成 ●冷蔵庫の食材を撮影して献立提案 ●カロリー・栄養自動計算 ●家族・SNS共有機能付き ●GeminiやChatGPTとも連携可能 | ●食材データベースが国によって偏る ●日本語レシピは翻訳精度に依存 ●オーブン設定など細かい調整は不可 ●スマホアプリ中心でPC操作が不便 ●プラン管理がやや複雑 | 無料 Pro:US$10=約1,500円/月 チーム向けプラン有 | ⭐⭐⭐⭐☆ | 主婦層 料理研究家 レシピ系YouTuber 飲食マーケ担当 |
| Sora(OpenAI) | OpenAI開発の次世代「テキスト→動画」生成AI。実写品質・物理的動作の自然さが世界トップクラス。 | ●テキストだけで高精細動画生成 ●被写体の一貫性・カメラワークがリアル ●“現実的な物理挙動”を再現 ●長尺映像にも対応予定 ●ChatGPTと連携可能 | ●一般公開前(企業・研究限定) ●処理コストが非常に高い ●API未提供 ●著作権・倫理面の議論あり ●長文プロンプト設計が難しい | 一般公開前(API予定価格:US$0.05/秒=約7円/秒) | ⭐⭐⭐⭐⭐ | 映像クリエイター 研究者 広告制作会社 |
| ChatGPT (画像生成特化) | OpenAIのGPT-4(特にGPT-4o)に統合されたDALL·E3機能により、テキストから高品質画像を生成。構図・文字要素の理解力が高い。 | ●DALL·E3統合で高精度画像生成 ●プロンプト+修正指示が自然言語で可能 ●画像編集(Inpainting)対応 ●文字やロゴ入り画像も正確 ●Midjourneyより“説明性”に強い | ●芸術性はMidjourneyに劣る ●商用条件はOpenAI利用規約準拠 ●高解像度出力は制限あり ●細かい構図調整は不得手 ●生成履歴が保存しづらい | ChatGPTPlus:US$20=約3,000円/月 API課金:1画像あたり約¥1〜¥10 | ⭐⭐⭐⭐☆ | 広告制作者 デザイナー 一般ユーザー(非技術者) |
| Flow(Google) | Googleが提供するAI映像生成スタジオ。Veo・Imagen・Geminiなど複数AIを統合し、映画レベルのショート映像を生成。 | ●テキスト→動画をワンストップで生成 ●ストーリーボード設計が不要 ●光・被写界深度など撮影演出を自動制御 ●シーンの連続性を維持 ●Googleクラウド連携で共有が容易 | ●β版で公開制限あり ●処理時間が長め ●編集機能は限定的 ●商用ライセンス未確定 ●一部モデルは英語プロンプト限定 | 現在無料(正式版では月額US$30〜想定=約4,500円) | ⭐⭐⭐⭐⭐ | クリエイター 広告代理店 映像企画・監督志望者 |
PDF版のダウンロードはこちら

