AI音声読み上げジェネレーター

DomoAI Text to Speech は、書いたセリフをナレーション、会話、アバター用音声に変換できます。声を選び、自分の声をクローンし、クローン音声の速度を調整し、感情を加え、シーン、レッスン、広告、SNS 動画向けの二人会話スクリプトも作成できます。

単一話者

手早いSNS投稿、プロフィール画像、下書き、軽い確認に適しています。

複数話者

ヒーロービジュアル、サムネイル、商品シーン、ポートフォリオ画像、元フレームに適しています。

音声クローン

精細なアニメアート、ポスター、大きめの切り抜き、高品質なキャンペーン画像、クライアント向けプレビューに適しています。

AI音声読み上げジェネレーター

DomoAI Text To Speech で作れるもの

DomoAI Text To Speech で作れるもの

SNS動画ナレーション

フック、キャプション、商品メモを Shorts、Reels、TikTok、YouTube、アニメ編集向けの音声に変換します。

会話シーン

Speaker A と Speaker B を使って、コメディ、教材シーン、フィクション、ポッドキャスト風の例を作れます。

Talking Avatar クリップ

ポートレート、マスコット、先生、キャラクターに声を付けます。短い台詞で、アバターに明確なメッセージを話させられます。

多言語ボイスオーバー

チュートリアル、広告、オンボーディング動画、地域向けSNS投稿用に、複数言語の音声下書きを作成します。

ブランドとクリエイターの声

定番イントロ、更新、レッスン、キャラクターコンテンツ向けに声をクローンします。同じ台詞に別のテンポが必要な場合は速度を調整できます。

600以上の言語でボイスオーバーを作成

各バージョンを一から録音しなくても、同じアイデアをより多くの市場に届けられます。 DomoAI Text to Speech は英語、日本語、中国語、韓国語を含む 600 以上の言語に対応しています。最終編集前に、ローカライズしたチュートリアル、広告、製品アップデート、キャラクター台詞、研修クリップの下書きに使えます。

600以上の言語でボイスオーバーを作成

台詞に感情を追加

セリフにより明確なムードが必要なときは、cheerful、sad、whispering、angry、excited、confused、playful などの感情タグを追加できます。より具体的なニュアンスには短い指示文も書けます。 ヒント:会話を一から書きたくない場合は、ChatGPT、Claude、Gemini などの LLM ツールでいくつか案を作ってください。短い Speaker A / Speaker B のやり取りを依頼し、最適なものを DomoAI に貼り付けます。 プロンプト案: [scenario] 向けに短い text-to-speech 会話スクリプトを 5 つ書いてください。Speaker A と Speaker B を使い、[cheerful]、[deadpan]、[whispering] のような簡単な感情タグを括弧で追加してください。各行は動画ナレーションに使える短さにしてください。

[cheerful][whispering][pause, betrayed][playful and teasing]
台詞に感情を追加

声をクローンして速度を調整

同じ話者を複数のクリップに登場させたい場合は、自分の声を追加できます。 クリアでノイズの少ないサンプルを録音またはアップロードし、声に名前を付けて、今後のスクリプトで再利用します。ブランドホスト、クリエイターの人格、キャラクターボイス、講座ナレーター、Talking Avatar に適しています。 Speed Control により、クローン音声の表現幅が広がります。丁寧な説明では遅く、自然な話し方では 1.0x 付近に、短い広告やSNSクリップで詰めたいときは速くできます。速度範囲は 0.5x から 2.0x です。 最良の結果には、10秒以上のクリーンな音声から始めてください。

声をクローンして速度を調整

Text To Speech を Talking Avatar と連携

Text to Speech は、ポートレートに話させたいときに特に便利です。短いスクリプトを書き、声を選択またはクローンし、その声を DomoAI Talking Avatar 内で使ってリップシンクの会話動画を作成できます。 Talking Avatar のワークフローは、正面を向いた単一の被写体に最適です。スクリプトと声のカスタマイズ、動作プロンプト、感情タグ、6種類の声色、音声クローン、多言語対応、最大80MBの音声ファイル(MP3、WAV、M4A)アップロードに対応しています。

Text To Speech を Talking Avatar と連携

シンプルな脚本から動画へのワークフロー

短い行でスクリプトを書きます。
ナレーションには Single、会話には Multi を選びます。
ホスト、キャラクター、先生、創業者、マスコット、ナレーターなど役割に合う声を選びます。
複数のクリップで話者を一貫させたいときは声をクローンします。
説明を遅く、自然に、またはテンポよくしたい場合はクローン音声の速度を調整します。
表現が重要な箇所だけに感情タグを追加します。
音声を生成して一度確認します。
音声を動画、Talking Avatar、リップシンク、編集タイムラインで使います。
必要に応じて字幕、音楽、効果音、最終的なテンポを編集ツールで追加します。
シンプルな脚本から動画へのワークフロー

よくある質問

生成、スタイル化、アップスケールを一か所で

テキスト、画像、動画素材から魅力的な動画を作成。生成、スタイル化、アップスケールをすべて同じプラットフォームで行えます。
最初の動画を作成