イラストや写真などをアップロードしてテキスト入力するだけで、しゃべる動画を生成してくれるサービス「Creative Reality Studio」をご紹介します。
動画を撮影しなくても、静止画1枚とテキストさえあれば動画を生成できるのはお手軽。
正直なところ、日本語だとまだ少し違和感はあるので仕上がりのクオリティーはさほどでもなかったんですけど、進化の早いAI界隈なのですぐに解消されるのではないでしょうか。
Creative Reality Studioの概要
Creative Reality Studioは、イスラエルのD-ID社が2022年にリリースしたサービスです。
喋らせる人の写真やイラストはアップロードすることができますし、Creative Reality Studioの中に既に美男美女のアバターも揃っていますので、喋らせる内容だけあればすぐに始めることができます。

またStable Diffusionの要領で指示文を入力するだけでアバターを作成し、そのアバターにしゃべらせることもできるようです。わざわざCreative Reality Studio内で作る必要はなさそうですが、アバターの作成から動画の完成までを一つのツールでできるのはツールを行ったり来たりしなくて済むのでいいですね。
Creative Reality Studioの使い方
こちらの女性は私がStable Diffusionという画像生成AIで作ったお姉さんです。

はい、こちらが喋っているところ。
ご覧いただくと分かりますが、日本語の発音がさすがに機械音声ライクだったり、外国語話者っぽい顔の動きで若干口の開き方が派手だったりしますが、まぁ思ってたよりも全然いいです。
元々は口を閉じた静止画から、しゃべっていると歯が見えたりと、口を開いているところがしっかり自動で生成されているのが面白いですね。
動画作成の手順は、まず左側のCreate Videoをクリックしてから、

下部のChoose a presenter内のADDボタンをクリックして写真やイラストを選択します。

右下のプルダウンで、言語・声・しゃべり方を選択します。

あとはしゃべらせたいテキストを入力して右上のGenerate Videoボタンをクリック。

無料だと20クレジット分の動画を生成できるんですが、クレジットは生成される動画の尺(テキストの量)によって左右されるので、テストする際は少なめのテキストでテストしてみてください。
写真をアップする際の注意事項としては、顔が正面を向いているものをチョイスしてください。この例は少し顔が横に傾いているので、口の開き方がより不自然になっています。
音声ファイルをアップロードすることもできます。音声に合わせて口が動いてくれるので、しゃべりはオリジナルでいける方は活用できます。

商用利用可はProプランから
気になるお値段はこちらの5段階。
商用利用可能なのはプロプラン以上なので、YouTubeなどで使おうと思ったら月額49.99ドルから。まずまずの値段です。
月間15分までしか作れないため、個人的には以下のような使い方でフックのように使うのがいいかなと思いました。
- 動画と動画のツナギに使うモーションロゴ的な使い方
- 動画の冒頭部分でエロめなお姉さんがフック的に喋る
最後に
静止画が喋る系は、Live2DやAdobeのCharacter Animitor、VTuberさんが使っているようなソフトだとリアルタイムでのリップシンク(口パクのこと)やまばたき、表情追加などの演出もあって、現時点では用途としては優れている感じがしますが、Creative Reality Studioは自分がしゃべらなくても機械音声が勝手に喋ってくれるのがポイントです。
あとは、外国語の方が口の動かし方が最適化されてる感じなので、外国、英語圏に向けたコンテンツを作りたければ、ChatGPTと併用してシナリオ書いちゃえばコンテンツ即出しできますね。
こんなツールも活かして動画制作やSNSの投稿に活かして稼いでみてはどうでしょう。

コメント