Googleは2月19日、音楽生成モデル「Lyria 3」をGeminiアプリに統合し、ベータ版として公開した。
Lyria 3は、プロンプトのほか画像や動画ファイルのマルチモーダル入力から最長30秒の楽曲を生成できる音楽生成AIモデル。インストゥルメンタル、歌モノ問わずさまざまなジャンルを指定可能で、日本語プロンプトにも対応している。プロンプトの代わりに画像や動画を入力した場合は、色調や被写体、動画であれば動きの速さなどを解析し、BPMやテンポ、音の明るさ、音の密度などをマッピングする。また、イメージしている楽曲の雰囲気やテーマを言葉で伝えることで、歌詞も生成する。
生成した楽曲はMP3形式の音声ファイルもしくは生成AIによるカバーアート付きのMP4動画ファイルとして保存できるほか、共有リンクによる共有が行なえる。生成した音声には人間の可聴域外の電子透かし(SynthID)を埋め込んでおり、生成した音楽かどうかを後から判別可能。Geminiに音声をアップロードすることでSynthIDを確認して検証できる。
GeminiのLyria 3は18歳以上の全ユーザーを対象として、日本語/英語/ドイツ語/スペイン語/フランス語/ヒンディー語/韓国語/ポルトガル語で提供を始めている。今後は対応言語の拡大と品質の向上を進める予定としている。
解説
・Googleは音楽生成モデル「Lyria 3」をGeminiに統合し、プロンプトや画像・動画から最長30秒の楽曲を生成できるベータ版を公開しました。
・インスト・歌モノ問わず日本語プロンプトに対応し、画像や動画の視覚情報を解析して、その雰囲気に最適なテンポや音色で作曲することが可能です。
・生成された楽曲には電子透かし「SynthID」が埋め込まれており、GeminiにアップロードすることでAI生成物かどうかを後から検証できる仕組みも備えています。
<ネットでの反応>
公開BGM使って著作権料払わなくていいからな
何でもできるやん
人間いらない時代がくる
ワロタ
バカみたいな風刺合戦になりそうだな
プロンプト「aespaのAngel #48のような曲調でシスターフッドをテーマにした日本語のガールズポップ」
一昔前のエロゲの主題歌みたいになった
音楽の特徴を一旦文章にしてそこから構成しようとしてる感じなのかな?
声とか音のニュアンスをうまく指示できるならもうちょっと良いのができそう
作れるのは30秒だけなのが残念
SUNOとかUdioを執拗に妨害するから
エンジニア経由で技術が散逸して
結局は中国のオープンモデルや
大資本が台頭して普及しちゃうんだよ
優位性あるの?
>>82
出した時点のマーケットシェアは期待してないとおもうよ。
競合や、音楽の著作権者が何言ってくるかの確認目的でしょう。
ついこの前まで変な音源の変なメロディしか作れなかったけど、利益と勝機が見つかったら一気に行く。チームのパワーで先行してる天才を押しきる。
検索エンジンでもスマホでも生成AIでも見た流れ。
歌詞を大殺界で繰り返すよう指定したのにお洒落な歌詞にされたは
流行りの歌手の歌使うよりもその商品に合った歌詞で作れるっていうメリットがあるんじゃないか
レーベルとのコネとかもあるんだろうけどさ
アイススケート界隈がもう使い始めてる
権利問題が面倒すぎてAI曲OKになったらしい

へぇ、プロンプトひとつで歌詞もメロディも作っちまうのか
今の時代、AIが作曲してやる夫がブログに載せる……まさにシンギュラリティだなw

~ロボットと作る音楽~



コメント