ビットニュース Googleは、テキストをビデオに変換するために特別に設計されたビデオ生成モデルであるLumiereをリリースしました。 Lumiere は、空間的および重要な時間的次元でのアップサンプリングとダウンサンプリングを行い、事前トレーニング済みのテキストから画像への拡散モデルを活用することで、モデルがフルフレームレートの低解像度ビデオを直接生成し、複数の時空間スケールで処理することを可能にします。 レポートによると、モデルのデモビデオは非常に高品質であり、可動域と一貫性も非常に良好です。
3.9K 人気度
17.5K 人気度
59.9K 人気度
8.6K 人気度
21.9K 人気度
Googleは、振幅と一貫性で優れたパフォーマンスを発揮するビデオ生成モデルであるLumiereをリリースします
ビットニュース Googleは、テキストをビデオに変換するために特別に設計されたビデオ生成モデルであるLumiereをリリースしました。 Lumiere は、空間的および重要な時間的次元でのアップサンプリングとダウンサンプリングを行い、事前トレーニング済みのテキストから画像への拡散モデルを活用することで、モデルがフルフレームレートの低解像度ビデオを直接生成し、複数の時空間スケールで処理することを可能にします。 レポートによると、モデルのデモビデオは非常に高品質であり、可動域と一貫性も非常に良好です。