中國(guó)の國(guó)産基盤モデルにより、兵馬俑でもダンス?
兵馬俑、イーロン?マスク氏、そして各地のネットユーザーによる「科目三」ダンスやネット有名人によるダンスなどの動(dòng)畫がこのところ、中國(guó)のSNSで流行している。これらの10秒ほどの動(dòng)畫に生身の人間は出演せず、いずれも基盤モデルで生成されたものだ。多くのネットユーザーがこのハードルの低い「ダンス」を體験するようになり、ダンスを競(jìng)うブームが巻き起こった。中央テレビ網(wǎng)が伝えた。
これは阿里雲(yún)(アリクラウド)の「通義千問」アプリがリリースした無(wú)料の機(jī)能で、アプリ內(nèi)で「通義舞王」「全民舞王」などの言葉を入力すると體験ページに入ることができる。ユーザーが表示に従い畫像をアップロードすると、指定したダンスのような動(dòng)きで踴る動(dòng)畫が十?dāng)?shù)分で生成され、元の畫像の表情や體形、ファッション、そして背景などの特徴はそのまま動(dòng)畫に反映される?!竿x千問」は第1弾としてユーザーに「科目三」「モンゴルダンス」「パドルステップ」「メルボルンシャッフル」などの12種の人気ダンステンプレートを提供している。
この機(jī)能を支えるアルゴリズムは、阿里通義実験室が開発した動(dòng)畫生成モデル「Animate Anyone」だ。この研究は早くも昨年11月末の時(shí)點(diǎn)でX(舊ツイッター)やユーチューブなどの海外SNSで人気になり、関連する動(dòng)畫の再生數(shù)が1億回以上、開発者のためのコミュニティであるGithubのスター數(shù)はわずか數(shù)日で1萬(wàn)を超え、最近の基盤モデル分野で最も人気の基盤モデルアルゴリズムの一つとなった。海外の開発者とネットユーザーはこのアルゴリズムの効果を稱賛し、「體験の入口を開放してほしい」と呼び掛けた。
公開された論文によると、Animate Anyoneは複數(shù)のイノベーション技術(shù)を集積し、ReferenceNetを?qū)毪贰⒃萎嬒瘠吻閳?bào)を捕捉?保存し、人物、表情、ファッションの細(xì)部を高度に再現(xiàn)できる。また同アルゴリズムは高効率の姿勢(shì)ガイド「Pose Guider」を利用し、動(dòng)きの精度と制御性を保証。さらに順序生成モジュールにより、動(dòng)畫のフレーム間の滑らかさを効果的に保証した。同じデータセットを使ったテストでは、Animate Anyoneの性能は中國(guó)內(nèi)外の同類モデルを大きく上回った。(編集YF)
「人民網(wǎng)日本語(yǔ)版」2024年1月11日
注目フォトニュース
掲載された記事、寫真の無(wú)斷転載を禁じます。
Tel:日本(03)3449-8257 Mail:japan@people.cn