「我々は技術(shù)で音の障害を乗り越える」。中央テレビニュースは24日、百度スマートクラウドと共同で中央広播電視総臺(tái)初のAI(人工知能)手話アナウンサーを正式にお披露目した。同アナウンサーは生身の人間のような肌、髪の毛、目を持ち、親しみやすく自然な印象だ。同アナウンサーは、「私は北京冬季五輪から、年中無(wú)休でAIによって聴覚障がい者に手話サービスを提供し、競(jìng)技の情報(bào)をスピーディにお屆けします」と述べた??萍既?qǐng)?bào)が伝えた。
ニュースAI手話アナウンサーは百度スマートクラウドの「デジタルスター運(yùn)営プラットフォーム」から技術(shù)的サポートとサービスを受ける。同プラットフォームはデジタルヒューマンとコンテンツの生成を一體化させたプラットフォーム級(jí)製品で、テレビ?ラジオ、雙方向エンターテインメント、ブランドなどの利用者にワンストップ型のバーチャル司會(huì)者、バーチャルアイドル、ブランドイメージキャラクターの生成?運(yùn)営サービスを提供し、デジタルバーチャルヒューマンの導(dǎo)入ハードルを下げることができる。
同プラットフォームは現(xiàn)在、2D?3Dの高精度で複數(shù)種類のデジタルヒューマンのスタイルの生成をサポートしており、フルスタックのAI能力により2Dデジタルヒューマンの「一文生成」を?qū)g現(xiàn)するだけでなく、任意の単一2Dフェイスにより高精度3Dフェイスを再構(gòu)築し、バーチャルヒューマンのフェイス3D模型の編集を行うことにより、任意の2Dフェイスを低コストで3Dバーチャルヒューマンに置き換え、2Dデジタルヒューマンスタイルの豊富さに欠けるという弱點(diǎn)?難點(diǎn)を解消するうえ、AI駆動(dòng)の高精度3Dデジタルヒューマンの生成期間を3ヶ月から1週間に短縮する。
コンテンツ生成の面については、生身の人間による駆動(dòng)、AIによる駆動(dòng)、融合駆動(dòng)など複數(shù)のライブ配信方式をサポートする。生身の人間がいるシーンで多様化したコンテンツを含む動(dòng)畫(huà)をスピーディに生成する。顔の4Dデータ(3D+時(shí)系列)に基づく高精度デジタルヒューマンの「文字から形狀へのモードを跨ぐ表情生成技術(shù)」により、口の動(dòng)きの合成の精度は98.5%になっている。
中央テレビニュースAI手話アナウンサーが身につける語(yǔ)彙は「國(guó)家通用手話辭典」の基準(zhǔn)に基づくもので、長(zhǎng)時(shí)間のスマート學(xué)習(xí)により視聴者に専門(mén)的で正確な手話解説を提供できる。(編集YF)
「人民網(wǎng)日本語(yǔ)版」2021年11月25日