議論を交わす研究チームのメンバー。(畫(huà)像提供は天津理工大學(xué)聾者工學(xué)院)
聴覚障害者がカメラの前で手話をすると、隣のディスプレイに「陽(yáng)光総在風(fēng)雨後」(明るい日差しが差し込むのはいつも風(fēng)雨の後)という7文字が直ちに「通訳」され表示された。より多くの聴覚障害者の意思を伝えるため、天津理工大學(xué)の研究開(kāi)発チームは5年近くの時(shí)間を費(fèi)やし、動(dòng)畫(huà)の言語(yǔ)バンクを構(gòu)築し、「複雑なシーンにおける中國(guó)手話同時(shí)通訳システム」を研究開(kāi)発し、人工知能(AI)技術(shù)により人々の利便性を高めた。人民日?qǐng)?bào)が伝えた。
張益彬氏は天津理工大學(xué)聾者工學(xué)院ネットワーク工學(xué)専攻2019年度學(xué)生であり、同大の鯨言創(chuàng)益バリアフリースマートテクノロジー研究開(kāi)発チームのメンバーでもある。この60人近くのチームの過(guò)半數(shù)が、張氏と同じ聴覚障害を持つ學(xué)生だ。彼らは5年近くの時(shí)間を費(fèi)やし、30萬(wàn)件點(diǎn)の動(dòng)畫(huà)の言語(yǔ)バンクを構(gòu)築した。今やチームが作った「複雑なシーンにおける中國(guó)手話同時(shí)通訳システム」が間もなく実用化されようとしている。
データによると、中國(guó)の聴覚障害者數(shù)は約2780萬(wàn)人。天津理工大學(xué)聾者工學(xué)院の袁甜甜副院長(zhǎng)は、「手話は今日も聴覚障害者の母語(yǔ)だ。音聲認(rèn)識(shí)ソフトウェアが近年普及しているが、表現(xiàn)の論理の出発點(diǎn)は終始、健常者だ。聴覚障害者にとって聞いて理解するのはもとより、最も強(qiáng)く願(yuàn)っているのは聞いてもらうことだ」と述べた。
手話は一種の視覚言語(yǔ)で、特定の文法と語(yǔ)順を持ち、手の動(dòng)き、表情、ジェスチャーを自由に組み合わせることができ、それによって異なる意味を表せる?!甘衷捳J(rèn)識(shí)」と「音聲認(rèn)識(shí)」に似た點(diǎn)があるとすれば、それは豊富な言語(yǔ)データベースが必要ということだ。今や音聲認(rèn)識(shí)の言語(yǔ)バンクは非常に成熟し、豊富になっている。袁氏は、「音聲の言語(yǔ)バンクは自然な狀態(tài)で非常に便利に得ることができるが、手話の言語(yǔ)バンクは非常に少ない」と述べた。
王建源氏は聾者工學(xué)院ネットワーク工學(xué)専攻2018年度學(xué)生であり、鯨言創(chuàng)益チームの創(chuàng)設(shè)メンバーでもある。王氏の擔(dān)當(dāng)は手話の言語(yǔ)バンクの構(gòu)築であるが、この言語(yǔ)バンクとは動(dòng)畫(huà)のことだ?!弗堀楗螗匹%ⅳ蚰激辍?dòng)畫(huà)を撮影してもらう。何度も何度も撮影する」。王氏とチームのメンバーは2年間で30萬(wàn)點(diǎn)以上の言語(yǔ)バンクを構(gòu)築した。王氏は、「試算と比較対照によると、中國(guó)の中國(guó)語(yǔ)能力試験の4級(jí)水準(zhǔn)まであとわずか100フレーズ余りとなっている」と説明した。
コンピュータに手話の言語(yǔ)バンクをフル活用させる。これは天津理工大學(xué)コンピュータ學(xué)院修士1年生の孫悅氏のチームにおける主な仕事內(nèi)容だ。孫氏は自身の仕事を「橋を架ける」と例える。「同じ一言であっても、手話の語(yǔ)順と中國(guó)語(yǔ)の語(yǔ)順には大きな差がありうる。これでは見(jiàn)ても分からない」。孫氏はメンバーと徐々に、手話認(rèn)識(shí)アルゴリズムフレームワークモデルを構(gòu)築した?!阜证辘浃工预à?、私たちはコンピュータのために手話の教材を作った」。この「教材」があれば、豊富な言語(yǔ)バンクを活用できる。これは手話を中國(guó)語(yǔ)に変換する法則を見(jiàn)つけたようなものだ。「橋」を架けてはじめて、データが順調(diào)に動(dòng)くようになる。今やこのモデルはすでに、「複雑なシーンにおける手話同時(shí)通訳」をほぼ実現(xiàn)できる。
「複雑なシーンにおける中國(guó)手話同時(shí)通訳システム」は2019年に、中國(guó)工業(yè)情報(bào)化部(省)次世代人工知能産業(yè)イノベーション重點(diǎn)任務(wù)公開(kāi)プロジェクトに入選するとともに、國(guó)から資金援助を獲得した。これはまた、チーム全體の前進(jìn)するペースを上げた。チームは昨年5月、天津市で開(kāi)かれた第5回世界知能會(huì)議の會(huì)場(chǎng)に研究成果を持ち込んだ?!弗伐攻匹啶袭?dāng)時(shí)すでに教育、法律、飲食、交通などの応用シーンをカバーしていた。十分に明るい環(huán)境であれば認(rèn)識(shí)率は95%にのぼった」。袁氏によると、このシステムは2022年北京冬季五輪のニュースの放送に用いられ、より多くの聴覚障害者がウィンタースポーツの魅力をゼロ距離で體験した。
情報(bào)を聞き訪問(wèn)に來(lái)る?yún)f(xié)力者が増えており、チームのメンバーはシステムの未來(lái)のさまざまな応用シーンを思い描いている。袁氏は、「システムは現(xiàn)在もアップグレード中だ。目標(biāo)は100萬(wàn)點(diǎn)の言語(yǔ)バンクで、社會(huì)生活の基本的なシーンをほぼ網(wǎng)羅することだ」と述べた。(編集YF)
「人民網(wǎng)日本語(yǔ)版」2022年7月18日