中國の検索大手?百度が開発したスマート翻訳機が今月21日に日本に上陸した。名古屋の観光スポットから最も便利な交通ルートまで、翻訳機は流暢かつ正確な中國語と日本語の雙方向翻訳で人々を驚嘆させた。人工知能(AI)翻訳サービスはハードとソフトウェアを通じて様々な対話シーンを繋ぎ、言葉が通じないという問題を解決しようとしている。なかにはAI翻訳は翻訳者を「抹殺する者」になりうると考える人すらいるほどだが、現(xiàn)実はどうなのだろうか?
▽現(xiàn)狀:翻訳機は多いが、精度の向上が望まれるレベル
2017年はAIが大躍進した1年と言えるだろう??茖W技術のトレンドとして、グーグルやアップルだけでなく、百度やアリババも人工知能の製品を相次いで発表し、スマート業(yè)界に勢いよく進出している。なかでも「AI翻訳」はインターネットの大手企業(yè)のほとんどが進出したいと考えている分野となっている。
海外では、マイクロソフトが9種類の言語をリアルタイムで文字テキストに翻訳する「Microsoft Translator」という翻訳アプリを発表した。中國國內(nèi)では、百度翻訳が全世界の28種類の言語の雙方向翻訳と756分野に対応している。テンセントのリアルタイム音聲通訳アプリ「翻訳君」は、AIカーネルをドライバとして、音聲認識やNMT(ニューラルネットワーク)などの技術を用いて、「同時通訳」機能を?qū)g現(xiàn)している。
AI翻訳が急速な進展を見せているが、オーソドックスな翻訳業(yè)界からは認められているとはいいがたい。伝神語聯(lián)網(wǎng)絡科技股フン有限公司(フンはにんべんに分)の何恩培董事長は、「翻訳機にしても、アプリにしても、中國語を英語または他の言語に翻訳する場合の精度はまあまあだが、外國人が話す英語やその他言語を中國語に翻訳した場合の精度は低く、実際のコミュニケーションにはほとんど役に立たない」としている。
▽難點:データ不足で言語の仕組みは不文律
世界において國際會議や発表會などに用いられる30種類以上の翻訳機は、一部のシーンにおける言葉の交流問題を解決しており、その現(xiàn)狀として翻訳機はすでに非常に大きな進歩を遂げたものの、一方で、高いレベルの翻訳が目指すところの「信頼性と老練さ、品の良さ」といった點ではまだまだ大きな隔たりが存在している。
囲碁界を制覇している人工知能?AlphaGoはなぜ翻訳分野においてはその完璧な力を発揮できていないのかという點について、何氏は、「人工知能の分野において、翻訳機が最も難しい課題の一つだというのは周知の事実。囲碁と異なり、言語にはその背後には多元的な文化や複雑な社會的屬性が含まれているので、その仕組みを規(guī)則化するのは不可能なことだ」と話す。
また、AI翻訳が「信頼性と老練さ、品の良さ」という高い要求を満たそうとした場合、話し言葉における二つの難題を克服しなければならない。一つは発言者の発音や切れ目を正しく判斷し、しかもごく短時間のうちに「発音の區(qū)切り」を判斷しなければならない。もう一つは話し言葉特有の文法の亂れや文脈の一貫性の無さ、センテンスの切れ目がはっきりしていないといった問題を解決しなければならない。
翻訳機がどのようにしてこのような問題を解決するのかという點について、清華大學計算機學部の劉洋副研究員は、「AI翻訳機の難點はいかに機械に人間と同じようにスマートな行動をさせるかという點だ」としている。彼は翻訳機はデータをドライバとしているので、その精度はデータによって決まるとしている。現(xiàn)在、翻訳データの多くは政府機関の書類であり、スポーツやエンターテイメントなどの分野に関するデータがほとんどない。それに加えて、各國の話し言葉にはくだけた表現(xiàn)やネット用語も多用されるので、AI翻訳は膨大な基礎語彙のデータベースのサポートを必要とする。
▽展望:データでAI翻訳の進展を推進
近年、ニューラルネットワーク(Neural Machine Translation, NMT)の技術によって、翻訳の応用がさらなる進歩を遂げた。NMTは脳の思考モデルを模倣しており、翻訳者と肩を並べるほどの高水準の翻訳文を作成できるようになっているのと同時に、その誤差を55%~85%にまで下げている。
また、言語処理や対話型言語などの技術の進歩は翻訳製品のバージョンアップを加速させ、コンピューター支援翻訳(CAT,Computer Aided Translation)から人工知能インタラクティブ翻訳への転換を促している。
清華大學計算機學部の教授は、「世界には數(shù)千種類の言語がある。大部分の言語同士の間の言語資料が不足している。そのため、言語モジュールの構築など言語資料の翻訳をする必要がある」としている。
AI翻訳は複合學科であり、數(shù)學や言語學、コンピューター科學、神経認識科學など多方面の進展にかかっている。そのため、AI翻訳はより多くの分野と一緒になって、データによる翻訳機の発展を促すべきだ。また、コンピューターに婉曲な言い回しや不規(guī)則な話し方を理解させるには、まだかなり長い時間を必要とするだろうとみられている。(編集HQ)
「人民網(wǎng)日本語版」2017年9月27日
このウェブサイトの著作権は人民日報社にあります。
掲載された記事、寫真の無斷転載を禁じます。
Tel:日本(03)3449-8257
Mail:japan@people.cn