スマート音聲認識技術(shù)、言外の意味まで察することが可能に

人民網(wǎng)日本語版　2016年12月05日14:45

人工知能がその威力を大いに発揮している昨今だが、現(xiàn)在の音聲認識技術(shù)では、デバイスはまだ十分に自然言語を理解するにはいたらず、いわゆる「言外の意味」を聞き取り、理解することは、SF作品の中においてのみ存在する出來事。しかしこの狀況には現(xiàn)在、変化が生じている。新華社が伝えた。

中國最新のスマート音聲技術(shù)の成果によると、デバイスはすでに高い正解率により音聲の文字化、多言語同時通訳、そして聲の模倣を可能にしているという。

1000人以上が集まる會場で、複數(shù)のゲストが3時間近くスピーチ?交流する。スピーチの內(nèi)容は速記者がいなくても、リアルタイムで巨大スクリーンに文字化される。

記者が安徽科大訊飛信息科技有限公司（科大訊飛）の年次総會を取材したところ、スピーチの一部の人名?地名のミス、発言者の口語表現(xiàn)に含まれる冗長な語彙を除く、ほぼすべての內(nèi)容が非常に正確に整理され、同時に英語?日本語?韓國語などの言語に翻訳されていた。

説明によると、これはディープニューラルネットに基づく音聲認識技術(shù)によって実現(xiàn)されるのだという。音聲認識技術(shù)とは分かりやすく言えば、コンピュータに人間の言葉を理解させ、その音聲に含まれる文字情報を読み取らせる技術(shù)だ。同技術(shù)はスマートコンピュータシステムで重要な役割を演じており、コンピュータに「耳」を與えることでマンマシンの通信?交流を?qū)g現(xiàn)する。音聲認識の正解率は、現(xiàn)在97％に達する。

同社の劉慶峰董事長（會長）は「萬物がインターネット化する時代を迎え、音聲を中心としキーボードを補助とするマンマシン交流が実需になる。今後5?10年で、人工知能は水や電気のように私たちの生活必需品になり、私たちの世界に大きな変化をもたらす」と述べた。

【1】【2】