人工知能がその威力を大いに発揮している昨今だが、現(xiàn)在の音聲認識技術(shù)では、デバイスはまだ十分に自然言語を理解するにはいたらず、いわゆる「言外の意味」を聞き取り、理解することは、SF作品の中においてのみ存在する出來事。しかしこの狀況には現(xiàn)在、変化が生じている。新華社が伝えた。
中國最新のスマート音聲技術(shù)の成果によると、デバイスはすでに高い正解率により音聲の文字化、多言語同時通訳、そして聲の模倣を可能にしているという。
1000人以上が集まる會場で、複數(shù)のゲストが3時間近くスピーチ?交流する。スピーチの內(nèi)容は速記者がいなくても、リアルタイムで巨大スクリーンに文字化される。
記者が安徽科大訊飛信息科技有限公司(科大訊飛)の年次総會を取材したところ、スピーチの一部の人名?地名のミス、発言者の口語表現(xiàn)に含まれる冗長な語彙を除く、ほぼすべての內(nèi)容が非常に正確に整理され、同時に英語?日本語?韓國語などの言語に翻訳されていた。
説明によると、これはディープニューラルネットに基づく音聲認識技術(shù)によって実現(xiàn)されるのだという。音聲認識技術(shù)とは分かりやすく言えば、コンピュータに人間の言葉を理解させ、その音聲に含まれる文字情報を読み取らせる技術(shù)だ。同技術(shù)はスマートコンピュータシステムで重要な役割を演じており、コンピュータに「耳」を與えることでマンマシンの通信?交流を?qū)g現(xiàn)する。音聲認識の正解率は、現(xiàn)在97%に達する。
同社の劉慶峰董事長(會長)は「萬物がインターネット化する時代を迎え、音聲を中心としキーボードを補助とするマンマシン交流が実需になる。今後5?10年で、人工知能は水や電気のように私たちの生活必需品になり、私たちの世界に大きな変化をもたらす」と述べた。
このウェブサイトの著作権は人民日報社にあります。
掲載された記事、寫真の無斷転載を禁じます。
Tel:日本(03)3449-8257
Mail:japan@people.cn