スピーディな會(huì)話內(nèi)容にも素早く対応できるスマート音聲認(rèn)識(shí)技術(shù)とその「魔力」を科大訊飛の劉慶峰會(huì)長(zhǎng)はある講演でアピールした。スピーチの內(nèi)容はリアルタイムで中國(guó)語(yǔ)?英語(yǔ)字幕として巨大ディスプレイに表示された。その反応は速く、間違いもほとんどみられなかった。新華網(wǎng)が伝えた。
劉會(huì)長(zhǎng)は「『科大訊飛スーパーブレーン計(jì)畫(huà)』に基づき、當(dāng)社は音聲と言語(yǔ)を入り口とする『認(rèn)知の革命』を起こした。當(dāng)社の音聲認(rèn)識(shí)技術(shù)の正解率はこの6年間で60.2%から95%以上まで向上し、世界トップになっている」と話した。
同社は6年前、世界初の音聲クラウド開(kāi)放プラットフォームをリリースした。同プラットフォームは現(xiàn)在、毎日40億回以上の音聲情報(bào)の処理を行っている。同社の胡郁副総裁は、「音聲合成で、中國(guó)は世界の先駆者となっている」と説明した。
◆スマート音聲認(rèn)識(shí)技術(shù)、広がる応用
「私は羅永浩です。落ち著いてください。まもなくナビを開(kāi)始します」これは高徳地図羅永浩バージョンのナビ音聲だ。高徳地図は2014年に初めて音聲合成技術(shù)により、有名人の聲によるナビゲーションを?qū)g現(xiàn)した。そして林志玲(リン?チーリン)の聲がリリースされると、瞬く間のうちに話題になった。その後さらに羅永浩などの有名人の音聲がリリースされた。
近年のAIブームにより、スマート音聲を始めとする各種アプリが次々と登場(chǎng)している。QQ閲読は科大訊飛の音聲合成技術(shù)を用い、本の朗読サービスを発表した。また蝦米音楽は科大訊飛の音聲認(rèn)識(shí)技術(shù)を使い、ハミング検索を発表した。
科大訊飛は公安?検察?裁判所と革新的な協(xié)力を展開(kāi)し、スマート音聲技術(shù)応用の新分野を開(kāi)拓している。安徽省で2016年に実施されたテストによると、AIが詐欺電話と判斷できる正確率は非常に高い。AIはさらに法廷の速記官を擔(dān)うこともできるとされており、スマート音聲認(rèn)証を法廷審理に用いたところ、その時(shí)間を3割短縮することができた。
中國(guó)中部のある省立病院の診察ホールでは、2臺(tái)のロボットが注目を浴びている?!袱长螭摔沥稀⑺饯习竷?nèi)ロボットの暁醫(yī)です。あなたのお役に立てて光栄です。診察室の場(chǎng)所、どの診察室に行くか、それから診察での問(wèn)題點(diǎn)についてお答えします」このような音聲と共に、219種の一般的な病気と癥狀に対応する診察室を熟知している暁醫(yī)は、スマート音聲認(rèn)識(shí)技術(shù)により、1日あたり5000回サービスを近く提供している。
百度の李彥宏會(huì)長(zhǎng)兼CEOは、「AIは複雑な世界をシンプルにする點(diǎn)が重要だ。今後30年から50年間に渡り、AIは人類の歴史の進(jìn)歩を促す力強(qiáng)い力になるだろう」と述べた。(編集YF)
「人民網(wǎng)日本語(yǔ)版」2017年12月13日
このウェブサイトの著作権は人民日?qǐng)?bào)社にあります。
掲載された記事、寫(xiě)真の無(wú)斷転載を禁じます。
Tel:日本(03)3449-8257
Mail:japan@people.cn