硬貨と同じサイズのグラフェンシートを喉の近くの首に貼ると、構(gòu)音障害者が再び発音できるようになる。清華大學(xué)集積回路學(xué)院の任天令教授およびその協(xié)力チームはこのほど、スマート音聲インタラクションの面で重要な成果を上げた。同チームが研究開(kāi)発したウェアラブル人工喉は喉の発音と関連する信號(hào)を感知するとともに、人工知能(AI)モデルによってこれを識(shí)別し音聲に合成する。その復(fù)元の正確度は90%を超えている。光明日?qǐng)?bào)が伝えた。
音聲認(rèn)識(shí)?インタラクションシステムに新たな技術(shù)的ルートを提供している同研究結(jié)果は、このほど「ネイチャー」のAI姉妹誌「Nature Machine Intelligence」にオンライン掲載された。
商用マイクや圧電フィルムと比べると、人工喉は低周波の筋肉運(yùn)動(dòng)、中周波の食道振動(dòng)、高周波の音波情報(bào)に高い感度を持つと同時(shí)に、騒音に強(qiáng)い音聲感知能力も備える。音響信號(hào)と機(jī)械運(yùn)動(dòng)の混合モードへの感知により、人工喉はより低い音聲基本周波信號(hào)を獲得できる。このほか、同デバイスは熱音響効果により音聲を再生する機(jī)能も実現(xiàn)できる。人工喉は製造プロセスがシンプルで、性能が安定し、集約しやすく、音聲認(rèn)識(shí)?インタラクションに新たなハードウェアプラットフォームを提供している。任氏の研究チームはその音聲インタラクションの応用例をさらに示した。具體的には、AIモデルの集約を通じ、人工喉は喉頭摘出術(shù)患者が口にする日常的な言葉を識(shí)別でき、正確度は90%を超えた。識(shí)別された?jī)?nèi)容は音聲に合成され人工喉によって再生された。これは患者の音聲コミュニケーション力を大まかに回復(fù)できる。(編集YF)
「人民網(wǎng)日本語(yǔ)版」2023年3月20日