AI受験生が上位大學(xué)の文系學(xué)部に「合格」　大きく進(jìn)歩した中國の技術(shù)

人民網(wǎng)日本語版　2024年06月28日10:50

2024年の中國大學(xué)統(tǒng)一入學(xué)試験（通稱「高考」）が終了すると、中國內(nèi)外のさまざまな大規(guī)模AIモデルが相次いで試験問題に挑戦した。こうした「大規(guī)模AIモデル受験生」にはGPT-4o（オープンAI）、豆包（字節(jié)跳動<バイトダンス>）、文心4.0（百度<バイドゥ>）、百小応（百川智能<バイチュアンAI>）、通義千問2.5（阿里巴巴<アリババ>）などが含まれる。出題された試験問題は、幅広い地域で採用される「新課標(biāo)I巻」（新指導(dǎo)要領(lǐng)Ⅰ巻）に基づくもので、河南省の受験生に実際に出題されたものだ。

試験の成績を見ると、文系ではGPT-4oが562點(diǎn)を獲得して首位に立ち、中國製品では豆包が542.5點(diǎn)でトップだった。

河南省の上位大學(xué)の文系合格ラインは521點(diǎn)で、中國製品は豆包、文心4.0、百小応が合格圏內(nèi)に入った。

インターネットにアップされている資料を総合すると、文系の試験でAIたちはそろって優(yōu)れた成績を上げ、特に言語類科目ではある程度の論理と言語を組み立てる能力の高さを示した。ところが、作文の面では、大規(guī)模AIモデルの文章は構(gòu)成が明確で、筋も通っているものの、理性が勝ちすぎ感性が不足気味という傾向が軒並み存在し、感情的な色合いや訴えかけるものも足りなかった。

理系ではAIモデルの成績はどれも振るわず、大半の総合得點(diǎn)が400點(diǎn)以下で、河南省の合格ラインの511點(diǎn)とは開きがあった。9製品のうち、GTP-4o、文心4.0、豆包が數(shù)學(xué)の試験で60點(diǎn)以上を取れたが、満點(diǎn)は150點(diǎn)なのでいずれも不合格の成績だ。調(diào)査?実験?探求の能力に重點(diǎn)が置かれる化學(xué)と物理の試験では、各AIモデルの平均點(diǎn)は化學(xué)（100點(diǎn)満點(diǎn)）が34點(diǎn)、物理（110點(diǎn)満點(diǎn)）が39點(diǎn)だった。

今回の試験結(jié)果を見ると、AIは文系分野で一定の優(yōu)位性を示し、特に言語処理と知識記憶の面で突出した成績を収めた。河南省の大學(xué)受験成績ランク統(tǒng)計データを見ると、GPT-4oは562點(diǎn)で文系受験生の中で8811番になり、実際の受験生なら上位2.45％に入る。中國製品では豆包が上位の約4.27％に入る。過去1年あまりの間に、中國のAI技術(shù)の能力が大きく進(jìn)歩したことがわかる。

理系分野では、深い論理的推論と臨機(jī)応変の柔軟な対応力が求められる問題は、AIモデルにとってなお非常に大きな課題だと言える。ここからわかる通り、AIは特定のタイプの任務(wù)に対処するときには高い能力を発揮するが、知識を総合的に運(yùn)用して実際の複雑な問題を解決する場面では、人間の知的水準(zhǔn)との間にまだ開きがある。（編集KS）

「人民網(wǎng)日本語版」2024年6月28日