中国共産党のプロパガンダがAIシステムに浸透 世界のチャットボットに影響

2026/05/20 更新: 2026/05/20

ウォール・ストリート・ジャーナルによれば、先週、学術誌「ネイチャー」が研究論文を公開した。米国の複数の大学の研究者が、中国共産党(中共)の公式支配下にあるメディアのコンテンツが、世界の主流AIチャットボットの訓練データに大量に組み込まれていることを示す、初の査読済みの証拠を発表したものである。

この研究は、オレゴン大学、パデュー大学、ニューヨーク大学、プリンストン大学などの機関の研究者が共同で行ったものだ。研究によれば「新華社」「人民日報」「学習強国」といった中国共産党の公式コンテンツが、現在ChatGPTなどのAIシステムの記憶の中に明確に存在していることが確認された。

研究者たちは、現在世界最大規模の中国語オープンソースデータベースの一つである「CulturaX」を分析した。このデータベースは中国語ウェブから収集した約1億8900万件のドキュメントを含み、多くのAI研究機関がモデルの訓練に使用している。

全体的に見ると、そのうち1.64%のコンテンツが中国共産党の公式メディアと重複している。この割合は一見低いように映るが、習近平や中国共産党大会などのテーマに関しては、中国共産党公式メディアのコンテンツの占有率が4分の1近くにまで急上昇する。

さらに注目されるのは、研究者が複数の主流AIチャットボットをテストした結果、同じ質問であっても中国語で回答した場合のほうが英語で回答した場合よりも中共寄りの内容になる傾向が確認された点である。

研究チームは、事情を知らない評価者9人を実験に参加させた。その結果、75%以上のケースにおいて、中国語の回答のほうが英語の回答より「親中共」的であることが示された。

論文はまた、OpenAIのGPT、GoogleのGemini、AnthropicのClaude、イーロン・マスク傘下のGrokを含む複数の主流AIシステムで同様の現象が見られると名指しで指摘した。

一方、中国国内のAIモデルであるDeepSeekは異なる様相を示し、中国語・英語を問わずその立場は明確に中共寄りであった。

最も警戒すべきは、このプロセスに中国共産党による秘密工作が必要ないという点だ。これらのプロパガンダコンテンツはもともとインターネット上に公開されており、通常のHTMLページとして無料で公開されているため、いかなるAI企業のウェブクローラーでも容易に収集できる。

これに対し、多くの西側独立系メディアは有料購読モデルを採用しているため、AIの訓練データに組み込まれにくいという逆転現象が生じている。

研究はさらに、この現象が中国に限らないことも明らかにした。報道の自由度が低い国、例えばロシアや北朝鮮においても、AIシステムは現地政府寄りのコンテンツを生成しやすい傾向にある。

研究者の一部は、今後真に懸念されるのは、プロパガンダコンテンツがAIに取り込まれること自体にとどまらず、AIの回答が情報源を明示しないことにあると警鐘を鳴らしている。利用者は、それらの見解が独立した情報に由来するものなのか、それとも独裁政府のプロパガンダに由来するものなのかを判断することが極めて困難になる。

関連特集: 国際