機械学習分野の国際会議ICML 2026が、査読プロセスにおけるAI(大規模言語モデル)の不正利用を電子透かし技術で検出し、投稿全体の約2%にあたる497本の論文をデスクリジェクト(門前払い)した。AI利用ポリシーに違反した査読者の論文を一括で却下するという前例のない措置であり、学術的誠実性の維持における転換点として注目を集めている。
17万フレーズの辞書を活用した検出手法
ICML運営チームは、Rao、Kumar、Lakkaraju、Shahらの研究に基づく電子透かし技術を導入した。17万語のフレーズ辞書から各論文に2つのフレーズをランダムに選択し、PDF内に不可視の指示として埋め込んだ。査読者がLLMを使って査読を行った場合、この指示によりLLMの出力に特定のフレーズが含まれる仕組みだ。ペア選択の確率は100億分の1未満で、フロンティアLLMに対する事前テストでは80%以上の検出率を達成した。
506名の査読者による795件の違反を検出
検出の結果、全査読の約1%にあたる795件のレビューが、LLM使用禁止(ポリシーA)の下で違反したと判定された。違反者は506名のユニークな査読者に及んだ。このうち違反率が50%を超えた51名については全レビューが削除され、残りの違反者についてはフラグが立ったレビューのみが除去された。
2つの査読ポリシーを併用
ICML 2026では初の試みとして、2つの査読ストリームを運用した。ポリシーAはLLMの使用を全面禁止し、ポリシーBは論文理解やレビューの推敲に限りLLM利用を許可するものだった。違反した398名の相互査読者が投稿していた497本の論文がデスクリジェクトの対象となった。
学術界全体への波及
AI生成コンテンツの学術分野への浸透は加速している。NeurIPS 2025では4,841本の採択論文から100件の捏造参考文献が検出され、ICLR 2026でもレビュー対象300本中50本で参考文献のハルシネーションが確認されている。ICML 2026の透かし手法は、学術コミュニティがAI時代の誠実性をいかに守るかという問いに対する一つの回答を示した形だ。ただし、運営チームは「フラグが立ったレビューの品質や査読者の意図を判断するものではない」と説明しており、あくまでポリシー違反の検出に焦点を当てた措置としている。

