AIが生成するコードは安全か査読前研究が示す実装の壁

結論から言います。生成AIにコードを書かせても、それが安全とは限りません。最新の査読前研究は「AIはセキュリティの原則を理解していても、安全なコードに落とし込めない場面が多い」と指摘します。つまりGitHub CopilotやCursorなどのAIコーディング支援を導入しても、出力をそのまま信用するのは危険だということです。情シスとしては、AI生成コードにも従来どおりのレビューと静的解析(SAST)を必須にする運用が求められます。

本記事は、2026年6月に公開されたarXivの査読前(プレプリント)論文を、企業のセキュリティ担当者の視点で噛み砕いたものです。査読前のため結果は今後変わりうる点に留意してください。

この記事でわかること
どんな研究か
何が新しく分かったのか
1. 最大の落とし穴は「知識を行動に移せない」こと
研究が示す今後の方向性
現場目線の課題——情シスはどう受け止めるか
情シスはまず何を参照すべきか
まとめ
出典

この記事でわかること

AIによる「安全なコード生成」研究の現在地（何ができて、何ができないか）
研究が指摘する最大の落とし穴「理解と実装のギャップ」とは何か
AIコーディング支援を社内導入する際に情シスが押さえるべき勘所

どんな研究か

取り上げるのは「SoK: AI Secure Code Generation: Progress, Pitfalls, and Paths Forward」（Rupam Patir 氏ほか、2026年6月23日 arXiv公開）です。SoK（Systematization of Knowledge）とは、ある分野の研究成果を体系的に整理・俯瞰する論文形式を指します。新しい手法の提案ではなく、「これまで何が分かったのか」を交通整理するのが目的です。

この論文は、AIに安全なコードを書かせるための代表的な4つのアプローチを横断的にレビューしています。

プロンプト工夫（指示の与え方でセキュリティを高める）
ファインチューニング（安全なコードで追加学習させる）
強化学習（安全な出力に報酬を与えて学習させる）
エージェント的ワークフロー（複数ステップで検証しながら生成する）

何が新しく分かったのか

研究チームは、AIの能力を3つの段階に分けて測る枠組みを提示しました。

セキュリティ原則を自然言語で理解できているか
それをコードとして実装できるか
理解と実装の間にどれだけギャップがあるか

論文によれば、「セキュアコーディングの原則を理解しているかどうかは、機能的な正しさ・安全性・その両立を予測する統計的に強い指標になる」とされています。原則を理解しているモデルほど、結果的に良いコードを書く傾向がある、というわけです。

最大の落とし穴は「知識を行動に移せない」こと

一方で、研究が強調する最大の問題が「知識と行動（actuation）のギャップ」です。論文の表現を借りれば「モデルは関連するセキュリティ原則を認識できても、それを安全かつ機能するコードに翻訳できないことが多い」。

平たく言えば、AIに「SQLインジェクションを防ぐには？」と聞けば正しく答えられるのに、いざコードを書かせると脆弱な実装をしてしまう、という現象です。「知っている」ことと「正しく書ける」ことは別物だ、という当たり前ながら見落としがちな事実を、定量的に裏づけた点が新しいといえます。

研究が示す今後の方向性

方向性	狙い
原則ガイド付き生成	セキュリティ原則を明示的に踏まえさせて生成精度を上げる
評価手法の高度化	「動くか」だけでなく「安全か」を厳密に測る
ベンチマークの整備	比較可能な共通の評価基準を作る
エージェントの改良	検証ステップを組み込んだ生成フローを洗練する

いずれも研究側の課題ですが、裏を返せば「現時点のAIは、安全なコード生成を保証する仕組みがまだ未成熟」という現実を示しています。

現場目線の課題——情シスはどう受け止めるか

正直なところ、開発の現場ではすでにAIコーディング支援が当たり前に使われています。情シスがツール導入を承認するかどうかにかかわらず、開発者が個人の判断でAIに書かせたコードが本番に混ざる、という状況は珍しくありません。利用実態を完全には把握しきれないもどかしさは、多くの担当者が感じているはずです。

そこに今回の研究が突きつけるのは、「AIが書いたから安全」という思い込みの危うさです。AIは流暢に、それらしいコードを大量に出力します。レビューする側が「AIが書いたなら大丈夫だろう」と気を緩めれば、人間が書いた以上に見逃しが増えかねません。限られた人員でレビューを回す現場ほど、この「もっともらしさ」の罠は深刻です。

ポイントは、AIを禁止することではなく、AI生成コードを「人間が書いたコードと同等か、それ以上に検証すべき対象」として扱う運用に組み込むことだと考えます。具体的には、AI由来かどうかに関わらず、コードレビュー・SAST・依存関係チェックを通す前提を崩さないこと。そして開発者に「AIの出力は鵜呑みにしない」という意識を地道に根づかせることです。

情シスはまず何を参照すべきか

社内ルールづくりにあたっては、自前で対策リストを抱え込むより、公的機関の指針を出発点にするのが近道です。IPA（情報処理推進機構）は生成AIの利活用・開発に関するセキュリティ情報を整理して公開しています。

IPA「AIセキュリティ」特設ページ——AIのライフサイクル全体（設計・開発・導入・運用）にわたる考え方の入口。
IPA「AI利用者のためのセキュリティ豆知識」——現場の利用者向けの平易な注意点。社内啓発の素材に使えます。

なお、IPAの「情報セキュリティ10大脅威 2026」では「AIの利用をめぐるサイバーリスク」が組織向けに初めて選出されました。AIコード生成の安全性は、まさにこの文脈の一部です。利用ルールの整備とあわせて、開発者・利用者への啓発を継続することが結局のところ効いてきます。

まとめ

査読前研究は「AIはセキュリティ原則を理解していても、安全なコードに実装できないギャップが大きい」と指摘した。
AI生成コードを無条件に信用せず、人間のコードと同等以上にレビュー・SASTで検証する運用が必要。
ルール整備はIPAの公的指針を出発点にし、開発者・利用者への地道な啓発を続けることが現実的な打ち手。

出典

Rupam Patir, Keyan Guo, Haipeng Cai, Hongxin Hu「SoK: AI Secure Code Generation: Progress, Pitfalls, and Paths Forward」arXiv:2606.25195（2026年6月23日公開、査読前プレプリント）https://arxiv.org/abs/2606.25195
IPA「AIセキュリティ」https://www.ipa.go.jp/digital/ai/security/index.html
IPA「情報セキュリティ10大脅威 2026」https://www.ipa.go.jp/security/10threats/index.html