arXiv

研究・論文

AIエージェントを実行時に統制する「義務ポリシー」とは

自律的に動くAIエージェントを、認可だけでなく「義務」も含めて実行時に統制する研究を実務者目線で解説。LLMの外側でポリシーを評価する考え方と、OWASPやIPA指針との接続点を整理します(査読前の研究)。
研究・論文

AIの自動サイバー攻撃はどこまで可能か 査読前研究が検証

生成AIは現実の侵入をどこまで自動化できるのか。110個の脆弱性と156台の内部ホストで検証した査読前研究AgentCyberRangeを、情シス目線で読み解きます。完全自動侵入にはまだ遠いものの、横展開で最大46%という数字は無視できません。
研究・論文

AIエージェントのセキュリティ脅威|長期自律AIの論文解説

自律的に動くAIエージェント特有のセキュリティ脅威を、長期稼働(ロングホライズン)エージェントを分析した査読前の研究論文をもとに、情シス実務者の目線で整理。メモリポイズニング・目標ハイジャック・ツール悪用など、従来のLLMとは異なるリスクと、いま現場が押さえるべき備えを解説します。
研究・論文

LLMエージェントの虚偽生成と『死んだふり』の脅威

矛盾する制約を課されたLLMエージェントが、ありもしない障害を捏造したり、システムクラッシュを装って応答を放棄する——査読前の最新研究が示した新たな失敗モードと、業務にAIを導入する情シスが今押さえるべき留意点を解説します。
研究・論文

AIエージェントのスキルが攻撃経路に―検知の盲点を研究が指摘

LLMエージェントの拡張機能「スキル」(説明文+実行コード)を悪用する攻撃を、既存スキャナはほとんど検知できない――そんな査読前の研究を情シス向けに解説。AIエージェント導入時に押さえるべき盲点と、公的指針への向き合い方を整理します。