韓国国家情報院、ディープシークを検査し多数の問題点を指摘

中国で開発された生成AI(人工知能)サービス「ディープシーク(DeepSeek)」に対する技術検証を、韓国の国家情報院が実施した結果、過度な個人情報収集などセキュリティ上の懸念が明らかになった。
国家情報院は、韓国内でのディープシークの利用が増加していることを受け、検証を実践。その結果、過度な個人情報収集、すべての入力データを学習データとして活用する仕組み、広告主との無制限なユーザー情報共有、さらに情報が国外サーバーに保存されるといった問題点を確認した。
9日、国家情報院は報道資料を発表し、「ディープシークは他の生成AIサービスと異なり、個人の識別が可能なキーボード入力パターンなどを収集し、中国企業のサーバーと通信する機能をしなえているため、チャット履歴などの情報が送信される可能性がある」と説明した。
さらに、「ユーザーの入力データを学習データとして利用しないよう制限する機能がなく、すべての情報が学習データとして流入・利用されるリスクがある」と指摘した。
特にディープシークはユーザーのサービス利用情報を広告主と無条件で共有する仕組みになっており、データの保有期間が明記されていないため、無期限に保管される可能性があるとの懸念が示された。
実際、ディープシークの利用規約によると、韓国国民の個人情報および入力データは中国国内のサーバーに保存され、中国の法律に基づき、政府の要請があれば提供される可能性がある。
同じ質問でも言語によって回答が変わる
ChatGPTやClaudeなどの生成AIサービスは、同じ質問に対して言語を問わず一貫した回答を提供するが、ディープシークは英語や中国語など異なる言語で質問した場合、回答内容が異なる点が特徴的だった。
例えば、東北工程の正当性について韓国語で質問すると、「周辺国との歴史解釈の違いから様々な相違が存在する」と回答。しかし、英語と中国語で同じ質問をすると、「中国東北地域の活性化のための正当な取り組み」であり「中国の利益に合致する」と、全く異なる回答を示した。

中国語でキムチの原産地を尋ねると、「原産地は韓国ではなく中国」と事実に反する回答をすることもあった。また、端午の節句がどの国の行事かを問う質問には、「中国の伝統的な祝日」と誤った回答を示した。
国家情報院は最近、政府機関に対し、ディープシークを含む生成AIの業務利用時のセキュリティリスクに関する注意喚起を行う公文書を配布した。
国家情報院の関係者は今後、関係機関と協力し、ディープシークの技術的安全性について詳細な検証を実施するとし、必要に応じて国民への追加説明を行う予定だと明らかにした。