中国のAIスタートアップ、DeepSeekがOpenAIのデータを無断で取得した可能性が浮上し、マイクロソフトとOpenAIが共同で調査を進めている。報道によれば、DeepSeek関連の個人がOpenAIのAPIを通じて大量のデータにアクセスしていたとされる。先週、DeepSeekは初のオープンソース推論モデル「DeepSeek-R1」を発表し、OpenAIのモデルと同等の性能を示したと主張している。

この発表により、世界のテクノロジー株は急落し、特にNvidiaの株価は17%下落、約6,000億ドルの時価総額を失った。米国政府は、DeepSeekの急速な台頭が国家安全保障上のリスクをもたらす可能性を検討している。この状況は、AI技術の競争が新たな段階に入ったことを示唆している。

DeepSeekのデータ取得疑惑とその手法

DeepSeekがOpenAIのデータを不正に取得した可能性が指摘される中、その手法についても関心が集まっている。報道によれば、DeepSeekに関連する個人がOpenAIのAPIを利用し、大量のデータにアクセスしていたという。

通常、OpenAIのAPIには利用制限が設けられており、正規の開発者であっても一定以上のリクエストには制限がかかる。しかし、今回のケースではその制限を回避する試みがあったと考えられている。APIを通じたデータ取得は、AI開発において一般的な手法だが、不正アクセスが事実であれば、DeepSeekはOpenAIの技術を直接的に活用した可能性がある。

仮に取得したデータを自社のAIモデル開発に利用していた場合、DeepSeekの新たなAIモデルが短期間で高性能化した理由の一端が見えてくる。特に、最新の「DeepSeek-R1」がOpenAIのモデルと同等の性能を示したことが、こうした疑念を強める要因となっている。

また、技術的な視点では、APIを使ったデータ取得だけでなく、機械学習の「リバースエンジニアリング」も疑われている。これは、外部から得た情報をもとにモデルの構造や挙動を解析し、類似のAIを構築する手法である。DeepSeekがどのような方法でデータを活用したのかは、今後の調査で明らかになるだろう。

AI競争の激化とDeepSeekの躍進がもたらす影響

DeepSeekが開発した新しい推論モデル「DeepSeek-R1」は、オープンソースとして公開され、AI研究者や開発者の間で注目を集めている。これまでAI開発の主導権を握っていたOpenAIやGoogleのGeminiシリーズ、MetaのLlamaシリーズに対抗しうるモデルと評価されており、AI分野の競争はさらに激化している。

この発表による市場への影響は大きく、Nvidiaの株価が大幅に下落するなど、AI関連企業に対する投資家の不安が表れている。特に、DeepSeekがNvidiaのH800チップを使用して短期間でモデルを訓練した点は、低コストで高性能なAIを開発できる可能性を示唆している。これにより、中国のAI企業が今後さらに技術力を向上させ、米国企業に対抗する構図が生まれつつある。

一方で、DeepSeekの急速な発展に対する懸念も広がっている。米国政府は国家安全保障の観点からDeepSeekの技術進展を警戒しており、今後規制の対象となる可能性もある。特に、中国のAI企業が米国の先進技術を活用しながら成長していることが問題視されており、今回のデータ取得疑惑が事実であれば、さらなる制裁措置や技術輸出規制が検討される可能性がある。

今後のAI開発と倫理的な課題

DeepSeekの事例は、AI技術の発展がもたらす倫理的な課題を浮き彫りにしている。AIの進化には大量のデータと計算資源が必要だが、その取得方法や利用方法が適切でない場合、公正な競争が損なわれる恐れがある。今回の疑惑が事実であれば、AI業界全体にとって深刻な問題となるだろう。

また、AIのオープンソース化が進むことで、技術の透明性と普及が加速する一方、知的財産の保護やデータの適正利用といった問題が浮上する。DeepSeekのように、新興企業が既存の技術を活用して短期間で競争力のあるAIを開発することは歓迎されるべき一方、その手法が倫理的に問題のあるものであれば、業界全体の信頼性が揺らぎかねない。

AI開発競争が続く中、各国政府や技術企業がどのように対応するかが重要となる。特に、中国と米国のAI技術戦争が激化する中で、技術の流出や不正利用の問題がどこまで影響を及ぼすのか、今後の動向が注目される。

Source:Quartz