AI 技術的競爭與專有技術的對抗正在進行當中。據彭博社報導(Bloomberg),知情人士透露微軟公司(Microsoft)和 OpenAI 正調查中國人工智慧新創公司 DeepSeek 團隊是否以未經授權的方式獲取 OpenAI 技術數據輸出。
在今年 1 月,中國人工智慧助理 DeepSeek 發布一款名為 R1 的開源 AI 模型,因低廉的開發成本,衝擊海外 AI 相關的科技股一度大跌,包括微軟、Nvidia 、Oracle 與 Google 母公司 Alphabet,不過近日 Nvidia 與微軟等主要企業股價已開始回升。
彭博社消息記載,知情人士表示微軟的安全研究人員在去年秋天觀察到,一些可能與 DeepSeek 有關的人士透過 OpenAI 的 API 提取大量數據,因開發者能夠付費獲取 API 授權,以將 OpenAI 的專有 AI 模型整合到自己的應用程式中。
Microsoft and OpenAI are investigating whether data output from OpenAI’s technology was obtained in an unauthorized manner by a group linked to Chinese artificial intelligence startup DeepSeek, according to people familiar with the matter https://t.co/0enZGV0yZr
— Bloomberg (@business) January 29, 2025
這類技術在業界被稱作「蒸餾」(distillation),主要目標是從一個較大的、性能強大的教師模型(Teacher Model) 提取知識,並將其轉移到一個較小、更高效的學生模型(Student Model)。
作為 OpenAI 的最大投資方,微軟已知會 OpenAI 這一項異常活動,因為這類行為可能違反 OpenAI 的服務條款,而 OpenAI 則在近日對金融時報(Financial Times)表示,他們已掌握證據顯示 DeepSeek 使用蒸餾技術獲取數據的跡象。
然而,有關數據取得的合法性上卻有些諷刺,因為 OpenAI 的 GPT 模型是透過大規模網路數據訓練而成,但 OpenAI 從未完整公開其訓練數據來源,這也在近年引發 GPT 是否未經授權使用受版權保護內容引發爭議。
拾い物だけどDeepSeekとはなんぞが一番わかりやすい pic.twitter.com/Vt6NNWV1jH
— イング (@ING_gurimore) January 29, 2025
於此同時,阿里巴巴在今日發表阿里雲 AI 模型「通義千問」旗艦版模型「Qwen 2.5-Max」,據稱表現比 DeepSeekV3 版本還要優秀。
這場爭議涉及 AI 技術的競爭、數據取得的合規性以及開源與專有技術的對抗,可能對未來 AI 產業發展帶來後續深遠的影響。
BREAKING: Alibaba just launched "Qwen" an AI model that writes, generates images/videos, and does web search.
— Ihtesham Haider (@ihteshamit) January 29, 2025
It outperforms DeepSeek, ChatGPT-o1, and Claude sonnet.
Here are 5 insane examples of what it can do: pic.twitter.com/fopnF1DqVE