【DeepSeek】AI業界を驚かせたブレークスルーとその創始者を深掘り!

2024年12月、中国の小さなスタートアップ企業「ディープシーク」が、テックジャイアントたちを脅かし、AI開発の常識を覆すブレークスルーを発表しました。ディープシークはそれまでほとんど無名の企業でしたが、たった2,000台の低性能Nvidia H800 GPUでトレーニングされたV3モデルを発表し、コーディング、論理的推論、数学の分野で多くのトップAIモデルを上回る成果を達成しました。この発表はシリコンバレーに衝撃を与え、多くの業界リーダーがAI開発のアプローチを見直すきっかけとなりました。

この驚異的な成果の背後には、梁文峰(リャン・ウェンフォン)という謎めいた天才がいました。その背景が明らかになるにつれ、彼の名前はテック業界で注目を集めるようになりました。

幼少期と数学の天才ぶり

梁文峰は1985年、中国広東省の沿岸都市・江門で生まれました。彼の父は小学校の教師で、質素な家庭で育ちました。幼少期から数学に非凡な才能を発揮し、他の子どもたちがスポーツや遊びに夢中になる中、梁は数時間にわたり複雑なパズルや方程式を解くことに没頭しました。彼の数字への情熱は、その後のキャリア全体を形作ることになります。

10代になると、彼の問題解決能力が際立ち始めました。複雑な課題を小さな要素に分解し、整理して解決する能力に優れていました。このスキルは後に、テクノロジーや金融の分野で現実世界の課題に取り組む際に大きな強みとなりました。17歳のとき、梁は中国トップクラスの大学である中山大学に合格し、電子情報工学を専攻しました。この分野は、彼の数学的才能を実際の技術応用と融合させることを可能にしました。

大学時代、梁はデータ分析やコンピューターシステムに深く没頭しました。数学が金融市場を説明できることに魅了され、確率モデルやアルゴリズムを研究して市場の動向を予測する方法を学びました。彼の才能を見抜いた教授たちは、彼に高度な研究プロジェクトを任せるようになりました。最終学年では、コンピューターを使って市場の動きを数学的に解析するアルゴリズム取引に焦点を当てました。この研究が、彼の将来のキャリアの基盤となりました。

DJIのオファーを断りAIを選択

この頃、梁はキャリアの大きな選択を迫られていました。ドローン大手「DJI」の創業者である汪滔(ワン・タオ)から共同創業者としてのオファーを受けました。この申し出は非常に魅力的で、巨額の富を手に入れるチャンスでした。しかし、梁はこのオファーを断りました。彼は、AIがドローンだけでなく、あらゆる業界を変革すると確信していたのです。DJIに参加する代わりに、彼は独自のAIソリューションを開発するための企業を立ち上げることを選びました。

2008年金融危機とAIの活用

2008年、世界的な金融危機が発生し、市場が混乱する中、梁はAIの力を試す機会を見出しました。多くの人がパニックに陥る中、梁と彼のチームは「機械学習」を活用し、市場の動きをより効率的に分析するアルゴリズム取引の開発に挑みました。

この手法は「クオンツ取引(量的取引)」と呼ばれ、数学モデルを使って株価や経済指標、ニュースの傾向を分析し、市場のパターンを特定する技術です。彼らのチームは、膨大な量のデータを収集し、AIに学習させることで市場の動きを予測しようとしました。

最初のモデルは頻繁に失敗しました。市場が急変するため、アルゴリズムが適応できなかったのです。しかし、梁と彼のチームは粘り強く改良を重ねました。人間の投資家のパニック行動を考慮することで、より正確な予測が可能になり、最終的に市場の動向を把握できるようになりました。

AI取引から汎用人工知能(AGI)へ

2013年、梁は大学時代の友人と共に「杭州ジャコビ投資管理」を設立し、実際の市場でAI取引をテストしました。その後、2015年には「杭州ハイフライヤー・テクノロジー」を立ち上げ、さらに高度なAI取引システムを開発しました。

2016年、ハイフライヤーはディープラーニングを活用したAI取引モデルを発表し、その結果は驚異的でした。市場が不安定な時期にも関わらず、安定した利益を確保し、2016年末には運用資産が10億元(約140億円)を超えました。

スーパーコンピューターの開発

2019年、梁はAIのトレーニング環境を強化するため、2億元(約28億円)を投じて「ファイアフライ1号機」を開発しました。さらに2021年には、10億元(約140億円)を投じて「ファイアフライ2号機」を構築し、1万台のNvidia A100 GPUを搭載しました。

この投資により、ディープシークはAI分野で独自の地位を確立し、2023年に汎用人工知能(AGI)の開発へと進みました。

ディープシークの成功と未来

2024年5月、ディープシークは「DeepSeek V2」を発表し、GPT-4 Turboと同等の性能を1/70のコストで実現しました。さらに12月には、「DeepSeek V3」をわずか248台のNvidia H800 GPUでトレーニングし、AI業界に衝撃を与えました。

この成功は、巨大な予算や最先端のハードウェアがなくても、革新的なアルゴリズムと効率的な開発手法があれば、AI業界で競争できることを証明しました。

梁文峰の挑戦は今後も続き、AIの未来を切り開いていくでしょう。

コメント

タイトルとURLをコピーしました