オープンソースAI競争に勝利しつつある「カイフー・リーのスタートアップ」

AIの専門家であり、グーグルやマイクロソフトの中国での設立を支援し、著名な投資家でもあるカイフー・リー(李開復)は、彼の新しいスタートアップ01.AIが、ジェネレーティブAIの最初の「キラーアプリ」を生み出すだろうと語っている。

Will Knight
WIRED
23 January 2024

メタ社は昨年7月、ChatGPTの背後にあるものと同様のAIモデルであるLlama 2を誰でもダウンロードして使えるように公開し、より強力な人工知能を構築する競争を揺るがした。11月には、北京のあまり知られていないスタートアップ、01.AIが独自のオープンソースモデルをリリースし、Llama 2を凌駕し、AIモデルのパワーを比較するために使用される多くのリーダーボードのトップに近いスコアを獲得した。

01.AIのモデル「Yi-34B」は、リリースから数日のうちに、スタートアップのハギング・フェイスが管理するランキングでトップに躍り出た。ハギング・フェイスは、自動インテリジェンスのためのさまざまな標準ベンチマークでAI言語モデルの能力を比較している。数ヶ月後、01.AIのモデルを改良したバージョンは、ハギング・フェイスのリストや他のリーダーボードで、開発者や企業が利用できるトップモデルの中に常に入っている。月曜日には、画像を処理し、その内容について議論することができる「マルチモーダル」AIモデル「Yi-VL-34B」を発表した。

OpenAI、グーグル、そして他のほとんどのAI企業は、その技術を厳しく管理しているが、01.AIは、キラーAIアプリの開発に役立つ忠実な開発者層を刺激することを期待して、AIモデルを提供している。昨年6月に設立された01.AIは、中国のeコマース大手アリババなどから2億ドルの投資を集め、Pitchbookによると評価額は10億ドルを超えている。

このスタートアップの創業者兼CEOは、著名な投資家であるカイフー・リー氏で、人工知能の先駆的な研究を行った後、マイクロソフトの北京研究所を設立し、グーグルの中国事業を2009年まで率いた。Yi-34Bの誕生は、より知的なマシンを作ろうとする彼のライフワークの集大成だと彼は言う。

「これは私のキャリア全体のビジョンでした」と、リーは北京の豪華に装飾されたアパートからズーム越しに語る。「コンピュータの言語を学ばなければならなかったのは、あまりにも長い時間でした。中国語で01.AIは「零一万五」として知られている。これは「ゼロイチ、すべて」を意味し、道教の経典『道徳経』の一節を暗に示している。

01.AIは、OpenAIとChatGPTによって始められ、これまで米国企業が独占してきたAI競争において、中国を代表する競合企業のひとつである。リー氏は、01.AIが健全な収益を獲得する言語モデルの能力に基づいて構築された最初の「キラーアプリ」のいくつかを構築することで、この革命の次の段階をリードすることを目指しているという。「モバイル時代を制したアプリは、Uber、WeChat、Instagram、TikTokのようなモバイルファーストのものです。次世代の生産性ツールは、Officeのようなものであってはならない」とリー氏は言う。

01.AIのエンジニアは、オフィスの生産性、創造性、ソーシャルメディアのために、さまざまな「AIファースト」のアプリを試しているとリーは言う。中国資本のソーシャルネットワークTikTokやオンライン小売業者Temuが米国の消費者の間でトップアプリとなっているのと同じように、世界中で成功する計画だと彼は言う。

01.AIのアプリはまだリリースされていないが、このスタートアップのオープンソースの言語モデルは、欧米ではすでに称賛を集めている。AIの専門家であり、AI研究とAIアプリ開発の両方を行うもうひとつの新しいベンチャー、Answer AIを最近設立したジェレミー・ハワードは言う。

AIのパイオニア

リーはAIの分野で特筆すべきキャリアを持っている。台湾から米国に移住し、テネシー州オークリッジの高校に通った後、コロンビア大学とカーネギーメロン大学でコンピューターサイエンスを学び、当時としては最先端の音声認識システムの開発を含む論文で博士号を取得した。

1990年にアップルにリサーチ・サイエンティストとして入社し、1996年にシリコン・グラフィックスに移ったリーは、1998年に中国に戻り、マイクロソフト・リサーチ・アジアの設立に携わった。2005年、グーグルの中国における検索事業の社長に就任し、2009年に退社して、今や隆盛を極める中国のハイテク産業で自身の投資会社シノベーション・ベンチャーズ(創新工場)を立ち上げた。

中国におけるスマートフォンの台頭がテック業界の急成長を牽引するなか、シノベーションは画像認識企業のMegviiや自律走行トラック輸送に取り組むTuSimpleなど、成功を収めた中国のAIスタートアップを数多く支援した。リーは中国のAI産業の擁護者となり、AIプロジェクトを構築するために帰国することを検討するよう中国の大学院生を奨励するために米国を訪れ、2018年には『AIスーパーパワーズ(日本語版のタイトルは『AI世界秩序: 米中が支配する「雇用なき未来」』)』を出版した。しかし、リーは米中間の協力も頻繁に提唱していた。

『AIスーパーパワーズ』の出版は、中国のハイテク産業が米国に匹敵し、おそらくは米国を凌駕する勢いであるというリーの見立てが正しいと欧米で認識され始めた時期と重なる。ワシントンの政策立案者や識者は、中国が世界中で米国の覇権に挑戦するという目標について語り始め、それがもたらすかもしれないリスクについて語り始めた。

このことは、中国とアメリカの間に橋を架けようとする人々に難題を突きつけた。2019年、シノベーション・ベンチャーズはシリコンバレーにあったオフィスを閉鎖した。同年10月、米国政府は中国のAI産業に対して直接行動を起こし、同社の顔認識技術の政府利用をめぐってMegviiに制裁を科した。

架け橋の再構築

01.AIのオープンソースAIモデル「Yi-34B」のリリースにより、リーは再び架け橋となった。Yi-34Bがリリースされてから数カ月後、欧米の開発者たちから改良版が出始め、ハギング・フェイスモデルのリーダーボードでその性能を上回るようになった。アメリカやヨーロッパの一部の国々は、北京語と英語の両方に堪能な中国のモデルをベースにAI戦略を構築している。

ハギング・フェイス社のCEOであるクレマン・デランジュ氏は、01.AIのモデルがリリースされた直後の11月のブリーフィングで、「これは本当に優れたモデルであり、多くの人々がこれをベースにしている」と語った。

デランジュ氏は、オープンソースの言語モデルは急速に改善されており、一部の特殊なタスクでは市場をリードするOpenAIのGPT-4よりも優れていると述べた。しかし同氏は、オープンソースの優れたモデルの多くは米国外から生まれたものであると指摘し、01.AIはそのモデルの周辺に生まれるイノベーションから利益を得ることができると述べた。「米国企業はオープンで透明性が少し低くなっている。しかし、AIには、企業がオープンソースをリリースすればするほどエコシステムが発展し、AIを構築する上でより強力になるという興味深いダイナミズムがある。」

メタ社のLlama 2は、米国企業によるトップクラスのオープンソースモデルの珍しい例であり、OpenAI、Microsoft、Google、および生成AIに多額の投資をしている他の主要な技術ライバルに対するソーシャルメディアの巨人の挑戦である。メタ社は、いくつかの注意点を除き、商用再利用を許可するライセンスの下でAI言語モデルをリリースすることを選択した。

Yi-34BとLlama 2は、単にオープンソースのAIモデルをリードしているだけではないようだ。中国語モデルがリリースされて間もなく、一部の開発者は01.AIのコードに以前メタ社のモデルに関する記述があったことに気づいたが、後に削除された。01.AIのオープンソース責任者であるリチャード・リンは後に、同社はこの変更を元に戻すと述べ、同社はYi-34Bのアーキテクチャの一部についてLlama 2から派生していることを認めた。他の主要な言語モデルと同様、01.AIのものは2017年にグーグルの研究者によって初めて開発された「トランスフォーマー」アーキテクチャに基づいており、中国企業はそのコンポーネントをLlama 2から派生させた。01.AIの広報担当者であるAnita Huang氏によると、同社が相談した法律専門家は、Yi-34BはLlama 2のライセンスの対象ではないと述べたという。メタ社はコメントの要請に応じなかった。

Yi-34Bがどの程度Llama 2から借用しているかはともかく、中国のモデルは与えられたデータによって機能が大きく異なる。「YiはLlamaのアーキテクチャーを共有していますが、そのトレーニングは全く異なっており、格段に優れています」とAbacus.AIのAI研究者でオープンソースのAIプロジェクトを追っているエリック・ハートフォードは言う。

メタ社のLlama 2との関係は、リーが中国のAIの専門知識に自信を持っているにもかかわらず、中国が現在、生成AIにおいてアメリカの後を追っていることを示す一例である。中国のAIシーンを研究するジョージ・ワシントン大学のジェフリー・ディン助教授によれば、中国の研究者は何十もの大規模な言語モデルを発表しているが、業界全体としてはまだアメリカに遅れをとっているという。

「欧米企業が大規模な言語モデルの開発で大きな優位性を得たのは、公開リリースを活用して問題をテストし、ユーザーからのフィードバックを得て、新しいモデルへの関心を高めることができたからです」と彼は言う。ディン氏らは、中国のAI企業は米国の企業よりも規制や経済的な逆風に直面していると主張している。

先週ダボスで開催された世界経済フォーラムでリーは、このメッセージが本国に伝わることを期待してか、どの国にとってもAIを最大限に活用するためにはオープンなアプローチが不可欠だと主張した。

「もしオープンソースでなければ、AIは、研究者、学生、起業家、趣味でやっている人たちだけでなく、どの国でも活用できるようになる。もしオープンソースがなかったら、彼らは何を学ぼうとするのでしょう。なぜなら、彼らが次のクリエイター、発明家、アプリケーション開発者になるかもしれないからです。」

もし彼が正しければ、01.AIのテクノロジーとその上に構築されたアプリケーションは、中国のテクノロジーをテック産業の次のフェーズの中心に据えることになるだろう。

www.wired.com