Chapter 1
Xアルゴリズムの全体像と思想
推薦システムの設計思想から3層アーキテクチャ、8段階パイプラインまでを解説します。
1.1なぜアルゴリズムを理解すべきか
あなたがXを開くたびに、画面には何百万もの投稿の中から選ばれた数十件だけが表示されます。この「選別」を行っているのが、推薦アルゴリズムです。
多くの人は、Xのタイムラインを「フォローしている人の投稿が時系列で流れてくる場所」だと考えています。しかし現実は大きく異なります。Xは2016年から、機械学習を用いた推薦システムを導入しており、あなたが見る投稿は、高度なアルゴリズムによって厳選されたものです。
2023年3月、イーロン・マスク氏の決定により、Xの推薦アルゴリズムがオープンソースとして公開されました。これにより、私たちは初めて「なぜある投稿が広く表示され、別の投稿が埋もれるのか」を技術的に理解できるようになりました。
本書は、2026年1月時点で公開されているXの推薦アルゴリズムのオープンソースコードを徹底解析し、アルゴリズムの仕組みを実践的な戦略に落とし込んだガイドです。
1.2Xの設計思想:滞在時間の最大化
Xの推薦アルゴリズムには、明確な設計思想があります。それは「ユーザーの滞在時間を最大化する」ことです。
これは単純な「いいねが多い投稿を上に表示する」というものではありません。アルゴリズムは以下を予測しています:
1. 即時反応の予測
- ・いいねするか?
- ・リプライするか?
- ・詳細を開くか?
2. 後続行動の予測
- ・Xを続けて使うか?
- ・別のアプリに移るか?
3. 長期的価値の予測
- ・フォローにつながるか?
- ・ミュート・ブロックされるか?
つまり、アルゴリズムは「今この瞬間の反応」だけでなく、「この投稿がユーザーの行動にどう影響するか」までを予測しているのです。この理解は極めて重要です。
1.33層アーキテクチャの全体像
Xの推薦システムは、3つの主要コンポーネントで構成されています。
役割:リクエスト受付と最終タイムライン組み立て
役割:8段階パイプライン処理(候補生成・フィルタ・スコアリング・ランキング)
役割:機械学習による19種類のエンゲージメント予測
Home Mixer:オーケストラの指揮者
Home Mixerは、ユーザーがXを開いた瞬間にリクエストを受け取る「入口」です。Rustで書かれた高速なサービスで、各コンポーネントに処理を依頼し、結果を統合してタイムラインを構築します。
Thunder:パイプラインの実行者
Thunderは、推薦処理の中核を担うコンポーネントです。8段階のパイプラインを通じて、数百万の候補から数十件の「あなたに最適な投稿」を選び出します。
Phoenix:予測の頭脳
Phoenixは、機械学習モデルを用いてエンゲージメント予測を行うコンポーネントです。「この投稿を見たユーザーは、いいねするか?リプライするか?」といった19種類の行動確率を予測します。
1.48段階パイプラインの流れ
Thunderが実行する8段階のパイプラインを詳しく見ていきましょう。
Candidate Source Selection
どこから候補を集めるかを決定
Candidate Retrieval
候補となる投稿を大量に取得
Pre-Filtering
明らかに不適切な候補を除外
Feature Extraction
各候補の特徴量を抽出
ML Scoring (Phoenix)
機械学習による予測スコアリング
Post-Filtering
スコア後の品質フィルタリング
Ranking
最終的な順位決定
Blending & Serving
最終タイムラインの構築
この8段階のパイプラインは、1リクエストあたり数百ミリ秒で処理されます。あなたがXを開くたびに、このすべての処理が裏側で実行されているのです。
1.5オープンソース化と透明性
2023年3月31日、イーロン・マスク氏のツイートとともに、Xの推薦アルゴリズムがGitHubで公開されました。
├── home-mixer/ # Home Mixer(Rust)
├── thunder/ # Thunder パイプライン(Rust)
├── phoenix/ # Phoenix MLモデル(Python/JAX)
└── candidate-pipeline/ # 候補生成パイプラインただし、すべてが公開されているわけではありません:
非公開の要素
- ・学習済みモデルの重み(パラメータ)
- ・実際の特徴量定義の一部
- ・インフラストラクチャの詳細
- ・リアルタイムで更新される閾値
つまり、私たちが見ることができるのは「システムの設計図」であり、「学習された知識」ではありません。しかし、設計図だけでも、アルゴリズムがどのように動作するかを深く理解することは可能です。
1.6この章のまとめ
Xのアルゴリズムは「滞在時間最大化」を目指している
単純ないいね数ではなく、ユーザー行動全体を予測
3層アーキテクチャで構成されている
Home Mixer → Thunder → Phoenix
8段階のパイプラインで投稿が選別される
候補収集 → フィルタリング → スコアリング → ランキング
2023年にオープンソース化された
設計図は公開、学習済みパラメータは非公開
よくある質問
Q1: アルゴリズムを理解することで、具体的にどんなメリットがありますか?
アルゴリズムを理解することで、自分の投稿がなぜ表示されるのか/されないのかを論理的に分析できるようになります。具体的には、どのようなエンゲージメント(いいね、リプライ、リツイートなど)がスコアに影響するかを把握し、投稿のタイミング、内容、形式を最適化できます。「なぜバズったのか」「なぜ伸びなかったのか」を推測ではなく技術的根拠に基づいて分析できるため、再現性のある戦略を立てることが可能になります。
Q2: Home Mixer、Thunder、Phoenixの役割の違いを簡単に説明してください
Home Mixerは「受付係」で、ユーザーのリクエストを受け取り、最終的なタイムラインを組み立てて返します。Thunderは「処理係」で、8段階のパイプラインを通じて数百万の候補から最適な投稿を選別します。Phoenixは「予測係」で、機械学習モデルを使って「この投稿を見たらユーザーはどう反応するか」を19種類の確率として予測します。3つが連携することで、あなたに最適なタイムラインが生成されます。
Q3: 8段階パイプラインの中で最も重要なステージはどれですか?
すべてのステージが重要ですが、特に「Stage 5: ML Scoring(Phoenix)」が核心部分です。ここでGrok Transformerモデルが19種類のエンゲージメント確率を予測し、各投稿にスコアを付けます。このスコアが最終的なランキングの基礎となるため、Phoenixの予測精度がタイムラインの質を決定づけます。
Q4: なぜXは2023年にアルゴリズムをオープンソース化したのですか?
イーロン・マスク氏は「透明性」を重視しており、ユーザーがアルゴリズムの仕組みを理解できるようにすることで信頼性を高めることを目指しました。また、オープンソース化により外部の開発者やセキュリティ研究者からのフィードバックを得られる利点もあります。ただし、学習済みモデルの重み(パラメータ)や一部の特徴量定義は非公開のままです。
Q5: 「滞在時間最大化」という設計思想は、投稿戦略にどう影響しますか?
滞在時間最大化を理解すると、単純に「いいね」を集めるだけでは不十分だとわかります。アルゴリズムは「この投稿を見た後、ユーザーがXを使い続けるか」まで予測しています。詳細を開かせる(クリックさせる)投稿、リプライを促す投稿、フォローにつながる投稿が高く評価されます。
理解度チェック
Xの推薦システムの設計思想は?
Phoenix MLモデルの主な役割は?
8段階パイプラインで最初に大量候補を集めるステージは?
Thunderはどの言語で書かれている?
オープンソースで公開されていないものは?