フィルターシステム

第6章:12種類のフィルター

スコアリングの前に立ちはだかる「関門」を理解する。一つでも引っかかれば、どんなに良いコンテンツでも完全除外されます。

6.1 フィルターの位置づけ

フィルターは、候補となる投稿がスコアリングされる前に適用される「関門」です。 スコアリングが「どれくらい良いか」を連続的な値で評価するのに対し、 フィルターは「通過か除外か」のバイナリ判定(二値判定)を行います。

処理の流れ

1
候補投稿
数百万件
2
12種類のフィルター
バイナリ判定
3
スコアリング
連続値で評価
4
最終表示
数十件

フィルター(バイナリ判定)

「通過」か「除外」の二択。一つでも引っかかれば候補から完全除外。スコアが高くても関係ありません。

スコアリング(連続値)

0.5、1.2、3.8などの連続的な値。スコアが低くても表示される可能性はある

6.2 コンテンツ品質フィルター(4種類)

コンテンツそのものの品質・安全性を判定するフィルターです。

フィルター名判定対象判定結果影響
SafetyFilter暴力、ヘイト、テロ、違法行為SAFE / SENSITIVE / UNSAFEUNSAFEは完全除外
NsfwFilter性的コンテンツ、成人向け一般 / 要年齢確認 / 禁止禁止は完全除外
SpamFilter大量投稿、自動化、リンク乱用正常 / 疑わしい / スパムスパムはアカウント凍結も
QualityFilter情報価値、オリジナリティ高品質 / 標準 / 低品質低品質は除外orリーチ制限

SafetyFilterの判定対象

  • 暴力的なコンテンツ
  • ヘイトスピーチ
  • テロリズム関連
  • 自傷・自殺関連
  • 違法行為の助長

6.3 ユーザー関係フィルター(3種類)

ユーザー間の関係性に基づくフィルターです。

フィルター名対象ロジック影響
BlockedFilterブロック関係双方向でブロックがあれば除外完全除外
MutedFilterミュート関係、キーワードミュート設定に該当すれば除外除外(相手に非通知)
FollowFilterフォロー関係「フォロー中のみ」設定時に適用設定依存

ブロックとミュートの違い

ブロック(強)

  • - 双方向で完全遮断
  • - 相手にも見えなくなる
  • - 最も強い関係遮断

ミュート(緩)

  • - 自分からだけ見えない
  • - 相手には通知されない
  • - キーワードミュートも可

6.4 コンテンツタイプフィルター(3種類)

コンテンツの種類や属性に基づくフィルターです。

フィルター名対象動作影響
MediaTypeFilterテキスト、画像、動画、リンクユーザーの好みを学習スコア調整が主
LanguageFilter投稿の言語言語不一致で大幅スコア減実質除外に近い
TopicFilterトピック分類興味/ミュート設定を参照ミュートは完全除外

言語フィルターの仕組み

# 判定ロジック

user_languages = ["ja", "en"]

tweet_language = "fr"

if tweet_language not in user_languages:

score *= 0.1 # 90%減

6.5 時間・鮮度フィルター(2種類)

時間に関連するフィルターです。

フィルター名対象動作影響
FreshnessFilter投稿の経過時間48時間超は原則除外、24時間超は0.5倍新しさ重視
DuplicateFilter重複・類似コンテンツ同一内容の後続投稿を除外重複は除外

鮮度による影響タイムライン

1.2x
1時間以内
1.0x
24時間以内
0.5x
24-48時間
除外
48時間超

6.6 フィルター回避の鉄則

避けるべきこと

  • - 暴力的・攻撃的な表現
  • - 差別的・ヘイト的な内容
  • - 同一内容の繰り返し投稿
  • - 短時間での大量投稿
  • - 不自然なリンクの多用
  • - 意味のない短文の連投

意識すべきこと

  • - 投稿言語とターゲット層を一致
  • - 24時間以内の新鮮な投稿
  • - 毎回オリジナルの内容
  • - 引用RTには独自意見を追加
  • - 多言語は分けて投稿
  • - ブロックされる行為を避ける

覚えておくべきフィルターの特性

バイナリ判定
通過か除外か中間なし
累積効果
アカウント信頼に影響
復旧の難しさ
予防が最重要
透明性の欠如
通知されない

6.7 この章のまとめ

重要ポイント

  • フィルターは「バイナリ判定」 - 通過か除外かの二択
  • 12種類のフィルター(品質4 + 関係3 + タイプ3 + 時間2)
  • 一つでも引っかかれば完全除外
  • 予防が最重要 - 復旧は困難
Q

フィルターの「バイナリ判定」とはどういう意味ですか?

A

バイナリ判定とは、「通過」か「除外」かの二択で判定される仕組みです。スコアリングのような連続的な数値ではなく、完全に白か黒かで判断されます。どんなに高品質なコンテンツでも、1つのフィルターに引っかかれば候補から完全に除外され、誰のタイムラインにも表示されなくなります。

Q

SafetyFilterで除外される内容は何ですか?

A

暴力的なコンテンツ、ヘイトスピーチ、テロリズム関連、自傷・自殺関連、違法行為の助長などです。判定結果は「SAFE」「SENSITIVE」「UNSAFE」の3段階で、UNSAFEと判定されると完全に除外されます。

Q

SpamFilterに引っかからないためのコツは?

A

(1)同一内容の繰り返し投稿を避ける (2)短時間での大量投稿を控える (3)不自然なリンクを多用しない (4)フォロー/アンフォローを繰り返さない (5)エンゲージメント購入をしない。予防が最も重要です。

Q

言語フィルターはどのように動作しますか?

A

投稿の言語が自動検出され、ユーザーの言語設定と比較されます。言語が一致しない場合、スコアが約0.1倍(90%減)になるため、実質的にほとんど表示されなくなります。

Q

フィルターに引っかかったことはどうやってわかりますか?

A

直接通知されることはありません。間接的なサインとして、インプレッションが極端に少ない、エンゲージメントがほぼゼロ、検索結果に表示されない、他のアカウントから見えないなどがあります。

理解度チェック

1

フィルターの判定方式は?

2

フィルターの総数は?

3

SpamFilterで検出されるものは?

4

FreshnessFilterで優先されるのは?

5

ブロック関係のフィルターの動作は?

回答済み: 0 / 5
Xアルゴリズム攻略ガイド