ランキングをリセットせずにキーワードテストを実施する方法

ターゲットにする価値のあるキーワードを見つけたとします。競合がそのキーワードでランキングしているのに、自分のアプリはしていないのかもしれません。あるいは、キーワードトラッキングによって、実需があり、なおかつ勝てる見込みのある競合状況を持つ機会として浮かび上がったのかもしれません。

次のステップは明白に思えます。メタデータを更新してテストすることです。

問題は、ほとんどの開発者がテストのやり方を間違えているという点です。1 回のアップデートで 3 つの要素を変更し、1 週間後に確認して結論を出し、さらに 3 つの要素を変更する。こうしたサイクルを 4 回繰り返した頃には、実際に何がランキングを動かしたのか、まったく分からなくなっています。

ここでは、読み取り可能なシグナルを生み出すキーワードテストの実施方法を紹介します。

なぜメタデータの更新のたびに時計がリセットされるのか

メタデータの更新を App Store に提出すると、Apple は新しいシグナルに基づいてアプリを再インデックスします。このインデックス処理には時間がかかります。7 日目の時点では、ランキングはまだ移行中です。14 日目になると、より安定してきます。21 日目には、その動きを再インデックスによる一時的な現象ではなく、新しいメタデータを反映した代表的なものとして信頼できます。

これは緩やかな目安ではありません。Apple のアルゴリズムが変更を処理する仕組み上の、実務的な制約です。

ここから導かれる結論はこうです。1 日目にメタデータの更新を提出し、10 日目にもう一度提出すると、最初の更新のインデックスが完了する前に 2 回目の更新が時計をリセットしてしまいます。結果として、2 つの実験が重なり合い、どちらからもクリーンなシグナルが得られなくなります。

最も明確なキーワードデータを得ている開発者は、21 〜 42 日ごとに 1 回だけ更新を行っています。それより速くはしません。この制約こそが、データを有用なものにしているのです。

3 つのフィールド、影響の小さい順から大きい順へ

すべてのメタデータ変更が、既存のランキングに対して同じリスクを持つわけではありません。

キーワードフィールド (100 文字)。 ここは新しいキーワードをテストする上で最もリスクの低い場所です。ユーザーには表示されないため、ここでの変更はクリックスルー率やコンバージョンに影響しません。主に検索ランキングのためにインデックスされます。まだ確証のないキーワードをテストする場合は、ここから始めましょう。21 日経ってもそのキーワードでランキングが動かなければ、ユーザーの目に触れる部分を一切いじることなく、何かを学べたことになります。

サブタイトル (30 文字)。 サブタイトルは検索結果やプロダクトページに表示されます。ここでの変更は、キーワードのインデックスと、ユーザーがタップする前に読むコピーの両方に影響します。サブタイトルの変更をテストするのは、キーワードフィールドのレベルでキーワードを検証した後、もしくはそのキーワードを目に見える位置に据える確信が十分に得られたときにしましょう。

タイトル (30 文字)。 タイトルはランキングへの影響が最も大きく、検索結果、ストアリスティング、デバイスのホーム画面でユーザーが最初に目にするものです。タイトルの変更は、良くも悪くも最大のランキング変動をもたらします。タイトルを変更するのは、キーワードフィールドまたはサブタイトルのレベルでそのキーワードが機能すると確認できた後、そして 21 日間のフル再インデックス期間を受け入れる準備ができたときだけにしてください。

手順はこうです。まずキーワードフィールド、次にサブタイトル、最後にタイトル。検証からコミットメントへと段階的に進めていくのです。

クリーンなテストを実施する

クリーンなテストとは、1 回の更新サイクルで 1 つの変数だけを変えるものです。

具体的には次のとおりです。

テストしたいキーワードを特定します。
現在のキーワードフィールドから、最もパフォーマンスの低いキーワードを削除します。
その代わりに新しいキーワードを追加します。
更新を提出します。日付を記録します。
21 日間待ちます。
新しいキーワードのランク順位をベースラインと比較して確認します。

これで実験は完了です。1 つのキーワードを入れ、1 つのキーワードを出し、1 つの 21 日間のウィンドウで測る。それだけです。

Marteso のバージョン履歴は、各メタデータ更新を自動的に記録します。21 日目には該当バージョンを呼び出し、何が変わったのかを正確に確認でき、メモや記憶から文脈を組み立て直すことなく、前後のキーワードランキングを比較できます。

21 日目にシグナルを読み取る

21 日目には、3 つの結果のいずれかを見ることになります。

キーワードがプラスに動いた。 ランキングに入った、または順位が改善しました。さらにもう 1 サイクル維持し、サブタイトルで補強すればその成果をさらに伸ばせるかどうかを検討しましょう。

キーワードが動かなかった。 横ばいのままか、まったくランキングに入りませんでした。これは失敗したテストではなく、データです。そのキーワードは十分な重みでインデックスされるためにタイトルレベルの配置を必要とするのかもしれませんし、評価やエンゲージメントからのより多くの関連性シグナルを必要とするのかもしれません。結果を記録し、別の候補をそのスロットにローテーションで入れましょう。

キーワードは動いたが、他のキーワードが落ちた。 トレードオフが生じています。新しい語句が、同じ意味クラスター内の既存キーワードとインデックスの重みを奪い合っているのかもしれません。次の更新を行う前に、戦略的にどちらのランキングがより重要かを判断しましょう。

テストを読み取り不能にする唯一のミス

うまくいかないキーワードテストの多くは、キーワードが間違っていたから悪いのではありません。同じウィンドウ内で他の何かが変わってしまったから悪いのです。

アプリのアップデート、評価プロンプトの追加、スクリーンショットの変更などをキーワードの更新と一緒に提出すると、いずれも変数を持ち込むことになります。21 日目に観測されるランキングの変化が、キーワードによるものなのか、スクリーンショットによるものなのか、評価プロンプトによるものなのか、あるいはそれらの組み合わせによるものなのか、判別できなくなります。

可能な限り、キーワードテストは他の変更から切り離しましょう。アクティブなキーワードテストの最中にバグ修正を提出する必要がある場合は、バージョン履歴に記録しておきましょう。スクリーンショットとキーワードを同時に変更する必要がある場合は、テストのクリーンさが落ちることを受け入れ、結論を出す前により長いウィンドウを取りましょう。

複利的な効果

12 か月後に最も強力なキーワードカバレッジを持つ開発者は、年に一度の ASO 監査を行っているわけではありません。彼らは一貫した、単一変数のサイクルを回しているのです。

8 回のクリーンな 21 日間テストを経れば、最も弱い 8 つのキーワードスロットを、見つけた中で最もパフォーマンスの高い 8 つの代替候補に置き換えたことになります。それは証拠に基づいて構築されたキーワードフィールドです。各サイクルが次のサイクルをより速くしてくれます。なぜなら、何がうまくいき、何がうまくいかず、その理由は何だったのかという明確な記録が手元にあるからです。

Marteso のキーワードトラッキングは、キーワードごとの 7 日間および 30 日間のランクトレンドラインを、メタデータ更新履歴のすべてと並べて表示します。週ごとの習慣はシンプルです。現在のメタデータがまだ機能していることを確認し、行動する価値のあるシグナルがあれば見極め、次の単一変数テストを計画する。ほとんどの週は何も変わりません。本物のシグナルが現れたときには、それにクリーンに対応するための仕組みが整っているのです。

今日やるべき 1 つのこと

キーワードフィールドを開きましょう。現在の 100 文字の中で、最もパフォーマンスの低いキーワードを見つけます。サジェストや競合分析から、置き換え候補を 1 つ特定します。

1 回の更新を計画しましょう。そのキーワードを 1 つだけ入れ替え、提出し、日付を記録し、21 日後に再確認する。

これで完全なテストです。一度実施して、何が学べるかを見てみましょう。そして、もう一度実施するのです。