スペック駆動テスト：要件ファーストのQAがスクリプトファーストのテストより優れている理由

Feb 10, 2026Yunhao Jiao

自動テストの考え方には、根本的に異なる2つのアプローチがあります。1つ目は、コードが行っていることを確認するスクリプトを書くというもの。2つ目は、コードが行うべきことの仕様を書き、その仕様に対してコードを検証するというものです。

ほとんどのテスト自動化は前者です。スペック駆動テストは後者です。その違いは、必要になるまで微妙に見えますが、必要になったときにはすべての違いをもたらします。

スクリプトファーストテストの問題点

スクリプトファーストテストは、自動化テストにおける主流のアプローチです。エンジニアはコードを確認し、その動作を観察し、その動作を確認するテストを記述します。テストは記述した瞬間から通過します。なぜなら、テストが検証する動作は現在存在する動作そのものだからです。

これがまさに問題の本質です。スクリプトファーストテストは実装を確認するものです。リグレッション（動作していたものが動作しなくなる状態）を検出することはできても、インテントギャップ（動作はしているが意図した動作とは異なる状態）を検出することはできません。

簡単な例を考えてみましょう。チェックアウトフォームでは請求先住所の入力が必須であるとします。開発者が誤ってバリデーションを省略した場合、フォームは請求先住所なしで送信されてしまいます。この実装に対して記述されたスクリプトファーストテストは、請求先住所なしでフォームが送信されることを「正しい動作」として確認します。テストは通過し、バグはそのままリリースされます。

「チェックアウトを完了するには請求先住所が必要である」という要件から記述されたスペックドリブンテストは、請求先住所なしでフォームが送信された時点で失敗します。バグはリリース前に検出されます。

この違いは単なる理論上の話ではありません。インテントギャップ、つまりコードが内部的には一貫しているにもかかわらず要件と一致しないケースは、AIコーディングツールが最も頻繁に引き起こす障害モードです。スクリプトファーストテストは、構造的にインテントギャップを検出することができません。

スペックドリブンテストとは何か

スペックドリブンテスト（要件駆動テストや仕様ベーステストとも呼ばれます）とは、既存の実装を調べるのではなく、ユーザーストーリー・受け入れ基準・機能仕様といったプロダクト要件から直接テストを導き出すアプローチです。

テストはコードが存在する前に、要件をもとに記述（または生成）されます。エージェンティックテストの場合は、要件からテストが生成され、AIコーディングツールによって生成された実装と照合されます。いずれの場合も、実装ではなく要件が信頼できる唯一の情報源となります。

スペックドリブンテストが問うのは「コードは本来すべきことをしているか？」という問いです。スクリプトファーストテストが問うのは「コードは現在していることを引き続きしているか？」という問いです。この二つは本質的に異なる問いです。

スペックドリブンテストがAIコーディングツールに適している理由

AIコーディングエージェントはプロンプトに基づいてコードを生成します。プロンプトは非公式な仕様です。仕様の品質が高いほど、出力の品質も高くなり、検証の精度も向上します。

TestSpriteはスペックドリブンテストをコアのアーキテクチャ原則として構築されています。エージェンティックテストエンジンはPRD・ユーザーストーリー・要件ドキュメントを読み込み、ソフトウェアが何をすべきかの内部構造化モデルを構築し、そのモデルに対して実装を検証するテストを生成します。

これは、コードを解析してその動作に基づいてテストを生成するテストツールとは異なるアプローチです。コード解析はスクリプトファーストテストを生成します。要件解析はスペックドリブンテストを生成します。

AIネイティブなチームにとって、これが重要な理由があります。それは、最も検出価値の高いバグが、AIが「もっともらしいが誤ったもの」を生成した場合に発生するバグだからです。そのようなバグは仕様と実装のギャップにのみ現れます。そのギャップを可視化するには、両方が揃っていなければなりません。

スペックドリブンテストの実践的な進め方

ステップ1：仕様を信頼できる唯一の情報源とする

スペックドリブンテストは明確な要件成果物から始まります。TestSpriteでは以下を利用できます：

正式なPRD（プロダクト要件ドキュメント）
受け入れ基準を含むユーザーストーリー
アプリケーションの意図した動作を説明するREADME
期待されるエンドポイントの動作を説明するAPIドキュメント
または、よりシンプルなプロジェクトの場合、コードベース自体 — 正式な仕様が存在しない場合、TestSpriteはコード構造から意図を推定できます

テストの品質は仕様の明確さに直接比例します。曖昧な要件からは曖昧なテストしか生まれません。「未認証ユーザーが/dashboardへのアクセスを試みた場合、/loginにリダイレクトされる」といった具体的な受け入れ基準からは、具体的で意味のあるテストが生まれます。

ステップ2：要件からのテスト生成

TestSpriteのエージェンティックテストエンジンは仕様を解析し、テスト計画を生成します。この計画には以下が含まれます：

テスト可能なシナリオとしての各ユーザーストーリーまたは受け入れ基準
ポジティブケース（機能が説明通りに動作する）
ネガティブケース（機能が無効な入力や不正アクセスを正しく処理する）
仕様から導出されたエッジケース（境界値・空の状態・並行操作）

このテスト計画は実行前にレビューおよび調整が可能です。エンジニアはテストケースの追加・削除・変更を行えます。

ステップ3：実装に対する実行

テストはモックやシミュレーションではなく、実際のアプリケーションに対して、分離されたクラウドサンドボックス上で実行されます。実際のアプリケーションの動作が、仕様から導出された期待される動作と照合されます。

テストの失敗は仕様違反を意味します。コードが仕様の要求とは異なる動作をしています。これらは常に意味のある失敗であり、仕様として定義されたものと実際に構築されたものとのギャップを示しています。

ステップ4：失敗の分類と修正ループ

スペックドリブンの失敗は3つのカテゴリに分類されます：

仕様違反 — 実装が要件に一致していない。これは実際のバグです。修正の推奨事項が生成され、MCP経由でコーディングエージェントに送信されます。

仕様の曖昧さ — テストの期待値が曖昧な要件から導出された。これは仕様の品質上の問題を浮き彫りにし、コードの修正ではなく要件の明確化を促します。

テストの脆弱性 — アプリケーションではなく、テストのメカニズム（ロケーターのずれ、タイミングの問題）が失敗した。セルフヒーリングによって透過的に解決されます。

スペックドリブンテストとテスト駆動開発（TDD）の違い

スペックドリブンテストとTDDは共通の原則を持っています。それは、実装の前または実装から独立して、望ましい動作を定義するという原則です。実践上の違いは、テストの作成者にあります：

TDDでは、エンジニアはコードを書く前に手動でテストを作成します。これには多大な時間投資と規律が必要であり、AIコード生成の速度にはスケールしません。

仕様駆動のエージェンティックテストでは、テストは要件から自動的に生成されます。エンジニアは仕様を記述するだけで（コーディングエージェントへのプロンプトとして書くものと同じです）、エージェンティックテストエンジンがテストを生成します。TDDのメリット——要件ファーストによる検証——が、手動テスト作成のオーバーヘッドなしに実現されます。

AIネイティブなチームにとって、仕様駆動のエージェンティックテストは、AI開発速度においてTDDの原則を実践的に実現する手段です。

仕様品質への投資

仕様駆動テストは、仕様の品質をテストカバレッジとして直接可視化します。これはバグではなく、意図された特性です。

コーディングセッションの前により明確な要件への投資を行うチームは、二つのことを発見します。より優れたAI生成コード（コーディングエージェントにより多くのコンテキストが与えられるため）と、より良いテストカバレッジ（エージェンティックテストエンジンがテストを導出するための情報が増えるため）です。仕様品質への投資は、双方向に大きな効果をもたらします。

意味のある仕様駆動テストに必要な最低限の仕様：

機能説明：何を構築するのか？
受け入れ基準：成功とはどのような状態か？
エッジケース：問題を引き起こす可能性のある入力や状態は何か？
不変条件：常に満たされていなければならないことは何か？

コーディングセッション前の15分で書かれた1ページの要件ドキュメントがあれば、包括的な仕様駆動テストカバレッジを生成するには十分です。代替案——AI生成コードに後からテストを当てはめること——はより多くの時間がかかり、見落としを生むスクリプトファーストなテストしか生み出しません。

はじめ方

TestSpriteによる仕様駆動テストは、要件ドキュメントから始まります。MCPを通じてTestSpriteをリポジトリに接続し、PRDやユーザーストーリーを指定するだけで、仕様から派生したテストカバレッジが自動的に生成されます。

こちらから始める →