1) 計画:意図をチェックリストに変換する
計画は短く具体的であるべきです。良い計画には境界(やらないこと)、チェックポイント(「完了」とみなす条件)、必要な入力(ログイン情報、URL、期間)が含まれます。
入力
どのウェブサイト、どのアカウントコンテキスト、どの時間範囲、どのフィールドが重要か。
制約事項
機密性の高いフォームは避ける、最大ページ数を設定する、送信前に確認する、ワークスペースの範囲を守る。
完了の定義
どのような出力を希望しますか:CSV、レポート、要約、または検証済みの完了したワークフロー。
2) 実行:実際のUI操作
「実行」とは、ブラウザが実際に操作を行うことを意味します:ボタンをクリックしたり、フォームに入力したり、複数ページのフローを進めたり、動的なUIを扱ったりします。製品は現在行っている操作を表示するべきです—つまり、あなたが操作を停止できるように。
ナビゲーション
ページを開く、タブを切り替える、リンクをたどる、リダイレクトから復元する。
フォーム入力
フィールドを丁寧に入力し、確認して、あなたの承認なしに送信しません。
抽出
アクセスできるページから構造化データを取得し、ソースを保持します。
マルチステップワークフロー
A → B → C をチェックポイント、リトライ、タイムアウト付きで実行します。
3) 検証: 「完了」はチェック済みの状態です
検証は、エージェントと推測者を分けるものです。「検証済み」とは、ブラウザがページの状態を確認し、出力が存在することを確かめ、証拠(例:UIの変化、エクスポートされたファイル、出典付きの要約)を提示することを意味します。
状態チェック
期待されるUIが表示されていますか?送信は成功しましたか?結果は見えていますか?
証拠
監査可能なステップログ、ソースリスト、スナップショット、またはリンク付きレポートなど。
フォールバック
検証に失敗した場合、エージェントは黙って「完了」するのではなく、指示を求めます。
どんなエージェント型AIブラウザでも試せる3つの実用的なワークフロー
深さと制御力を示すタスクで評価してください。これらをクリアすれば、「エージェンティック」は本物である可能性が高いです。
ワークフローA:リサーチブリーフ
検索 → 10件の情報源を開く → 主要な主張を抽出 → 引用付きで要約 → 1ページのブリーフを作成。
ワークフローB:オペレーション
ログイン → ダッシュボードへ移動 → フィールドを更新 → プレビューを確認 → 提出(確認ステップあり)。
ワークフローC:繰り返し可能なルーチン
毎日:情報源を開く → 変更点を取得 → 結果を記録 → 一貫したレポート形式で共有。
次のステップ:本格的な実行のために設計されたブラウザを試してみましょう
「エージェント型AIブラウザ」の目的が繰り返しのウェブ操作をやめることなら、Tabbitは実用的なスタート地点です。 実行、ワークスペース、リサーチ/レポート作成が可能です。