Anthropicは、AIアシスタント「Claude」がユーザーのコンピューターを直接操作してタスクをこなせる新機能を公開した。公式Xアカウントは、「Claude can now use your computer to complete tasks. It opens your apps, navigates your browser, fills in spreadsheets」と投稿し、Claudeがアプリ起動、ブラウザー操作、表計算入力まで担えるようになったと案内している。

CoworkとClaude Codeで利用可能、まずはmacOS向け研究プレビュー

Anthropicのヘルプセンターによると、この機能は「Cowork」と「Claude Code」で利用でき、macOS版のClaude Desktopアプリで研究プレビューとして提供される。対象プランはProとMaxで、Windows対応は今後提供予定とされている。Cowork自体は今年1月にClaude Desktop上の研究プレビューとして始まり、ローカルPC上で知識労働を処理する用途へ広がってきた。

コネクターがない作業を“画面操作”で補う

Anthropicは、この機能を「コネクターや専用ツールがない作業を埋める手段」と位置付けている。CoworkではまずGmail、Google Drive、Slackなどのコネクターを優先し、次にChromeブラウザー操作を試し、それでも足りない場合に画面そのものを見てクリック、入力、アプリ操作を行う構造である。Anthropicは、Slack連携で直接メッセージを読む方が速くて正確であり、画面操作はより時間がかかり、誤りも起きやすいと説明している。

想定用途は資料作成からUI検証まで

公式の説明では、ローカルファイルと接続済みツールを使った競合調査レポートの作成、スマホシミュレーター上でのアプリ検証、複数ソースからのデータを表計算へ転記して保存する作業、さらには専用コネクターのない社内ダッシュボードや特殊ツールの操作などが想定ユースケースとして挙げられている。つまり、Claudeを単なるチャット相手ではなく、デスクトップ上で実作業を代行するエージェントとして使う方向が鮮明になった。

利用時はアプリごとの許可が必要、安全面では制約も多い

一方で、Anthropicは安全面の注意も強く促している。Claudeは新しいアプリへアクセスするたびにユーザーの許可を求め、一部の機密性の高いアプリは初期状態でブロックされる。投資・取引、機密データ入力、顔画像の収集などは避けるよう訓練されているが、同社は「安全策は完全ではない」と明記している。加えて、画面操作のためにスクリーンショットを取得するため、表示中の個人情報や機密情報も見える可能性があるとして、金融・医療・法務・他人の個人情報を含むアプリには使わないよう推奨している。

“仮想マシン内の作業”から“実デスクトップ操作”へ踏み込んだ

Coworkはもともと、ローカルPC上で動きつつも、コード実行やファイル処理の一部を隔離VM内で扱う設計だった。今回のcomputer useは、その外側に出て、実際のデスクトップやアプリを直接操作する点が大きい。Anthropic自身も、通常のCoworkが使う仮想マシン外で動作し、実デスクトップに触れるため、従来以上に慎重な監視が必要だと説明している。

背景には2024年から進めてきた「computer use」開発がある

Anthropicは2024年10月、Claude 3.5 Sonnet向けにAPIベースの「computer use」を公開し、画面を見てカーソルを動かし、ボタンをクリックし、文字入力する能力を開発者向けベータとして提供していた。当時から、一般的なPCソフトを人間のように扱えることが新しさとして打ち出されており、今回の公開はその能力をCoworkやClaude Codeという自社プロダクト側に本格的に持ち込んだ動きといえる。

今回の発表が意味するもの

今回の機能追加は、AIがAPIやプラグイン経由で作業する段階から、ユーザーの実際の作業環境そのものを扱う段階へ進み始めたことを示している。もっとも、Anthropic自身が研究プレビューと位置付けている通り、複雑な多段タスクでは再試行が必要で、デスクトップは起動したままにしておく必要もある。とはいえ、Claudeが「画面の向こう側」で実際に働く方向へ大きく踏み出したことは確かであり、今後のAIエージェント競争でも重要な節目になりそうだ。

出典

https://twitter.com/claudeai/status/2036195789601374705?s=20