
Perplexity AIが開発したWebブラウザ「Comet」が先日リリースされました。
ウェイティングリストに登録して待っていた私のところにもようやく招待が来たのでさっそく使ってみました。
使ってみた感想などをつらつらと書いていきたいと思います。
Cometのインストール方法や機能についてはここでは書きません。
他の方々が記事にしてくださってますし、Perplexityに聞いてみるがいいかと。
Cometは使えるのか?
現時点では、既存のブラウザから乗り換えようと思えるほどではありませんでした。
以降で具体的なことを書きますが、Cometを使うことのメリットが限定的だと感じました。
使いづらいと感じたこと
期待したほどAIが賢くない
鳴り物入りのAIブラウザという印象でしたが、マルチモーダルではないんですね。
早々にマルチモーダル化してほしいです。
マルチモーダルなのかなと勘違いしていて、簡易的なブラウザゲームだったらプレイできるのではないかと考え、指示してみました。
しかし、ゲームをプレイできず、画面を上下にスクロールしたのちにページをリロードしただけでした。
CometのAssistantに聞いてみると「Canvasという技術で描画・操作するものは未対応」というような回答でした。
ちなみに、ChatGPTのエージェントモードではゲームの自動プレイができました。
そんなわけで、画面に映っているものを認識できないので、例えば画面に映っている写真の人物について質問するなどしても的外れな答え(ハルシネーション)が返ってくるだけです。
AIブラウザと聞いて、そのレベルを期待してしまうのは、今の時代だとまだ酷なのかもしれませんね。
また、インストール後に以下のような「Comet Assistantを試す」画面が表示されたので、試しに「トレンドニュースを検索する」をクリックしてみました。

その結果がこちら。

トレンドニュースの検索の仕方を教えてくれました。笑
トレンドニュースを検索してほしいのですけど…。
できないことを最初の画面に出すって一体。
出力形式に一貫性がない
他の多くのブラウザと同様に何かを調べたいときはアドレスバーに入力します。
Cometの場合(検索エンジンがデフォルトのPerplexityのままなら)、AIが回答の出力形式を判断してくれます。
「東京 明日 天気」と入力したら以下の画面が表示されました。AIがまとめた情報のみで、Web検索結果(天気情報サイトへのリンク)は表示されていません。

対して、「google pixel 10 pro」と入力したら以下の画面が表示されました。Web検索結果が3項目表示され、それに続いてAIがまとめた情報が表示されました。

AIが回答の出力形式を判断してくれるというと聞こえはいいのですが、ユーザーからしたら指示してみるまで回答形式がわからず、期待と異なる結果になるかもしれません。
(もし複数の天気情報サイトを自分で見て自分で天気を判断したい人がいるとしたら、Web検索結果の表示を期待するはず)
ユーザーが何かを調べようとした場合は、回答形式は、AIが都度判断するのではなく、「Web検索結果+AIの要約」のフォーマットで固定するなど、一貫性を持たせてほしいです。
音声入力が使いづらい
テキスト入力でうまく動作してくれた内容を、同じように音声入力で指示してみても期待通りに動作しませんでした。
音声を認識しているのに一切返答がなかったり、返答しても画面操作をしてくれなかったりしてまともに使えませんでした。
また、音声入力に関する言語選択の画面を見る限り、こちらの言語を自動認識してくれるわけではなさそうです。
OSの言語設定は日本語ですが、Cometのデフォルトの音声入力言語は英語になっていました。
それに気づいて変えるまでは全然反応してもらえませんでした。
なぜか日本語をURLエンコードしない
使いづらいのとは少し違いますが、気に入らなかったので書きます。
日本語で質問・指示を入力すると、それがURLの一部としてアドレスバーに表示されますが、この状態でアドレスバーにマウスオーバーしたりフォーカスしたりすると実際のURLの文字列が表示されます。
それがなぜか中国語ピンイン表記なのです。
「花→hua」だし、「話→hua」です(ピンインが同じ文字は同じになります)。
「平成狸合戦ぽんぽこ→ping-cheng-li-he-zhan-honhoko」です(honhokoって何?)。

ここはURLエンコードにしてほしいです。
「花→%E8%8A%B1」、「話→%E8%A9%B1」みたいに。
日本語なんて中国語の一部だろみたいな扱いに感じられてリスペクトが感じられません。
言語は文化やアイデンティティと強いつながりがあるので、日本人としては日本語→ピンインは不快です。
使えると感じたこと
一度の指示で複数ステップにわたる自動操作ができる
例えば新宿駅周辺でカフェ巡りしたいなと思ったら、Googleマップを操作させてこんな感じでカフェ巡りルートを作成させることができます。
(自動操作中は画面の周囲が青く光ります)


同じようにすれば旅先での名所めぐりプランも作れるでしょう。
複数のタブの情報を集約できる
何かを買う前に比較検討することは誰にでもあると思うのですが、商品の種類が多すぎると比較も大変だと思います。
そんなときに少しでも気になった商品のページをComet上で開いておいて、全タブの商品の比較表を作成するよう依頼することができます。

一覧化されるだけでもかなり比較が楽になると思うので、これは便利です。
まとめ
AIブラウザに対する期待値が高すぎたのか、結構がっかり感があります。
個人的には、AIとブラウザを統合するのではなく、それぞれが独立したアプリとして存在し、AIがブラウザを使う・連携するという方向性に進んでほしい気持ちはあります。
とはいえ、Cometはまだまだ発展途上だと思うので、今後の機能追加・改善には期待しています。
アップデートを待ちたいと思います。