Perplexity、検索特化の高性能テキスト埋め込みモデルを発表

Perplexityが新たなテキスト埋め込みモデルを公開

Perplexityは、pplx-embed-v1およびpplx-embed-context-v1という高性能なテキスト埋め込みモデルを発表しました。これらのモデルは、大規模な検索や検索タスク向けに設計されており、それぞれ0.6Bおよび4Bのパラメータサイズのバリエーションが用意されています。小規模版は速度と効率を重視し、大規模版は検索品質の最大化を目指しています。

利用可能なプラットフォーム

これらのモデルは、Hugging Face（MITライセンス）やPerplexity APIを通じて利用でき、Transformers、SentenceTransformers、ONNXに対応しています。また、INT8およびバイナリ量子化をネイティブでサポートしており、FP32比でストレージを4倍から32倍削減することが可能です。指示プレフィックスが不要であるため、多言語や文脈に基づく検索ベンチマークにおいて、Qwen3-EmbeddingやGemini-Embeddingを上回る性能を発揮します。

技術的背景とメリット

テキスト埋め込みモデルは、テキストを高次元ベクトルに変換し、意味的な類似性を計算する技術です。Perplexityの新モデルは、ウェブスケールの文書検索課題に対応し、初段検索（first-stage retrieval）を強化して、後段ランキングに繋げることができます。

量子化（INT8/バイナリ）は、モデルサイズを劇的に縮小し、推論速度を向上させるための標準手法です。特にエッジデバイスや大規模な展開において、その効果は顕著です。従来のモデルは指示プレフィックスに依存するため、展開時に問題が生じることがありましたが、新モデルはその依存を排除し、実運用性を高めています。

業界への影響

このリリースによって、Perplexityは大規模埋め込み研究の最前線に位置づけられ、速度重視のユーザーと品質重視のユーザーの両方をカバーすることが期待されます。ストレージ削減と高精度により、ウェブスケールの組織におけるセマンティック検索コストを低減し、RAG（Retrieval-Augmented Generation）やエンタープライズ検索の採用を加速させる可能性があります。競合であるQwen3やGeminiをベンチマークで上回る点は、オープンソースコミュニティ（Hugging Face経由）での普及を促進し、埋め込みモデルの民主化を進めるでしょう。

今後の展望

Perplexityは埋め込みモデル以外にも、2025年10月末にPerplexity Patents（自然言語クエリで特許検索）をリリース予定であり、Samsungとの提携によりGalaxyデバイスに「Hey Plex」音声アシスタントを統合する計画もしています。さらに、Proユーザー向けのインアプリショッピング機能も導入し、広告からサブスクリプション中心への移行を進めています。

最近の主要動向として、Perplexity Computer（19モデルオーケストレーションシステム）を公開しました。これは、研究・設計・コーディング・デプロイのプロセスをエンドツーエンドで扱うマルチエージェントプラットフォームで、数ヶ月にわたって自律的なワークフローをサンドボックス環境で実行することができます。これにより、Perplexityは単一モデル依存から脱却し、AIエージェントの柔軟性を業界に示しています。

埋め込みモデルは、Perplexity Computerの検索基盤を強化する可能性があり、同社のエコシステム拡大を象徴しています。業界全体においても、Multiverse Computingのモデル圧縮技術が類似の効率化トレンドを示しており、今後の動向に注目が集まります。