跳到主要内容

新添:嵌入向量与重排序10个模型一站式完美支持RAG

· 阅读需 2 分钟
Knox Anderson
OpenRouter 核心团队

嵌入模型是基于神经网络(如Transformer)的模型,能够将非结构化且复杂的数据(如文档、图片、音频、视频或表格数据)转换为密集的数值向量(即嵌入向量),这些向量能捕捉数据的语义信息。它们作为数据点的表示或索引,是语义搜索和检索增强生成(RAG)的核心组成部分,而RAG是目前构建领、专用或企业专用聊天机器人及其他AI应用的主流方法。

重排序模型是能够输出查询与多个文档之间相关性分数的神经网络。常见的做法是使用这些分数对通过嵌入方法(或基于词法的搜索算法,如BM25和TF-IDF)初步检索到的文档进行重新排序。筛选得分最高的文档可以将检索结果优化为更相关的子集。

我们同时提供了嵌入和重排序模型的API接口,可接收您的数据(如文档、查询或查询-文档对)并返回相应的嵌入向量或相关性分数。嵌入模型和重排序器作为模块化组件,能够与RAG技术栈的其他部分(如向量数据库和生成式大语言模型LLM)无缝集成。

模型列表

  • voyage‑3‑large
  • voyage‑3.5
  • voyage‑3.5‑lite
  • voyage‑code‑3
  • voyage‑finance‑2
  • voyage‑law‑2
  • voyage‑code‑2
  • voyage‑multimodal‑3
  • rerank-2
  • rerank-2-lite

相关嵌入、重排序与RAG详细文档请点击此处查看 >>>

相关模型价格与创建访问模型密钥请点击此处>>>并输入“voyage”搜索查看

相关模型API端点参考文档请点击此处查看 >>>