为了在大多数一般使用案例中快速为 mongot
部署提供健康的资源平衡,小型或中型高 CPU节点通常是有效的点。此配置为常见搜索工作负载提供了坚实的基础。
要根据特定工作负载进行更精确的资源预配,查看以下页面:
这些页面为关键任务应用程序或需要更高保真度优化的情况提供指导。
注意
调整搜索和向量搜索工作负载的资源大小是一个迭代进程。这些示例代表了一个点,但在确定特定工作负载的大小时可能需要进行高级考虑和测量。
工作负载类
mongot
部署分为两类:
低 CPU(适用于较低数据量和向量搜索)
High-CPU(适用于更高数据量和全文搜索)
使用以下指导选择符合应用程序需求的起始配置。
低 CPU 工作负载
低 CPU 原型非常适合向量搜索应用程序或低数据量应用程序,在这些应用程序中,内存优先级高于原始 CPU 功率。这些节点的8:1 RAM与 CPU 的比率通常为。确定适当大小类别的关键因素是对预期向量总大小的估计。要查看参考向量大小范围,请参阅简介中“选择起始大小”步骤中的表格。
下表显示了根据低 CPU 部署中的预期工作负载提供的内存、存储和 CPU 核心建议:
工作负载大小类别 | 默认内存 (GB) | 默认存储 (GB) | CPU 内核 |
---|---|---|---|
小 | 8 - 16 | 50 - 100 | 1 - 2 |
中型 | 32 - 64 | 200 - 400 | 4 - 8 |
大 | 128 - 256 | 800 - 1600 | 16 - 32 |
其他考量:
小型:适用于初始测试或非常小的向量搜索应用程序。
中:适合不断增长的向量搜索用例或中等数据量。
大型:适用于大量向量搜索应用程序或较大的低 CPU 密集型工作负载。
高 CPU 工作负载
高 CPU 原型专为通用全文搜索工作负载而设计,在此类工作负载中,查询的 CPU 密集型程度更高。这些节点的RAM与 CPU 的比率通常为 2:1。确定适当大小类别的关键因素包括所需的吞吐量(QPS) 和预期的索引负载。插入量可以作为索引负载的提供服务。更多插入操作通常表示更高级别的索引活动。要查看参考 QPS 范围,请参阅简介中选择起始大小步骤中的表格。
下表显示了根据高 CPU 部署中的预期工作负载提供的内存、存储和 CPU 核心建议:
工作负载大小类别 | 默认内存 (GB) | 默认存储 (GB) | CPU 内核 |
---|---|---|---|
小 | 4 - 8 | 100 - 200 | 2 - 4 |
中型 | 16 - 32 | 400 - 800 | 8 - 16 |
大 | 64 - 96 | 1600 - 2400 | 32 - 48 |
其他考量:
小:中等查询率全文搜索的起点。至少设置两个小节点(总共 4 个 CPU)可支持大约 40 QPS。
中:适合具有更高查询吞吐量的更活跃的全文搜索应用程序。
大型:适用于要求严格的全文搜索、繁重的索引或大量查询工作负载。
大型向量搜索工作负载的注意事项
矢量搜索是AI应用的重点关注领域。自动二进制量化等现代技术正在将主节点 (primary node in the replica set)资源限制从RAM转移到存储。二进制量化使索引受到更大的存储限制。
在这些情况下,请考虑具有大量可用存储的低 CPU 类节点。大容量存储支持全保真向量嵌入和源向量嵌入的量化版本。这种资源与工作负载的结合可确保您能够高效且经济地构建和扩展现代AI应用程序。