Learn the "why" behind slow queries and how to fix them in our 2-Part Webinar.
Register now >
Docs 菜单
Docs 主页
/ /

Atlas Stream Processing Tier 选择指南

Atlas Stream Processing根据 层级为每个流处理器分配资源。固定的资源分配和费用提供了可预测性,从而简化了系统设计进程。在规划部署时,使用本指南了解哪些层最适合您的流处理工作负载。

每个层级都提供固定分配的处理能力、内存、带宽、并行性和分区(如果处理器具有 Apache Kafka 源)。

层级
vCPU
RAM (GB)
带宽 (Mbps)
最大并行度
源Kafka分区限制

SP 2

0.25

0.5

50

1

32

SP 5

0.5

1

125

2

64

SP 10

1

2

200

8

无限制

SP 30

2

8

750

16

无限制

SP 50

8

32

2500

64

无限制

层级资源配置不同,适用于不同阶段和规模的项目。

层级
用例(Use Case)

SP 2

开发、试用部署

成本最低的选项,能够支持资源要求有限的简单工作负载。

SP 5

开发、基本生产部署

一种低成本选项,适用于低吞吐量的生产任务,甚至是那些采用更复杂计算的任务。 SP5 处理器可以支持基本的筛选、投影和变更流处理。

SP 10

主流生产部署

生产工作负载的基线。 SP10 及更高版本适用于需要更高级别并行性、无限制的Kafka分区或查询和联接等数据扩充操作的管道。

SP 30

复杂的生产部署

专为内存密集型状态操作而设计的高性能选项。 SP30 支持使用长时间窗口、多次查找和需要大型RAM缓冲区来进行扩展数据扩充的阶段的管道。

SP 50

企业级生产

性能最高的选项,专为高吞吐量流和广泛的转换逻辑而设计。 SP50 处理器适用于需要大规模并行处理或计算密集型工作流程的操作。

选择适当的层级时,请考虑以下因素:

流处理器在初始运行期间可能比常规操作期间需要更多的资源。示例,如果处理器对大型Atlas集合执行 $initialSync,则该处理器需要在同步期间支持大量 I/O 和计算。

为了吸收如此高的需求,请暂时选择更高的层级,并在同步完成并且处理器转换为仅使用新的变更流事件时扩展处理器。

聚合管道逻辑是 CPU 和RAM消耗的主节点 (primary node in the replica set)驾驶员。

  • Windows:持久的 Windows 会消耗更多RAM来保存动态
    文档。
  • 自定义逻辑:Javascript$function 阶段或复杂分组
    逻辑会增加每条消息的计算要求。
  • 复合复杂性:额外的状态或计算复杂性阶段
    引入更多潜在的资源需求变化。即使在消费高峰期间,保持剩余容量也能确保一致的吞吐量。

每个网络或存储联系点都会增加流处理器的开销。

  • 源或接收器密度:读取或写入并行化
    源或接收器(例如带有分区的Apache Kafka主题)会增加 I/O 要求。
  • 数据扩充:$lookup$https 阶段;和操作
    要丰富针对Atlas集合的数据流,需要网络带宽和连接池化。
  • 协调:在复杂的部署中协调多个源
    和接收器,流处理器可以提供服务集线器,在每个节点之间路由数据流。此类处理器受益于 SP30 和 SP50 层的更高吞吐量。

相反,高吞吐量流处理工作负载可能会增加对互联资源的需求。

  • 对Atlas的影响:来自流的大容量并行 I/O

    处理器可能会超过Atlas源集群或接收器集群的读取或写入容量。这不仅会增加处理器的延迟,还会成为依赖这些集群的其他工作负载的瓶颈。

    为确保全系统性能,请根据与之交互的处理器按比例扩展Atlas集群。

即使处理逻辑很简单,性能目标也可能需要更高层级的处理器。

  • 高吞吐量:更高层级的处理器可以更好地支持流
    以高速率生成事件。
  • 低延迟 SLA:较高层级处理器提供的高并行性有助于确保在速度至关重要时事件不会在队列中累积。特别是,SP50 处理器提供的线程是 SP30 处理器的四倍。

  • 数据丰富和缓存:使用$cachedLookup 来丰富
    包含大量静态或缓慢变化的参考数据的流,有利于更高层的处理器提供缓存所需的RAM 。
  • 复杂接收器:某些接收器涉及更昂贵的
    转换、事务和文件管理开销。对于与这些接收器交互的处理器,更高的层有助于确保一致的性能和延迟。

Atlas Stream Processing扩展是垂直的。您可以通过停止处理器、选择新层级并重新启动处理器来向上或向下扩展处理器。 Atlas Stream Processing检查点确保过渡期间不会丢失数据。定期监控处理器的性能,并根据本指南中描述的因素调整其层级。

后退

开始体验

在此页面上