As seguintes limitações se aplicam ao Atlas Stream Processing:
O
state.stateSize
combinado de todas as instâncias de processamento de fluxo não pode exceder 80% da RAM disponível para um funcionário no mesmo nível de SPI. Por exemplo, o tamanho máximo de um processador de fluxo na camadaSP30
que tem 8GB de RAM por funcionário é de 6.4GB. Se astate.stateSize
de qualquer um dos processadores de fluxo estiver se aproximando de 80% da RAM disponível para um trabalhador na mesma camada SPI, vá para a próxima camada SPI.Quando o limite de 80% de RAM é ultrapassado, todos os processadores de fluxo falham com um erro
stream processing instance out of memory
. Você pode visualizar o valorstate.stateSize
de cada processador de fluxo com o comandosp.processor.stats()
. Confira Ver estatísticas de um processador de fluxo para saber mais.Uma instância de Atlas Stream Processing pode usar somente clusters no mesmo projeto como fontes ou coletores.
Uma definição de pipeline do Atlas Stream Processing não pode exceder 16 MB.
Somente usuários com os roles
Project Owner
ouAtlas admin
podem usar o Atlas Stream Processing.Atualmente, o Atlas Stream Processing é compatível apenas com os seguintes tipos de conexão:
Tipo de conexãoUsoFonte ou Coletor
Banco de Dados Atlas
Fonte ou Coletor
Conexão de amostra
Apenas fonte
Para o Atlas Stream Processing usando Apache Kafka como $source, se o tópico do Apache Kafka que atua como $source para o processador em execução adicionar uma partição, o Atlas Stream Processing continuará em execução sem ler a partição. O processador falha quando detecta a nova partição depois de restaurá-la de um checkpoint após uma falha, ou você a reinicia após interrompê-la. Você deve recriar os processadores que leem dos tópicos com as partições recém-adicionadas.
Atualmente, o Atlas Stream Processing permite apenas dados formatados em JSON. Atualmente, ele não oferece suporte a serializações alternativas, como Avro ou Protocol Buffers.
Para conexões Apache Kafka, o Atlas Stream Processing atualmente aceita apenas os seguintes protocolos de segurança:
SASL_PLAINTEXT
SASL_SSL
SSL
Para
SASL
, o Atlas Stream Processing suporta os seguintes mecanismos:PLAIN
SCRAM-SHA-256
SCRAM-SHA-512
OAUTHBEARER
SSL
Para, você deve fornecer os seguintes ativos para a autenticação TLS mútua do seu sistema Apache Kafka com o Atlas Stream Processing:uma Autoridade de certificação (se você estiver usando uma autoridade de certificação diferente da Apache Kafka CA padrão)
um certificado TLS do cliente
um arquivo de chave TLS, usado para assinar seu certificado TLS
O Atlas Stream Processing não é compatível com UDFs de $function JavaScript.
O Atlas Stream Processing é compatível com um subconjunto dos Estágios de Pipeline de agregação disponíveis no Atlas, permitindo que você execute muitas das mesmas operações em dados de streaming que você pode realizar em dados em repouso. Para obter uma lista completa dos estágios do pipeline de agregação compatíveis, consulte a documentação do Stream Aggregation.
O Atlas Stream Processing não suporta as variáveis de agregação
$$NOW
,$$CLUSTER_TIME
,$$USER_ROLES
e$SEARCH_META
.