Join us Sept 17 at .local NYC! Use code WEB50 to save 50% on tickets. Learn more >
MongoDB Event
Menu Docs
Página inicial do Docs
/ /
Centro de Arquitetura Atlas
/ / /

Transformação da experiência do motorista com a MongoDB e o Google Cloud

Aprenda a criar experiências automotivas em tempo real e controladas por voz usando o MongoDB Atlas e o conjunto de ferramentas do Google Cloud. Combine dados do veículo, contexto do usuário e incorporações do manual do carro em um assistente automotivo inteligente e dimensionável que se adapta às necessidades do motorista.

Casos de uso: Gen AI, Personalização

Setores: Manufatura e Mobilidade

Produtos: Banco de dados do MongoDB Atlas, MongoDB Atlas Vector Search

Parceiros: Google cloud, PowerSync

À medida que as montadoras correm para entregar experiências de direção de última geração, elas enfrentam uma pressão crescente para se diferenciar com sistemas digitais inteligentes e de fácil utilização. Assistentes de voz automotivos surgiram como uma oportunidade essencial — no entanto, a maioria ainda fica aquém, limitada a comandos básicos, como definir a navegação ou controlar a música. Com o surgimento da IA generativa, há um caminho claro para superar essas limitações e proporcionar interações verdadeiramente personalizadas e dinâmicas ao volante.

Esta solução demonstra como as equipes automotivas podem criar um assistente de voz dimensionável e em tempo real, alimentado por AI generativa e com suporte do MongoDB Atlas. A arquitetura integra a telemetria do veículo, preferências do usuário e incorporações do manual do veículo para criar um assistente veicular capaz de se adaptar às necessidades de cada motorista. Ao usar o document model flexível do MongoDB Atlas e a pesquisa vetorial integrada, os desenvolvedores podem simplificar a complexidade dos dados e entregar recursos mais rapidamente, para uma experiência automotiva melhor e mais intuitiva.

Gif demonstrando como a demonstração funciona

Figura 1. Assistente veicular Gen AI em ação

Ao longo do caminho, as equipes aprenderão:

  • Unifique dados estruturados e não estruturados para aumentar o contexto dos sistemas de AI.

  • Habilite interações em tempo real com uma arquitetura dimensionável e nativa da nuvem.

  • Ofereça experiências personalizadas com a pesquisa semântica alimentada pelo Atlas Vector Search.

Embora esta solução se concentre na indústria automotiva, seu potencial se estende muito além. Indústrias como as de transporte, saúde, hospitalidade e eletrônicas de consumo estão explorando interfaces de voz de IA generativa para melhorar o engajamento do cliente, reduzir a fricção e simplificar o suporte. Seja um assistente doméstico inteligente, um concierge digital ou um sistema de triagem médica habilitado por AI, essa arquitetura fornece uma base para construir experiências orientadas por voz e impulsionadas por dados que são intuitivas e relevantes. Empresas de diversos setores estão utilizando o poder da voz com IA generativa e o MongoDB para transformar a experiência do usuário.

Para dar vida a um assistente veicular mais inteligente, projetamos uma arquitetura que combina tecnologias de nuvem e de borda em uma experiência integrada. No centro de tudo está o MongoDB Atlas, que atua como uma camada de dados, em conjunto com as funcionalidades de AI do Google Cloud. Essa arquitetura garante interações rápidas, personalizadas e confiáveis.

Arquitetura de referência para a solução de assistente veicular
clique para ampliar

Figura 2. Uma arquitetura de referência de um assistente com IA generativa para automóveis

Vamos detalhar como funciona.

Eles são executados no veículo, próximo ao motorista, e permitem a interação por voz em tempo real.

  • Console do carro: interface do carro onde os usuários interagem com o assistente e recebem respostas. É um aplicativo da web nesta demonstração, mas ele representa o sistema embarcado em um veículo real.

  • Armazenamento de dados local: os veículos armazenam sinais essenciais localmente usando o PowerSync SDK, um banco de dados leve de borda criado no SQLite. Isso garante acesso rápido aos dados de diagnóstico e mantém os dados em sincronização com o MongoDB Atlas.

  • Backend do assistente: esse componente gerencia a conversa. Ele lida com a transcrição de voz utilizando o Google Cloud Speech-to-Text e interpreta a intenção do motorista. Dependendo da query, ele pode responder diretamente ou chamar ferramentas para obter mais dados ou agir. Para a versão de demonstração, incluímos quatro ferramentas de exemplo:

    • Consultar manual: usa o Atlas Vector Search para recuperar informações relevantes do manual do veículo.

    • Executar diagnósticos: obtém os códigos de diagnóstico atuais dos dados locais do veículo.

    • Recalcular rota: ajusta a viagem se o motorista adicionar uma parada.

    • Fechar chat: encerra a conversa de forma gentil.

const functionDeclarations = [
{
functionDeclarations: [
{
name: "closeChat",
description:
"Closes the chat window when the conversation is finished. By default it always returns to the navigation view. Ask the user to confirm this action before executing.",
parameters: {
type: FunctionDeclarationSchemaType.OBJECT,
properties: {
view: {
type: FunctionDeclarationSchemaType.STRING,
enum: ["navigation"],
description:
"The next view to display after closing the chat.",
},
},
required: ["view"],
},
},
{
name: "recalculateRoute",
description:
"Recalculates the route when a new stop is added. By default this function will find the nearest service station. Ask the user to confirm this action before executing.",
parameters: {
type: FunctionDeclarationSchemaType.OBJECT,
properties: {},
},
},
{
name: "consultManual",
description:
"Retrieves relevant information from the car manual.",
parameters: {
type: FunctionDeclarationSchemaType.OBJECT,
properties: {
query: {
type: FunctionDeclarationSchemaType.STRING,
description:
"A question that represents an enriched version of what the user wants to retrieve from the manual. It must be in the form of a question.",
},
},
required: ["query"],
},
},
{
name: "runDiagnostic",
description:
"Fetches active Diagnostic Trouble Codes (DTCs) in the format OBD II (SAE-J2012DA_201812) from the vehicle to assist with troubleshooting.",
parameters: {
type: FunctionDeclarationSchemaType.OBJECT,
properties: {},
},
},
],
},
];

Fornecem inteligência da AI, armazenamento dimensionável e funcionalidades de processamento de dados.

  • Ingestão de dados: conteúdos não estruturados, como manuais de automóveis, são carregados no Google Cloud Storage. Isso aciona um pipeline usando Pub/Sub, Cloud Run e Document AI para dividir os PDFs em partes. O Vertex AI gera incorporações para essas partes, que são armazenados no MongoDB Atlas para pesquisa semântica.

  • Fornecer APIs de voz: as funções Text-to-Speech e Speech-to-Text do Google Cloud lidam com a interação de voz natural. Vertex AI: fornece incorporações de texto para queries de pesquisa e alimenta o LLM (Gemini) usado pelo assistente.

  • Armazenamento e recuperação de dados: O MongoDB Atlas armazena:

    • Incorporações manuais de partes para recuperação por meio do Atlas Vector Search.

    • Preferências do usuário e dados da sessão.

    • Sinais de veículos — tanto os valores mais recentes quanto a telemetria completa de séries temporais.

O Atlas Vector Search é utilizado para associar as perguntas dos usuários às seções de manuais mais relevantes, possibilitando um fluxo de geração aumentada de recuperação (RAG). O suporte nativo do MongoDB para dados estruturados, semiestruturados e vetoriais em um único local simplifica a lógica do assistente e acelera o desenvolvimento.

  • Sincronização de dados: utilizamos o PowerSync para sincronização bidirecional entre o veículo e a nuvem:

    • Do veículo para a nuvem: o veículo envia dados de telemetria, como códigos de diagnóstico, velocidade e aceleração. Uma função de execução na nuvem os processa e armazena no Atlas.

    • Nuvem para veículo: permite atualizações ou ações enviadas remotamente para o carro, como atualizações OTA ou bloqueio remoto.

O MongoDB Atlas é a plataforma de dados para desenvolvedores que alimenta esta solução. Como isso melhora a arquitetura:

  • Unifica dados operacionais e vetoriais: sinais de veículos, incorporações vetoriais e sessões de usuários são armazenados juntos em uma única plataforma consistente.

  • Permite respostas mais relevantes: o Atlas Vector Search recupera instantaneamente as partes corretas de documentos extensos, alimentando respostas precisas e ricas em contexto.

  • Criado para ter escala empresarial: seja um único modelo ou uma frota global, o MongoDB Atlas oferece escalabilidade horizontal integrada, alta disponibilidade e segurança de nível empresarial.

  • Simplifica a sincronização entre a borda e a nuvem: o PowerSync e o MongoDB trabalham juntos para integrar ambientes automotivos e de nuvem sem atrito.

Esta arquitetura é projetada para dimensionar, evoluir e se adaptar, assim como os veículos aos quais ela oferece suporte. Com o MongoDB no centro, os fabricantes de automóveis podem se concentrar menos na infraestrutura de dados e mais em oferecer experiências inteligentes e úteis dentro do veículo, que realmente fazem a diferença na estrada.

Os dados são fundamentais para qualquer experiência impulsionada por IA. A qualidade, estrutura e acessibilidade dos seus dados são o que definem o sucesso ou o fracasso da experiência. Nessa solução, o document model do MongoDB desempenha uma função central, permitindo flexibilidade, velocidade e dimensionamento para desenvolvedores que criam assistentes inteligentes para veículos.

Ao contrário dos bancos de dados relacionais tradicionais que dependem de tabelas rígidas e junções complexas, o MongoDB armazena dados como documentos flexíveis. Isso facilita a representação de estruturas de dados do mundo real, como telemetria de veículos ou partes de conhecimento incorporadas, exatamente como são usadas no código. Isso também significa que você pode iterar mais rapidamente, adaptar seu modelo sem tempo de inatividade e desenvolver novas funcionalidades à medida que seu aplicativo evolui.

O document model é projetado para refletir a maneira como os desenvolvedores pensam. Precisa adicionar metadados aos seus dados de diagnóstico? Ou associar múltiplos tipos de conteúdo a uma única seção do manual? No MongoDB, trata-se de apenas algumas linhas de código e não de reescrever um esquema. E como cada documento é autônomo, as consultas são mais rápidas e simples. Menos junções, menos partes móveis e mais tempo para criar.

Essa flexibilidade também gera ciclos de inovação mais rápidos. As equipes podem fazer melhorias no modelo de dados com agilidade, sem precisar fazer migrações caras ou deixar o aplicativo inativo, para responder aos novos lançamentos de recursos para os veículos e às mudanças nas expectativas dos usuários.

A IA generativa se desenvolve em dados ricos, diversos e não estruturados. Incorporações, metadados contextuais, referências estruturadas — tudo isso desempenha um papel em tornar os sistemas de AI mais inteligentes. O MongoDB é singularmente adequado para esses tipos de aplicativos:

  • Armazenar incorporações vetoriais, metadados e conteúdo de origem em um único documento.

  • Combine dados estruturados e vetoriais sem alternar entre sistemas.

  • Faça a query de campos vetoriais e não vetoriais juntos para obter resultados contextuais e precisos.

O resultado? Arquitetura mais simples, melhor desempenho e respostas de AI mais relevantes.

Com a geração aumentada de recuperação (RAG), a qualidade da fragmentação e das incorporações impacta diretamente a qualidade das respostas da AI. Um conteúdo mal segmentado ou um contexto ausente podem gerar respostas vagas ou imprecisas. Os manuais técnicos são inerentemente complexos. Em geral, eles contêm textos densos, diagramas e terminologias específicas da área que dificultam a recuperação de informações corretas.

Para abordar isso, representamos cada parte do manual como um documento. O documento inclui não apenas o texto e sua incorporação vetorial, como também metadados, como tipo de conteúdo (por exemplo, segurança, diagnóstico), números de página, comprimento da parte e links para partes relacionadas. Esse contexto adicional ajuda o sistema a entender como as informações se relacionam entre si — o que é especialmente importante em tópicos altamente técnicos ou interdependentes.

O document model flexível do MongoDB simplifica a captura dessa complexidade. À medida que o manual evolui ou novas necessidades surgem, podemos adicionar campos de forma incremental ou ajustar a estrutura sem precisar de uma migração completa do esquema. Isso permite uma recuperação mais precisa e, em última análise, respostas de AI mais úteis.

{
"_id": {
"$oid": "67cc4b09c128338a8133b59a"
},
"text": "Oil Pressure Warning Lamp. If it illuminates when the engine is running this indicates a malfunction. Stop your vehicle as soon as it is safe to do so and switch the engine off. Check the engine oil level. If the oil level is sufficient, this indicates a system malfunction.",
"page_numbers": [
23
],
"content_type": [
"safety",
"diagnostic"
],
"metadata": {
"page_count": 1,
"chunk_length": 1045
},
"id": "chunk_0053",
"prev_chunk_id": "chunk_0052",
"next_chunk_id": "chunk_0054",
"related_chunks": [
{
"id": "chunk_0048",
"content_type": [
"safety"
],
"relation_type": "same_context"
},
{
"id": "chunk_0049",
"content_type": [
"safety"
],
"relation_type": "same_context"
},
...
],
"embedding": [
-0.002636542310938239,
-0.005587903782725334,
...
],
"embedding_timestamp": "2025-03-08T13:50:00.887107"
}

Para sinais de veículos, modelamos nossos dados usando a Especificação de Sinal de Veículo da COVESA (VSS). A VSS fornece uma estrutura hierárquica padronizada para descrever sinais em tempo real, como velocidade, aceleração ou códigos de falha de diagnóstico (DTCs). É um formato aberto e extensível que facilita a colaboração, a integração de sistemas e a reutilização de dados em várias plataformas de veículos.

O document model MongoDB lida nativamente com estruturas aninhadas, tornando direta a representação da hierarquia VSS. Os sinais podem ser agrupados logicamente, assim como aparecem no modelo VSS, o que se alinha perfeitamente à estrutura em árvore da especificação.

Arquitetura de referência para a solução de assistente veicular

3figura. O modelo de dados VSS é uma estrutura hierárquica de árvore construída com módulos que podem ser combinados de forma flexível. Fonte: https://covesa.global/vehcycle-signal-specification/

Essa estrutura não apenas acelera o desenvolvimento, mas também garante que as ferramentas e fluxos de trabalho de AI tenham acesso consistente a dados limpos, estruturados e significativos.

{
"_id": {
"$oid": "67e58d5f672b23090e57d478"
},
"VehicleIdentification": {
"VIN": "1HGCM82633A004352"
},
"Speed": 0,
"TraveledDistance": 0,
"CurrentLocation": {
"Timestamp": "2020-01-01T00:00:00Z",
"Latitude": 0,
"Longitude": 0,
"Altitude": 0
},
"Acceleration": {
"Lateral": 0,
"Longitudinal": 0,
"Vertical": 0
},
"Diagnostics": {
"DTCCount": 0,
"DTCList": []
}
}

O document model do MongoDB não apenas armazena seus dados. Ele reflete a complexidade do mundo real, facilitando a criação de sistemas mais inteligentes que respondem em tempo real, se adaptam às necessidades do usuário e crescem com a sua plataforma. Seja para armazenar diagnósticos de veículos ou manuais codificados em vetor, o MongoDB fornece as ferramentas para desenvolver experiências inteligentes mais rapidamente.

A construção desta solução pode ser dividida em cinco etapas principais. Você usará o MongoDB Atlas para hospedar seus dados, o Google Cloud para serviços de IA, o PowerSync para fluxos de dados de veículos e um aplicativo de pilha completa para vincular tudo. Você encontrará todos os ativos e recursos necessários no Repositório do GitHub.

1

Provisione um cluster na sua conta do Atlas e preencha seu banco de dados com os dados necessários para a demonstração. Um despejo de dados pode ser encontrado dentro do repositório para replicar rapidamente o banco de dados com todos os dados e metadados necessários com um único comando mongorestore.

2

Crie um projeto na Google Cloud e habilite as APIs necessárias: Speech-to-Text, Text-to-Speech, Document AI, e Vertex AI. Para o desenvolvimento local, configure as credenciais padrão do aplicativo para que ele se possa autenticar facilmente com os serviços Google. Instruções detalhadas são fornecidas na Documentação Google Cloud.

3

A demonstração inclui um conjunto pré-calculado de incorporações para o manual do veículo. No entanto, você pode gerar suas próprias incorporações analisando arquivos em PDF com a AI de documento e incorporá-las usando a Vertex AI. Isso oferece a você a flexibilidade de expandir o assistente com documentos personalizados ou manuais adicionais, conforme necessário.

4

Crie uma conta no PowerSync e vincule seu banco de dados MongoDB usando sua string de conexão. O PowerSync atua como uma ponte de dados, sincronizando dados do MongoDB com aplicativos cliente em tempo real. Defina regras de sincronização para a coleção vehicleData.

5

Clone o repositório localmente e crie um arquivo .env usando o modelo fornecido. Depois que seu ambiente estiver configurado, execute npm install para instalar dependências e, em seguida, inicie o servidor de desenvolvimento com npm run dev. O aplicativo estará disponível em http://localhost:.3000

Para obter detalhes completos sobre a implementação — incluindo exemplos de código, dumps de dados e scripts assistentes — visite o repositório GitHub.

Conforme as experiências automotivas evoluem para se tornarem mais inteligentes e personalizadas, esta solução demonstra como os fabricantes de automóveis podem utilizar a IA generativa e o MongoDB para oferecer interações significativas dentro do veículo. Aqui estão os principais pontos de destaque:

  • A AI conversacional começa com a base de dados correta: dados ricos, contextuais e acessíveis são o que impulsionam os assistentes de voz inteligentes. O MongoDB Atlas unifica telemetria estruturada, manuais não estruturados e incorporações vetoriais em uma única plataforma de fácil utilização para o desenvolvedor, eliminando silos de dados e facilitando o fornecimento de respostas relevantes em tempo real.

  • O MongoDB acelera a inovação da fábrica à linha de chegada: os aplicativos automotivos modernos exigem flexibilidade e rapidez, desde a manutenção preditiva e diagnósticos até os sistemas de cockpit digital. O esquema flexível do MongoDB, as funcionalidades de sincronização em tempo real e a escalabilidade ajudam as equipes a avançar mais rapidamente, colaborar de maneira mais eficaz e entregar recursos que diferenciam seus veículos.

  • Os motoristas estão prontos para a próxima geração de assistentes de voz: veículos elétricos, autonomia e sistemas de segurança inteligentes reinventam o setor. Com isso, as expectativas para os sistemas automotivos nunca foram tão altas. Com a AI generativa, os assistentes podem ir além de simples comandos e oferecer conversas interativas e detalhadas — com o MongoDB, os desenvolvedores têm as ferramentas certas para criar essas experiências em escala.

  • Dr. Humza Akhtar, MongoDB

  • Rami Pinto, MongoDB

Voltar

Excelência em Manutenção Preditiva

Nesta página