使用生成式AI和MongoDB Atlas Vector Search 将非结构化数据纳入库存分类,以便做出更好的决策。
产品和工具: MongoDB Atlas数据库、 MongoDB Atlas Vector Search、 MongoDB Node.js驱动程序
合作伙伴: AWS、 Amazon Bedrock、Anthropic、Cohere、Vercel
解决方案概述
全球汽车运营面临着复杂的破坏。不稳定的地缘政治和关税的回归推迟了车型年份转换,并造成严重的库存短缺。截至 2025 6 月,下一代车型仅占美国库存的 3%。为了应对供应紧张并保护利润率,您需要的工具不仅仅是简单的财务指标。
传统上,组织依靠 ABC 分析来细分库存。此方法仅根据美元使用情况对项目进行优先级排序,其中“A 类”驱动的收入最多,而“ C类”驱动的收入最少。这种方法虽然简单,但忽略了关键变量,如交付时间、持久性或过时性。
图 1。库存分类的 ABC 分析。
多标准库存分类 (MCIC) 通过添加定量数据点来改进这一问题,但它仍然存在一个盲点:非结构化数据。客户数评论、维护日志和社交情绪占全球数据的 80%,但传统模型无法进程。该解决方案弥补了这一空白。通过将生成式AI和MongoDB Atlas Vector Search 相结合,您可以将定性反馈转化为可行的评分功能。
图 2。将非结构化数据转换为机器学习模型的特征。
该解决方案使您能够从被动的库存跟踪转变为以客户为中心的预测性决策。 MongoDB通过四步方法支持下一代AI驱动的库存分类:
从非结构化数据创建并存储向量嵌入。
设计并存储与业务目标相关的评估标准。
创建代理应用程序以根据这些条件执行数据转换。
重新运行添加了新特征的库存分类模型。
图 3。 Gen AI支持的库存分类的方法和要求。
除了自动执行定性标准的手动评估之外,该解决方案还可以实施整个数据策略。通过在单个平台中统一向量嵌入、元数据和操作数据,可以消除脱节的批处理分析管道造成的延迟。您可以在新 SKU 到达时立即对其进程,从而能够实时精确、扩展地管理海量产品目录。
参考架构
此架构实施了四步方法。该解决方案依赖于动态、代理的工作流程,其中MongoDB Atlas充当数据主干。
创建和存储向量嵌入
将非结构化数据(例如产品评论、供应商说明或支持记录)摄取到MongoDB Atlas中。您可以使用嵌入模型(例如来自 Voyage AI 的模型)来矢量化此文本。然后,您可以将生成的嵌入直接与原始源文本一起存储在MongoDB文档中。这种统一方法降低了基础架构的复杂性,并使您能够通过单个API运行低延迟语义搜索。
图 4。产品评论可以作为向量嵌入存储在MongoDB Atlas中。
数据模型方法
MongoDB文档模型统一了不同的数据类型,没有严格的模式约束。此功能简化了扩展表示复杂数据的方式。以下示例说明了此代理工作流程所需的数据结构。
定量指标
通常,库存事务(例如
orders)包含计算标准 MCIC指标(例如年度美元使用量、平均单位成本、年度总使用量和交付周期)所需的原始数据。在关系系统中,订单数据通常分散在多个表头、行项目和物流表中。为了优化读取性能并简化应用程序逻辑,您可以将此数据存储到单个 orders集合中。
使用扩展参考模式,您可以将产品信息嵌入订单的商品列表中。这种方法使您能够在单个数据库操作中检索ACID 事务的完整检索。
{ "_id": "order_55021", "status": "delivered", "purchaseTimestamp": { "$date": "2024-05-08T16:05:31.000Z" }, "items": [ { "price": 85.00, "productId": "part_9921_brake_pad", "productName": "Ceramic Brake Pads - Front Pair" } ], "reviews": [ { "reviewId": "rev_7721", "score": 5, "commentTitle": "Great fit", "commentMessage": "Arrived on time and fit perfectly on my 2020 Sedan." } ] } 源自非结构化来源的指标
有价值的库存信号通常存在于非结构化文本中,例如维护日志、支持票证或客户反馈。在此示例中,您可以通过为标题和消息内容生成向量嵌入来使用评论来执行语义分析。
将向量嵌入 (emb) 存储在原始文本字段旁边,以便使用MongoDB Atlas Vector Search启用混合搜索。此外,查看分数等元数据使您能够将语义查询(示例,查找有关“可靠性”的评论)与结构化筛选器(示例,
"score": 5)相结合。{ "_id": "rev_99812", "productId": "part_9921_brake_pad", "score": 5, "title": "Excellent durability", "message": "I've put 20k miles on these pads and they still look new. Much better than OEM.", "emb": [0.02, -0.15, 0.44, 0.12, ... ] } 标准定义
该解决方案的关键步骤是定义灵活的、数据驱动的分类标准。无需依赖硬编码规则,只需将条件保存为条件集合中的“知识对象”即可。 AI代理会根据您的业务目标(示例“持久性”)和可用数据生成这些定义。
此文档结构包括权重、显式评分标准和数据源。此文档结构提供了一个模式,代理可以使用该模式对库存中的产品进行一致评估。
{ "criteriaName": "Durability", "criteriaDefinition": "Measures how customers perceive the product’s durability relative to their expectations.", "elements": [ { "name": "Expected Durability", "weight": 0.30, "description": "The level of durability customers believe the product should have based on price and category." }, { "name": "Perceived Durability", "weight": 0.40, "description": "How customers describe the actual durability, build quality, and sturdiness after usage." } ], "scoringScale": [ { "description": "Highly durable item that meets or exceeds expectations, strongly positive sentiment", "score": 1 }, { "description": "Low durability item that fails to meet expectations, negative sentiment", "score": 0.01 } ], "dataSources": ["inventory", "reviews"] }
构建解决方案
为了动作演示这种方法,团队构建了一个简单的应用程序,用于执行前面步骤中介绍的概念。该演示可操作代理工作流程,让您体验从传统 MCIC 到AI增强分类的过渡。
您可以在 GitHub 存储库中访问权限完整的源代码和文档。
图 8。演示应用程序高级架构。
请按照以下步骤设立应用程序并探索代理工作流程:
初始化数据库:创建MongoDB Atlas 群集,并使用提供的库存和查看数据填充数据库。
.env.local设置环境:克隆存储库,使用MongoDB Atlas和 AWS 基岩凭证配置 文件,然后使用npm run dev启动应用。运行传统分析:在左侧面板中选择标准定量标准,例如“年度美元使用量”,然后单击“运行分析”以建立基线分类。
定义新条件:单击添加新条件并描述业务目标,例如“识别具有高客户忠诚度的产品”。代理会提出结构化定义和数据源。
生成分数:单击“生成”。该代理会遍历您的库存,分析非结构化数据,并为每个产品分配分数。
优化分类:将新标准纳入您的选择,调整权重,然后再次单击“运行分析”,查看定性见解如何改变您的库存类别。
请参阅以下部分中的演示应用程序的实际动作。
图 9。使用生成式AI进行库存分类。
关键要点
该解决方案演示了如何将生成式AI与文档模型的灵活性相结合,实现库存分类的现代化。在实现此架构时,请考虑以下核心优势:
释放隐藏的库存价值:传统的财务指标错过了文本中包含的关键见解。通过矢量化客户评论和维护日志等非结构化数据,您可以将定性反馈转化为定量特征,从而提高分类准确性。
自动生成条件:手动设置规则既缓慢又严格。代理工作流程使您能够根据高级别的业务目标动态生成评估标准并对其进行评分。这可以扩展专家在海量产品目录中的决策。
简化数据架构:脱节的系统会产生延迟。通过将操作数据、元数据和向量嵌入存储在单个MongoDB文档模型中,您可以消除复杂的提取、转换和加载 (ETL) 管道,并启用对新库存项目的实时分析。
提高决策质量:仅凭财务指标会导致见解的差距。将客户情绪和产品可靠性分数相结合,可以全面了解库存价值,使您能够确定传统 ABC 分析忽略的高影响项目的优先顺序。
作者
Humza Akhtar,MongoDB
Rami Pinto Prieto, MongoDB
Daniel Jamir, MongoDB