利用人工智能技术进行数据映射的 MapForce。
目前的人工智能模型在诸多方面具有提升数据集成任务的潜力。其中,与数据映射和ETL(提取、转换、加载)相关的最重要进展,主要集中在人工智能驱动的分类能力上。
无论是对自然语言输入,还是对其他非结构化数据,如图像和音频进行分类,人工智能系统在那些历史上一直非常困难、耗时且容易出错的分类任务中表现出色。基于大型语言模型(LLM)的人工智能接口能够分析海量的训练数据,从而学习语言中复杂的模式、语境和细微之处,从而能够高效地“理解”人类生成的语音和内容。
人工智能系统对不同领域数据的分类能力,可以帮助组织以有意义的方式提升其数据的价值。这尤其适用于数据集成或ETL(抽取、转换、加载)过程中,对数据库或其他数据存储系统写入的数据进行优化。人工智能提供的这些数据,可以提供额外的线索,从而为企业的决策提供支持。
由于许多人工智能系统,例如 OpenAI 的 GPT-4,可以通过 API 接口提供服务,因此可以立即将这些系统的功能集成到 MapForce 中的数据转换项目中。
利用MapForce内置的无需编写代码的工具,可以轻松定义Web服务请求,从而方便地调用各种API,包括OpenAI API、Azure OpenAI API、AWS AI Services等,从而在任何数据映射项目中实现基于人工智能的数据处理功能。
配置 MapForce 中人工智能功能的总体步骤包括:
以下内容介绍了利用人工智能技术在数据抽取、转换和加载(ETL)或数据集成过程中进行数据分类的实际应用案例。
自动化情感分析。 自然语言处理一直是数据分析师们面临的难题,因为机器缺乏对人类语言中那些较为抽象的方面,例如语境、讽刺、歧义和俚语的理解。
由于人工智能在很大程度上克服了这些局限性,它可以分析文本数据,例如客户评价或社交媒体帖子,以确定文本中表达的情感,判断其是积极、消极还是中性。这种分类可以帮助企业了解客户反馈,评估公众舆论,并根据情感分析的结果做出数据驱动的决策。
以下的数据映射项目利用人工智能技术,分析支持数据库中接收到的记录,并自动判断一条记录是否.. 积极的;正面的;乐观的。, 负面的;消极的;负数。,构成了一个.. 错误报告或者应该被视为一种.. 功能需求建议。结果随后会被写入客户反馈数据库。
这个。 这篇文章描述了所需的步骤。 要在 MapForce 中构建这种基于人工智能的 ETL 功能。
与文本分类类似,由人工智能驱动的图像分类技术在性能上远远领先于传统技术。例如,在电子商务领域,人工智能可以自动将产品图像分类到不同的类别,或者在图像中识别特定的物体。这种分类可以帮助进行库存管理、搜索优化、内容组织等。
在下面的数据映射示例中,一个产品目录数据库通过人工智能驱动的图像分类技术进行了增强,从而为产品列表添加了描述性标签。这在产品名称含义模糊(例如,“Mongoose”,指的是一种自行车)或者产品描述缺失的情况下尤其有用。
该功能调用微软 Azure 认知服务中的计算机视觉 API,用于分析产品图片,并返回一个标签列表,这些标签将被添加到数据库中。例如,当分析一张名为“黄色西瓜”的图片时(实际上这是一种鱼饵),返回的标签是“鱼饵”、“金属制品”。
学习如何创建这个数据集成项目。 本文使用人工智能技术对图像进行分类。.
要开始使用,您可以了解更多关于我们如何构建上述情感分析数据抽取、转换和加载 (ETL) 项目,或者基于人工智能的图像分类数据映射。 您可以在自己的数据集成项目中尝试这些功能,只需下载 MapForce 的完整功能免费试用版即可。



