Back
Jason Yuan

Jason Yuan

Reallysec 助力 Adobe 打造 AI 驱动的图像搜索与识别系统

Reallysec 助力 Adobe 打造 AI 驱动的图像搜索与识别系统

Adobe 的核心产品与云服务体系

全球知名的软件巨头 Adobe,以其旗舰产品 Photoshop、Illustrator 和 Acrobat 闻名。这些核心应用被整合进 Adobe 的云服务体系,包括:

  • Creative Cloud(创意云)
  • Document Cloud(文档云)
  • Experience Cloud(体验云)

这些云平台中,尤其是图像搜索至关重要的产品(如 Adobe Stock),都在后台广泛采用 Elasticsearch 技术以支撑其高性能的内容检索能力。

Elasticsearch 的弹性与稳定性非常高……并且它在开源特性与严格审查机制之间取得了良好的平衡。


Adobe + Elasticsearch 的搜索生态格局

Adobe 当前自主运维的 Elastic Stack 架构包括:

  • 18 个生产集群
  • 托管超过 100 亿份文档
  • 实时写入速率约为每秒 6000 个文档

以 Adobe Lightroom 为例,为更好地支持图像搜索体验,Adobe 将系统从 Amazon Elasticsearch Service 迁移至自建的 Elasticsearch 集群,并迁移了近 35 亿份文档

Adobe 的内容类型多以非结构化数据为主,包括图像、视频、Photoshop 文件等,同时也包含大量结构化文档,特别是 PDF 格式。在此背景下,Elastic Stack 结合 Adobe 自研的 Elasticsearch 插件,有效支持了以下多样化的内容搜索场景:

  • 基于计算机视觉与元数据的智能搜索
  • 深度文本与混合内容搜索
  • 视频及富媒体格式搜索
  • 企业级文档检索
  • 内容发现与个性化推荐

结合 Adobe Sensei 与 Elasticsearch 的机器学习应用

Adobe Sensei 的 AI 与机器学习技术承担了图像搜索模型训练的核心任务。为配合 Sensei,Adobe 开发了多个专用 Elasticsearch 插件:

  • 相似度插件(Similarity Plugin)
  • 搜索排序插件(Ranking Plugin)

这些插件增强了 Adobe 在图像识别和相似图像查找方面的能力,提供了如下实时搜索功能:

  • 人脸检测(Face Detection)
  • 物体识别(Object Detection)
  • 人脸聚类(Face Clustering)
  • 自动标签(Auto Tagging)
  • 命名实体识别(Named Entity Recognition)

Adobe Stock 的机器学习图像搜索示例

Adobe Stock 是 Adobe 图像搜索能力的代表平台,其内容库包含超过 1.3 亿张图像资产。Adobe Stock 展现出以下特性:

  • 强大的图像检索能力:可根据关键词、属性等信息进行精准检索
  • 便捷的图像筛选与排序功能:通过内容、颜色、构图等属性进行相似图像查找
  • 高级过滤维度:支持按价格、标签、类型等字段进行索引与筛选

深度学习模型与 Elasticsearch 的协同工作

Adobe Stock 背后的图像搜索技术,基于深度训练的机器学习模型与 Elasticsearch 数据存储系统协同运作。这些模型采用 卷积神经网络(CNN) 来学习图像的深度特征表达(embeddings),并将这些特征映射为欧几里得距离空间中的相似度指标,用于建立图像及属性的聚类关系。

在此基础上,Adobe 还引入了大量额外的机器学习技术,使得整个系统智能度极高,为用户带来既美观又高效的图像搜索体验。

Copyright © 2025 武汉真的安全信息技术有限公司
鄂ICP备2022016220号-1

ReallySec