一、搜索条件 📌
支持多条件组合筛选,精准定位爬取范围,提升数据抓取效率,具体条件如下表:
| 筛选类型 | 具体说明 |
|---|---|
| 关键词筛选 | 支持模糊匹配,关联视频标题、简介内容,快速检索目标内容(含迪士尼原创、授权内容) |
| 类型筛选 | 按视频属性分类(动画电影、真人电影、剧集、动漫、纪录片、迪士尼原创等),可单选或多选 |
| 地区筛选 | 按迪士尼平台划分的地区维度筛选,适配不同地区发行内容抓取(含多语言版本筛选) |
| 年份筛选 | 支持单一年份精准筛选、年份区间(如2020-2024)范围筛选,覆盖经典与新上线内容 |
| 热度筛选 | 按平台实时热度排序筛选,可优先抓取高热度、高曝光内容(含迪士尼推荐榜单内容) |
二、导出字段 📋
爬取完成后,导出以下完整结构化字段,无冗余、无缺失,适配开发与使用需求,具体字段分类如下表:
| 字段分类 | 具体字段 | 补充说明 |
|---|---|---|
| 基础核心字段 | 标题、简介、类型、年份 | 简介为完整剧情/内容描述;类型可多类型标注(如“动画电影+迪士尼原创”) |
| 基础核心字段 | 演员、导演、配音演员 | 演员/配音演员按优先级排序;区分真人演员与配音演员,标注对应角色 |
| 基础核心字段 | 评分、时长、分级 | 评分含平台官方评分;时长单位:分钟;分级标注(如G级、PG级) |
| 基础核心字段 | 地区、语言 | 地区为内容发行/归属地区;语言含原声、配音、字幕语言列表 |
| 剧集专属字段 | 季数、集数、单集信息 | 仅剧集类内容导出;单集信息含标题、简介、时长、对应配音/字幕 |
| 媒体资源字段 | 封面图、缩略图、预告片URL | 均为高清URL链接,缩略图尺寸适配展示需求;预告片URL支持直接调用 |
| 迪士尼专属字段 | 版权归属、IP关联 | 标注版权归属(迪士尼原创/授权);关联IP(如“米老鼠系列”“冰雪奇缘系列”) |
三、输出格式 📊
支持两种通用结构化格式,可按需选择导出,适配不同使用场景,具体如下表:
| 输出格式 | 适用场景 | 核心优势 |
|---|---|---|
| JSON 格式 | 程序调用、批量导入系统、二次开发 | 结构清晰,适配代码解析,便于自动化处理,可兼容IP关联字段嵌套 |
| CSV 格式 | 表格查看、数据筛选、Excel编辑、数据统计 | 简洁直观,操作便捷,适配人工整理分析,字段对应无错乱 |
补充说明(贴合迪士尼平台特性)
- 适配迪士尼平台专属内容(如迪士尼原创动画、皮克斯联动内容、漫威联动影视),确保IP关联字段精准抓取;
- 区分真人影视与动画影视,对应字段(配音演员/真人演员)精准拆分,贴合迪士尼内容特点。