返回所有脚本
免费试用

Yelp业务概述通过搜索过滤器
01KEBQZTDXSMEHHZVFN10V5FK1
由 CafeScraper 维护
Yelp商业档案收集工具一键自动收集数据,将分散的搜索结果转换为结构化数据集。该工具通过自定义搜索和过滤条件捕获核心业务信息,并支持以JSON、CSV等格式导出结果。
补充说明
使用Yelp商家评论采集工具可获取哪些数据?
通过该采集工具,你可以从Yelp提取全面的评论相关信息,包括撰写评论的作者/用户信息、评论者给出的评分、评论发布日期、评论完整文本、相关配图、其他用户的互动反馈、针对该评论的回复内容、该评论在同一商家所有评论中的排序/位置、评论者是否在该商家签到的标识、被评论商家的名称、商家页面的URL链接、评论者是否拥有精英会员(Elite)身份的标识、联系方式以及评论是否包含推荐内容。
若你需要额外的信息,请与我们联系。
该采集工具是否需要编程知识?操作流程是否复杂?
该采集工具完全不需要任何编程知识。我们为非技术用户设计了极其友好的图形化界面,仅需三个简单步骤即可完成操作:
- 选择你偏好的采集方式(如通过URL),并输入必要信息(如URL)。
- 点击“开始”按钮,系统将自动运行。
- 任务完成后,只需点击“导出”按钮,即可下载结构化文件。
整个过程仅涉及点击操作和基础信息输入,无需编写任何代码。同时,我们也为开发人员和技术专业人士提供了全面的文档,以支持高级集成需求。
采集结果可导出为哪些格式?
你可以将结果导出为JSON、CSV等结构化格式。
返回的数据是否为实时数据?
是的,每次调用都会即时从Yelp爬取最新的公开数据,确保结果与平台保持同步,不依赖任何缓存,从而保证数据的时效性。
采集过程是否稳定且合规?
我们通过多项技术措施确保采集过程稳定、合规且负责任:
- 遵守规则:我们的爬虫逻辑严格遵循Yelp的robots.txt协议,并模拟正常用户的访问行为,避免对Yelp服务器造成任何不利影响。
- 智能调度:我们的系统采用IP地址轮换、随机请求延迟等技术,有效规避反爬机制,大幅降低被封禁的风险。
- 持续维护:我们的专业团队持续监控Yelp页面结构的变化,并及时更新采集算法,以维持服务的长期稳定性。
我们的目标是为你提供安全、可持续的数据获取方式,而非一次性的数据调取。
字典
| 列名 | 描述 | 数据类型 |
|---|---|---|
| business_id | 商家的唯一标识符 | Text |
| yelp_biz_id | 与商家关联的Yelp商家ID | Text |
| name | 商家名称 | Text |
| updates_from_business | 商家提供的更新或信息 | Array |
| overall_rating | 商家的总体评分 | Number |
| reviews_count | 商家的评论总数 | Number |
| is_claimed | 指示商家是否已在Yelp上认领(布尔值:True/False) | Boolean |
| categories | 与商家相关的类别或标签 | Array |
| website | 商家的网站URL | Text |
| phone_number | 商家的联系电话号码 | Text |
| opening_hours | 商家的营业时间 | Object |
| address | 商家的街道地址 | Object |
| amenities | 商家提供的便利设施或特色服务 | Array |
| about_the_business | 关于商家的信息或描述 | Text |
| highlights | 商家的特色服务或提供的亮点 | Array |
| services_offered | 商家提供的服务 | Array |
| URL | 商家页面的URL链接 | url |
| price_range | 与商家相关的价格范围: - 经济实惠(通常每人低于10美元) - 中等价位(约每人11-30美元) - 高价(约每人31-60美元) - $$非常昂贵(超过每人61美元) |
Text |
| latitude | 商家位置的纬度坐标 | Number |
| longitude | 商家位置的经度坐标 | Number |
| service_area | 商家服务的地理区域或范围 | Text |
| city | 商家所在的城市 | Text |
| state | 商家所在的州或地区 | Text |
| country | 商家所在的国家 | Text |
| zip_code | 商家位置的邮政编码 | Text |
| images_videos_urls | 与商家相关的图片或视频的URL | Array |
| is_closed | 指示商家是否已关闭(布尔值:True/False) | Boolean |
输入参数
Yelp分类 category Required Text
描述:该参数用于指定需要搜索的分类。
Yelp地点 location Required Text
描述:该参数用于指定需要搜索的地点。
商家搜索结果最大页数 business_page_turning Required Number
描述:该参数用于指定要爬取的商家搜索结果页面的最大页数。