返回所有脚本

Yelp业务概述按业务URL

01KEEB33MXBZTRA3RPVFRNGBKA
由 CafeScraper 维护
免费试用
我们的Yelp商家资料收集工具支持一键自动化数据采集,将分散的平台信息转化为结构化数据集。该工具通过商家页面链接获取核心商家信息,并提供JSON、CSV等多种格式的导出功能。

补充说明

使用Yelp商家评论采集工具可获取哪些数据?

通过该采集工具,你可从Yelp提取全方位的评论相关信息,包括评论作者/用户信息、评论者评分、评论发布日期、评论完整文本、相关配图、其他用户的互动反馈、针对该评论的回复、该评论在同一商家所有评论中的排序/位置、评论者是否在该商家签到的标识、被评论商家名称、商家页面链接、评论者是否拥有精英会员身份的标识、联系方式,以及评论是否包含推荐内容。
若你需要其他额外信息,可与我们取得联系。

该采集工具是否需要编程知识?操作流程是否复杂?

该采集工具完全无需任何编程知识。我们为非技术用户设计了极其友好的图形化操作界面,仅需三个简单步骤即可完成操作:

  1. 选择你偏好的采集方式(如通过链接),并输入所需的相关信息(如链接)。
  2. 点击「开始」按钮,系统将自动运行采集任务。
  3. 任务完成后,只需点击「导出」按钮,即可下载结构化的采集结果文件。
    整个操作过程仅涉及点击和基础信息输入,无需编写任何代码。同时,我们也为开发人员和技术专业人士提供了完善的文档资料,以支持各类高级集成需求。

采集结果可导出为哪些格式?

你可将采集结果导出为JSON、CSV等结构化数据格式。

返回的数据是否为实时数据?

是。每次调用工具都会即时从Yelp爬取最新的公开数据,确保结果与平台数据实时同步,全程不依赖任何缓存,保障数据的时效性。

采集过程是否稳定且合规?

我们通过多项技术手段,确保采集过程稳定、合规且可控:

  1. 合规遵循规则:爬虫逻辑严格遵守Yelp的robots.txt协议,同时模拟正常用户的访问行为,避免对Yelp的服务器造成任何不利影响。
  2. 智能任务调度:系统采用IP地址轮换、随机请求延迟等技术,有效规避反爬机制,大幅降低被封禁的风险。
  3. 持续技术维护:专业技术团队持续监控Yelp的页面结构变化,并及时更新采集算法,保障服务的长期稳定性。
    我们的目标是为你提供安全、可持续的数据获取服务,而非一次性的数据调取。

字典

列名 描述 数据类型
business_id 企业的唯一标识符 Text
yelp_biz_id 与该企业关联的Yelp企业ID Text
name 企业名称 Text
updates_from_business 企业提供的更新或信息 Array
overall_rating 企业的总体评分 Number
reviews_count 企业的评论总数 Number
is_claimed 指示该企业是否已在Yelp上认领(布尔值:True/False) Boolean
categories 与企业相关的类别或标签 Array
website 企业的网站URL Text
phone_number 企业的联系电话号码 Text
opening_hours 企业的营业时间 Object
address 企业的街道地址 Object
amenities 企业提供的设施或特色服务 Array
about_the_business 关于企业的信息或描述 Text
highlights 企业的突出特色或服务项目 Array
services_offered 企业提供的服务 Array
URL 企业页面的URL或链接 url
price_range 与企业相关的价格范围:
- $经济实惠(通常每人低于10美元)
- $$中等价位(约每人11-30美元)
- $$$高价(约每人31-60美元)
- $$$$非常昂贵(超过每人61美元)
Text
latitude 企业位置的纬度坐标 Number
longitude 企业位置的经度坐标 Number
service_area 企业服务的地理区域或范围 Text
city 企业所在的城市 Text
state 企业所在的州或地区 Text
country 企业所在的国家 Text
zip_code 企业位置的邮政编码 Text
images_videos_urls 与企业相关的图片或视频的URL Array
is_closed 指示该企业是否关闭(布尔值:True/False) Boolean

输入参数

Yelp商家链接 business_url Required Text
描述:该参数用于指定需要爬取的Yelp商家链接。