您听说过 Oxylabs 的新一代住宅代理吗?本文将向您详细介绍如何使用它。
快速入门
新一代住宅代理专为重型数据检索操作而设计。它们可以毫不费力地提取网络数据,不会出现任何延迟或错误。该产品与普通代理一样可定制,但同时能保证更高的成功率。除了可重复使用的 cookies 和 POST 请求外,还支持自定义标题和 IP 粘性。
如果您曾经使用过普通代理进行数据搜刮,那么集成下一代住宅代理将轻而易举。唯一不同的是,我们要求用户接受我们的证书,或完全忽略它。 -k
或 --不安全
cURL 标志(或您选择的语言中的等效表达式)。
要使用新一代住宅代理进行请求,我们需要使用 ngrp.oxylabs.io:60000
端点。下面是一个 cURL 示例。您还可以找到其他语言的代码示例 这里 或我们的 GitHub.
curl -k -x ngrp.oxylabs.io:60000 -U "USERNAME:PASSWORD" http://ip.oxylabs.io
如果您有任何本文件未涉及的问题,请联系您的客户经理或我们的支持人员,地址是 [email protected].
提出要求
GET ngrp.oxylabs.io:60000
最简单的方法是向我们发送一个不带任何自定义选项的简单查询。我们将在我们的终端添加所有标准标头,选择最快的代理并向您发送响应正文。
要使用下一代住宅代理所需的功能,如设置代理地理位置或通过会话控制重复使用同一 IP,我们需要在请求中发送额外的标头。
以下是受支持的功能和标头的完整列表:
查询参数
参数 | 说明 | |
---|---|---|
X-Oxylabs-Session-Id |
如果需要在多个请求中重复使用同一个 IP,可添加一个会话 ID,它可以是一个随机字符串 | |
X-Oxylabs-地理位置 |
要使用特定位置的 IP 地址,请指定国家或城市,例如 德国 .可找到支持的地理位置 这里. |
|
页眉 |
您可以添加自己的标题,例如 用户代理 或任何其他信息,而不是使用预先生成的信息。 |
|
曲奇 |
您可以添加自己的 cookie,例如 Cookie:NID=1234567890 您的要求。 |
|
X-Oxylabs-Status-Code |
如果目标返回成功响应的自定义状态代码,您可以发送响应的状态代码,我们的系统将不会重试请求。 | |
X-Oxylabs-Render |
如果您希望呈现 JavaScript,请使用 网页 获取渲染的 HTML 或 png 获取页面截图。 |
|
X-Oxylabs-Parser-Type |
该标头可用于选择解析器类型。目前 电子商务产品 是支持的。 |
|
X-Oxylabs-Parse |
标头用于解析网站数据。数值 1 必须通过才能进行解析。 |
curl -k -v -x ngrp.oxylabs.io:60000 -U user:pass1 "https://ip.oxylabs.io"
会议
如果您想使用同一个代理发出多个请求,可以通过添加 X-Oxylabs-Session-Id
头,其中包含一个随机生成的会话 ID 字符串。我们将为该 ID 分配一个代理,并最多保留 10 分钟。之后,我们将为该特定会话 ID 分配一个新的代理。
curl -k -v -x ngrp.oxylabs.io:60000 -U user:pass1 "https://ip.oxylabs.io" -H "X-Oxylabs-Session-Id:123randomString"
地理位置
如果从不受支持的地理位置访问,某些网站将不提供内容。您可以在请求中指定要从哪个国家访问目标网站。只需添加 X-Oxylabs-地理位置
标头,其值设置为国家名称(例如)、 德国
德国或 美国
美国。
新一代住宅代理还支持城市级目标定位。如果要添加城市,只需在国家前添加城市名称即可,例如:: 德国慕尼黑
.
支持的地理位置参数值的完整列表如下所示 这里.
curl -k -v -x ngrp.oxylabs.io:60000 -U user:pass1 "https://ip.oxylabs.io" -H "X-Oxylabs-Geo-Location:慕尼黑,德国"
页眉
如果您比我们更了解某个特定目标,您可以在请求中添加自己的标头。它既可以是标准标头,如 用户代理
或 接受语言
以及完全定制和针对特定目标的内容。
curl -k -v -x ngrp.oxylabs.io:60000 -U user:pass1 "https://ip.oxylabs.io" -H "Your-Custom-Header: interesting header content" -H "User-Agent:Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Ubuntu Chromium/73.0.3683.86 Chrome/73.0.3683.86 Safari/537.36" -H "Accept-Language: en-US" -H "接受语言:en-US" -K
曲奇
系统还允许为目标网站设置自定义 cookie。通过您的首次请求,我们将返回所有响应标头和 cookie。您可以在自己的终端修改它们,并在下一次请求时将它们发送回我们的系统。如果您使用相同的 IP 地址连续进行几次请求,重复使用 cookie 可能是个好主意(参见 会议 更多)
curl -k -v -x ngrp.oxylabs.io:60000 -U user:pass1 "https://ip.oxylabs.io" -H "Cookie:NID=1234567890; 1P_JAR=0987654321"
自定义状态代码
默认情况下,只要返回 2xx 或 4xx 状态代码,我们就认为请求成功。不过,有时网站会在返回所需内容的同时返回非标准 HTTPS 状态代码。如果您的某个目标出现这种情况,您可以指出哪些状态代码是可接受的,并且对您有实际价值。只需添加 X-Oxylabs-Status-Code
头,其中包含所有对您有效的 HTTP 响应代码。请注意,2xx 和 4xx 仍会被自动标记为成功。
curl -k -v -x ngrp.oxylabs.io:60000 -U user:pass1 "https://ip.oxylabs.io" -H "X-Oxylabs-Status-Code:500,501,502,503"
POST 请求
下一代住宅代理服务器不仅支持发送 获取
请求,还可以让您 职位
到你选择的网络端点。这意味着您可以向目标网站发送数据,然后让网站返回不同的结果。
curl -X POST -k -v -x ngrp.oxylabs.io:60000 -U user:pass1 "https://ip.oxylabs.io" -d "@/path/to/file.json"
JavaScript 渲染
启用 JavaScript 渲染。在目标需要 JavaScript 加载内容时使用。该参数有两个可用值: 网页
(获取原始输出)和 png
(获取 Base64 编码的截图)。
curl -k -v -x ngrp.oxylabs.io:60000 -U user:pass1 "https://ip.oxylabs.io" -H "X-Oxylabs-Render: html"
自适应解析
自适应解析能够解析任何电子商务产品页面中最重要的字段。要启用电子商务产品页面的自适应解析功能,需要发送两个附加标头: X-Oxylabs-Parser-Type: ecommerce_product
来选择解析器类型,而 X-Oxylabs-Parse: 1
来解析检索到的页面。
可由下一代住宅代理自适应解析电子商务产品页面的字段:
- 标题
- 正常价格
- 报价
- 货币
- 产品说明
- 产品 ID
- 图片 URL
- 网页中的 URL
curl -v -k -x ngrp.oxylabs.io:60000 -U user:pass1 "https://ip.oxylabs.io" -H "X-Oxylabs-Parser-Type: ecommerce_product" -H "X-Oxylabs-Parse: 1"
输出示例
{ "结果":[ { "内容":{ "url":"https://ip.oxylabs.io/product/product_example.html"、 "body":{ "price":11.99, "标题":"产品标题示例"、 "货币":"$"、 "old_price":15.99, "description": null、 "image_links":[ "https://ip.oxylabs.io/img/product_example.png" ], "ids_from_url":[], "simple_links":[ { "链接":"https://ip.oxylabs.io/product/another_example.html"、 "description":"另一个产品示例" } ], "ids_from_html":[ { "产品编号":"14158288" } ], "price_range_lower": null、 "price_range_upper": null }, "元":{ "标题":"产品元标题示例"、 "关键字":[], "description":"产品描述示例" }, "parse_status_code":12000 }, "创建时间":"2020-01-01 10:00:00", "更新时间":"2020-01-01 10:00:07", "id":29964797, "页":1, "url":"https://ip.oxylabs.io/product/product_example.html"、 "job_id":"6699272813062145025", "status_code":200 } ] }
使用统计
您可以访问我们的 仪表板 或通过查询以下端点:
GET https://data.oxylabs.io/v1/stats
默认情况下,API 将返回所有时间的使用统计数据。添加 group_by=month
将返回月度统计数据,而 group_by=day
将返回每日数据。流量以字节为单位显示。
该查询将返回所有时间的统计数据。您可以通过添加以下任一选项来查询您每天和每月的使用量 group_by=day
或 group_by=month
.流量以字节为单位显示。
curl --user user:pass1 'https://data.oxylabs.io/v1/stats'
输出示例
{ "元":{ "group_by": null、 "date_from": null、 "date_to": null、 "source": null }, "数据":{ "来源":[ { "results_count_all":"1482", "results_count":"0", "realtime_results_count":"0", "super_api_results_count":"12777", "渲染":"0", "geo_location":"0", "平均响应时间2.18, "request_traffic":"6629", "响应流量":"17850", "标题":"通用" } ] } }
答复样本
这就是响应的样子。要查看报头和 cookie,必须启用 "详细 "模式。
http/1.1 200 ok X-Job-Id:1234567890123456 X-Session-Id:123randomString cf-cache-status:动态 cf-ray:55c2ab837eddcba8-VIE content-encoding: gzip content-length: 72657 content-type: text/html date: Tue, 1 Jan 2020 00:00:01 GMT,expect-ct: max-age=604800,report-uri="https://report-uri.cloudflare.com/cdn-cgi/beacon/expect-ct" last-modified:Tue, 1 Dec 2020 00:00:00 GMT 服务器: cloudflare status: 200 strict-transport-security: max-age=31536000 X-DNS-Prefetch-Control: off Set-Cookie:NID=1234567890; expires=Wed, 29-Jul-2020 10:56:21 GMT Set-Cookie:1P_JAR=0987654321; expires=Wed, 29-Jul-2020 10:56:21 GMT x-cache:MISS from localhost x-cache-lookup:MISS from localhost:3129content here
参考资料
https://docs.oxylabs.io/next-gen-residential-proxies/index.html#quick-start
免责声明 这部分内容主要来自商家。如果商家不希望在我的网站上显示,请 联系我们 删除您的内容。
最后更新于 5 月 16, 2022