深度网页内容获取工具
本工具采用高保真度浏览器模拟技术,理论上适用于所有依赖客户端环境检测的网站,例如需要进行Cloudflare点击验证的页面。
专为现代网络设计,可解析由JavaScript动态渲染的页面,获取其最终源码。有效应对各类客户端环境检测挑战。
本工具采用高保真度浏览器模拟技术,理论上适用于所有依赖客户端环境检测的网站,例如需要进行Cloudflare点击验证的页面。
专为现代网络设计,可解析由JavaScript动态渲染的页面,获取其最终源码。有效应对各类客户端环境检测挑战。
您也可以通过API直接调用我们的源码获取服务。
/scrape
请求必须为 `Content-Type: application/json`,并包含以下JSON对象:
{
"url": "https://target-website.com"
}
{
"source_code": "...",
"logs": [
"正在生成浏览器指纹...",
"正在启动浏览器内核...",
"..."
]
}
{
"error": "Timeout 90000ms exceeded.",
"logs": [...]
}
curl -X POST 'https://vapi.233.ka.xyz/scrape' \
--header 'Content-Type: application/json' \
--data-raw '{
"url": "https://example.com"
}'
import requests
import json
api_url = "https://vapi.233.ka.xyz/scrape"
payload = {"url": "https://example.com"}
response = requests.post(
api_url,
headers={"Content-Type": "application/json"},
data=json.dumps(payload)
)
if response.status_code == 200:
print(response.json())
else:
print(f"Error: {response.status_code}", response.text)
async function getSourceCode(targetUrl) {
const response = await fetch('https://vapi.233.ka.xyz/scrape', {
method: 'POST',
headers: {
'Content-Type': 'application/json',
},
body: JSON.stringify({ url: targetUrl }),
});
const data = await response.json();
if (!response.ok) {
throw new Error(data.error);
}
return data;
}
getSourceCode('https://example.com')
.then(data => console.log(data.source_code))
.catch(error => console.error(error));
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, 'https://vapi.233.ka.xyz/scrape');
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_POST, 1);
curl_setopt($ch, CURLOPT_POSTFIELDS, json_encode([
'url' => 'https://example.com'
]));
$headers = array();
$headers[] = 'Content-Type: application/json';
curl_setopt($ch, CURLOPT_HTTPHEADER, $headers);
$result = curl_exec($ch);
if (curl_errno($ch)) {
echo 'Error:' . curl_error($ch);
}
curl_close($ch);
var_dump(json_decode($result, true));