
本文旨在解决PHP客户端在尝试获取BigQuery查询结果时遇到的404“未找到”错误,特别是当BigQuery作业在特定地理区域执行时。核心问题在于API调用未显式指定作业的执行区域,导致无法正确检索结果。解决方案是,在调用`jobs->getQueryResults()`方法时,通过第三个参数传递一个包含作业区域信息的数组。
Google BigQuery是一个高度可扩展、经济高效的无服务器企业数据仓库,用于分析PB级数据。在PHP应用程序中与BigQuery交互通常通过Google Cloud Client Library for PHP实现。这涉及初始化Google_Client,设置必要的认证凭据和作用域,然后使用Google_Service_Bigquery服务对象来提交查询、管理作业并获取结果。
一个典型的BigQuery查询提交流程如下所示:
<?php
require __DIR__ . '/vendor/autoload.php';
use Google\Client;
use Google\Service\Bigquery;
use Google\Service\Bigquery\Job;
use Google\Service\Bigquery\JobConfiguration;
use Google\Service\Bigquery\JobConfigurationQuery;
// 1. 初始化Google客户端
$client = new Client();
$client->setApplicationName('Google-BigQuery-PHP-App');
// 如果在App Engine等Google Cloud环境中运行,可以使用默认凭据
// 否则,需要通过服务账号密钥文件进行认证
$client->useApplicationDefaultCredentials();
// 设置必要的API作用域
$client->addScope('https://www.googleapis.com/auth/bigquery');
$client->addScope('https://www.googleapis.com/auth/devstorage.read_write'); // 如果涉及存储操作,可能需要此权限
// 2. 创建BigQuery服务对象
$bq = new Bigquery($client);
// 3. 构建查询作业配置
$query = "SELECT * FROM `your-project.your_dataset.your_table` LIMIT 100"; // 替换为你的SQL查询
$queryConfig = new JobConfigurationQuery();
$queryConfig->setQuery($query);
// 可以选择性设置默认项目ID,如果查询中未完全限定表名
// $queryConfig->setDefaultDataset(new Google_Service_Bigquery_DatasetReference(['projectId' => 'your-project', 'datasetId' => 'your_dataset']));
$config = new JobConfiguration();
$config->setQuery($queryConfig);
$job = new Job();
$job->setConfiguration($config);
// 4. 提交查询作业
$projectId = 'your-project-id'; // 替换为你的Google Cloud项目ID
try {
$submittedJob = $bq->jobs->insert($projectId, $job);
$jobReference = $submittedJob->getJobReference();
$jobId = $jobReference->getJobId();
echo "BigQuery作业提交成功,作业ID: " . $jobId . PHP_EOL;
} catch (Exception $e) {
echo "作业提交失败: " . $e->getMessage() . PHP_EOL;
exit;
}
// 后续步骤:获取查询结果 (这正是问题所在)
// ...在成功提交BigQuery查询作业并获取到作业ID后,下一步通常是使用jobs-youjiankuohaophpcngetQueryResults()方法来检索查询结果。然而,开发者有时会遇到一个令人困惑的404 Not found错误,即使作业ID看起来正确无误,并且在BigQuery控制台(dashboard)中查看时,该作业也显示为已成功完成。
立即学习“PHP免费学习笔记(深入)”;
典型的错误响应如下:
{
"error": {
"code": 404,
"message": "Not found: Job my-project:job-id",
"errors": [...]
}
}即使通过以下代码尝试获取结果,也可能触发此错误:
// 假设 $jobId 和 $projectId 已经正确获取
try {
$queryResults = $bq->jobs->getQueryResults($projectId, $jobId); // 此时可能抛出404错误
// ... 处理结果 ...
} catch (Exception $e) {
echo "获取查询结果失败: " . $e->getMessage() . PHP_EOL;
}仔细检查BigQuery控制台中的作业详情,可能会发现作业ID的显示方式与PHP客户端直接使用的作业ID有所不同。例如,控制台可能显示为my-project:europe-west1.job-id,其中包含了区域信息(europe-west1),而PHP客户端默认情况下可能只使用了纯粹的job-id部分。这正是问题的关键所在。
BigQuery作业(包括查询作业、加载作业、导出作业等)是具有区域性的资源。这意味着它们在特定的地理位置(例如us-east1、europe-west1、asia-northeast1等)执行和存储其元数据。当您提交一个BigQuery作业时,如果未明确指定区域,BigQuery可能会根据数据集的位置或项目的默认位置自动选择一个区域来执行该作业。
当您通过jobs->getQueryResults()方法尝试获取作业结果时,BigQuery API需要知道该作业是在哪个区域执行的,以便在正确的区域查找并返回结果。如果API调用中没有提供这个区域信息,BigQuery服务会尝试在默认或全局区域查找作业。如果作业实际上是在一个不同的、非默认的区域执行的,那么API将无法找到该作业,从而返回404 Not found错误。
这解释了为什么控制台能够找到作业(因为它可能在内部处理了区域信息),而PHP客户端的直接调用却失败了。
解决此问题的关键是在调用jobs->getQueryResults()方法时,显式地将BigQuery作业的执行区域作为参数传递。jobs->getQueryResults()方法接受一个可选的第三个参数,该参数是一个关联数组,用于传递额外的请求选项,其中就包括location。
您需要做的就是创建一个包含"location"键值对的数组,并将其作为第三个参数传递给getQueryResults()方法。
<?php
// ... (省略前面的客户端初始化、认证和作业提交代码) ...
// 假设 $jobId 和 $projectId 已经正确获取
$jobId = $jobReference->getJobId(); // 从 jobs->insert 返回的 jobReference 中获取
$projectId = 'your-project-id'; // 你的项目ID
// 确定BigQuery作业实际执行的区域
// 这个区域信息通常在提交作业时确定,或者可以在BigQuery控制台中查看作业详情获取。
$jobLocation = 'europe-west1'; // 替换为你的BigQuery作业实际执行的区域
// 构建包含 location 参数的数组
$arrLocation = array("location" => $jobLocation);
try {
// 正确的解决方案:传递 location 参数
$queryResults = $bq->jobs->getQueryResults($projectId, $jobId, $arrLocation);
echo "成功获取查询结果!" . PHP_EOL;
// 遍历并处理查询结果
if ($queryResults->getRows()) {
foreach ($queryResults->getRows() as $row) {
foreach ($row->getF() as $field) {
echo $field->getV() . "\t";
}
echo PHP_EOL;
}
} else {
echo "查询没有返回任何行。" . PHP_EOL;
}
} catch (Exception $e) {
echo "获取查询结果失败: " . $e->getMessage() . PHP_EOL;
// 捕获并打印详细的错误信息,有助于调试
if (method_exists($e, 'getErrors')) {
print_r($e->getErrors());
}
}通过这种方式,getQueryResults()方法就能够知道去哪个区域查找指定的作业ID,从而成功检索到查询结果。
在PHP客户端中,当BigQuery作业在特定区域执行时,尝试使用jobs->getQueryResults()获取查询结果却遇到404 Not found错误,其根本原因在于API调用未能显式指定作业的执行区域。通过在getQueryResults()方法的第三个参数中,以关联数组的形式传递"location"键值对,可以明确告知BigQuery API作业所在的区域,从而成功检索到查询结果。理解BigQuery作业的区域性是解决此类问题的关键,并有助于构建更健壮、高效的PHP BigQuery集成应用。
以上就是BigQuery PHP客户端查询结果404错误:区域性作业的处理的详细内容,更多请关注php中文网其它相关文章!
PHP怎么学习?PHP怎么入门?PHP在哪学?PHP怎么学才快?不用担心,这里为大家提供了PHP速学教程(入门到精通),有需要的小伙伴保存下载就能学习啦!
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号