如何在 Python 中使用 Boto3 库来运行 Glue Job?
问题陈述- 在 Python 中使用 boto3 库来运行粘合作业。例如,运行作业 run_s3_file_job。
解决这个问题的方法/算法
步骤 1 - 导入 boto3 和 botocore 异常以处理异常。
第 2 步- job_name 是必需参数,而 arguments 是函数中的可选参数。很少有工作需要参数来运行。在这种情况下,参数可以作为 dict 传递。
例如:arguments = {'arguments1' = 'value1', 'arguments2' = 'value2'}
如果作业不带参数,则只需传递 job_name。
步骤 3 - 使用 boto3 库创建 AWS 会话。确保在默认配置文件中提到 region_name。如果未提及,则在创建会话时显式传递 region_name。
第 4 步- 为胶水创建一个 AWS 客户端。
第 5 步- 现在使用 start_job_run 函数并根据需要传递 JobName 和参数。
第 6 步- 一旦作业开始,它会为 job_run_id 提供作业的元数据。
第 7 步- 如果检查作业时出现问题,则处理通用异常。
示例
使用以下代码运行现有的粘合作业 -
import boto3输出结果frombotocore.exceptionsimport ClientError
def run_glue_job(job_name, arguments = {}):
session = boto3.session.Session()
glue_client = session.client('glue')
try:
job_run_id = glue_client.start_job_run(JobName=job_name, Arguments=arguments)
return job_run_id
except ClientError as e:
raise Exception( "boto3 client error in run_glue_job: " + e.__str__())
except Exception as e:
raise Exception( "Unexpected error in run_glue_job: " + e.__str__())
print(run_glue_job("run_s3_file_job"))
{'JobRunId':'jr_5f8136286322ce5b7d0387e28df6742abc6f5e6892751431692ffd717f45fc00',
'ResponseMetadata': {'RequestId': '36c48542-a060-468b-83ccb067a540bc3c', 'HTTPStatusCode': 200, 'HTTPHeaders': {'date': 'Sat, 13
Feb 2021 13:36:50 GMT', 'content-type': 'application/x-amz-json-1.1',
'content-length': '82', 'connection': 'keep-alive', 'x-amzn-requestid':
'36c48542-a060-468b-83cc-b067a540bc3c'}, 'RetryAttempts': 0}}
以上是 如何在 Python 中使用 Boto3 库来运行 Glue Job? 的全部内容, 来源链接: utcz.com/z/350492.html