
本文旨在解决在University of Michigan的Runstone环境中,使用`requests_with_caching`库调用TasteDive API时,API返回HTML而非预期JSON数据的问题。我们将深入探讨该问题产生的原因,并提供一个简洁有效的Python解决方案,确保在特定学习环境下能够正确获取并解析API返回的JSON数据。
在数据收集和处理任务中,与外部API交互是常见操作。然而,有时会遇到API行为不符合预期的情况,例如返回HTML内容而非标准的JSON格式。对于University of Michigan课程中使用的TasteDive API,存在一个特殊的背景:该API本身已不再活跃,但在Runstone学习环境中,通过定制的requests_with_caching.get()函数,它被设计为仍然能够“正常”工作。
最初的问题在于,尽管使用了requests_with_caching.get(),API响应的.json()方法仍然可能抛出错误,指示响应无法被解析为JSON,甚至直接返回HTML内容。这通常发生在API的实际服务已经关闭,或者返回了某种错误页面时。然而,Runstone环境的requests_with_caching库的特殊之处在于,它可能在内部维护了一个预先缓存的、有效的TasteDive API响应集合。这意味着,当我们在Runstone中使用此函数时,我们期望获取的是来自这个缓存的JSON数据,而不是直接从已停用的外部API获取的实时响应。
当尝试在代码中加入复杂的错误处理逻辑,例如检查KeyError,或者尝试打印tastedive_resp.text来分析HTML内容时,实际上可能偏离了在Runstone环境中利用其缓存机制的初衷。如果tastedive_resp.json()方法本身就因响应不是有效的JSON而失败,那么后续的KeyError处理就变得无关紧要。
解决此问题的关键在于信任并直接利用Runstone环境中requests_with_caching库的特性。在Runstone的特定配置下,requests_with_caching.get()函数被设计为在成功调用后,其返回的响应对象能够直接通过.json()方法提供有效的JSON数据。这意味着,在大多数情况下,我们不需要为可能出现的HTML响应或KeyError做过于复杂的额外处理,因为该环境的缓存机制已经确保了响应的格式正确性。
正确的做法是,在获取到响应对象resp之后,直接调用resp.json()来解析JSON数据并返回。如果requests_with_caching成功从其内部缓存中检索到数据,那么resp.json()将直接返回一个Python字典,其中包含了所需的电影相似度信息。
以下是经过优化的Python代码,它简洁地实现了在Runstone环境中从TasteDive API获取电影相似数据的功能:
import requests_with_caching
import json # 虽然在这个精简版本中没有直接使用json.dumps,但导入是好习惯
def get_movies_from_tastedive(movie_name):
"""
从TasteDive API获取与指定电影相似的电影列表。
此函数针对Runstone环境中的requests_with_caching库进行优化。
Args:
movie_name (str): 要查询的电影名称。
Returns:
dict: 包含相似电影信息的JSON响应字典。
"""
base_url = "https://tastedive.com/api/similar"
# 定义API请求参数
params = {
'q': movie_name, # 查询电影名称
'type': 'movies', # 指定类型为电影
'limit': 5 # 限制返回结果数量
}
# 使用requests_with_caching.get发送请求,它将处理缓存逻辑
# permanent_cache_file="tastedive_cache.txt" 参数可以省略,
# 因为Runstone环境通常会自行管理缓存
resp = requests_with_caching.get(base_url, params=params)
# 直接解析并返回JSON响应。在Runstone环境中,
# 这里的resp.json()预期会成功返回有效的JSON数据。
return resp.json()
# 示例调用
# movie_data_bridesmaids = get_movies_from_tastedive("Bridesmaids")
# print(json.dumps(movie_data_bridesmaids, indent=2))
# movie_data_black_panther = get_movies_from_tastedive("Black Panther")
# print(json.dumps(movie_data_black_panther, indent=2))通过理解Runstone环境的特殊性并简化代码,我们可以有效地解决TasteDive API返回HTML的问题,并成功完成相关的数据收集任务。
以上就是在Runstone环境中高效处理TasteDive API的JSON数据的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号