Python读取JSON：文件解析与数据处理实战指南

手把手教你用Python玩转代理IP配置

搞爬虫的老铁们应该都懂，代理IP就像快递小哥——帮你把请求送到目标网站门口。今天咱们就拿天启代理的API来举个栗子，手把手教你怎么用Python处理代理IP的JSON数据。

先看个典型场景：你从天启代理的API拿到一批新鲜IP，返回的是JSON格式。这时候就需要用Python的json库来解析，就像拆快递一样把里面的IP地址和端口掏出来。

import json

 假设这是从天启代理API获取的响应数据
proxy_data = '''
{
    "code": 0,
    "data": [
        {"ip": "123.123.123.1", "port": 8000},
        {"ip": "123.123.123.2", "port": 8001}
    ]
}
'''

data_dict = json.loads(proxy_data)
for item in data_dict['data']:
    print(f"可用代理：{item['ip']}:{item['port']}")

实战中的三个坑点

第一坑：动态IP怎么存？建议用字典结构存储代理信息，方便后续调用。比如：

proxy_list = []
for proxy in data_dict['data']:
    proxy_list.append({
        'http': f"http://{proxy['ip']}:{proxy['port']}",
        'https': f"https://{proxy['ip']}:{proxy['port']}"
    })

第二坑：IP失效太快？这里就要夸夸天启代理的独门绝技了，他们的IP存活时间比同行多出30%左右。实测用他们的IP池做循环调用，半小时内基本不会出现集体阵亡的情况。

第三坑：异常处理怎么做？给大伙儿支个招——用try-except包住请求代码，遇到连接超时就自动切换下一个IP。天启代理的响应≤10ms，这个设计能帮你省下不少重试时间。

JSON配置文件管理大法

推荐把代理配置单独存成.json文件，方便后续维护。比如创建个tianqi_proxies.json:

{
    "proxy_settings": {
        "api_url": "https://api.tianqi.pro/getips",
        "timeout": 5,
        "retry_times": 3
    }
}

读取的时候注意路径问题，建议用绝对路径。这里有个小技巧：用Path(__file__).parent获取当前文件所在目录，避免找不到文件的尴尬。

真实场景下的骚操作

举个实际案例：用requests库发起带代理的请求。重点看怎么处理多个代理的轮换：

import random

def get_with_proxy(url):
    proxies = random.choice(proxy_list)
    try:
        resp = requests.get(url, proxies=proxies, timeout=5)
        return resp.text
    except Exception as e:
        print(f"{proxies} 这个IP可能歇菜了，错误信息：{str(e)}")
        return None

这里有个细节：天启代理的接口响应时间＜1秒，建议设置3秒超时足够。如果发现超时频繁，八成是其他家的IP质量不行（手动狗头）。