我在用 python 搜索谷歌图像搜索时遇到了非常困难的情况。我需要只使用标准 python 库(所以 urllib、urllib2、json,..)
有人可以帮忙吗?假设图像是 jpeg.jpg 并且位于我运行 python 的同一文件夹中。
我尝试了一百种不同的代码版本,使用标头、用户代理、base64 编码、不同的 url (images.google.com、{{图片的 URL}}&sa=X&ei=H6RaTtb5JcTeiALLlmPi2CQ&ved=0CDsQ9Q8 等...)
什么都不起作用,总是出现错误,404、401 或管道损坏:(
请向我展示一些 python 脚本,该脚本实际上会使用我自己的图像作为搜索数据来搜索 google 图像(“jpeg.jpg”存储在我的计算机/设备上)
谢谢谁能解决这个问题
Dave:)
我在Python中使用以下代码搜索Google图像并将图像下载到我的计算机:
import os
import sys
import time
from urllib import FancyURLopener
import urllib2
import simplejson
# Define search term
searchTerm = "hello world"
# Replace spaces ' ' in search term for '%20' in order to comply with request
searchTerm = searchTerm.replace(' ','%20')
# Start FancyURLopener with defined version
class MyOpener(FancyURLopener):
version = 'Mozilla/5.0 (Windows; U; Windows NT 5.1; it; rv:1.8.1.11) Gecko/20071127 Firefox/2.0.0.11'
myopener = MyOpener()
# Set count to 0
count= 0
for i in range(0,10):
# Notice that the start changes for each iteration in order to request a new set of images for each loop
url = ('https://ajax.googleapis.com/ajax/services/search/images?' + 'v=1.0&q='+searchTerm+'&start='+str(i*4)+'&userip=MyIP')
print url
request = urllib2.Request(url, None, {'Referer': 'testing'})
response = urllib2.urlopen(request)
# Get results using JSON
results = simplejson.load(response)
data = results['responseData']
dataInfo = data['results']
# Iterate for each result and get unescaped url
for myUrl in dataInfo:
count = count + 1
print myUrl['unescapedUrl']
myopener.retrieve(myUrl['unescapedUrl'],str(count)+'.jpg')
# Sleep for one second to prevent IP blocking from Google
time.sleep(1)
您还可以找到非常有用的信息here https://developers.google.com/image-search/v1/jsondevguide.
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)