from urllib.request import urlopen, urlretrieve import re def downloadPage(pageNumber): downloadURL = 'http://pluto.jhuapl.edu/soc/Pluto-Encounter/index.php?order=dateTaken&page=' response = urlopen(downloadURL + str(pageNumber)) source = str(response.read()) searchStr = 'col-xs-2 thumbBox' imagePositions = [m.end() for m in re.finditer(searchStr, source)] # Entire line: # div class="col-xs-2 thumbBox">

2015-07-13

21:00:54 UTC

Exp: 150 msec

Target: PLUTO

Range: 0.7M km

# Image URL #http://pluto.jhuapl.edu/soc/Pluto-Encounter/data/pluto/level2/lor/jpeg/029912/lor_0299124574_0x630_sci_4.jpg for p in imagePositions: try: beginOffset = len('">