fix recursion, make sure that result is not redirect

2009-08-20 20:29:34 +02:00 · 2009-08-20 20:29:34 +02:00 · 7df4cc4fa7
commit 7df4cc4fa7
parent 1ef34da4d1
1 changed files with 10 additions and 7 deletions
--- a/oxweb/movieposterdb.py
+++ b/oxweb/movieposterdb.py
@ -10,6 +10,8 @@ def getData(id):
    '''
    >>> getData('0060304')['posters'][0]
    u'http://www.movieposterdb.com/posters/06_03/1967/0060304/l_99688_0060304_639fdd1e.jpg'
    >>> getData('0123456')['posters']
    []
    '''
    data = {
        "url": getUrl(id)
@ -20,17 +22,18 @@ def getData(id):
 def getId(url):
    return url.split("/")[-2]
-def getPostersByUrl(url):
+def getPostersByUrl(url, group=True):
    posters = []
    html = getUrlUnicode(url)
-    if not "The movie you requested is not found" in html:
+    if url in html:
-        results = re.compile('<a href="(http://www.movieposterdb.com/group/.*?)">', re.DOTALL).findall(html)
+        if group:
-        for result in results:
+            results = re.compile('<a href="(http://www.movieposterdb.com/group/.+?)\??">', re.DOTALL).findall(html)
-            posters += getPostersByUrl(result)
+            for result in results:
-        results = re.compile('<a href="(http://www.movieposterdb.com/poster/.*?)">', re.DOTALL).findall(html)
+                posters += getPostersByUrl(result, False)
        results = re.compile('<a href="(http://www.movieposterdb.com/poster/.+?)">', re.DOTALL).findall(html)
        for result in results:
            html = getUrlUnicode(result)
-            posters.append(findRe(html, '"(http://www.movieposterdb.com/posters/.*?\.jpg)"'))
+            posters.append(findRe(html, '"(http://www.movieposterdb.com/posters/.+?\.jpg)"'))
    return posters
 def getUrl(id):