(.*?)')) html = getUrlUnicode("http://www.allmovie.com/cg/avg.dll?p=avg&sql=1:%s~T1" % allmovieId) data['review'] = stripTags(findRe(html, 'Review.*?

(.*?)')) html = getUrlUnicode("http://www.allmovie.com/cg/avg.dll?p=avg&sql=1:%s~T2" % allmovieId) data['cast'] = map( lambda x: map( lambda x: stripTags(x).strip(), x.split(' -') ), findRe(html, '

(.*?)').split('')[:-1] ) html = getUrlUnicode("http://www.allmovie.com/cg/avg.dll?p=avg&sql=1:%s~T3" % allmovieId) data['credits'] = map( lambda x: map( lambda x: stripTags(x).strip(), x.split(' -') ), findRe(html, '
(.*?)').split('')[:-1] ) return data def getMoviePoster(allmovieId): data = getMovieData(allmovieId) if data: return data['poster'] return '' def parseEntry(html, title): return stripTags(findRe(html, '%s(.*?)' % title)) def parseList(html, title): return map(lambda x: stripTags(x), findRe(html, '%s(.*?)' % title).split('
')) if __name__ == '__main__': print getMovieData('177524')