38
38
,'publisher' : publisher
41
feeds = [(u'Arag\xf3n', u'http://elperiodicodearagon.com/RSS/2.xml'),
42
(u'Internacional', u'http://elperiodicodearagon.com/RSS/4.xml'),
43
(u'Espa\xf1a', u'http://elperiodicodearagon.com/RSS/3.xml'),
44
(u'Econom\xeda', u'http://elperiodicodearagon.com/RSS/5.xml'),
45
(u'Deportes', u'http://elperiodicodearagon.com/RSS/7.xml'),
46
(u'Real Zaragoza', u'http://elperiodicodearagon.com/RSS/10.xml'),
47
(u'Opini\xf3n', u'http://elperiodicodearagon.com/RSS/103.xml'),
48
(u'Escenarios', u'http://elperiodicodearagon.com/RSS/105.xml'),
49
(u'Sociedad', u'http://elperiodicodearagon.com/RSS/104.xml'),
50
(u'Gente', u'http://elperiodicodearagon.com/RSS/330.xml')]
42
(u'Arag\xf3n', u'http://elperiodicodearagon.com/RSS/2.xml'),
43
(u'Internacional', u'http://elperiodicodearagon.com/RSS/4.xml'),
44
(u'Espa\xf1a', u'http://elperiodicodearagon.com/RSS/3.xml'),
45
(u'Econom\xeda', u'http://elperiodicodearagon.com/RSS/5.xml'),
46
(u'Deportes', u'http://elperiodicodearagon.com/RSS/7.xml'),
47
(u'Real Zaragoza', u'http://elperiodicodearagon.com/RSS/10.xml'),
48
(u'Opini\xf3n', u'http://elperiodicodearagon.com/RSS/103.xml'),
49
(u'Escenarios', u'http://elperiodicodearagon.com/RSS/105.xml'),
50
(u'Sociedad', u'http://elperiodicodearagon.com/RSS/104.xml'),
51
(u'Gente', u'http://elperiodicodearagon.com/RSS/330.xml')
54
h3{font-family:Arial,Helvetica,sans-serif; font-weight:bold;font-size:xx-large;}
55
h2{font-family:Arial,Helvetica,sans-serif; font-weight:normal;font-size:small;}
56
dd{font-family:Arial,Helvetica,sans-serif; font-weight:normal;font-size:small;}
56
h3 {font-family:Arial,Helvetica,sans-serif; font-weight:bold;font-size:30px;}
57
h2 {font-family:Arial,Helvetica,sans-serif; font-weight:bold;font-size:18px;}
58
h4 {font-family:Arial,Helvetica,sans-serif; font-style:italic; font-weight:normal;font-size:20px;}
59
.columnaDeRecursosRelacionados {font-family:Arial,Helvetica,sans-serif; font-weight:bold;font-size:14px;}
60
img{margin-bottom: 0.4em}
59
63
remove_attributes = ['height','width']
82
86
dict(name='a', attrs={'class':'AvisoComentario'}),
83
87
dict(name='div', attrs={'class':'CajaAvisoComentario'}),
84
88
dict(name='div', attrs={'class':'navegaNoticias'}),
89
dict(name='div', attrs={'class':'Mensaje'}),
85
90
dict(name='div', attrs={'id':'PaginadorDiCom'}),
86
91
dict(name='div', attrs={'id':'CajaAccesoCuentaUsuario'}),
87
92
dict(name='div', attrs={'id':'CintilloComentario'}),
107
112
(re.compile(r'<p> </p>', re.DOTALL|re.IGNORECASE), lambda match: ''),
108
113
(re.compile(r'<p id="">', re.DOTALL|re.IGNORECASE), lambda match: '<p>')
116
# Para sustituir el video incrustado de YouTube por una imagen
118
def preprocess_html(self, soup):
119
for video_yt in soup.findAll('iframe',{'title':'YouTube video player'}):
121
video_yt.name = 'img'
122
fuente = video_yt['src']
123
fuente2 = fuente.replace('http://www.youtube.com/embed/','http://img.youtube.com/vi/')
124
video_yt['src'] = fuente2 + '/0.jpg'