1
# -*- coding: utf-8 -*-
3
__author__='grzegorz.maj@dziennik.krakow.pl>'
6
http://dziennikpolski24.pl
7
Author: grzegorz.maj@dziennik.krakow.pl
9
from calibre.web.feeds.news import BasicNewsRecipe
11
class DziennikPolski24(BasicNewsRecipe):
13
title=u'Dziennik Polski'
14
publisher=u'Grupa Polskapresse'
16
__author__='grzegorz.maj'
17
description=u'Wiadomości z wydania Dziennika Polskiego'
19
max_articles_per_feed=50
20
needs_subscription=True
22
remove_javascript=True
24
use_embedded_content=False
25
remove_empty_feeds=True
26
extra_css='.date{margin-top: 4em;} .logo_author{margin-left:0.5em;}'
28
publication_type='newspaper'
29
cover_url='http://www.dziennikpolski24.pl/_p/images/logoDP24-b.gif'
30
INDEX='http://dziennikpolski24.pl/'
37
dict(name = 'div', attrs = {'class':['toolbar']})
39
, dict(name = 'h2', attrs = {'class':['teaser']})
40
, dict(name = 'div', attrs = {'class':['picture']})
41
, dict(name = 'div', attrs = {'id':['showContent']})
42
, dict(name = 'div', attrs = {'class':['paging']})
43
, dict(name = 'div', attrs = {'class':['wykupTresc']})
51
(u'Kraj', u'http://www.dziennikpolski24.pl/rss/feed/1151')
52
, (u'Świat', u'http://www.dziennikpolski24.pl/rss/feed/1153')
53
, (u'Gospodarka', u'http://www.dziennikpolski24.pl/rss/feed/1154')
54
, (u'Małopolska', u'http://www.dziennikpolski24.pl/rss/feed/1155')
55
, (u'Kultura', u'http://www.dziennikpolski24.pl/rss/feed/1156')
56
, (u'Opinie', u'http://www.dziennikpolski24.pl/rss/feed/1158')
57
, (u'Kronika Nowohucka', u'http://www.dziennikpolski24.pl/rss/feed/1656')
58
, (u'Na bieżąco', u'http://www.dziennikpolski24.pl/rss/feed/1543')
59
, (u'Londyn 2012', u'http://www.dziennikpolski24.pl/rss/feed/2545')
60
, (u'Piłka nożna', u'http://www.dziennikpolski24.pl/rss/feed/2196')
61
, (u'Siatkówka', u'http://www.dziennikpolski24.pl/rss/feed/2197')
62
, (u'Koszykówka', u'http://www.dziennikpolski24.pl/rss/feed/2198')
63
, (u'Tenis', u'http://www.dziennikpolski24.pl/rss/feed/2199')
64
, (u'Formuła 1', u'http://www.dziennikpolski24.pl/rss/feed/2203')
65
, (u'Lekkoatletyka', u'http://www.dziennikpolski24.pl/rss/feed/2204')
66
, (u'Żużel', u'http://www.dziennikpolski24.pl/rss/feed/2200')
67
, (u'Sporty motorowe', u'http://www.dziennikpolski24.pl/rss/feed/2206')
68
, (u'Publicystyka sportowa', u'http://www.dziennikpolski24.pl/rss/feed/2201')
69
, (u'Kolarstwo', u'http://www.dziennikpolski24.pl/rss/feed/2205')
70
, (u'Inne', u'http://www.dziennikpolski24.pl/rss/feed/2202')
71
, (u'Miasto Kraków', u'http://www.dziennikpolski24.pl/rss/feed/1784')
72
, (u'Region nowosądecki', u'http://www.dziennikpolski24.pl/rss/feed/1795')
73
, (u'Region Małopolski Zachodniej', u'http://www.dziennikpolski24.pl/rss/feed/1793')
74
, (u'Region tarnowski', u'http://www.dziennikpolski24.pl/rss/feed/1797')
75
, (u'Region podhalański', u'http://www.dziennikpolski24.pl/rss/feed/1789')
76
, (u'Region olkuski', u'http://www.dziennikpolski24.pl/rss/feed/1670')
77
, (u'Region miechowski', u'http://www.dziennikpolski24.pl/rss/feed/1806')
78
, (u'Region podkrakowski', u'http://www.dziennikpolski24.pl/rss/feed/1787')
79
, (u'Region proszowicki', u'http://www.dziennikpolski24.pl/rss/feed/1804')
80
, (u'Region wielicki', u'http://www.dziennikpolski24.pl/rss/feed/1802')
81
, (u'Region podbeskidzki', u'http://www.dziennikpolski24.pl/rss/feed/1791')
82
, (u'Region myślenicki', u'http://www.dziennikpolski24.pl/rss/feed/1800')
83
, (u'Autosalon', u'http://www.dziennikpolski24.pl/rss/feed/1294')
84
, (u'Kariera', u'http://www.dziennikpolski24.pl/rss/feed/1289')
85
, (u'Przegląd nieruchomości', u'http://www.dziennikpolski24.pl/rss/feed/1281')
86
, (u'Magnes', u'http://www.dziennikpolski24.pl/rss/feed/1283')
87
, (u'Magazyn Piątek', u'http://www.dziennikpolski24.pl/rss/feed/1293')
88
, (u'Pejzaż rodzinny', u'http://www.dziennikpolski24.pl/rss/feed/1274')
89
, (u'Podróże', u'http://www.dziennikpolski24.pl/rss/feed/1275')
90
, (u'Konsument', u'http://www.dziennikpolski24.pl/rss/feed/1288')
93
def append_page(self, soup, appendtag):
95
tag=soup.find('div', attrs = {'class':'paging'})
98
li_nks=tag.findAll('li')
99
appendtag.find('div', attrs = {'class':'paging'}).extract()
100
if appendtag.find('ul', attrs = {'class':'menuf'}):
101
appendtag.find('ul', attrs = {'class':'menuf'}).extract()
105
link_tag=li_nk.contents[0].contents[0].string
106
if u'następna' in link_tag:
107
soup2=self.index_to_soup(self.INDEX+li_nk.contents[0]['href'])
108
if soup2.find('div', attrs = {'id':'showContent'}):
109
pagetext=soup2.find('div', attrs = {'id':'showContent'})
110
pos=len(appendtag.contents)
111
appendtag.insert(pos, pagetext)
112
if soup2.find('div', attrs = {'class':'rightbar'}):
113
pagecont=soup2.find('div', attrs = {'class':'rightbar'})
114
tag=pagecont.find('div', attrs = {'class':'paging'})
115
li_nks=tag.findAll('li')
118
def get_browser(self):
119
br=BasicNewsRecipe.get_browser()
120
if self.username is not None and self.password is not None:
121
br.open('http://www.dziennikpolski24.pl/pl/moje-konto/950606-loguj.html')
122
br.select_form(nr = 1)
123
br["user_login[login]"]=self.username
124
br['user_login[pass]']=self.password
129
def preprocess_html(self, soup):
130
self.append_page(soup, soup.body)