1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
|
# -*- coding: utf-8 -*-
# Copyright 2012-2015 Facundo Batista
#
# This program is free software: you can redistribute it and/or modify it
# under the terms of the GNU General Public License version 3, as published
# by the Free Software Foundation.
#
# This program is distributed in the hope that it will be useful, but
# WITHOUT ANY WARRANTY; without even the implied warranties of
# MERCHANTABILITY, SATISFACTORY QUALITY, or FITNESS FOR A PARTICULAR
# PURPOSE. See the GNU General Public License for more details.
#
# You should have received a copy of the GNU General Public License along
# with this program. If not, see <http://www.gnu.org/licenses/>.
#
# For further info, check https://launchpad.net/encuentro
"""Tests for the scrapers for Conectate backend."""
from __future__ import unicode_literals
import unittest
from server import scrapers_conect
_RES_SERIES_1 = [
("Máquinas y herramientas", "01. Historia de las máquinas y las herramientas", "http://www.conectate.gob.ar/sitios/conectate/busqueda/encuentro?rec_id=121847"), # NOQA
("Máquinas y herramientas", "02. Diseño y uso de máquinas-herramientas", "http://www.conectate.gob.ar/sitios/conectate/busqueda/encuentro?rec_id=121848"), # NOQA
("Máquinas y herramientas", "03. Diseño y uso de herramientas de corte", "http://www.conectate.gob.ar/sitios/conectate/busqueda/encuentro?rec_id=121849"), # NOQA
("Máquinas y herramientas", "04. Herramientas de corte y máquinas-herramientas: nuevos paradigmas", "http://www.conectate.gob.ar/sitios/conectate/busqueda/encuentro?rec_id=121850"), # NOQA
]
_RES_SERIES_2 = [
("Oficios Curso de Carpintería", "01. Introducción a la carpintería", "http://www.conectate.gob.ar/sitios/conectate/busqueda/buscar?rec_id=103248"), # NOQA
("Oficios Curso de Carpintería", "02. Realización de caballetes", "http://www.conectate.gob.ar/sitios/conectate/busqueda/buscar?rec_id=103260"), # NOQA
("Oficios Curso de Carpintería", "03. Realización de sillas, parte 1", "http://www.conectate.gob.ar/sitios/conectate/busqueda/buscar?rec_id=103261"), # NOQA
("Oficios Curso de Carpintería", "04. Realización de sillas, parte 2", "http://www.conectate.gob.ar/sitios/conectate/busqueda/buscar?rec_id=103265"), # NOQA
("Oficios Curso de Carpintería", "05. Realización de cajas y cajones, parte 1", "http://www.conectate.gob.ar/sitios/conectate/busqueda/buscar?rec_id=103268"), # NOQA
("Oficios Curso de Carpintería", "06. Realización de cajas y cajones, parte 2", "http://www.conectate.gob.ar/sitios/conectate/busqueda/buscar?rec_id=103270"), # NOQA
("Oficios Curso de Carpintería", "07. Revestimientos, parte 1", "http://www.conectate.gob.ar/sitios/conectate/busqueda/buscar?rec_id=103275"), # NOQA
("Oficios Curso de Carpintería", "08. Revestimientos, parte 2", "http://www.conectate.gob.ar/sitios/conectate/busqueda/buscar?rec_id=103277"), # NOQA
("Oficios Curso de Carpintería", "09. Muebles laminados, parte 1", "http://www.conectate.gob.ar/sitios/conectate/busqueda/buscar?rec_id=103279"), # NOQA
("Oficios Curso de Carpintería", "10. Muebles laminados, parte 2", "http://www.conectate.gob.ar/sitios/conectate/busqueda/buscar?rec_id=103282"), # NOQA
]
_RES_SERIES_3 = [
("Sin límites", "04. Natación - Chaco", "http://www.conectate.gob.ar/sitios/conectate/busqueda/encuentro?rec_id=105174"), # NOQA
("Sin límites", "09. Tenis de mesa - GBA", "http://www.conectate.gob.ar/sitios/conectate/busqueda/encuentro?rec_id=105186"), # NOQA
("Sin límites", "13. Basquet en silla femenino - GBA", "http://www.conectate.gob.ar/sitios/conectate/busqueda/encuentro?rec_id=105193"), # NOQA
("Sin límites", "14. Esfuerzo y entrenamiento", "http://www.conectate.gob.ar/sitios/conectate/busqueda/encuentro?rec_id=105194"), # NOQA
]
_RES_VIDEO_01 = 26
class ScrapersTestCase(unittest.TestCase):
"""Tests for the scrapers."""
def test_example_series_1(self):
html = open("tests/ej-conect-series_1.html", 'rb').read()
res = scrapers_conect.scrap_series(html)
self.assertEqual(res, _RES_SERIES_1)
def test_example_series_2(self):
html = open("tests/ej-conect-series_2.html", 'rb').read()
res = scrapers_conect.scrap_series(html)
self.assertEqual(res, _RES_SERIES_2)
def test_example_series_3(self):
html = open("tests/ej-conect-series_3.html", 'rb').read()
res = scrapers_conect.scrap_series(html)
self.assertEqual(res, _RES_SERIES_3)
def test_example_video_01(self):
html = open("tests/ej-conect-video_01.html", 'rb').read()
res = scrapers_conect.scrap_video(html)
self.assertEqual(res, _RES_VIDEO_01)
|