~ubuntu-branches/ubuntu/gutsy/awstats/gutsy-updates

« back to all changes in this revision

Viewing changes to wwwroot/cgi-bin/lib/search_engines.pm

  • Committer: Bazaar Package Importer
  • Author(s): Charles Fry
  • Date: 2007-02-10 11:11:02 UTC
  • mfrom: (1.2.4 upstream)
  • Revision ID: james.westby@ubuntu.com-20070210111102-bbx43ay1krtxh1nq
Tags: 6.6+dfsg-1
New upstream release (Closes: #350987, #335865)

Show diffs side-by-side

added added

removed removed

Lines of Context:
5
5
# SearchEnginesHashLib.
6
6
# An entry if known in SearchEnginesKnownUrl is also welcome.
7
7
#------------------------------------------------------------------------------
8
 
# $Revision: 1.35 $ - $Author: eldy $ - $Date: 2005/11/26 19:24:18 $
 
8
# $Revision: 1.41 $ - $Author: eldy $ - $Date: 2006/11/15 22:30:15 $
9
9
 
10
10
# 2005-08-19 Sean Carlos http://www.antezeta.com/awstats.html
11
11
#            added minor italian search engines
20
20
#                     internationnal -> international
21
21
#            added 'google\.'=>'mail\.google\.', to NotSearchEnginesKeys in order to
22
22
#            avoid counting gmail referrals as search engine traffic
23
 
# 2005-08-21 Sean Carlos http://www.antezeta.com/awstats.html:
 
23
# 2005-08-21 Sean Carlos http://www.antezeta.com/awstats.html
24
24
#            avoid counting babelfish.altavista referrals as search engine traffic
25
25
#            avoid counting translate.google referrals as search engine traffic
26
26
# 2005-11-20 Sean Carlos
27
27
#            added missing 'tiscali','key=', entry.  Check order
28
28
# 2005-11-22 Sean Carlos
29
29
#            added Google Base & Froogle.  Froogle not tested.
 
30
# 2006-04-18 Sean Carlos http://www.antezeta.com/awstats.html
 
31
#            added biglotron.com (France)
 
32
#            added blingo http://www.blingo.com/
 
33
#            added Clusty & Vivisimo
 
34
#            added eniro.no (Norway) [https://sourceforge.net/forum/message.php?msg_id=3134783]
 
35
#            added GPU p2p search http://search.centraldatabase.org/
 
36
#            added mail.tiscali to "not search engines list" [https://sourceforge.net/forum/message.php?msg_id=3166688]
 
37
#            added Ask group's "mysearch"
 
38
#            added sify.com (India)
 
39
#            added sogou.com (Cina) [https://sourceforge.net/forum/message.php?msg_id=3501603]
 
40
#            Ask changes:
 
41
#            - added Ask Japan (ask.jp) 
 
42
#            - break out Ask new country level variants (DE, ES, FR, IT, NL)
 
43
#            - updated Ask name from Ask Jevees
 
44
#            - added Ask q= parameter - many recent searches probably not recognized; [https://sourceforge.net/forum/message.php?msg_id=3465444]
 
45
#            - updated Ask uk (new uk.ask.com added to older ask.co.uk)
 
46
#            updated voila kw|rdata parameter [https://sourceforge.net/forum/message.php?msg_id=3373912]
 
47
#            for each new engine, added link to Search Engine.  This serves to document engine. Done for major & Italian engines as well. Requires patch
 
48
#               to AWStats to allow untranslated html.  Otherwise html will appear instead of link.
 
49
#            reviewed mnoGoSearch (http://www.mnogosearch.org/); the search engined mentioned no longer
 
50
#               exists https://sourceforge.net/forum/message.php?msg_id=3025426
 
51
# 2006-05-13 Sean Carlos http://www.antezeta.com/awstats.html
 
52
#            added 10 Chello European broadband portals (Austria, Belgium, Czech Republic, France, Hungary, The Netherlands, Norway, Poland, Slovakia, Sweden)
 
53
#            added Alice Internal Search (blends data with Google?) search.alice.it.master:10005
 
54
#            added detection of google cache views from IPs 66.249.93.104 72.14.203.104 72.14.207.104
 
55
#               To do: add more extensive IP list; keywords not yet detected.
 
56
#            added icerocket.com blog search http://www.icerocket.com/
 
57
#            added live.com (msn) http://www.live.com/
 
58
#            added Meta motor kartoo.  Note: Kartoo does not provide search words in referrers, thus the engine will appear in the
 
59
#               search engine list but the actual search words are not available.
 
60
#            added netluchs.de http://www.netluchs.de/
 
61
#            added sphere.com blog search http://www.sphere.com/
 
62
#            added wwweasel.de http://wwweasel.de
 
63
#            added Yahoo Mindset! http://mindset.research.yahoo.com/
 
64
#            updated Mirago query parameter recognition (qry=); added breakout for each country (France, Germany, Spain, Italy, Norway, Sweden, Denmark, Netherlands, Belgium, Switzerland)
 
65
# 2006-05-13 Sean Carlos http://www.antezeta.com/awstats.html 
 
66
#            added Google cache IPs 64.233.183.104 & 66.102.7.104
 
67
# 2006-05-20 Sean Carlos http://www.antezeta.com/awstats.html 
 
68
#               anzwers.com.au
 
69
#               schoenerbrausen.de http://www.schoenerbrausen.de/
 
70
#               added Google cache IP 216.239.59.104
 
71
#               answerbus http://www.answerbus.com/ (does not provide keywords)
 
72
# 2006-05-23 Sean Carlos http://www.antezeta.com/awstats.html
 
73
#               added Google cache IP 66.102.9.104, 64.233.161.104
 
74
# 2006-06-23 Sean Carlos http://www.antezeta.com/awstats.html 
 
75
#               added Alice Search search.alice.it
 
76
#               added GoodSearch http://www.goodsearch.com/ (does not provide keywords) "a Yahoo-powered search engine that donates money to your favorite charity or school each time you search the web"
 
77
#               added googlee.com, variant of Google
 
78
#               added gotuneed http://www.gotuneed.com/ Italian search engine, in beta
 
79
#               added icq.com
 
80
#               added logic to parse Google Cache search keywords. Seems to work for alpha but not numeric cache IDs, i.e. search?q=cache:lWVLmnuGJswJ: is recognized but q=cache:Yv5qxeJNuhgJ: is not recognized. The URL triggering the keywords will also appear.  The URLs are probably too varied to parse out?
 
81
#               added Nusearch http://www.nusearch.com/
 
82
#               added Polymeta www.polymeta.hu (does not provide keywords)
 
83
#               added scroogle http://www.scroogle.org/ (does not always provide keywords)
 
84
#               added Tango http://tango.hu/search.php?st=0&q=jeles+napok
 
85
#               Changed Google Cache notation 64\.233\.(161|167|179|183|187)\.104 to 64\.233\.1[0-9]{2}\.104
 
86
#                                             72\.14\.(203|205|207|209|221)\.104 to 72\.14\.2[0-9]{2}\.104
 
87
#                                             216\.239\.(51|59)\.104 to 216\.239\.5[0-9]\.104
 
88
#                                             66\.102\.(7|9)\.104 to 66\.102\.[1-9]\.104
 
89
# 2006-06-27 Sean Carlos http://www.antezeta.com/awstats.html
 
90
#               added Onet.pl http://szukaj.onet.pl/ 
 
91
#               corrected name "Wirtualna Polska" from "Szukaj" (search); added link http://szukaj.wp.pl/ 
 
92
# 2006-06-30 Sean Carlos http://www.antezeta.com/awstats.html
 
93
#       Additional Polish Search Engines:
 
94
#       added Dodaj.pl http://www.dodaj.pl/
 
95
#       added Gazeta.pl http://szukaj.gazeta.pl/
 
96
#       added Gery.pl http://szukaj.gery.pl/
 
97
#       added Hoga.pl http://www.hoga.pl/
 
98
#       added Interia.pl http://www.google.interia.pl/
 
99
#       added Katalog.Onet.pl http://katalog.onet.pl/
 
100
#       added NetSprint.pl http://www.netsprint.pl/
 
101
#       added o2.pl http://szukaj2.o2.pl/
 
102
#       added Polska http://szukaj.polska.pl/
 
103
#       added Szukacz http://www.szukacz.pl/
 
104
#       added Wow.pl http://szukaj.wow.pl/
 
105
#       added Sagool http://sagool.jp/
 
106
 
 
107
# 2006-08-25 Social Bookmarks
 
108
#       International
 
109
#       added del.icio.us/search - for now, just search referrer. To do: consider /tag/(tagname) referrer?
 
110
#       added stumbleupon.com - No keywords supplied.
 
111
#       added swik.net
 
112
#       added digg. Keywords sometimes supplied.
 
113
#       Italy
 
114
#       added segnalo.alice.it - No keywords supplied.
 
115
#       added ineffabile.it - No keywords supplied.
 
116
 
 
117
#       added filter for google groups.  Attempt to parse group name as keyword.
 
118
 
 
119
# 2006-09-14 
 
120
#       added Eniro Sverige http://www.eniro.se/
 
121
#       added MyWebSearch http://search.mywebsearch.com/ 
 
122
#       added Teecno http://www.teecno.it/ Italian Open Source Search Engine
30
123
 
31
124
#package AWSSE;
32
125
 
 
126
# 2006-09-25 (Gabor Moizes)
 
127
# added 4-counter (Google alternative) http://4-counter.com/
 
128
# added Googlecom (Google alternative) http://googlecom.com/
 
129
# added Goggle (Google alternative) http://goggle.co.hu/
 
130
# added Comet toolbar http://as.starware.com
 
131
# added new IP for Yahoo: 216.109.125.130
 
132
# added Ledix http://ledix.net/
 
133
# added AT&T search (powered by Google) http://www.att.net/
 
134
# added Keresolap (Hungarian search engine) http://www.keresolap.hu/
 
135
# added Mozbot (French search engine) http://www.mozbot.fr/
 
136
# added Zoznam (Slovak search engine) http://www.zoznam.sk/
 
137
# added sapo.pt (Portuguese search engine) http://www.sapo.pt/
 
138
# added shaw.ca (powered by Google) http://start.shaw.ca/
 
139
# added Searchalot http://www.searchalot.com/
 
140
# added Copernic http://www.copernic.com/
 
141
# added 216.109.125.130 to Yahoo
 
142
# added 66.218.69.11 to Yahoo
 
143
# added Avantfind http://www.avantfind.com/
 
144
# added Steadysearch http://www.steadysearch.com/
 
145
# added Steadysearch http://www.steady-search.com/
 
146
# modified 216\.239\.5[0-9]\.104/search to 216\.239\.5[0-9]\.104
 
147
 
33
148
 
34
149
# SearchEnginesSearchIDOrder
35
150
# It contains all matching criteria to search for in log fields. This list is
42
157
# Major international search engines
43
158
'base\.google\.',
44
159
'froogle\.google\.',
 
160
'groups\.google\.',
45
161
'images\.google\.',
46
 
'google\.','216\.239\.(35\.101|37\.101|39\.100|39\.101|51\.100|51\.101|35\.100)',
 
162
'google\.',
 
163
'googlee\.',
 
164
'googlecom\.com',
 
165
'goggle\.co\.hu',
 
166
'216\.239\.(35|37|39|51)\.100',
 
167
'216\.239\.(35|37|39|51)\.101', 
 
168
'216\.239\.5[0-9]\.104', 
 
169
'64\.233\.1[0-9]{2}\.104',
 
170
'66\.102\.[1-9]\.104',
 
171
'66\.249\.93\.104',
 
172
'72\.14\.2[0-9]{2}\.104',
47
173
'msn\.',
 
174
'live\.com',
48
175
'voila\.',
49
 
'yahoo\.','(66\.218\.71\.225|216\.109\.117\.135)',
 
176
'mindset\.research\.yahoo',
 
177
'yahoo\.','(66\.218\.71\.225|216\.109\.117\.135|216\.109\.125\.130|66\.218\.69\.11)',
50
178
'search\.aol\.co',
51
179
'tiscali\.',
52
180
'lycos\.',
64
192
 
65
193
@SearchEnginesSearchIDOrder_list2=(
66
194
# Minor international search engines
 
195
'4\-counter\.com',
 
196
'att\.net',
67
197
'northernlight\.',
68
198
'hotbot\.',
69
199
'kvasir\.',
74
204
'euroseek\.',
75
205
'looksmart\.',
76
206
'spray\.',
77
 
'nbci\.com/search',
 
207
'nbci\.com\/search',
 
208
'de\.ask.\com', # break out Ask country specific engines.  (.jp is in Japan section)
 
209
'es\.ask.\com',
 
210
'fr\.ask.\com',
 
211
'it\.ask.\com',
 
212
'nl\.ask.\com',
 
213
'uk\.ask.\com',
78
214
'(^|\.)ask\.com',
79
215
'atomz\.',
80
216
'overture\.com',                # Replace 'goto\.com','Goto.com',
88
224
'ixquick\.com',
89
225
'search\.earthlink\.net', 
90
226
'i-une\.com',
 
227
'blingo\.com',
 
228
'centraldatabase\.org',
 
229
'clusty\.com',
 
230
'mysearch\.',
 
231
'vivisimo\.com',
 
232
'kartoo\.com',
 
233
'icerocket\.com',
 
234
'sphere\.com',
 
235
'ledix\.net',
 
236
'start\.shaw\.ca',
 
237
'searchalot\.com',
 
238
'copernic\.com',
 
239
'avantfind\.com',
 
240
'steadysearch\.com',
 
241
'steady-search\.com',
 
242
# Chello Portals
 
243
'chello\.at',
 
244
'chello\.be',
 
245
'chello\.cz',
 
246
'chello\.fr',
 
247
'chello\.hu',
 
248
'chello\.nl',
 
249
'chello\.no',
 
250
'chello\.pl',
 
251
'chello\.se',
 
252
'chello\.sk',
 
253
'chello', # required as catchall for new countries not yet known
 
254
# Mirago 
 
255
'mirago\.be',
 
256
'mirago\.ch',
 
257
'mirago\.de',
 
258
'mirago\.dk',
 
259
'es\.mirago\.com',
 
260
'mirago\.fr',
 
261
'mirago\.it',
 
262
'mirago\.nl',
 
263
'no\.mirago\.com',
 
264
'mirago\.se',
 
265
'mirago\.co\.uk',
 
266
'mirago', # required as catchall for new countries not yet known
 
267
'answerbus\.com',
 
268
'icq\.com\/search',
 
269
'nusearch\.com',
 
270
'goodsearch\.com',
 
271
'scroogle\.org',
 
272
'questionanswering\.com',
 
273
'mywebsearch\.com',
 
274
'as\.starware\.com',
 
275
# Social Bookmarking Services
 
276
'del\.icio\.us',
 
277
'digg\.com',
 
278
'stumbleupon\.com',
 
279
'swik\.net',
 
280
'segnalo\.alice\.it',
 
281
'ineffabile\.it',
 
282
# Minor Australian search engines
 
283
'anzwers\.com\.au',
91
284
# Minor brazilian search engines
92
285
'engine\.exe', 'miner\.bol\.com\.br',
93
286
# Minor chinese search engines
94
 
'baidu\.com','search\.sina\.com','search\.sohu\.com',
 
287
'baidu\.com','search\.sina\.com','search\.sohu\.com', 'sogou\.com',
95
288
# Minor czech search engines
96
289
'atlas\.cz','seznam\.cz','quick\.cz','centrum\.cz','jyxo\.(cz|com)','najdi\.to','redbox\.cz',
97
290
# Minor danish search-engines 
99
292
# Minor dutch search engines
100
293
'ilse\.','vindex\.',
101
294
# Minor english search engines
102
 
'(^|\.)ask\.co\.uk','bbc\.co\.uk/cgi-bin/search','ifind\.freeserve','looksmart\.co\.uk','mirago\.','splut\.','spotjockey\.','ukdirectory\.','ukindex\.co\.uk','ukplus\.','searchy\.co\.uk',
 
295
'(^|\.)ask\.co\.uk','bbc\.co\.uk/cgi-bin/search','ifind\.freeserve','looksmart\.co\.uk','splut\.','spotjockey\.','ukdirectory\.','ukindex\.co\.uk','ukplus\.','searchy\.co\.uk',
103
296
# Minor finnish search engines
104
297
'haku\.www\.fi',
105
298
# Minor french search engines
106
299
'recherche\.aol\.fr','ctrouve\.','francite\.','\.lbb\.org','rechercher\.libertysurf\.fr', 'search[\w\-]+\.free\.fr', 'recherche\.club-internet\.fr',
107
 
'toile\.com', 
 
300
'toile\.com', 'biglotron\.com', 
 
301
'mozbot\.fr', 
108
302
# Minor german search engines
109
303
'sucheaol\.aol\.de',
110
304
'fireball\.de','infoseek\.de','suche\d?\.web\.de','[a-z]serv\.rrzn\.uni-hannover\.de',
111
305
'suchen\.abacho\.de','brisbane\.t-online\.de','allesklar\.de','meinestadt\.de',
112
306
'212\.227\.33\.241',
113
307
'(161\.58\.227\.204|161\.58\.247\.101|212\.40\.165\.90|213\.133\.108\.202|217\.160\.108\.151|217\.160\.111\.99|217\.160\.131\.108|217\.160\.142\.227|217\.160\.176\.42)',
114
 
# Minor hungarian search engines
 
308
'wwweasel\.de',
 
309
'netluchs\.de',
 
310
'schoenerbrausen\.de',
 
311
# Minor Hungarian search engines
115
312
'heureka\.hu','vizsla\.origo\.hu','lapkereso\.hu','goliat\.hu','index\.hu','wahoo\.hu','webmania\.hu','search\.internetto\.hu',
116
 
# Minor italian search engines
117
 
'virgilio\.it','arianna\.libero\.it','supereva\.com','kataweb\.it',
118
 
# Minor norvegian search engines
119
 
'sok\.start\.no',
120
 
# Minor polish search engines
121
 
'szukaj\.wp\.pl',
 
313
'tango\.hu',
 
314
'keresolap\.hu',
 
315
'polymeta\.hu',
 
316
# Minor Indian search engines
 
317
'sify\.com',
 
318
# Minor Italian search engines
 
319
'virgilio\.it','arianna\.libero\.it','supereva\.com','kataweb\.it','search\.alice\.it\.master','search\.alice\.it','gotuneed\.com',
 
320
'godado','jumpy\.it','shinyseek\.it','teecno\.it',
 
321
# Minor Japanese search engines
 
322
'ask\.jp','sagool\.jp',
 
323
# Minor Norwegian search engines
 
324
'sok\.start\.no', 'eniro\.no',
 
325
# Minor Polish search engines
 
326
'szukaj\.wp\.pl','szukaj\.onet\.pl','dodaj\.pl','gazeta\.pl','gery\.pl','hoga\.pl','netsprint\.pl','interia\.pl','katalog\.onet\.pl','o2\.pl','polska\.pl','szukacz\.pl','wow\.pl',
122
327
# Minor russian search engines
123
328
'ya(ndex)?\.ru', 'aport\.ru', 'rambler\.ru', 'turtle\.ru', 'metabot\.ru',
124
 
# Minor swedish search engines
125
 
'evreka\.passagen\.se',
 
329
# Minor Swedish search engines
 
330
'evreka\.passagen\.se','eniro\.se',
 
331
# Minor Slovak search engines
 
332
'zoznam\.sk',
 
333
# Minor Portuguese search engines
 
334
'sapo\.pt',
126
335
# Minor swiss search engines
127
336
'search\.ch', 'search\.bluewin\.ch'
128
337
);
133
342
 
134
343
 
135
344
# NotSearchEnginesKeys
136
 
# If a search engie key is found, we check its exclude list to know if it's
 
345
# If a search engine key is found, we check its exclude list to know if it's
137
346
# really a search engine
138
347
#------------------------------------------------------------------------------
139
348
%NotSearchEnginesKeys=(
141
350
'google\.'=>'mail\.google\.',
142
351
'google\.'=>'translate\.google\.',
143
352
'msn\.'=>'hotmail\.msn\.',
144
 
'yahoo\.'=>'mail\.yahoo\.'
 
353
'tiscali\.'=>'mail\.tiscali\.',
 
354
'yahoo\.'=>'mail\.yahoo\.',
 
355
'yandex\.'=>'direct\.yandex\.'
145
356
);
146
357
 
147
358
 
152
363
# Major international search engines
153
364
'base\.google\.','google_base',
154
365
'froogle\.google\.','google_froogle',
 
366
'groups\.google\.','google_groups',
155
367
'images\.google\.','google_image',
156
 
'google\.','google','216\.239\.(35\.101|37\.101|39\.100|39\.101|51\.100|51\.101|35\.100)','google',
 
368
'google\.','google',
 
369
'googlee\.','google',
 
370
'googlecom\.com','google',
 
371
'goggle\.co\.hu','google',
 
372
'216\.239\.(35|37|39|51)\.100','google_cache',
 
373
'216\.239\.(35|37|39|51)\.101','google_cache',
 
374
'216\.239\.5[0-9]\.104','google_cache',
 
375
'64\.233\.1[0-9]{2}\.104','google_cache',
 
376
'66\.102\.[1-9]\.104','google_cache',
 
377
'66\.249\.93\.104','google_cache',
 
378
'72\.14\.2[0-9]{2}\.104','google_cache',
157
379
'msn\.','msn',
 
380
'live\.com','live',
158
381
'voila\.','voila',
159
 
'yahoo\.','yahoo','(66\.218\.71\.225|216\.109\.117\.135)','yahoo',
 
382
'mindset\.research\.yahoo','yahoo_mindset',
 
383
'yahoo\.','yahoo','(66\.218\.71\.225|216\.109\.117\.135|216\.109\.125\.130|66\.218\.69\.11)','yahoo',
160
384
'lycos\.','lycos',
161
385
'alexa\.com','alexa',
162
386
'alltheweb\.com','alltheweb',
171
395
'search\.sli\.sympatico\.ca','sympatico',
172
396
'excite\.','excite',
173
397
# Minor international search engines
 
398
'4\-counter\.com','google4counter',
 
399
'att\.net','att',
174
400
'northernlight\.','northernlight',
175
401
'hotbot\.','hotbot',
176
402
'kvasir\.','kvasir',
181
407
'euroseek\.','euroseek',
182
408
'looksmart\.','looksmart',
183
409
'spray\.','spray',
184
 
'nbci\.com/search','nbci',
 
410
'nbci\.com\/search','nbci',
 
411
'de\.ask.\com','askde', # break out Ask country specific engines.
 
412
'es\.ask.\com','askes',
 
413
'fr\.ask.\com','askfr',
 
414
'it\.ask.\com','askit',
 
415
'nl\.ask.\com','asknl',
 
416
'uk\.ask.\com','askuk',
 
417
'(^|\.)ask\.co\.uk','askuk',
185
418
'(^|\.)ask\.com','ask',
186
419
'atomz\.','atomz',
187
420
'overture\.com','overture',             # Replace 'goto\.com','Goto.com',
195
428
'ixquick\.com','ixquick',
196
429
'search\.earthlink\.net','earthlink',
197
430
'i-une\.com','iune',
 
431
'blingo\.com','blingo',
 
432
'centraldatabase\.org','centraldatabase',
 
433
'clusty\.com','clusty',
 
434
'mysearch\.','mysearch',
 
435
'vivisimo\.com','vivisimo',
 
436
'kartoo\.com','kartoo',
 
437
'icerocket\.com','icerocket',
 
438
'sphere\.com','sphere',
 
439
'ledix\.net','ledix',
 
440
'start\.shaw\.ca','shawca',
 
441
'searchalot\.com','searchalot',
 
442
'copernic\.com','copernic',
 
443
'avantfind\.com','avantfind',
 
444
'steadysearch\.com','steadysearch',
 
445
'steady-search\.com','steadysearch',
 
446
# Chello Portals
 
447
'chello\.at','chelloat',
 
448
'chello\.be','chellobe',
 
449
'chello\.cz','chellocz',
 
450
'chello\.fr','chellofr',
 
451
'chello\.hu','chellohu',
 
452
'chello\.nl','chellonl',
 
453
'chello\.no','chellono',
 
454
'chello\.pl','chellopl',
 
455
'chello\.se','chellose',
 
456
'chello\.sk','chellosk',
 
457
'chello','chellocom',
 
458
# Mirago 
 
459
'mirago\.be','miragobe',
 
460
'mirago\.ch','miragoch',
 
461
'mirago\.de','miragode',
 
462
'mirago\.dk','miragodk',
 
463
'es\.mirago\.com','miragoes',
 
464
'mirago\.fr','miragofr',
 
465
'mirago\.it','miragoit',
 
466
'mirago\.nl','miragonl',
 
467
'no\.mirago\.com','miragono',
 
468
'mirago\.se','miragose',
 
469
'mirago\.co\.uk','miragocouk',
 
470
'mirago','mirago', # required as catchall for new countries not yet known
 
471
'answerbus\.com','answerbus',
 
472
'icq\.com\/search','icq',
 
473
'nusearch\.com','nusearch',
 
474
'goodsearch\.com','goodsearch',
 
475
'scroogle\.org','scroogle',
 
476
'questionanswering\.com','questionanswering',
 
477
'mywebsearch\.com','mywebsearch',
 
478
'as\.starware\.com','comettoolbar',
 
479
# Social Bookmarking Services
 
480
'del\.icio\.us','delicious',
 
481
'digg\.com','digg',
 
482
'stumbleupon\.com','stumbleupon',
 
483
'swik\.net','swik',
 
484
'segnalo\.alice\.it','segnalo',
 
485
'ineffabile\.it','ineffabile',
 
486
# Minor Australian search engines
 
487
'anzwers\.com\.au','anzwers',
198
488
# Minor brazilian search engines
199
489
'engine\.exe','engine',
200
490
'miner\.bol\.com\.br','miner',
202
492
'baidu\.com','baidu',
203
493
'search\.sina\.com','sina',
204
494
'search\.sohu\.com','sohu',
 
495
'sogou\.com','sogou',
205
496
# Minor czech search engines
206
497
'atlas\.cz','atlas',
207
498
'seznam\.cz','seznam',
226
517
'ilse\.','ilse',
227
518
'vindex\.','vindex',
228
519
# Minor english search engines
229
 
'(^|\.)ask\.co\.uk','askuk',
230
520
'bbc\.co\.uk/cgi-bin/search','bbc',
231
521
'ifind\.freeserve','freeserve',
232
522
'looksmart\.co\.uk','looksmartuk',
233
 
'mirago\.','mirago',
234
523
'splut\.','splut',
235
524
'spotjockey\.','spotjockey',
236
525
'ukdirectory\.','ukdirectory',
248
537
'search[\w\-]+\.free\.fr','free',
249
538
'recherche\.club-internet\.fr','clubinternet',
250
539
'toile\.com','toile',
 
540
'biglotron\.com', 'biglotron',
 
541
'mozbot\.fr', 'mozbot',
251
542
# Minor german search engines
252
543
'sucheaol\.aol\.de','aolde',
253
544
'fireball\.de','fireball',
260
551
'meinestadt\.de','meinestadt',
261
552
'212\.227\.33\.241','metaspinner',
262
553
'(161\.58\.227\.204|161\.58\.247\.101|212\.40\.165\.90|213\.133\.108\.202|217\.160\.108\.151|217\.160\.111\.99|217\.160\.131\.108|217\.160\.142\.227|217\.160\.176\.42)','metacrawler_de',
263
 
# Minor hungarian search engines
 
554
'wwweasel\.de','wwweasel',
 
555
'netluchs\.de','netluchs',
 
556
'schoenerbrausen\.de','schoenerbrausen',
 
557
# Minor Hungarian search engines
264
558
'heureka\.hu','heureka',
265
559
'vizsla\.origo\.hu','origo',
266
560
'lapkereso\.hu','lapkereso',
269
563
'wahoo\.hu','wahoo',
270
564
'webmania\.hu','webmania',
271
565
'search\.internetto\.hu','internetto',
272
 
# Minor italian search engines
 
566
'tango\.hu','tango_hu',
 
567
'keresolap\.hu','keresolap_hu',
 
568
'polymeta\.hu','polymeta_hu',
 
569
# Minor Indian search engines
 
570
'sify\.com','sify',
 
571
# Minor Italian search engines
273
572
'virgilio\.it','virgilio',
274
573
'arianna\.libero\.it','arianna',
275
574
'supereva\.com','supereva',
276
575
'kataweb\.it','kataweb',
277
 
# Minor norvegian search engines
278
 
'sok\.start\.no','start',
279
 
# Minor polish search engines
 
576
'search\.alice\.it\.master','aliceitmaster',
 
577
'search\.alice\.it','aliceit',
 
578
'gotuneed\.com','gotuneed',
 
579
'godado','godado',
 
580
'jumpy\.it','jumpy\.it',
 
581
'shinyseek\.it','shinyseek\.it',
 
582
'teecno\.it','teecnoit',
 
583
# Minor Japanese search engines
 
584
'ask\.jp','askjp',
 
585
'sagool\.jp','sagool',
 
586
# Minor Norwegian search engines
 
587
'sok\.start\.no','start', 'eniro\.no','eniro',
 
588
# Minor Polish search engines
280
589
'szukaj\.wp\.pl','wp',
 
590
'szukaj\.onet\.pl','onetpl',
 
591
'dodaj\.pl','dodajpl',
 
592
'gazeta\.pl','gazetapl',
 
593
'gery\.pl','gerypl',
 
594
'netsprint\.pl\/hoga\-search','hogapl',
 
595
'netsprint\.pl','netsprintpl',
 
596
'interia\.pl','interiapl',
 
597
'katalog\.onet\.pl','katalogonetpl',
 
598
'o2\.pl','o2pl',
 
599
'polska\.pl','polskapl',
 
600
'szukacz\.pl','szukaczpl',
 
601
'wow\.pl','wowpl',
281
602
# Minor russian search engines
282
603
'ya(ndex)?\.ru','yandex',
283
604
'aport\.ru','aport',
284
605
'rambler\.ru','rambler',
285
606
'turtle\.ru','turtle',
286
607
'metabot\.ru','metabot',
287
 
# Minor swedish search engines
 
608
# Minor Swedish search engines
288
609
'evreka\.passagen\.se','passagen',
 
610
'eniro\.se','enirose',
 
611
# Minor Slovak search engines
 
612
'zoznam\.sk','zoznam',
 
613
# Minor Portuguese search engines
 
614
'sapo\.pt','sapo',
289
615
# Minor swiss search engines
290
616
'search\.ch','searchch',
291
617
'search\.bluewin\.ch','bluewin',
313
639
'dmoz','search=',
314
640
'google_base','(p|q|as_p|as_q)=',
315
641
'google_froogle','(p|q|as_p|as_q)=',
 
642
'google_groups','group\/', # does not work
316
643
'google_image','(p|q|as_p|as_q)=',
 
644
'google_cache','(p|q|as_p|as_q)=cache:[0-9A-Za-z]{12}:',
317
645
'google','(p|q|as_p|as_q)=',
318
646
'lycos','query=',
319
647
'msn','q=',
 
648
'live','q=',
320
649
'netscape','search=',
321
650
'tiscali','key=',
322
651
'aol','query=',
323
652
'terra','query=',
324
 
'voila','kw=',
 
653
'voila','(kw|rdata)=',
325
654
'search.com','q=',
 
655
'yahoo_mindset','p=',
326
656
'yahoo','p=',
327
657
'sympatico', 'query=', 
328
658
'excite','search=',
329
659
# Minor international search engines
 
660
'google4counter','(p|q|as_p|as_q)=',
 
661
'att','qry=',
330
662
'go','qt=',
331
 
'ask','ask=',
 
663
'askde','(ask|q)=', # break out Ask country specific engines.
 
664
'askes','(ask|q)=',
 
665
'askfr','(ask|q)=',
 
666
'askit','(ask|q)=',
 
667
'asknl','(ask|q)=',
 
668
'ask','(ask|q)=',
332
669
'atomz','sp-q=',
333
670
'euroseek','query=',
334
671
'findarticles','key=',
345
682
'dogpile', 'q(|kw)=',
346
683
'spray','string=',
347
684
'teoma','q=',
348
 
'virgilio','qs=',
349
 
'arianna','query=',
350
 
'supereva','q=',
351
 
'kataweb','q=',
352
685
'webcrawler','searchText=',
353
686
'wisenut','query=', 
354
687
'ixquick', 'query=',
355
688
'earthlink', 'q=',
356
689
'iune','(keywords|q)=',
 
690
'blingo','q=',
 
691
'centraldatabase','query=',
 
692
'clusty','query=',
 
693
'mysearch','searchfor=',
 
694
'vivisimo','query=',
 
695
# kartoo: No keywords passed in referring URL.
 
696
'kartoo','',
 
697
'icerocket','q=',
 
698
'sphere','q=',
 
699
'ledix','q=',
 
700
'shawca','q=',
 
701
'searchalot','q=',
 
702
'copernic','web\/',
 
703
'avantfind','keywords=',
 
704
'steadysearch','w=',
 
705
# Chello Portals
 
706
'chelloat','q1=',
 
707
'chellobe','q1=',
 
708
'chellocz','q1=',
 
709
'chellofr','q1=',
 
710
'chellohu','q1=',
 
711
'chellonl','q1=',
 
712
'chellono','q1=',
 
713
'chellopl','q1=',
 
714
'chellose','q1=',
 
715
'chellosk','q1=',
 
716
'chellocom','q1=',
 
717
# Mirago
 
718
'miragobe','(txtsearch|qry)=',
 
719
'miragoch','(txtsearch|qry)=',
 
720
'miragode','(txtsearch|qry)=',
 
721
'miragodk','(txtsearch|qry)=',
 
722
'miragoes','(txtsearch|qry)=',
 
723
'miragofr','(txtsearch|qry)=',
 
724
'miragoit','(txtsearch|qry)=',
 
725
'miragonl','(txtsearch|qry)=',
 
726
'miragono','(txtsearch|qry)=',
 
727
'miragose','(txtsearch|qry)=',
 
728
'miragocouk','(txtsearch|qry)=',
 
729
'mirago','(txtsearch|qry)=',
 
730
'answerbus','', # Does not provide query parameters
 
731
'icq','q=',
 
732
'nusearch','nusearch_terms=',
 
733
'goodsearch','Keywords=',
 
734
'scroogle','Gw=', # Does not always provide query parameters
 
735
'questionanswering','',
 
736
'mywebsearch','searchfor=',
 
737
'comettoolbar','qry=',
 
738
# Social Bookmarking Services
 
739
'delicious','all=',
 
740
'digg','s=',
 
741
'stumbleupon','',
 
742
'swik','swik\.net/', # does not work. Keywords follow domain, e.g. http://swik.net/awstats+analytics
 
743
'segnalo','',
 
744
'ineffabile','',
 
745
# Minor Australian search engines
 
746
'anzwers','search=',
357
747
# Minor brazilian search engines
358
748
'engine','p1=', 'miner','q=',
359
749
# Minor chinese search engines
360
 
'baidu','word=', 'sina', 'word=', 'sohu','word=',
 
750
'baidu','word=', 'sina', 'word=', 'sohu','word=', 'sogou', 'query=',
361
751
# Minor czech search engines
362
752
'atlas','searchtext=', 'seznam','w=', 'quick','query=', 'centrum','q=', 'jyxo','s=', 'najdi','dotaz=', 'redbox','srch=',
363
753
# Minor danish search engines
365
755
# Minor dutch search engines
366
756
'ilse','search_for=', 'vindex','in=',
367
757
# Minor english search engines
368
 
'askuk','ask=', 'bbc','q=', 'freeserve','q=', 'looksmartuk','key=',
369
 
'mirago','txtsearch=', 'splut','pattern=', 'spotjockey','Search_Keyword=', 'ukindex', 'stext=', 'ukdirectory','k=', 'ukplus','search=', 'searchy', 'search_term=',
 
758
'askuk','(ask|q)=', 'bbc','q=', 'freeserve','q=', 'looksmartuk','key=',
 
759
'splut','pattern=', 'spotjockey','Search_Keyword=', 'ukindex', 'stext=', 'ukdirectory','k=', 'ukplus','search=', 'searchy', 'search_term=',
370
760
# Minor finnish search engines
371
761
'haku','w=',
372
762
# Minor french search engines
373
763
'francite','name=', 'clubinternet', 'q=',
374
764
'toile', 'q=',
 
765
'biglotron','question=',
 
766
'mozbot','q=',
375
767
# Minor german search engines
376
768
'aolde','q=',
377
769
'fireball','q=', 'infoseek','qt=', 'webde','su=',
378
770
'abacho','q=', 't-online','q=', 
379
771
'metaspinner','qry=',
380
772
'metacrawler_de','qry=',
381
 
# Minor hungarian search engines
 
773
'wwweasel','q=',
 
774
'netluchs','query=',
 
775
'schoenerbrausen','q=',
 
776
# Minor Hungarian search engines
382
777
'heureka','heureka=', 'origo','(q|search)=', 'goliat','KERESES=', 'wahoo','q=', 'internetto','searchstr=',
383
 
# Minor norvegian search engines
384
 
'start','q=',
385
 
# Minor polish search engines
 
778
'keresolap_hu','q=',
 
779
'tango_hu','q=',
 
780
'polymeta_hu','',
 
781
# Minor Indian search engines
 
782
'sify','keyword=',
 
783
# Minor Italian search engines
 
784
'virgilio','qs=',
 
785
'arianna','query=',
 
786
'supereva','q=',
 
787
'kataweb','q=',
 
788
'aliceitmaster','qs=',
 
789
'aliceit','qs=',
 
790
'gotuneed','', # Not yet known
 
791
'godado','Keywords=',
 
792
'jumpy\.it','searchWord=',
 
793
'shinyseek\.it','KEY=',
 
794
'teecnoit','q=',
 
795
# Minor Japanese search engines
 
796
'askjp','(ask|q)=',
 
797
'sagool','q=',
 
798
# Minor Norwegian search engines
 
799
'start','q=', 'eniro','q=',
 
800
# Minor Polish search engines
386
801
'wp','szukaj=',
 
802
'onetpl','qt=',
 
803
'dodajpl','keyword=',
 
804
'gazetapl','slowo=',
 
805
'gerypl','q=',
 
806
'hogapl','qt=',
 
807
'netsprintpl','q=',
 
808
'interiapl','q=',
 
809
'katalogonetpl','qt=',
 
810
'o2pl','qt=',
 
811
'polskapl','qt=',
 
812
'szukaczpl','q=',
 
813
'wowpl','q=',
387
814
# Minor russian search engines
388
815
'yandex', 'text=', 'rambler','words=', 'aport', 'r=', 'metabot', 'st=',
389
816
# Minor swedish search engines
390
817
'passagen','q=',
 
818
'enirose','q=',
391
819
# Minor swiss search engines
392
820
'searchch', 'q=', 'bluewin', 'qry='
393
821
);
407
835
@WordsToCleanSearchUrl= ('act=','annuaire=','btng=','cat=','categoria=','cfg=','cof=','cou=','count=','cp=','dd=','domain=','dt=','dw=','enc=','exec=','geo=','hc=','height=','hits=','hl=','hq=','hs=','id=','kl=','lang=','loc=','lr=','matchmode=','medor=','message=','meta=','mode=','order=','page=','par=','pays=','pg=','pos=','prg=','qc=','refer=','sa=','safe=','sc=','sort=','src=','start=','style=','stype=','sum=','tag=','temp=','theme=','type=','url=','user=','width=','what=','\\.x=','\\.y=','y=','look=');
408
836
 
409
837
# SearchEnginesKnownUTFCoding
410
 
# Known param that proves a search engines has coded its param in UTF8
 
838
# Known parameter that proves a search engine has coded its parameters in UTF-8
411
839
#------------------------------------------------------------------------------
412
840
%SearchEnginesKnownUTFCoding=(
413
841
# Most common search engines
422
850
#------------------------------------------------------------------------------
423
851
%SearchEnginesHashLib=(
424
852
# Major international search engines
425
 
'alexa','Alexa',
426
 
'alltheweb','AllTheWeb',
427
 
'altavista','AltaVista',
428
 
'a9', 'A9.com',
429
 
'dmoz','DMOZ',
430
 
'google_base','Google (Base)',
431
 
'google_froogle','Froogle (Google)',
432
 
'google_image','Google (Images)',
433
 
'google','Google',
434
 
'lycos','Lycos',
435
 
'msn','MSN',
436
 
'netscape','Netscape',
437
 
'aol','AOL',
438
 
'terra','Terra',
439
 
'tiscali','Tiscali',
440
 
'voila','Voila',
441
 
'search.com','Search.com',
442
 
'yahoo','Yahoo',
443
 
'sympatico', 'Sympatico',
444
 
'excite','Excite',
 
853
'alexa','<a href="http://www.alexa.com/" title="Search Engine Home Page [new window]" target="_blank">Alexa</a>',
 
854
'alltheweb','<a href="http://www.alltheweb.com/" title="Search Engine Home Page [new window]" target="_blank">AllTheWeb</a>',
 
855
'altavista','<a href="http://www.altavista.com/" title="Search Engine Home Page [new window]" target="_blank">AltaVista</a>',
 
856
'a9', '<a href="http://www.a9.com/" title="Search Engine Home Page [new window]" target="_blank">A9</a>',
 
857
'dmoz','<a href="http://dmoz.org/" title="Search Engine Home Page [new window]" target="_blank">DMOZ</a>',
 
858
'google_base','<a href="http://base.google.com/" title="Search Engine Home Page [new window]" target="_blank">Google (Base)</a>',
 
859
'google_froogle','<a href="http://froogle.google.com/" title="Search Engine Home Page [new window]" target="_blank">Froogle (Google)</a>',
 
860
'google_groups','<a href="http://groups.google.com/" title="Search Engine Home Page [new window]" target="_blank">Google (Groups)</a>',
 
861
'google_image','<a href="http://images.google.com/" title="Search Engine Home Page [new window]" target="_blank">Google (Images)</a>',
 
862
'google_cache','<a href="http://www.google.com/help/features.html#cached" title="Search Engine Home Page [new window]" target="_blank">Google (cache)</a>',
 
863
'google','<a href="http://www.google.com/" title="Search Engine Home Page [new window]" target="_blank">Google</a>',
 
864
'lycos','<a href="http://www.lycos.com/" title="Search Engine Home Page [new window]" target="_blank">Lycos</a>',
 
865
'msn','<a href="http://search.msn.com/" title="Search Engine Home Page [new window]" target="_blank">MSN Search</a>',
 
866
'live','<a href="http://www.live.com/" title="Search Engine Home Page [new window]" target="_blank">Windows Live</a>',
 
867
'netscape','<a href="http://www.netscape.com/" title="Search Engine Home Page [new window]" target="_blank">Netscape</a>',
 
868
'aol','<a href="http://www.aol.com/" title="Search Engine Home Page [new window]" target="_blank">AOL</a>',
 
869
'terra','<a href="http://www.terra.es/" title="Search Engine Home Page [new window]" target="_blank">Terra</a>',
 
870
'tiscali','<a href="http://search.tiscali.com/" title="Search Engine Home Page [new window]" target="_blank">Tiscali</a>',
 
871
'voila','<a href="http://www.voila.fr/" title="Search Engine Home Page [new window]" target="_blank">Voila</a>',
 
872
'search.com','<a href="http://www.search.com/" title="Search Engine Home Page [new window]" target="_blank">Search.com</a>',
 
873
'yahoo_mindset','<a href="http://mindset.research.yahoo.com/" title="Search Engine Home Page [new window]" target="_blank">Yahoo! Mindset</a>',
 
874
'yahoo','<a href="http://www.yahoo.com/" title="Search Engine Home Page [new window]" target="_blank">Yahoo!</a>',
 
875
'sympatico','<a href="http://sympatico.msn.ca/" title="Search Engine Home Page [new window]" target="_blank">Sympatico</a>',
 
876
'excite','<a href="http://www.excite.com/" title="Search Engine Home Page [new window]" target="_blank">Excite</a>',
445
877
# Minor international search engines
 
878
'google4counter','<a href="http://www.4-counter.com/" title="Search Engine Home Page [new window]" target="_blank">4-counter (Google)</a>',
 
879
'att','<a href="http://www.att.net/" title="Search Engine Home Page [new window]" target="_blank">AT&T search (powered by Google)</a>',
446
880
'go','Go.com',
447
 
'ask','Ask Jeeves',
 
881
'askde','<a href="http://de.ask.com/" title="Search Engine Home Page [new window]" target="_blank">Ask Deutschland</a>',
 
882
'askes','<a href="http://es.ask.com/" title="Search Engine Home Page [new window]" target="_blank">Ask Espa&ntilde;a</a>', # break out Ask country specific engines.
 
883
'askfr','<a href="http://fr.ask.com/" title="Search Engine Home Page [new window]" target="_blank">Ask France</a>',
 
884
'askit','<a href="http://it.ask.com/" title="Search Engine Home Page [new window]" target="_blank">Ask Italia</a>',
 
885
'asknl','<a href="http://nl.ask.com/" title="Search Engine Home Page [new window]" target="_blank">Ask Nederland</a>',
 
886
'ask','<a href="http://www.ask.com/" title="Search Engine Home Page [new window]" target="_blank">Ask</a>',
448
887
'atomz','Atomz',
449
888
'dejanews','DejaNews',
450
889
'euroseek','Euroseek',
459
898
'nbci','NBCI',
460
899
'northernlight','NorthernLight',
461
900
'overture','Overture',                 # Replace 'goto\.com','Goto.com',
462
 
'dogpile','Dogpile',
 
901
'dogpile','<a href="http://www.dogpile.com/" title="Search Engine Home Page [new window]" target="_blank">Dogpile</a>',
463
902
'spray','Spray',
464
 
'teoma','Teoma',                                                        # Replace 'directhit\.com','DirectHit',
465
 
'webcrawler','WebCrawler',
 
903
'teoma','<a href="http://search.ask.com/" title="Search Engine Home Page [new window]" target="_blank">Teoma</a>',                                                      # Replace 'directhit\.com','DirectHit',
 
904
'webcrawler','<a href="http://www.webcrawler.com/" title="Search Engine Home Page [new window]" target="_blank">WebCrawler</a>',
466
905
'wisenut','WISENut', 
467
 
'ixquick', 'ix quick', 
 
906
'ixquick','<a href="http://www.ixquick.com/" title="Search Engine Home Page [new window]" target="_blank">ix quick</a>', 
468
907
'earthlink', 'Earth Link',
469
 
'iune','i-une.com',
 
908
'iune','<a href="http://www.i-une.com/" title="Search Engine Home Page [new window]" target="_blank">i-une</a>',
 
909
'blingo','<a href="http://www.blingo.com/" title="Search Engine Home Page [new window]" target="_blank">Blingo</a>',
 
910
'centraldatabase','<a href="http://search.centraldatabase.org/" title="Search Engine Home Page [new window]" target="_blank">GPU p2p search</a>',
 
911
'clusty','<a href="http://www.clusty.com/" title="Search Engine Home Page [new window]" target="_blank">Clusty</a>',
 
912
'mysearch','<a href="http://www.mysearch.com" title="Search Engine Home Page [new window]" target="_blank">My Search</a>',
 
913
'vivisimo','<a href="http://www.vivisimo.com/" title="Search Engine Home Page [new window]" target="_blank">Vivisimo</a>',
 
914
'kartoo','<a href="http://www.kartoo.com/" title="Search Engine Home Page [new window]" target="_blank">Kartoo</a>',
 
915
'icerocket','<a href="http://www.icerocket.com/" title="Search Engine Home Page [new window]" target="_blank">Icerocket (Blog)</a>',
 
916
'sphere','<a href="http://www.sphere.com/" title="Search Engine Home Page [new window]" target="_blank">Sphere (Blog)</a>',
 
917
'ledix','<a href="http://www.ledix.net/" title="Search Engine Home Page [new window]" target="_blank">Ledix</a>',
 
918
'shawca','<a href="http://start.shaw.ca/" title="Search Engine Home Page [new window]" target="_blank">Shaw.ca</a>',
 
919
'searchalot','<http://www.searchalot.com/" title="Search Engine Home Page [new window]" target="_blank">Searchalot</a>',
 
920
'copernic','<http://www.copernic.com/" title="Search Engine Home Page [new window]" target="_blank">Copernic</a>',
 
921
'avantfind','<http://www.avantfind.com/" title="Search Engine Home Page [new window]" target="_blank">Avantfind</a>',
 
922
'steadysearch','<http://www.avantfind.com/" title="Search Engine Home Page [new window]" target="_blank">Avantfind</a>',
 
923
# Chello Portals
 
924
'chelloat','<a href="http://www.chello.at/" title="Search Engine Home Page [new window]" target="_blank">Chello Austria</a>',
 
925
'chellobe','<a href="http://www.chello.be/" title="Search Engine Home Page [new window]" target="_blank">Chello Belgium</a>',
 
926
'chellocz','<a href="http://www.chello.cz/" title="Search Engine Home Page [new window]" target="_blank">Chello Czech Republic</a>',
 
927
'chellofr','<a href="http://www.chello.fr/" title="Search Engine Home Page [new window]" target="_blank">Chello France</a>',
 
928
'chellohu','<a href="http://www.chello.hu/" title="Search Engine Home Page [new window]" target="_blank">Chello Hungary</a>',
 
929
'chellonl','<a href="http://www.chello.nl/" title="Search Engine Home Page [new window]" target="_blank">Chello Netherlands</a>',
 
930
'chellono','<a href="http://www.chello.no/" title="Search Engine Home Page [new window]" target="_blank">Chello Norway</a>',
 
931
'chellopl','<a href="http://www.chello.pl/" title="Search Engine Home Page [new window]" target="_blank">Chello Poland</a>',
 
932
'chellose','<a href="http://www.chello.se/" title="Search Engine Home Page [new window]" target="_blank">Chello Sweden</a>',
 
933
'chellosk','<a href="http://www.chello.sk/" title="Search Engine Home Page [new window]" target="_blank">Chello Slovakia</a>',
 
934
'chellocom','<a href="http://www.chello.com/" title="Search Engine Home Page [new window]" target="_blank">Chello (Country not recognized)</a>',
 
935
# Mirago
 
936
'miragobe','<a href="http://www.mirago.be/" title="Search Engine Home Page [new window]" target="_blank">Mirago Belgium</a>',
 
937
'miragoch','<a href="http://www.mirago.ch/" title="Search Engine Home Page [new window]" target="_blank">Mirago Switzerland</a>',
 
938
'miragode','<a href="http://www.mirago.de/" title="Search Engine Home Page [new window]" target="_blank">Mirago Germany</a>',
 
939
'miragodk','<a href="http://www.mirago.dk/" title="Search Engine Home Page [new window]" target="_blank">Mirago Denmark</a>',
 
940
'miragoes','<a href="http://es.mirago.com/" title="Search Engine Home Page [new window]" target="_blank">Mirago Spain</a>',
 
941
'miragofr','<a href="http://www.mirago.fr/" title="Search Engine Home Page [new window]" target="_blank">Mirago France</a>',
 
942
'miragoit','<a href="http://www.mirago.it/" title="Search Engine Home Page [new window]" target="_blank">Mirago Italy</a>',
 
943
'miragonl','<a href="http://www.mirago.nl/" title="Search Engine Home Page [new window]" target="_blank">Mirago Netherlands</a>',
 
944
'miragono','<a href="http://no.mirago.com/" title="Search Engine Home Page [new window]" target="_blank">Mirago Norway</a>',
 
945
'miragose','<a href="http://www.mirago.se/" title="Search Engine Home Page [new window]" target="_blank">Mirago Sweden</a>',
 
946
'miragocouk','<a href="http://zone.mirago.co.uk/" title="Search Engine Home Page [new window]" target="_blank">Mirago UK</a>',
 
947
'mirago','<a href="http://www.mirago.com/" title="Search Engine Home Page [new window]" target="_blank">Mirago (country unknown)</a>',
 
948
'answerbus','<a href="http://www.answerbus.com/" title="Search Engine Home Page [new window]" target="_blank">Answerbus</a>',
 
949
'icq','<a href="http://www.icq.com/" title="Search Engine Home Page [new window]" target="_blank">icq</a>',
 
950
'nusearch','<a href="http://www.nusearch.com/" title="Search Engine Home Page [new window]" target="_blank">Nusearch</a>',
 
951
'goodsearch','<a href="http://www.goodsearch.com/" title="Search Engine Home Page [new window]" target="_blank">GoodSearch</a>',
 
952
'scroogle','<a href="http://www.scroogle.org/" title="Search Engine Home Page [new window]" target="_blank">Scroogle</a>',
 
953
'questionanswering','<a href="http://www.questionanswering.com/" title="Questionanswering home page [new window]" target="_blank">Questionanswering</a>',
 
954
'mywebsearch','<a href="http://search.mywebsearch.com/" title="MyWebSearch home page [new window]" target="_blank">MyWebSearch</a>',
 
955
'comettoolbar','<a href="http://as.starware.com/dp/search" title="Comet toolbar search home page [new window]" target="_blank">Comet toolbar search</a>',
 
956
# Social Bookmarking Services
 
957
'delicious','<a href="http://del.icio.us/" title="del.icio.us home page [new window]" target="_blank">del.icio.us</a> (Social Bookmark)',
 
958
'digg','<a href="http://www.digg.com/" title="Digg home page [new window]" target="_blank">Digg</a> (Social Bookmark)',
 
959
'stumbleupon','<a href="http://www.stumbleupon.com/" title="Stumbleupon home page [new window]" target="_blank">Stumbleupon</a> (Social Bookmark)',
 
960
'swik','<a href="http://swik.net/" title="Swik home page [new window]" target="_blank">Swik</a> (Social Bookmark)',
 
961
'segnalo','<a href="http://segnalo.alice.it/" title="Segnalo home page [new window]" target="_blank">Segnalo</a> (Social Bookmark)',
 
962
'ineffabile','<a href="http://www.ineffabile.it/" title="Ineffabile.it home page [new window]" target="_blank">Ineffabile.it</a> (Social Bookmark)',
 
963
# Minor Australian search engines
 
964
'anzwers','<a href="http://anzwers.com.au/" title="anzwers.com.au home page [new window]" target="_blank">anzwers.com.au</a>',
470
965
# Minor brazilian search engines
471
966
'engine','Cade', 'miner','Meta Miner',
472
967
# Minor chinese search engines
473
 
'baidu','Baidu', 'sina','Sina', 'sohu','Sohu',
 
968
'baidu','Baidu', 'sina','Sina', 'sohu','Sohu', 'sogou','<a href="http://www.sogou.com/" title="Search Engine Home Page [new window]" target="_blank">Sogou</a>',
474
969
# Minor czech search engines
475
970
'atlas','Atlas.cz',     'seznam','Seznam', 'quick','Quick.cz', 'centrum','Centrum.cz', 'jyxo','Jyxo.cz', 'najdi','Najdi.to', 'redbox','RedBox.cz',
476
971
# Minor danish search-engines
478
973
# Minor dutch search engines
479
974
'ilse','Ilse','vindex','Vindex\.nl',                                            
480
975
# Minor english search engines
481
 
'askuk','Ask Jeeves UK', 'bbc','BBC', 'freeserve','Freeserve', 'looksmartuk','Looksmart UK',
482
 
'mirago','Mirago', 'splut','Splut', 'spotjockey','Spotjockey', 'ukdirectory','UK Directory', 'ukindex','UKIndex', 'ukplus','UK Plus', 'searchy','searchy.co.uk',
 
976
'askuk','<a href="http://uk.ask.com/" title="Search Engine Home Page [new window]" target="_blank">Ask UK</a>',
 
977
'bbc','BBC', 'freeserve','Freeserve', 'looksmartuk','Looksmart UK',
 
978
'splut','Splut', 'spotjockey','Spotjockey', 'ukdirectory','UK Directory', 'ukindex','UKIndex', 'ukplus','UK Plus', 'searchy','searchy.co.uk',
483
979
# Minor finnish search engines
484
980
'haku','Ihmemaa',                                                                               
485
981
# Minor french search engines
486
982
'aolfr','AOL (fr)', 'ctrouve','C\'est trouv�', 'francite','Francit�', 'lbb', 'LBB', 'libertysurf', 'Libertysurf', 'free', 'Free.fr', 'clubinternet', 'Club-internet',
487
983
'toile', 'Toile du Qu�bec',
488
 
# Minor german search engines
 
984
'biglotron','<a href="http://www.biglotron.com/" title="Search Engine Home Page [new window]" target="_blank">Biglotron</a>',
 
985
'mozbot','<a href="http://www.mozbot.fr/" title="Search Engine Home Page [new window]" target="_blank">Mozbot</a>',
 
986
# Minor German search engines
489
987
'aolde','AOL (de)',
490
988
'fireball','Fireball', 'infoseek','Infoseek', 'webde','Web.de',
491
989
'abacho','Abacho', 't-online','T-Online', 
492
990
'allesklar','allesklar.de', 'meinestadt','meinestadt.de', 
493
991
'metaspinner','metaspinner',
494
992
'metacrawler_de','metacrawler.de',
 
993
'wwweasel','<a href="http://wwweasel.de/" title="Search Engine Home Page [new window]" target="_blank">WWWeasel</a>',
 
994
'netluchs','<a href="http://www.netluchs.de/" title="Search Engine Home Page [new window]" target="_blank">Netluchs</a>',
 
995
'schoenerbrausen','<a href="http://www.schoenerbrausen.de/" title="Search Engine Home Page [new window]" target="_blank">Schoenerbrausen/</a>',
495
996
# Minor hungarian search engines
496
997
'heureka','Heureka', 'origo','Origo-Vizsla', 'lapkereso','Startlapkeres�', 'goliat','G�li�t', 'indexhu','Index', 'wahoo','Wahoo', 'webmania','webmania.hu', 'internetto','Internetto Keres�',
497
 
# Minor italian search engines
498
 
'virgilio','Virgilio', 'arianna','Arianna', 'supereva','Supereva', 'kataweb','Kataweb',
499
 
# Minor norvegian search engines
500
 
'start','start.no',                                                             
 
998
'tango_hu','<a href="http://tango.hu/" title="Search Engine Home Page [new window]" target="_blank">Tango</a>',
 
999
'keresolap_hu','<a href="http://keresolap.hu/" title="Search Engine Home Page [new window]" target="_blank">Tango keresolap</a>',
 
1000
'polymeta_hu','<a href="http://www.polymeta.hu/" title="Search Engine Home Page [new window]" target="_blank">Polymeta</a>',
 
1001
# Minor Indian search engines
 
1002
'sify','<a href="http://search.sify.com/" title="Search Engine Home Page [new window]" target="_blank">Sify</a>',
 
1003
# Minor Italian search engines
 
1004
'virgilio','<a href="http://www.virgilio.it/" title="Search Engine Home Page [new window]" target="_blank">Virgilio</a>',
 
1005
'arianna','<a href="http://arianna.libero.it/" title="Search Engine Home Page [new window]" target="_blank">Arianna</a>',
 
1006
'supereva','<a href="http://search.supereva.com/" title="Search Engine Home Page [new window]" target="_blank">Supereva</a>',
 
1007
'kataweb','<a href="http://www.kataweb.it/ricerca/" title="Search Engine Home Page [new window]" target="_blank">Kataweb</a>',
 
1008
'aliceitmaster','<a href="http://www.alice.it/" title="Search Engine Home Page [new window]" target="_blank">search.alice.it.master</a>',
 
1009
'aliceit','<a href="http://www.alice.it/" title="Search Engine Home Page [new window]" target="_blank">alice.it</a>',
 
1010
'gotuneed','<a href="http://www.gotuneed.com/" title="Search Engine Home Page [new window]" target="_blank">got u need</a>',
 
1011
'godado','Godado.it',
 
1012
'jumpy\.it','Jumpy.it',
 
1013
'shinyseek\.it','Shinyseek.it',
 
1014
'teecnoit','<a href="http://www.teecno.it/" title="Teecno home page [new window]" target="_blank">Teecno</a>',
 
1015
# Minor Japanese search engines
 
1016
'askjp','<a href="http://www.ask.jp/" title="Search E@SearchEngngine Home Page [new window]" target="_blank">Ask Japan</a>',
 
1017
'sagool','<a href="http://sagool.jp/" title="Sagool home page [new window]" target="_blank">Sagool</a>',
 
1018
# Minor Norwegian search engines
 
1019
'start','start.no', 'eniro','<a href="http://www.eniro.no/" title="Search Engine Home Page [new window]" target="_blank">Eniro</a>',    
501
1020
# Minor polish search engines
502
 
'wp','Szukaj',
 
1021
'wp','<a href="http://szukaj.wp.pl/" title="Wirtualna Polska home page [new window]" target="_blank">Wirtualna Polska</a>',
 
1022
'onetpl','<a href="http://szukaj.onet.pl/" title="Onet.pl home page [new window]" target="_blank">Onet.pl</a>',
 
1023
'dodajpl','<a href="http://www.dodaj.pl/" title="Dodaj.pl home page [new window]" target="_blank">Dodaj.pl</a>',
 
1024
'gazetapl','<a href="http://szukaj.gazeta.pl/" title="Gazeta.pl home page [new window]" target="_blank">Gazeta.pl</a>',
 
1025
'gerypl','<a href="http://szukaj.gery.pl/" title="Gery.pl home page [new window]" target="_blank">Gery.pl</a>',
 
1026
'hogapl','<a href="http://www.hoga.pl/" title="Hoga.pl home page [new window]" target="_blank">Hoga.pl</a>',
 
1027
'netsprintpl','<a href="http://www.netsprint.pl/" title="NetSprint.pl home page [new window]" target="_blank">NetSprint.pl</a>',
 
1028
'interiapl','<a href="http://www.google.interia.pl/" title="Interia.pl home page [new window]" target="_blank">Interia.pl</a>',
 
1029
'katalogonetpl','<a href="http://katalog.onet.pl/" ti@SearchEngtle="Katalog.Onet.pl home page [new window]" target="_blank">Katalog.Onet.pl</a>',
 
1030
'o2pl','<a href="http://szukaj2.o2.pl/" title="o2.pl home page [new window]" target="_blank">o2.pl</a>',
 
1031
'polskapl','<a href="http://szukaj.polska.pl/" title="Polska home page [new window]" target="_blank">Polska</a>',
 
1032
'szukaczpl','<a href="http://www.szukacz.pl/" title="Szukacz home page [new window]" target="_blank">Szukacz</a>',
 
1033
'wowpl','<a href="http://szukaj.wow.pl/" title="Wow.pl home page [new window]" target="_blank">Wow.pl</a>',
503
1034
# Minor russian search engines
504
1035
'yandex', 'Yandex', 'aport', 'Aport', 'rambler', 'Rambler', 'turtle', 'Turtle', 'metabot', 'MetaBot',
505
 
# Minor swedish search engines
 
1036
# Minor Swedish search engines
506
1037
'passagen','Evreka',
 
1038
'enirose','<a href="http://www.eniro.se/" title="Eniro Sverige home page [new window]" target="_blank">Eniro Sverige</a>',
 
1039
# Minor Slovak search engines
 
1040
'zoznam','<a href="http://www.zoznam.sk/" Searc Engine home page [new window]" target="_blank">Zoznam</a>',
 
1041
# Minor Portuguese search engines
 
1042
'sapo','<a href="http://www.sapo.pt/" Searc Engine home page [new window]" target="_blank">Sapo</a>',
507
1043
# Minor Swiss search engines
508
1044
'searchch', 'search.ch', 'bluewin', 'search.bluewin.ch',                                                                
509
1045
# Generic search engines