1
Quest�es Frequentemente Perguntadas e Dicas
4
1. Hey! Isto n�o se parece com um FAQ! O que ele me oferece?
6
3. O que � um script de recurso?
7
4. Como monitorar v�rios recursos?
8
5. Toda vez que minha m�quina libera um alias IP, ele perde a interface toda
9
(isto �, eth0)! Como eu posso fix�-lo?
10
6. Eu quero muitos endere�os IP como recursos (mais de 8). Qual � a melhor
12
7. A documenta��o indica que uma linha serial � obrigat�ria, mas quando eu
13
comento a linha no arquivo de configura��o e uso somente duas conex�es
14
ethernet percebi que trabalham bem.
15
8. Qual � a diferen�a entre normal e nice failback?
16
9. Como usar o heartbeat com o firewall ipchains?
17
10. Como sintonizar o heartbeat em sistemas com carga pesada?
18
11. Quando eu tento iniciar o heartbeat recebo a mensagem:
19
"Starting High-Availability services: Heartbeat failure [rc=1]. Failed.
20
e n�o h� nada em qualquer arquivo de log. O que est� errado?
21
12. Como rodar mult�plos clusters no mesmo segmento de rede?
22
13. Como pegar a �ltima vers�o do CVS do heartbeat?
23
14. Heartbeat em outros SOs.
24
15. Se nada me ajuda, o que eu devo fazer?
26
------------------------------------------------------------------------------
30
Acabe suas c�licas! Precisamos de um documento "pega-tudo" para suprir
31
informa��es �teis de um modo que foi facilmente referenciado e que
32
cresceriam sem um monte de trabalho. Ele termina em um FAQ mais que qualquer
37
HA (cluster de Alta Disponibilidade) - Isto � um cluster que permite um host
38
(ou hosts) tornarem-se Altamente Dispon�veis, que significa que se um nodo
39
falha (ou um servi�o que o nodo fornece falha) outro nodo assume o servi�o
40
ou nodo e passa a responder pela m�quina que falhou. http://www.linu-ha.org/
41
Cluster de processamento - Isto � o que um cluster Beowulf �. Permite
42
processamento distribu�do atrav�s de componentes de prateleira. Neste caso �
43
usualmente barato m�quinas IA32. http://www.beowulf.org/
44
Cluster de balanceamento de carga - Isto � o projeto Linux Virtual Server
45
faz. Neste cen�rio voc� tem uma m�quina com balan�o de cargo em requisi��es
46
para um certo servidor (apache por exemplo) atrav�s de uma fazenda de
47
servidores. http://www.linuxvirtualserver.org/
48
Todos esses sites possuem howtos, etc. Para uma vis�o geral sobre clustering
49
sob Linux, consulte o Clustering HOWTO.
53
Script de recurso s�o basicamente (extendido) scripts de inicializa��o
54
System V. Eles possuem suporte as opera��es stop (parar), start (iniciar) e
55
status (estado). No futuro adicionaremos tamb�m suporte para um opera��o
56
"monitor" para monitoramento de servi�os assim que voc� os requisitar. O
57
script IPaddr implementa esta nova opera��o monitor agora (mas o heartbeat
58
n�o usa esta fun��o dele). Para mais informa��es veja Resource HOWTO.
62
O Heartbeat por si s� n�o foi designado para monitorar v�rios recursos. Se
63
voc� presisa monitorar alguns recursos (por exemplo, disponibilidade de um
64
servidor WWW) voc� precisa de algum terceiro grupo de software. Uma boa
67
http://kernel.org/software/mon
69
2. Pegue todos os m�dulos requeridos listados. Voc� pode localiz�-los em um
70
mirror mais pr�ximo ou no arquivo CPAN )www.cpan.org). Eu n�o estou muito
71
familiarizado com Perl, ent�o eu baixei-o do arquivo CPAN em pacotes .tar.gz
72
e instalei-os do modo usual (perl Makefile.pl && make && make test && make
75
3. Mon � um software para monitoramento diferente dos recursos da rede. Ele
76
pode pingar computadores, conectar-se por v�rias portas, monitorar WWW,
77
MySQL, etc. No caso de uma disfun��o de alguns recursos ele dispara scripts.
79
4. Descompacte o mon em algum diret�rio. O melhor ponto de partida � o
80
arquivo README. A documenta��o completa est� em <dir>/doc, onde <dir> est�
81
localizado onde voc� descompactou o mon.
83
5. Para um r�pido in�cio fa�a os seguintes passos:
84
Copie todos os subdiret�rios localizados em <dir> para /usr/lib/mon
85
Crie o diret�rio /etc/mon
86
Copie auth.cf de <dir>/etc para /etc/mon
88
Agora, o mon est� preparado para trabalhar. Voc� precisa criar seu pr�prio
89
arquivo mon.cf, onde voc� informar os recursos que o mon deve verificar e
90
quais a��es o mon ir� iniciar em caso de disfun��o e quando recursos est�o
91
dispon�veis novamente. Todos os scripts de monitoramento est�o em
92
/usr/lib/mon/mon.d/. No in�cio (cabe�alho) de cada script voc� pode
93
localizar uma explica��o de como us�-lo.
94
Todos os scripts de alerta est�o localizados em /usr/lib/mon/alert.d/. Esses
95
scripts s�o disparados quando algo estiver errado. No caso voc� est� usando
96
ipvs em sua homepage (www.linuxvirtualserver) voc� pode localizar scripts
97
para adicionar e remover servidores da lista ipvs.
101
Isto n�o � um problema com o heartbeat, mas ao contr�rio � causado por
102
v�rias vers�es de ferramentas de rede. Atualize para as vers�es mais
103
recentes das ferramentas de rede e elas ir�o longe. Voc� pode test�-las com
104
ifconfig manualmente.
108
Ao inv�s de falhar muitos endere�os IP, somente falha um endere�o do
109
roteador. No seu roteador, fa�a a "route add -net x.x.x.0/24 gw x.x.x.2",
110
onde x.x.x.2 � o endere�o IP controlado pelo heartbeat. Ent�o, fa�a todos os
111
endere�os com x.x.x.0/24 que voc� quiser para falhar um alias permanente de
112
lo0 em AMBOS os nodos do cluster. Isto � feito via "ifconfig lo:2 x.x.x.3
113
netmask 255.255.255.255 -arp" etc...
117
Ele trabalhar�, entretanto se alguma coisa fizer sua ethernet / pilha de IP
118
falhar, voc� perder� ambas as conex�es. Voc� definitivamente deve rodar
119
cabos diferentes, dependendo de qu�o importante seus dados s�o...
123
Modo normal failback:
124
Neste modo, uma das duas m�quinas � designada como fornecedor preferido de
125
um dado grupo de recursos. Se a m�quina est� no ar, ent�o ela sempre ir� ser
126
fornecedora de todo o grupo de recursos para o qual ele � designado. Falhas
127
ocorrem quando esta m�quina sai de servi�o, e quando ela retorna (failback).
128
Neste modo � requerido se voc� deseja uma configura��o ativa-ativa.
130
Neste modo, n�o h� afinidade natural entre um grupo de recursos e um nodo
131
particular no cluster (arquivo haresources n�o se opondo). Ao inv�s disso,
132
h� uma afinidade entre um grupo de recursos e qualquer m�quina que est�
133
atualmente rodando. Falhas ocorrem *somente* quando uma m�quina que est�
134
fornecendo um servi�o sai de funcionamento. N�o h� o conceito de failback
135
neste modo. Este modo minimiza interrup��es de servi�o, mas n�o pode rodar
136
uma configura��o ativa-ativa.
140
Para fazer o heartbeat trabalhar com ipchains, voc� deve aceitar tr�fego de
141
entrada e sa�da na porta UDP 694. Adicione algo como
142
/sbin/ipchains -A output -i ethN -p udp -s <IP_origem> -d <IP_destino> -j
144
/sbin/ipchains -A input -i ethN -p udp -s <IP_origem> -d <IP_destino> -j
149
Existe a probabilidade que o padr�o n�o esteja de acordo para a maioria dos
150
sistemas linux sob carga pesada (desculpe!), aqui est� a sugest�o:
151
Configure deadtime para 60 segundos ou mais
152
Configura warntime para qualquer coisa que voc� *desejar* que seu deadtime
154
Rode seu sistema sob carga pesada por algumas semanas.
155
Veja em seus logs o tempo que seu sistema ficou sem ouvir um heartbeat.
156
Configure seu deadtime para 1,5 - 2 vezes o que voc� encontrou. Configure o
157
warntime para o valor que voc� encontrou nos logs.
158
Continue a monitorar os logs para avisos sobre tempos de heartbeat longos.
162
Provavelmente � um problema de permiss�o no arquivo authkeys. Ele precisa
163
estar em modo de somente leitura (400, 600 ou 700). Dependendo de onde e
164
quando o heartbeat descobrir o problema, a mensagem estar� localizada em
166
Mas, ele tende a estar em
168
b) qualquer lugar que voc� especificou em sua configura��o
173
Utilizar multicast e pegar cada um de seus pr�prio grupo multicast. Se voc�
174
precisa/quer usar broadcast, ent�o rode cada cluster em n�meros de portas
179
H� um dep�sito CVS para Linux-HA. Voc� pode encontr�-lo em cvs.linux-ha.org.
180
Acesse somente leitura via usu�rio guest, senha guest, nome de m�dulo
181
linux-ha. Mais detalhes est�o localizados no email do anunciante. Est�
182
dispon�vel tamb�m atrav�s da web utilizando viewcvs em
183
http://cvs.linux-ha.org/viewcvs.cgi/linux-ha
187
Heartbeat est� sendo portado atualmente para usar automake.
191
Por favor esteja certo que voc� leu toda a documenta��o e procurou nos
192
arquivos das listas de discuss�es. Se voc� continuar n�o encontrando uma
193
solu��o voc� pode postar para a lista de discuss�o. Por favor inclua o
195
- Qual SO voc� est� utilizando.
196
- Qual vers�o (distro/kernel).
197
- Como voc� instalou o heartbeat (tar.gz, rpm, src.rpm ou instala��o
199
- Inclua os seus logs que descrevem o erro. Envie-os como anexos. Por favor
200
n�o envie logs "limpos". Os logs reais tem mais informa��o neles do que
201
vers�es limpas. Sempre inclua pelo menos uma pequena informa��o irrelevante
202
ante e depois dos eventos em quest�o, ent�o saberemos que voc� n�o se
203
esqueceu de nada. N�o edit os logs a menos que voc� realmente tenha algo
204
super-secreto ou raz�o de alta-seguran�a para fazer isso.
206
------------------------------------------------------------------------------
209
(c) 2000 Rudy Pawul rpawul@iso-ne.com
210
(c) 2001 Dusan Djordjevic dj.dule@linux.org.yu
212
Tradu��o: Mauro Alexandre Nogueira (Mandcap) <mauronogueira@pop.com.br>