차이
문서의 선택한 두 판 사이의 차이를 보여줍니다.
다음 판 | 이전 판 | ||
fence_lock_해결 [2023/01/12 15:01] – 만듦 koov | fence_lock_해결 [2023/01/13 01:51] (현재) – koov | ||
---|---|---|---|
줄 1: | 줄 1: | ||
====== fence lock 해결 ====== | ====== fence lock 해결 ====== | ||
+ | |||
+ | ===== 문제점 ===== | ||
+ | * 펜싱 장치의 전원이 꺼지는 것과 동시에 클러스터의 노드 전원이 꺼지면 클러스터 서비스가 장애 조치를 수행하지 않거나 GFS 파일 시스템이 잠깁니다. | ||
+ | * 네트워크가 다운되면 다른 노드의 펜싱이 실패하고 모든 것이 잠깁니다. | ||
+ | * 이 상황에 빠지면 한쪽 장비가 복구가 불가능한 상황인경우 멀쩡한 다른 노드가 정상적으로 서비스가 올라오지 않는 상태가 발생한다. | ||
+ | * ''/ | ||
+ | <WRAP prewrap> | ||
+ | <code vim> | ||
+ | Nov 19 12:55:50 node1 fenced[2080]: | ||
+ | Nov 19 13:26:16 node1 fenced[2080]: | ||
+ | Nov 19 13:56:42 node1 fenced[2080]: | ||
+ | </ | ||
+ | </ | ||
+ | |||
+ | ===== 해결방안 ===== | ||
+ | 클러스터가 반복적으로 노드 차단에 실패하는 상태에 있으면 이를 수정하는 두 가지 일반적인 방법이 있습니다. | ||
+ | |||
+ | * a) 노드가 펜스 장치에 도달하고 펜스 작동을 수행할 수 있는 기능을 복원합니다. 예를 들어 네트워크가 중단된 경우 연결을 복원하고, | ||
+ | |||
+ | * b) 장애가 발생한 노드를 수동으로 펜스(전원 끄기)하고 나머지 노드에서 '' | ||
+ | |||
+ | ==== cman ==== | ||
+ | '' | ||
+ | <WRAP center round important 60%> | ||
+ | 경고 : 이 명령을 실행하기 전에 잘못된 노드의 전원을 완전히 꺼야 합니다. 그렇지 않으면 데이터 손상 또는 기타 공유 리소스 충돌이 발생할 수 있습니다. | ||
+ | </ | ||
+ | |||
+ | |||
+ | * RHEL 6 | ||
+ | <WRAP prewrap> | ||
+ | <code bash> | ||
+ | # fence_ack_manual -n < | ||
+ | </ | ||
+ | </ | ||
+ | |||
+ | * RHEL 5 | ||
+ | <WRAP prewrap> | ||
+ | <code bash> | ||
+ | # fence_ack_manual -e -n < | ||
+ | </ | ||
+ | </ | ||
+ | |||
+ | ==== pacemaker ==== | ||
+ | '' | ||
+ | <WRAP center round important 60%> | ||
+ | 경고 : 이 명령을 실행하기 전에 잘못된 노드의 전원을 완전히 꺼야 합니다. 그렇지 않으면 데이터 손상 또는 기타 공유 리소스 충돌이 발생할 수 있습니다. | ||
+ | </ | ||
+ | |||
+ | <WRAP prewrap> | ||
+ | <code bash> | ||
+ | # pcs stonith confirm < | ||
+ | </ | ||
+ | </ | ||
+ | |||
+ | |||
+ | ===== 참조링크 ===== | ||
+ | * https:// | ||
+ | |||