AlwaysOn DB 점검 중 이벤트 뷰어 시스템 쪽에서 failover clustering이 지속 발생하는 것을 확인했다.

이벤트 ID 는 1196 이었고 이벤트 상세 내역과 구글링 결과 DNS 등록 문제로 판단했다.

 

인프라 도움을 받아 AD서버 DNS 쪽 확인해보니 해당 DB이름으로 DNS 등록이 되어 있지 않은 것을 확인했다.

우선 DNS 쪽에 해당 DB에 대한 DNS 등록을 했고 차후 같은 에러가 나는지 모니터링 해봐야겠다.

 

차후에도 같은 에러가 발생했다.

  1. event id 1196 확인 
    1. 상세 내용 : EventID 1196
  2. 확인 내용
    1. 네트워크 인터페이스 ipv6 enable 확인
    2. 자동으로 받아온 DNS(ipv6) 를 포함하여 등록된 DNS 서버가 4개로 확인
  3. 조치 내용
    1. 네트워크 인터페이스 ipv6 disable 조치

결국엔 사용하지 않는 ipv6 enable처리 때문이었고 disable처리 하면서 에러로그 남지 않게 되었다.

 

 

 

 

세션id로 실행 계획 보기

 

서비스 운영 중 갑자기 APM 쪽에서 폭포수를 그리기 시작했다.

빠르게 DPM 확인해보니 DB 쪽은 문제 없어서 DB문제는 아닌가보다 하고 있었는데,

다른 DBA 분이 넌지시 계정쪽 문제 인 것 같으니 계정 확인해보라고 하셨다.

 

알고보니 마스터 성으로 사용중인 계정이 잠긴 것이다.

마스터 성으로 사용하는 계정은 일반 개발자에게도 오픈된 계정으로 사실상 sysadmin 계정을 공용으로 사용하는 계정이다.

해당 계정의 이러한 사용은 사내 특수성을 고려하여 제약을 두려고 노력 중인 사항이지만 현재로서는 큰 공수를 두기가 힘들어 권고만 하던 수준이었다.

 

잠긴 계정을 풀고 APM을 보니 막혀있던 트랜젝션들이 해소되고 있었다.

 

해당 계정의 잠긴 사유를 확인해보기 위해 dberror log와 DB접근제어(chakraMax)로 확인했다.

 

우선은 dberror log에 계정잠김 최초시점을 보니, SSMS에서 비밀번호를 오기입한 흔적이 보였다.

5번 이상 실패하여 계정이 잠긴 것으로 추측했고 DB접근제어에서도 이렇다 할 큰 작업이나 막대한 요청은 없었다.

보안 감사 지적사항으로 나온 암호정책강제적용으로 5번 실패에 계정이 잠긴 것으로 판단할 수 있을 것 같다.

 

개발자들의 SA성 계정 사용을 막기 위한 방안 마련이 시급하다.

 

+ Recent posts