반응형

Trouble Shooting 5

K8s Worker Node에 지정한 Pod 배치하기(Taint, Tolerations)

Overview특정한 Pod가 너무많은 Memory와 CPU를 사용해서, Worker Node 장애가 발생하였다.따라서 Worker Node에 지정한 Pod 배치하는 방법에 대해서 알아본다. Worker Node에 지정한 Pod 배치하기간단하게 Taint와 Tolerations를 활용해서, 특정 Worker Node에 지정한 Pod를 배치할 수 있다. Taint는 특정 노드에 적용되어 Tolerations을 갖지 않는 파드를 거부한다. Tolerations은 Taint 가 적용된 노드에 스케줄링될 수 있도록 파드에 설정한다.​ node1 노드에 `key=value:NoSchedule` taint를 추가한다. kubectl taint nodes node1 key=value:NoSchedule 간단하게 스크..

Trouble Shooting 2024.06.17

Terraform State Error 시 해결 방법

OverviewTerraform 실행시에 State 상태에서 멈춰있을 때 해결방법에 대해서 알아본다.   Terraform State Error Terraform 실행시에 State 상태에서 멈춰서 동작이 하지 않을때가 있다. Terraform은 `TF_LOG` 환경 변수를 통해 로깅을 제공한다. 따라서 해당명령어로 디버깅할 수 있다.export TF_LOG=DEBUGterraform apply -var-file="devqa.tfvars" 그러면 에러가 나는 부분을 쉽게 찾을 수 있다.2024-05-13T18:55:35.041+0900 [DEBUG] provider.terraform-provider-google_v5.21.0_x5: ---[ REQUEST ]--------------------------..

Trouble Shooting 2024.05.29

ACM(AWS Certificate Manager) 인증서 갱신 오류 해결 방법

OverviewACM(AWS Certificate Manager) 인증서 갱신 오류에 대해서 트러블 슈팅 해본다.    ACM(AWS Certificate Manager) 인증서 갱신 오류 먼저 아래의 사진을 보면, AWS Certificate Manager가 DNS 검증을 사용하여 인증서를 자동으로 갱신할 수 없다는 것이다. 만료 날짜(2023년 6월 11일 23:59:59 UTC) 이전에 갱신을 완료하려면 나열된 각 도메인에 대한 DNS 구성에 적절한 CNAME 레코드가 있는지 확인해야 한다.  따라서 ACM의 해당 인증서로가서 CNAME을 먼저 확인해준다. 그리고 Route53으로 가서 해당 CNAME이름과 값을 가지고 있는 레코드가 있는지 확이해준뒤 없으면 추가해준다.  그리고 기다리면 아래와 같..

Trouble Shooting 2024.05.07

ArgoCD Ingress 오류 해결 가이드 (GKE)

OverviewGKE에서 ArgoCD Ingress 생성시에 LoadBalancer에서 Health Check가 되지 않아 Server Error가 발생하는 문제에 대해서 트러블 슈팅 해본다.  ArgoCD Ingress Error(With GKE) 먼저 LoadBalancer의 백엔드 서비스를 확인해보면, 영역별 네트워크 엔드포인트 그룹(=AWS Target Group)에서 Health Check가 되지않아 Server Error가 발생한다.curl https://argocd.somaz.link/healthzError: Server ErrorThe server encountered a temporary error and could not complete your request.Please try aga..

Trouble Shooting 2024.04.26

Harbor Garbage Collection(GC) 오류 해결 방법

OverviewHarbor Grabage Collection(GC) 동작 Error에 대해서 트러블 슈팅 해보았다. Harbor Garbage Collection(GC) Error Garbage Collection 실행을 한다.  Garbage Collection을 실행했지만 Status Error 가 발생했다.  Logs 부분을 클릭하면 에러코드를 확인할 수 있다.  코드를 확인해보면, gc를 실행하는 registry controller에 도달하지 못했다고 나온다. 즉 통신이 제대로 되지 않는 것으로 보인다.2024-04-22T07:52:19Z [ERROR] [/jobservice/job/impl/gc/garbage_collection.go:105]: failed to start gc as regist..

Trouble Shooting 2024.04.23
반응형