특정 API의 개발과 배포가 완료되고, 시간이 어느 정도 지난 뒤 트래픽이 몰리는 상황은 생각보다 자주 발생합니다. 이런 상황이 오면 자연스럽게 여러 선택지를 떠올리게 됩니다. 특정 값을 캐싱할 수도 있고, 메시지 큐를 도입해 비동기 처리를 할 수도 있으며, 아예 비동기 API 구조로 전환하는 방법도 있습니다. 레이턴시를 줄이기 위한 방법은 분명 많습니다. 그리고 각각의 방법은 그럴듯해 보입니다. 하지만 여기서 한 번 더 생각해볼 필요가 있습니다. "과연 어떤 방법을 사용하는 것이 효율적인 선택일까?" 이 질문은 "캐시를 쓸까, MQ를 쓸까, 비동기로 바꿀까"를 묻는 질문처럼 보이지만, 사실은 그보다 앞선 문제를 묻고 있는 질문일지도 모릅니다.사실 이전에 이거와 비슷하게 글을 작성한적이 있습니다. 특명:..