인프런 강의 주소


보는 방법

  • 블로그 내용은 강의 핵심 키워드 위주로 요약해서 상기용/테스트용으로 적합
    • 추가로 유료 강의라서 자세히 적으면 저작권 문제의 소지가 있기도 해서 키워드 위주로 요약해서 기록
  • 제대로 된 복습은 강의 자료와 영상을 통해서 해라
  • 가끔씩 다음 내용도 기록할 수 있다
    • 강의를 보고 생긴 의문에 대해 구글링해서 찾은 내용
    • 나중에 다시 볼 때 참고할 만한 정보



인터넷 네트워크

인터넷 통신

  • 딱히 메모할 키워드 없음


IP(인터넷 프로토콜)

  • IP(인터넷 프로토콜)
    • IP 주소(IP Address)
    • IP 패킷(Packet)
  • IP 프로토콜의 한계
    • 비연결성
    • 비신뢰성
    • 프로그램 구분
    • 비연결성, 비신뢰성은 TCP로, 프로그램 구분은 PORT로 해결


TCP, UDP

  • 인터넷 프로토콜 스택의 4계층
    • 애플리케이션 계층: HTTP
    • 전송 계층: TCP, UDP
    • 인터넷 계층: IP
    • 네트워크 인터페이스 계층
  • TCP/IP 패킷 정보
  • TCP(Transmission Control Protocol(전송 제어 프로토콜)) 특징
    • 연결지향: TCP 3 way handshake
    • 데이터 전달 보증
    • 순서 보장
  • TCP 3 way handshake
    • SYN: 접속 요청
    • ACK: 요청 수락
  • UDP(User Datagram Protocol(사용자 데이터그램 프로토콜)) 특징
    • 데이터 전달 및 순서가 보장되지 않지만, 단순하고 빠름: IP와 거의 같다. PORT, 체크섬 정도만 추가


PORT

  • IP와 PORT의 관계: IP가 아파트라면, PORT는 몇동 몇호인지 구분


DNS

  • DNS(Domain Name System)
    • 다음을 해결
      • IP는 기억하기 어렵다.
      • IP는 변경될 수 있다.
    • 어떻게?
      • 도메인명으로 DNS 서버에 묻고, DNS 서버가 그에 맞는 IP를 전달



URI와 웹 브라우저 요청 흐름

URI

  • URI(Uniform Resource Identifier)
    • 자원을 구분하는 통일된 방식
    • URL과 URN을 포함하는 개념
      • URL(Locator): 리소스 있는 위치
      • URN(Name): 리소스의 이름
      • 거의 URI는 URL과 같은 단어로 취급
  • URL 문법
    • scheme://[userinfo@]host[:port][/path][?query][#fragment]
      • []는 생략 가능
      • scheme: 주로 프로토콜 사용(https 등)
      • userinfo: 거의 사용 X
      • host: 도메인명 또는 IP 주소
      • PORT: 일반적으로 생략
      • path: 리소스 경로, 계층적 구조
      • query(query parameter, query string)
        • 웹서버에 제공하는 파라미터
        • key=value 형태
        • ?로 시작, &로 추가
      • fragment: 잘 사용 X


웹 브라우저 요청 흐름

  • 웹 브라우저가 생성한 HTTP 메시지가, TCP/IP 패킷 속 전송 데이터
  • 웹 브라우저가 요청 패킷(HTTP 요청 메시지) 전달 -> 서버는 응답 패킷(HTTP 응답 메시지) 전달 -> HTTP 응답 메시지가 HTML이라면, 브라우저가 HTML 렌더링



HTTP 기본

모든 것이 HTTP

  • HTTP(HyperText Transfer Protocol)
    • HTTP 메시지에 거의 모든 형태의 데이터를 전송
      • HTML, TEXT, IMAGE, 음성, 영상, 파일
      • JSON, XML는 주로 서버 사이에서
  • HTTP/1.1
    • 가장 많이 사용
    • 기반 프로토콜: TCP


클라이언트 서버 구조

  • HTTP는 클라이언트 서버 구조(요청과 응답)


Stateful, Stateless

  • HTTP는 Stateless(무상태 프로토콜)를 기본으로 함
    • 서버가 클라이언트의 상태를 보존X
    • 장점: 서버 확장성 높음(서버 증설, 수평 확장, 스케일 아웃)
    • 단점: 클라이언트가 추가 데이터 전송
  • Stateful(상태 유지)는 최소한만 사용


비 연결성(connectionless)

  • HTTP는 connectionless(비 연결성)를 기본으로 함
    • 서버는 연결 유지X, 최소한의 자원 사용
    • 단점: TCP/IP 연결을 새로 맺어야 함 -> 3 way handshake 시간 추가
    • 해결: Persistent Connections(지속 연결)


HTTP 메시지

  • HTTP 메시지 구조
    • start-line(시작 라인)
    • header
    • message body
  • start-line
    • request-line(요청 메시지의 start-line)
      • 구조: method request-target HTTP-version
      • 예시: GET /search?q=hello&hl=ko HTTP/1.1
      • method(HTTP 메서드): 서버가 수행해야 할 동작(GET, POST 등)
      • request-target(요청 대상)
        • absolute-path[?query]
        • 절대경로= “/” 로 시작하는 경로
    • status-line(응답 메시지의 start-line)
      • 구조: HTTP-version status-code reason-phrase
      • status-code: 요청 성공, 실패 나타냄
      • reason-phrase(이유 문구): 사람이 이해할 수 있는 짧은 상태 코드 설명 글
  • header(HTTP 헤더)
    • 구조: field-name: field-value
    • 용도: HTTP 전송에 필요한 모든 부가정보
  • message body: 실제 전송할 데이터



HTTP 메서드

HTTP API를 만들어보자

  • API URI 설계
    • 리소스 식별, 행위(메서드)를 분리
    • URI 계층 구조 활용


HTTP 메서드 - GET, POST

  • HTTP 메서드 종류
    • GET: 리소스 조회
    • POST: 요청 데이터 처리, 주로 등록에 사용
    • PUT: 리소스를 대체, 해당 리소스가 없으면 생성
    • PATCH: 리소스 부분 변경
    • DELETE: 리소스 삭제
  • GET
    • 리소스 조회
    • 서버에 전달하고 싶은 데이터는 query(쿼리 파라미터, 쿼리 스트링)를 통해서 전달
  • POST
    • 요청 데이터 처리
    • 메시지 바디를 통해 서버로 요청 데이터 전달
    • 주로 전달된 데이터로 신규 리소스 등록, 프로세스 처리에 사용


HTTP 메서드 - PUT, PATCH, DELETE

  • PUT
    • 리소스를 대체, 해당 리소스가 없으면 생성
    • 클라이언트가 리소스 위치를 알고 URI 지정
      • POST와 차이점
      • PATCH, DELETE도 비슷한 거 같은 느낌?(내 추측)
  • PATCH: 리소스 부분 변경
  • DELETE: 리소스 삭제


HTTP 메서드의 속성

  • 안전(Safe)
    • 호출해도 리소스를 변경하지 않는다
    • ex) GET / post(X)
  • 멱등(Idempotent)
    • 몇 번을 호출하든 결과가 똑같다
    • 멱등 메서드
      • GET: 몇 번 조회하든 같은 결과가 조회된다.
      • PUT: 결과를 대체한다. 따라서 같은 요청을 여러번 해도 최종 결과는 같다.
      • DELETE: 결과를 삭제한다. 같은 요청을 여러번 해도 삭제된 결과는 똑같다.
      • POST: 멱등이 아니다! 두 번 호출하면 같은 결제가 중복해서 발생할 수 있다.
    • 서버가 TIMEOUT 등으로 정상 응답을 못주었을 때, 클라이언트가 같은 요청을 다시 해도 되는지에 대한 판단 근거
    • 멱등은 외부 요인으로 중간에 리소스가 변경되는 것까지는 고려하지는 않는다.
  • 캐시가능(Cacheable)
    • 응답 결과 리소스를 캐시해서 사용해도 되는가?
    • 실제로는 GET, HEAD 정도만 캐시로 사용



HTTP 메서드 활용

클라이언트에서 서버로 데이터 전송

  • 클라이언트에서 서버로 데이터 전송
    • 데이터 전달 방식
      • 쿼리 파라미터를 통한 데이터 전송: GET
      • 메시지 바디를 통한 데이터 전송: POST, PUT, PATCH
    • 케이스
      • 동적 데이터 조회
        • 조회는 GET 사용
        • GET은 쿼리 파라미터 사용해서 데이터를 전달
      • HTML Form을 통한 데이터 전송
      • HTTP API를 통한 데이터 전송
  • HTML Form을 통한 데이터 전송
    • POST 전송 -> 저장
      • Content-Type: application/x-www-form-urlencoded 사용
        • form의 내용을 메시지 바디를 통해서 전송(key=value, 쿼리 파라미터 형식)
        • urlencoded: url encoding / 예로 abc김 -> abc%EA%B9%80
    • HTML Form은 GET 전송도 가능
    • Content-Type: multipart/form-data
      • 파일 업로드 같은 바이너리 데이터 전송시 사용
      • 다른 종류의 여러 파일과 폼의 내용 함께 전송 가능
  • HTTP API를 통한 데이터 전송
    • 쓰이는 상황
      • 서버 to 서버: 백엔드 시스템 통신
      • 앱 클라이언트(아이폰, 안드로이드): 앱 클라이언트에서 서버로 데이터 전송할 때 HTTP API 사용
      • 웹 클라이언트: HTML에서 Form이 아니라 자바 스크립트를 통해 전달할 때 사용(AJAX)
    • Content-Type: application/json을 주로 사용 (사실상 표준)


HTTP API 설계 예시

  • HTTP API(컬렉션)
    • POST 기반 등록
    • 신규 자원 등록 특징
      • 클라이언트는 등록될 리소스의 URI를 모른다
      • 서버가 새로 등록된 리소스 URI를 생성해준다
    • 컬렉션(Collection)
      • 서버가 관리하는 리소스 디렉토리
      • 서버가 리소스의 URI를 생성하고 관리
  • HTTP API(스토어)
    • PUT 기반 등록
    • 신규 자원 등록 특징: 클라이언트가 직접 리소스의 URI를 지정한다
    • 스토어(Store)
      • 클라이언트가 관리하는 리소스 저장소
      • 클라이언트가 리소스의 URI를 알고 관리
  • HTML FORM 사용(컨트롤 URI)
    • GET, POST만 지원 -> 제약
    • 컨트롤 URI
      • 제약을 해결하기 위해 동사로 된 리소스 경로 사용
      • HTTP 메서드로 해결하기 애매한 경우 사용
  • URI 설계 개념
    • 핵심: 문서와 컬렉션을 최대한 사용하고 애매한 경우는 컨트롤 URI를 사용
      • 문서(document)
        • 단일 개념(파일 하나, 객체 인스턴스, 데이터베이스 row)
        • 예) /members/100, /files/star.jp
      • 스토어(store)는 실무에서 거의 사용 안 함



HTTP 상태코드

HTTP 상태코드 소개

  • 상태 코드: 클라이언트가 보낸 요청의 처리 상태를 응답에서 알려주는 기능
    • 2xx (Successful): 요청 정상 처리
    • 3xx (Redirection): 요청을 완료하려면 추가 행동이 필요
    • 4xx (Client Error): 클라이언트 오류, 잘못된 문법등으로 서버가 요청을 수행할 수 없음
    • 5xx (Server Error): 서버 오류, 서버가 정상 요청을 처리하지 못함


2xx - 성공

강의 내용

  • 2xx (Successful): 클라이언트의 요청을 성공적으로 처리
    • 200 OK: 요청 성공
    • 201 Created: 요청 성공해서 새로운 리소스가 생성됨
    • 202 Accepted
      • 잘 사용되진 않음
      • 요청이 접수되었으나 처리가 완료되지 않았음
    • 204 No Content
      • 서버가 요청을 성공적으로 수행했지만, 응답 페이로드(본문에 보낼 데이터)가 없음
  • 주로 200만, 혹은 201까지만 쓰는 경우가 많다.

궁금증

  • 페이로드 뜻은?
    • 인용 사이트
    • 페이로드(payload)는 전송되는 데이터를 의미합니다. 데이터를 전송할 때, 헤더와 메타데이터, 에러 체크 비트 등과 같은 다양한 요소들을 함께 보내어, 데이터 전송의 효율과 안정성을 높히게 됩니다. 이 때, 보내고자 하는 데이터 자체를 의미하는 것이 바로 페이로드입니다. 우리가 택배 배송을 보내고 받을 때, 택배 물건이 페이로드이고, 송장이나 박스, 뾱뾱이와 같은 완충재 등등은 부가적인 것이기 때문에 페이로드가 아닙니다.


3xx - 리다이렉션1

  • 3xx (Redirection)
    • 요청을 완료하기 위해 유저 에이전트의 추가 조치 필요
    • 리다이렉트: 웹 브라우저는 3xx 응답의 결과에 Location 헤더가 있으면, Location 위치로 자동 이동
  • 리다이렉션 종류
    • 영구 리다이렉션: 특정 리소스의 URI가 영구적으로 이동
    • 일시 리다이렉션
      • 일시적인 변경(주문 완료 후 주문 내역 화면으로 이동)
      • PRG: Post/Redirect/Get
    • 특수 리다이렉션
      • 결과 대신 캐시를 사용
  • 영구 리다이렉션: 리소스의 URI가 영구적으로 이동
    • 많이 사용하진 않음
    • 301 Moved Permanently: 리다이렉트시 요청 메서드가 GET으로 변하고, 본문이 제거될 수 있음(MAY)
    • 308 Permanent Redirect
      • 301과 기능은 같음
      • 리다이렉트시 요청 메서드와 본문 유지(처음 POST를 보내면 리다이렉트도 POST 유지)


3xx - 리다이렉션2

  • 일시적인 리다이렉션: 리소스의 URI가 일시적으로 변경
    • 302 Found: 리다이렉트시 요청 메서드가 GET으로 변하고, 본문이 제거될 수 있음(MAY)
    • 307 Temporary Redirect
      • 302와 기능은 같음
      • 리다이렉트시 요청 메서드와 본문 유지
    • 303 See Other
      • 302와 기능은 같음
      • 리다이렉트시 요청 메서드가 GET으로 변경
    • 뭘 써야 하나요?
      • 307, 303을 권장하지만 현실적으로 이미 많은 애플리케이션 라이브러리들이 302를 기본값으로 사용
      • 자동 리다이렉션시에 GET으로 변해도 되면 그냥 302를 사용해도 큰 문제 없음
  • PRG: Post/Redirect/Get(일시적인 리다이렉션 예시)
    • POST로 주문후에 주문 결과 화면을 GET 메서드로 리다이렉트
    • POST(주문) -> 302 Found(GET 메서드로 리다이렉트) -> GET(주문 결과 화면)
  • 특수 리다이렉션
    • 304 Not Modified
      • 결과 대신 캐시를 사용
      • 클라이언트에게 리소스가 수정되지 않았음을 알려준다 -> 클라이언트는 로컬PC에 저장된 캐시를 재사용한다 (캐시로 리다이렉트 한다)


4xx - 클라이언트 오류, 5xx - 서버 오류

  • 4xx (Client Error): 오류의 원인이 클라이언트에 있음
    • 400 Bad Request: 클라이언트가 잘못된 요청을 해서 서버가 요청을 처리할 수 없음
    • 401 Unauthorized
      • 클라이언트가 해당 리소스에 대한 인증(Authentication)이 필요함
      • 오류 메시지는 Unauthorized 이지만 인증(Authentication)되지 않음(이름이 아쉬움)
        • 인증(Authentication): 본인이 누구인지 확인(로그인)
        • 인가(Authorization): 권한부여(인증이 있어야 인가가 있음)
    • 403 Forbidden
      • 서버가 요청을 이해했지만 승인을 거부함
      • 주로 인증은 했지만, 접근 권한이 불충분한 경우
    • 404 Not Found
      • 요청 리소스가 서버에 없음
      • 또는 클라이언트가 권한이 부족한 리소스에 접근할 때, 해당 리소스를 숨기고 싶을 때
  • 5xx (Server Error): 서버 오류
    • 500 Internal Server Error: 서버 문제로 오류 발생
    • 503 Service Unavailable
      • 서비스 이용 불가
      • 서버가 일시적인 과부하 또는 예정된 작업으로 잠시 요청을 처리할 수 없음



HTTP 헤더1 - 일반 헤더

HTTP 헤더 개요

  • HTTP 헤더: HTTP 전송에 필요한 모든 부가정보
  • RFC2616 - 과거
    • 엔티티 본문: 요청이나 응답에서 전달할 실제 데이터
    • 엔티티 본문(entity body)는 메시지 본문(message body) 속에 넣어져서 전달
    • 엔티티 헤더는 엔티티 본문의 데이터를 해석할 수 있는 정보 제공
  • RFC723x(현재)
    • 엔티티(Entity) -> 표현(Representation): 표현 = 표현 메타데이터 + 표현 데이터
    • 표현 데이터는 메시지 본문(message body)을 통해 전달 - 페이로드(payload)
    • 표현 헤더는 표현 데이터를 해석할 수 있는 정보 제공
    • 표현 헤더는 표현 메타데이터와, 페이로드 메시지를 구분해야 하지만, 여기서는 생략


표현

  • 표현 헤더: 전송, 응답 둘다 사용
    • Content-Type: 표현 데이터의 형식
    • Content-Encoding: 표현 데이터의 압축 방식
    • Content-Language: 표현 데이터의 자연 언어(ko, en …)
    • Content-Length: 표현 데이터의 길이
      • 바이트 단위
      • Transfer-Encoding(전송 코딩)을 사용하면 Content-Length를 사용하면 안됨


콘텐츠 협상

  • 콘텐츠 협상(네고시에이션): 클라이언트가 선호하는 표현 요청
    • 협상 헤더는 요청시에만 사용
    • Accept: 클라이언트가 선호하는 미디어 타입 전달
    • Accept-Charset: 클라이언트가 선호하는 문자 인코딩
    • Accept-Encoding: 클라이언트가 선호하는 압축 인코딩
    • Accept-Language: 클라이언트가 선호하는 자연 언어
  • 우선순위
    • Quality Values(q 값) 사용
      • q가 클수록 높은 우선순위(0~1)
      • ex) Accept-Language: ko-KR,ko;q=0.9,en-US;q=0.8,en;q=0.7
    • 구체적인 것이 우선한다


전송 방식

  • 전송 방식
    • 단순 전송
    • 압축 전송: ex) Content-Encoding: gzip
    • 분할 전송: ex) Transfer-Encoding: chunked
    • 범위 전송
      • 이미지 50% 받았는데, 도중에 끊겨서 다시 요청할 때, 나머지 50%만 주세요할 때
      • ex) Range: bytes=1001-2000 <-> Content-Range: bytes 1001-2000 / 2000


일반 정보

  • 일반 정보
    • Referer
      • 이전 웹 페이지 주소
      • Referer를 사용해서 유입 경로 분석 가능
      • referer는 단어 referrer의 오타
    • User-Agent
      • 유저 에이전트(클리이언트 애플리케이션) 정보
      • 어떤 종류의 브라우저에서 장애가 발생하는지 파악 가능
    • Server
      • 요청을 처리하는 오리진 서버의 소프트웨어 정보
      • 오리진 서버: 클라이언트 요청에 실제로 응답해주는 서버(원본 파일이 저장된 곳)
    • Date: 메시지가 생성된 날짜


특별한 정보

  • Host
    • 요청한 호스트 정보(도메인)
    • 하나의 IP 주소(서버)에 여러 도메인이 적용되어 있을 때: 가상호스트를 통해 여러 도메인을 한번에 처리할 수 있는 서버
    • ex) Host: www.google.com
  • Location
    • 201 (Created): Location 값은 요청에 의해 생성된 리소스 URI
    • 3xx (Redirection): Location 값은 자동으로 리다이렉트되는 대상 리소스
  • Retry-After
    • 503 (Service Unavailable): 서비스가 언제까지 불능인지 알려줄 수 있음
    • ex) Retry-After: 120 (초단위 표기) / Retry-After: Fri, 31 Dec 1999 23:59:59 GMT (날짜 표기)


인증

  • 인증
    • Authorization: 클라이언트 인증 정보를 서버에 전달
    • WWW-Authenticate
      • 리소스 접근시 필요한 인증 방법 정의
      • 401 Unauthorized 응답과 함께 사용


쿠키

  • 쿠키
    • Set-Cookie: 서버에서 클라이언트로 쿠키 전달(응답)
    • Cookie: 클라이언트가 서버에서 받은 쿠키를 저장하고, HTTP 요청시 서버로 전달
    • 쿠키 필요성
      • HTTP는 무상태(Stateless) 프로토콜이다
      • 클라이언트와 서버는 서로 상태를 유지하지 않는다
      • 사용자 로그인 세션 관리
    • 모든 요청에 쿠키 정보 자동 포함
      • 네트워크 트래픽 추가 유발
      • 최소한의 정보만 사용(세션 id, 인증 토큰)
      • 서버에 전송하지 않고, 웹 브라우저 내부에 데이터를 저장하고 싶으면 웹 스토리지 (localStorage, sessionStorage) 참고
  • 생명주기
    • Expires
      • 만료일이 되면 쿠키 삭제
      • ex) Set-Cookie: expires=Sat, 26-Dec-2020 04:39:21 GMT
    • max-age
      • 0이나 음수를 지정하면 쿠키 삭제
      • ex) Set-Cookie: max-age=3600 (3600초)
    • 세션 쿠키: 만료 날짜를 생략하면 브라우저 종료시 까지만 유지
    • 영속 쿠키: 만료 날짜를 입력하면 해당 날짜까지 유지
  • 도메인
    • 명시
      • 명시한 문서 기준 도메인 + 서브 도메인 포함
      • ex) domain=example.org
    • 생략
      • 현재 문서 기준 도메인만 적용
      • ex) example.org
  • 경로
    • 명시한 경로를 포함한 하위 경로 페이지만 쿠키 접근
    • 일반적으로 루트 패스(path=/)로 지정
  • 보안
    • Secure: 쿠키를 https인 경우에만 전송
    • HttpOnly
      • HTTP 전송에만 사용
      • 자바스크립트에서 접근 불가(document.cookie)
    • SameSite: 요청 도메인과 쿠키에 설정된 도메인이 같은 경우만 쿠키 전송



HTTP 헤더2 - 캐시와 조건부 요청

캐시 기본 동작

  • 캐시가 없을 때
    • 데이터가 변경되지 않아도 계속 네트워크를 통해서 데이터를 다운로드 받아야 한다
    • 인터넷 네트워크는 매우 느리고 비싸다
    • 브라우저 로딩 속도가 느리다
  • 캐시 적용
    • 캐시 가능 시간동안 네트워크를 사용하지 않아도 된다
    • 비싼 네트워크 사용량을 줄일 수 있다
    • 브라우저 로딩 속도가 매우 빠르다
  • 캐시 시간 초과
    • 캐시 유효 시간이 초과하면, 서버를 통해 데이터를 다시 조회하고, 캐시를 갱신한다(네트워크 다운로드가 발생한다)
    • 캐시가 만료되도, 클라이언트가 가진 데이터와 서버가 가진 데이터가 같으면 굳이 이렇게 해야 할까? -> 검증 헤더와 조건부 요청


검증 헤더와 조건부 요청1

  • 검증 헤더
    • 클라이언트의 데이터와 서버의 데이터가 같다는 사실을 확인할 수 있는 방법 필요해서 넣은 헤더
    • ex) Last-Modified: 2020년 11월 10일 10:00:00(응답할 때)
  • 조건부 요청 헤더
    • ex) if-modified-since: 2020년 11월 10일 10:00:00
    • 캐시 유효 시간이 초과해도 서버의 데이터가 갱신되지 않으면, 304 Not Modified와 헤더 메타 정보만 응답(바디X)
  • 장점
    • 클라이언트는 서버가 보낸 응답 헤더 정보로 캐시의 메타 정보를 갱신
    • 클라이언트는 캐시에 저장되어 있는 데이터 재활용
    • 결과적으로 네트워크 다운로드가 발생하지만 용량이 적은 헤더 정보만 다운로드


검증 헤더와 조건부 요청2

  • 검증 헤더
    • 캐시 데이터와 서버 데이터가 같은지 검증하는 데이터
    • Last-Modified , ETag
  • 조건부 요청 헤더
    • If-Modified-Since: Last-Modified와 함께 사용
    • If-None-Match: ETag와 함께 사용
  • Last-Modified, If-Modified-Since 단점
    • 데이터를 수정해서 날짜가 다르지만, 같은 데이터를 수정해서 데이터 결과가 똑같은 경우
    • 서버에서 별도의 캐시 로직을 관리하고 싶은 경우: ex) 스페이스나 주석처럼 크게 영향이 없는 변경에서 캐시를 유지하고 싶은 경우
  • ETag(Entity Tag), If-None-Match
    • 캐시 제어 로직을 서버에서 완전히 관리
      • 캐시용 데이터에 임의의 고유한 버전 이름을 달아두고, 데이터가 변경되면 이 이름을 바꿈
      • ETag만 서버에 보내서 같으면 유지, 다르면 다시 받기


캐시와 조건부 요청 헤더

  • 캐시 제어 헤더
    • Cache-Control: 캐시 제어
    • Pragma: 캐시 제어(하위 호환)
    • Expires: 캐시 유효 기간(하위 호환)
    • 대부분 Cache-Control 사용
  • Cache-Control
    • Cache-Control: max-age
      • 캐시 유효 시간, 초 단위
    • Cache-Control: no-cache
      • 데이터는 캐시해도 되지만, 항상 원(origin) 서버에 검증하고 사용
    • Cache-Control: no-store
      • 데이터에 민감한 정보가 있으므로 저장하면 안됨(메모리에서 사용하고 최대한 빨리 삭제)


프록시 캐시

강의 내용

  • Cache-Control - 기타 캐시 지시어(directives)
    • Cache-Control: public
      • 공용으로 사용하는 public 캐시(프록시 캐시)에 저장되도 됨
    • Cache-Control: private
      • 응답이 해당 사용자만을 위한 것임, private 캐시(웹 브라우저나 로컬에 저장되는 캐시)에 저장해야 함(기본값)

궁금증

  • 프록시 캐시란?
    • 인용 사이트
    • 웹 캐시(프록시 서버)는 웹 사용자에 의해 빈번히 요청되는 데이터를 사용자와 지리적으로 가까운 웹캐시 서버에 보관해 빠른 서비스를 가능하게 한다.
    • 동작 과정
      1. 브라우저가 웹 캐시와 TCP 연결을 설정하고 웹 캐시에 있는 객체에 대한 HTTP 요청을 보낸다.
      2. 웹 캐시는 객체의 사본이 캐시에 저장되어 있는지 확인한다. 저장되어 있다면 브라우저로 HTTP 응답 메세지와 함께 객체를 보낸다.
      3. 저장되어 있지 않다면 origin 서버로 TCP 연결을 설정한다. 이 연결로 브라우저가 요청한 객체에 대한 HTTP 요청을 보낸다. origin 서버는 웹 캐시로 HTTP 응답 메시지와 함께 객체를 보낸다
      4. 웹 캐시가 origin 서버로부터 객체를 수신할 때, 객체를 저장 장치에 복사하고 객체의 사본을 HTTP 응답 메세지와 함께 브라우저로 보낸다.


캐시 무효화

  • 확실한 캐시 무효화 응답
    • Cache-Control: no-cache, no-store, must-revalidate 와 Pragma: no-cache 같이
      • no-cache, no-store, must-revalidate 같이 조합해서 사용해야지 확실하게 캐시를 무효화할 수 있다
        • Cache-Control: no-cache => 데이터는 캐시해도 되지만, 항상 원 서버에 검증하고 사용(원 서버 말고 프록시 캐시에서 멋대로 판단 nono)
        • Cache-Control: no-store => 메모리에서 사용하고 최대한 빨리 삭제
        • Cache-Control: must-revalidate
          • 캐시 만료후 최초 조회시 원 서버에 검증해야함
          • 원 서버 접근 실패시 반드시 오류가 발생해야함 - 504(Gateway Timeout)
          • must-revalidate는 캐시 유효 시간이라면 캐시를 사용함
      • Pragma의 경우 하위 호완을 위해 사용
  • no-cache vs must-revalidate
    • no-cache: 원 서버에 접근할 수 없는 경우(순간 네트워크 단절) 캐시 서버 설정에 따라서 캐시 데이터를 반환할 수 있음(오류 보다는 오래된 데이타라도 보여주자)
    • must-revalidate: 원 서버에 접근할 수 없는 경우, 항상 오류가 발생해야 함(매우 중요한 돈과 관련된 경우)