[HTTP 웹 기본 지식(김영한)] ‘인터넷 네트워크’ ~ ‘HTTP 헤더2 - 캐시와 조건부 요청’
인프런 강의 주소
보는 방법
- 블로그 내용은 강의 핵심 키워드 위주로 요약해서 상기용/테스트용으로 적합
- 추가로 유료 강의라서 자세히 적으면 저작권 문제의 소지가 있기도 해서 키워드 위주로 요약해서 기록
- 제대로 된 복습은 강의 자료와 영상을 통해서 해라
- 가끔씩 다음 내용도 기록할 수 있다
- 강의를 보고 생긴 의문에 대해 구글링해서 찾은 내용
- 나중에 다시 볼 때 참고할 만한 정보
인터넷 네트워크
인터넷 통신
- 딱히 메모할 키워드 없음
IP(인터넷 프로토콜)
- IP(인터넷 프로토콜)
- IP 주소(IP Address)
- IP 패킷(Packet)
- IP 프로토콜의 한계
- 비연결성
- 비신뢰성
- 프로그램 구분
- 비연결성, 비신뢰성은 TCP로, 프로그램 구분은 PORT로 해결
TCP, UDP
- 인터넷 프로토콜 스택의 4계층
- 애플리케이션 계층: HTTP
- 전송 계층: TCP, UDP
- 인터넷 계층: IP
- 네트워크 인터페이스 계층
- TCP/IP 패킷 정보
- TCP(Transmission Control Protocol(전송 제어 프로토콜)) 특징
- 연결지향: TCP 3 way handshake
- 데이터 전달 보증
- 순서 보장
- TCP 3 way handshake
- SYN: 접속 요청
- ACK: 요청 수락
- UDP(User Datagram Protocol(사용자 데이터그램 프로토콜)) 특징
- 데이터 전달 및 순서가 보장되지 않지만, 단순하고 빠름: IP와 거의 같다. PORT, 체크섬 정도만 추가
PORT
- IP와 PORT의 관계: IP가 아파트라면, PORT는 몇동 몇호인지 구분
DNS
- DNS(Domain Name System)
- 다음을 해결
- IP는 기억하기 어렵다.
- IP는 변경될 수 있다.
- 어떻게?
- 도메인명으로 DNS 서버에 묻고, DNS 서버가 그에 맞는 IP를 전달
- 다음을 해결
URI와 웹 브라우저 요청 흐름
URI
- URI(Uniform Resource Identifier)
- 자원을 구분하는 통일된 방식
- URL과 URN을 포함하는 개념
- URL(Locator): 리소스 있는 위치
- URN(Name): 리소스의 이름
- 거의 URI는 URL과 같은 단어로 취급
- URL 문법
scheme://[userinfo@]host[:port][/path][?query][#fragment]
[]
는 생략 가능- scheme: 주로 프로토콜 사용(https 등)
- userinfo: 거의 사용 X
- host: 도메인명 또는 IP 주소
- PORT: 일반적으로 생략
- path: 리소스 경로, 계층적 구조
- query(query parameter, query string)
- 웹서버에 제공하는 파라미터
- key=value 형태
- ?로 시작, &로 추가
- fragment: 잘 사용 X
웹 브라우저 요청 흐름
- 웹 브라우저가 생성한 HTTP 메시지가, TCP/IP 패킷 속 전송 데이터
- 웹 브라우저가 요청 패킷(HTTP 요청 메시지) 전달 -> 서버는 응답 패킷(HTTP 응답 메시지) 전달 -> HTTP 응답 메시지가 HTML이라면, 브라우저가 HTML 렌더링
HTTP 기본
모든 것이 HTTP
- HTTP(HyperText Transfer Protocol)
- HTTP 메시지에 거의 모든 형태의 데이터를 전송
- HTML, TEXT, IMAGE, 음성, 영상, 파일
- JSON, XML는 주로 서버 사이에서
- HTTP 메시지에 거의 모든 형태의 데이터를 전송
- HTTP/1.1
- 가장 많이 사용
- 기반 프로토콜: TCP
클라이언트 서버 구조
- HTTP는 클라이언트 서버 구조(요청과 응답)
Stateful, Stateless
- HTTP는 Stateless(무상태 프로토콜)를 기본으로 함
- 서버가 클라이언트의 상태를 보존X
- 장점: 서버 확장성 높음(서버 증설, 수평 확장, 스케일 아웃)
- 단점: 클라이언트가 추가 데이터 전송
- Stateful(상태 유지)는 최소한만 사용
비 연결성(connectionless)
- HTTP는 connectionless(비 연결성)를 기본으로 함
- 서버는 연결 유지X, 최소한의 자원 사용
- 단점: TCP/IP 연결을 새로 맺어야 함 -> 3 way handshake 시간 추가
- 해결: Persistent Connections(지속 연결)
HTTP 메시지
- HTTP 메시지 구조
- start-line(시작 라인)
- header
- message body
- start-line
- request-line(요청 메시지의 start-line)
- 구조: method request-target HTTP-version
- 예시: GET /search?q=hello&hl=ko HTTP/1.1
- method(HTTP 메서드): 서버가 수행해야 할 동작(GET, POST 등)
- request-target(요청 대상)
absolute-path[?query]
- 절대경로= “/” 로 시작하는 경로
- status-line(응답 메시지의 start-line)
- 구조: HTTP-version status-code reason-phrase
- status-code: 요청 성공, 실패 나타냄
- reason-phrase(이유 문구): 사람이 이해할 수 있는 짧은 상태 코드 설명 글
- request-line(요청 메시지의 start-line)
- header(HTTP 헤더)
- 구조: field-name: field-value
- 용도: HTTP 전송에 필요한 모든 부가정보
- message body: 실제 전송할 데이터
HTTP 메서드
HTTP API를 만들어보자
- API URI 설계
- 리소스 식별, 행위(메서드)를 분리
- URI 계층 구조 활용
HTTP 메서드 - GET, POST
- HTTP 메서드 종류
- GET: 리소스 조회
- POST: 요청 데이터 처리, 주로 등록에 사용
- PUT: 리소스를 대체, 해당 리소스가 없으면 생성
- PATCH: 리소스 부분 변경
- DELETE: 리소스 삭제
- GET
- 리소스 조회
- 서버에 전달하고 싶은 데이터는 query(쿼리 파라미터, 쿼리 스트링)를 통해서 전달
- POST
- 요청 데이터 처리
- 메시지 바디를 통해 서버로 요청 데이터 전달
- 주로 전달된 데이터로 신규 리소스 등록, 프로세스 처리에 사용
HTTP 메서드 - PUT, PATCH, DELETE
- PUT
- 리소스를 대체, 해당 리소스가 없으면 생성
- 클라이언트가 리소스 위치를 알고 URI 지정
- POST와 차이점
- PATCH, DELETE도 비슷한 거 같은 느낌?(내 추측)
- PATCH: 리소스 부분 변경
- DELETE: 리소스 삭제
HTTP 메서드의 속성
- 안전(Safe)
- 호출해도 리소스를 변경하지 않는다
- ex) GET / post(X)
- 멱등(Idempotent)
- 몇 번을 호출하든 결과가 똑같다
- 멱등 메서드
- GET: 몇 번 조회하든 같은 결과가 조회된다.
- PUT: 결과를 대체한다. 따라서 같은 요청을 여러번 해도 최종 결과는 같다.
- DELETE: 결과를 삭제한다. 같은 요청을 여러번 해도 삭제된 결과는 똑같다.
- POST: 멱등이 아니다! 두 번 호출하면 같은 결제가 중복해서 발생할 수 있다.
- 서버가 TIMEOUT 등으로 정상 응답을 못주었을 때, 클라이언트가 같은 요청을 다시 해도 되는지에 대한 판단 근거
- 멱등은 외부 요인으로 중간에 리소스가 변경되는 것까지는 고려하지는 않는다.
- 캐시가능(Cacheable)
- 응답 결과 리소스를 캐시해서 사용해도 되는가?
- 실제로는 GET, HEAD 정도만 캐시로 사용
HTTP 메서드 활용
클라이언트에서 서버로 데이터 전송
- 클라이언트에서 서버로 데이터 전송
- 데이터 전달 방식
- 쿼리 파라미터를 통한 데이터 전송: GET
- 메시지 바디를 통한 데이터 전송: POST, PUT, PATCH
- 케이스
- 동적 데이터 조회
- 조회는 GET 사용
- GET은 쿼리 파라미터 사용해서 데이터를 전달
- HTML Form을 통한 데이터 전송
- HTTP API를 통한 데이터 전송
- 동적 데이터 조회
- 데이터 전달 방식
- HTML Form을 통한 데이터 전송
- POST 전송 -> 저장
- Content-Type: application/x-www-form-urlencoded 사용
- form의 내용을 메시지 바디를 통해서 전송(key=value, 쿼리 파라미터 형식)
- urlencoded: url encoding / 예로 abc김 -> abc%EA%B9%80
- Content-Type: application/x-www-form-urlencoded 사용
- HTML Form은 GET 전송도 가능
- Content-Type: multipart/form-data
- 파일 업로드 같은 바이너리 데이터 전송시 사용
- 다른 종류의 여러 파일과 폼의 내용 함께 전송 가능
- POST 전송 -> 저장
- HTTP API를 통한 데이터 전송
- 쓰이는 상황
- 서버 to 서버: 백엔드 시스템 통신
- 앱 클라이언트(아이폰, 안드로이드): 앱 클라이언트에서 서버로 데이터 전송할 때 HTTP API 사용
- 웹 클라이언트: HTML에서 Form이 아니라 자바 스크립트를 통해 전달할 때 사용(AJAX)
- Content-Type: application/json을 주로 사용 (사실상 표준)
- 쓰이는 상황
HTTP API 설계 예시
- HTTP API(컬렉션)
- POST 기반 등록
- 신규 자원 등록 특징
- 클라이언트는 등록될 리소스의 URI를 모른다
- 서버가 새로 등록된 리소스 URI를 생성해준다
- 컬렉션(Collection)
- 서버가 관리하는 리소스 디렉토리
- 서버가 리소스의 URI를 생성하고 관리
- HTTP API(스토어)
- PUT 기반 등록
- 신규 자원 등록 특징: 클라이언트가 직접 리소스의 URI를 지정한다
- 스토어(Store)
- 클라이언트가 관리하는 리소스 저장소
- 클라이언트가 리소스의 URI를 알고 관리
- HTML FORM 사용(컨트롤 URI)
- GET, POST만 지원 -> 제약
- 컨트롤 URI
- 제약을 해결하기 위해 동사로 된 리소스 경로 사용
- HTTP 메서드로 해결하기 애매한 경우 사용
- URI 설계 개념
- 핵심: 문서와 컬렉션을 최대한 사용하고 애매한 경우는 컨트롤 URI를 사용
- 문서(document)
- 단일 개념(파일 하나, 객체 인스턴스, 데이터베이스 row)
- 예) /members/100, /files/star.jp
- 스토어(store)는 실무에서 거의 사용 안 함
- 문서(document)
- 핵심: 문서와 컬렉션을 최대한 사용하고 애매한 경우는 컨트롤 URI를 사용
HTTP 상태코드
HTTP 상태코드 소개
- 상태 코드: 클라이언트가 보낸 요청의 처리 상태를 응답에서 알려주는 기능
- 2xx (Successful): 요청 정상 처리
- 3xx (Redirection): 요청을 완료하려면 추가 행동이 필요
- 4xx (Client Error): 클라이언트 오류, 잘못된 문법등으로 서버가 요청을 수행할 수 없음
- 5xx (Server Error): 서버 오류, 서버가 정상 요청을 처리하지 못함
2xx - 성공
강의 내용
- 2xx (Successful): 클라이언트의 요청을 성공적으로 처리
- 200 OK: 요청 성공
- 201 Created: 요청 성공해서 새로운 리소스가 생성됨
- 202 Accepted
- 잘 사용되진 않음
- 요청이 접수되었으나 처리가 완료되지 않았음
- 204 No Content
- 서버가 요청을 성공적으로 수행했지만, 응답 페이로드(본문에 보낼 데이터)가 없음
- 주로 200만, 혹은 201까지만 쓰는 경우가 많다.
궁금증
- 페이로드 뜻은?
- 인용 사이트
- 페이로드(payload)는 전송되는 데이터를 의미합니다. 데이터를 전송할 때, 헤더와 메타데이터, 에러 체크 비트 등과 같은 다양한 요소들을 함께 보내어, 데이터 전송의 효율과 안정성을 높히게 됩니다. 이 때, 보내고자 하는 데이터 자체를 의미하는 것이 바로 페이로드입니다. 우리가 택배 배송을 보내고 받을 때, 택배 물건이 페이로드이고, 송장이나 박스, 뾱뾱이와 같은 완충재 등등은 부가적인 것이기 때문에 페이로드가 아닙니다.
3xx - 리다이렉션1
- 3xx (Redirection)
- 요청을 완료하기 위해 유저 에이전트의 추가 조치 필요
- 리다이렉트: 웹 브라우저는 3xx 응답의 결과에 Location 헤더가 있으면, Location 위치로 자동 이동
- 리다이렉션 종류
- 영구 리다이렉션: 특정 리소스의 URI가 영구적으로 이동
- 일시 리다이렉션
- 일시적인 변경(주문 완료 후 주문 내역 화면으로 이동)
- PRG: Post/Redirect/Get
- 특수 리다이렉션
- 결과 대신 캐시를 사용
- 영구 리다이렉션: 리소스의 URI가 영구적으로 이동
- 많이 사용하진 않음
- 301 Moved Permanently: 리다이렉트시 요청 메서드가 GET으로 변하고, 본문이 제거될 수 있음(MAY)
- 308 Permanent Redirect
- 301과 기능은 같음
- 리다이렉트시 요청 메서드와 본문 유지(처음 POST를 보내면 리다이렉트도 POST 유지)
3xx - 리다이렉션2
- 일시적인 리다이렉션: 리소스의 URI가 일시적으로 변경
- 302 Found: 리다이렉트시 요청 메서드가 GET으로 변하고, 본문이 제거될 수 있음(MAY)
- 307 Temporary Redirect
- 302와 기능은 같음
- 리다이렉트시 요청 메서드와 본문 유지
- 303 See Other
- 302와 기능은 같음
- 리다이렉트시 요청 메서드가 GET으로 변경
- 뭘 써야 하나요?
- 307, 303을 권장하지만 현실적으로 이미 많은 애플리케이션 라이브러리들이 302를 기본값으로 사용
- 자동 리다이렉션시에 GET으로 변해도 되면 그냥 302를 사용해도 큰 문제 없음
- PRG: Post/Redirect/Get(일시적인 리다이렉션 예시)
- POST로 주문후에 주문 결과 화면을 GET 메서드로 리다이렉트
- POST(주문) -> 302 Found(GET 메서드로 리다이렉트) -> GET(주문 결과 화면)
- 특수 리다이렉션
- 304 Not Modified
- 결과 대신 캐시를 사용
- 클라이언트에게 리소스가 수정되지 않았음을 알려준다 -> 클라이언트는 로컬PC에 저장된 캐시를 재사용한다 (캐시로 리다이렉트 한다)
- 304 Not Modified
4xx - 클라이언트 오류, 5xx - 서버 오류
- 4xx (Client Error): 오류의 원인이 클라이언트에 있음
- 400 Bad Request: 클라이언트가 잘못된 요청을 해서 서버가 요청을 처리할 수 없음
- 401 Unauthorized
- 클라이언트가 해당 리소스에 대한 인증(Authentication)이 필요함
- 오류 메시지는 Unauthorized 이지만 인증(Authentication)되지 않음(이름이 아쉬움)
- 인증(Authentication): 본인이 누구인지 확인(로그인)
- 인가(Authorization): 권한부여(인증이 있어야 인가가 있음)
- 403 Forbidden
- 서버가 요청을 이해했지만 승인을 거부함
- 주로 인증은 했지만, 접근 권한이 불충분한 경우
- 404 Not Found
- 요청 리소스가 서버에 없음
- 또는 클라이언트가 권한이 부족한 리소스에 접근할 때, 해당 리소스를 숨기고 싶을 때
- 5xx (Server Error): 서버 오류
- 500 Internal Server Error: 서버 문제로 오류 발생
- 503 Service Unavailable
- 서비스 이용 불가
- 서버가 일시적인 과부하 또는 예정된 작업으로 잠시 요청을 처리할 수 없음
HTTP 헤더1 - 일반 헤더
HTTP 헤더 개요
- HTTP 헤더: HTTP 전송에 필요한 모든 부가정보
- RFC2616 - 과거
- 엔티티 본문: 요청이나 응답에서 전달할 실제 데이터
- 엔티티 본문(entity body)는 메시지 본문(message body) 속에 넣어져서 전달
- 엔티티 헤더는 엔티티 본문의 데이터를 해석할 수 있는 정보 제공
- RFC723x(현재)
- 엔티티(Entity) -> 표현(Representation): 표현 = 표현 메타데이터 + 표현 데이터
- 표현 데이터는 메시지 본문(message body)을 통해 전달 - 페이로드(payload)
- 표현 헤더는 표현 데이터를 해석할 수 있는 정보 제공
- 표현 헤더는 표현 메타데이터와, 페이로드 메시지를 구분해야 하지만, 여기서는 생략
표현
- 표현 헤더: 전송, 응답 둘다 사용
- Content-Type: 표현 데이터의 형식
- Content-Encoding: 표현 데이터의 압축 방식
- Content-Language: 표현 데이터의 자연 언어(ko, en …)
- Content-Length: 표현 데이터의 길이
- 바이트 단위
- Transfer-Encoding(전송 코딩)을 사용하면 Content-Length를 사용하면 안됨
콘텐츠 협상
- 콘텐츠 협상(네고시에이션): 클라이언트가 선호하는 표현 요청
- 협상 헤더는 요청시에만 사용
- Accept: 클라이언트가 선호하는 미디어 타입 전달
- Accept-Charset: 클라이언트가 선호하는 문자 인코딩
- Accept-Encoding: 클라이언트가 선호하는 압축 인코딩
- Accept-Language: 클라이언트가 선호하는 자연 언어
- 우선순위
- Quality Values(q 값) 사용
- q가 클수록 높은 우선순위(0~1)
- ex)
Accept-Language: ko-KR,ko;q=0.9,en-US;q=0.8,en;q=0.7
- 구체적인 것이 우선한다
- Quality Values(q 값) 사용
전송 방식
- 전송 방식
- 단순 전송
- 압축 전송: ex) Content-Encoding: gzip
- 분할 전송: ex) Transfer-Encoding: chunked
- 범위 전송
- 이미지 50% 받았는데, 도중에 끊겨서 다시 요청할 때, 나머지 50%만 주세요할 때
- ex) Range: bytes=1001-2000 <-> Content-Range: bytes 1001-2000 / 2000
일반 정보
- 일반 정보
- Referer
- 이전 웹 페이지 주소
- Referer를 사용해서 유입 경로 분석 가능
- referer는 단어 referrer의 오타
- User-Agent
- 유저 에이전트(클리이언트 애플리케이션) 정보
- 어떤 종류의 브라우저에서 장애가 발생하는지 파악 가능
- Server
- 요청을 처리하는 오리진 서버의 소프트웨어 정보
- 오리진 서버: 클라이언트 요청에 실제로 응답해주는 서버(원본 파일이 저장된 곳)
- Date: 메시지가 생성된 날짜
- Referer
특별한 정보
- Host
- 요청한 호스트 정보(도메인)
- 하나의 IP 주소(서버)에 여러 도메인이 적용되어 있을 때: 가상호스트를 통해 여러 도메인을 한번에 처리할 수 있는 서버
- ex) Host: www.google.com
- Location
- 201 (Created): Location 값은 요청에 의해 생성된 리소스 URI
- 3xx (Redirection): Location 값은 자동으로 리다이렉트되는 대상 리소스
- Retry-After
- 503 (Service Unavailable): 서비스가 언제까지 불능인지 알려줄 수 있음
- ex) Retry-After: 120 (초단위 표기) / Retry-After: Fri, 31 Dec 1999 23:59:59 GMT (날짜 표기)
인증
- 인증
- Authorization: 클라이언트 인증 정보를 서버에 전달
- WWW-Authenticate
- 리소스 접근시 필요한 인증 방법 정의
- 401 Unauthorized 응답과 함께 사용
쿠키
- 쿠키
- Set-Cookie: 서버에서 클라이언트로 쿠키 전달(응답)
- Cookie: 클라이언트가 서버에서 받은 쿠키를 저장하고, HTTP 요청시 서버로 전달
- 쿠키 필요성
- HTTP는 무상태(Stateless) 프로토콜이다
- 클라이언트와 서버는 서로 상태를 유지하지 않는다
- 사용자 로그인 세션 관리
- 모든 요청에 쿠키 정보 자동 포함
- 네트워크 트래픽 추가 유발
- 최소한의 정보만 사용(세션 id, 인증 토큰)
- 서버에 전송하지 않고, 웹 브라우저 내부에 데이터를 저장하고 싶으면 웹 스토리지 (localStorage, sessionStorage) 참고
- 생명주기
- Expires
- 만료일이 되면 쿠키 삭제
- ex) Set-Cookie: expires=Sat, 26-Dec-2020 04:39:21 GMT
- max-age
- 0이나 음수를 지정하면 쿠키 삭제
- ex) Set-Cookie: max-age=3600 (3600초)
- 세션 쿠키: 만료 날짜를 생략하면 브라우저 종료시 까지만 유지
- 영속 쿠키: 만료 날짜를 입력하면 해당 날짜까지 유지
- Expires
- 도메인
- 명시
- 명시한 문서 기준 도메인 + 서브 도메인 포함
- ex) domain=example.org
- 생략
- 현재 문서 기준 도메인만 적용
- ex) example.org
- 명시
- 경로
- 명시한 경로를 포함한 하위 경로 페이지만 쿠키 접근
- 일반적으로 루트 패스(path=/)로 지정
- 보안
- Secure: 쿠키를 https인 경우에만 전송
- HttpOnly
- HTTP 전송에만 사용
- 자바스크립트에서 접근 불가(document.cookie)
- SameSite: 요청 도메인과 쿠키에 설정된 도메인이 같은 경우만 쿠키 전송
HTTP 헤더2 - 캐시와 조건부 요청
캐시 기본 동작
- 캐시가 없을 때
- 데이터가 변경되지 않아도 계속 네트워크를 통해서 데이터를 다운로드 받아야 한다
- 인터넷 네트워크는 매우 느리고 비싸다
- 브라우저 로딩 속도가 느리다
- 캐시 적용
- 캐시 가능 시간동안 네트워크를 사용하지 않아도 된다
- 비싼 네트워크 사용량을 줄일 수 있다
- 브라우저 로딩 속도가 매우 빠르다
- 캐시 시간 초과
- 캐시 유효 시간이 초과하면, 서버를 통해 데이터를 다시 조회하고, 캐시를 갱신한다(네트워크 다운로드가 발생한다)
- 캐시가 만료되도, 클라이언트가 가진 데이터와 서버가 가진 데이터가 같으면 굳이 이렇게 해야 할까? -> 검증 헤더와 조건부 요청
검증 헤더와 조건부 요청1
- 검증 헤더
- 클라이언트의 데이터와 서버의 데이터가 같다는 사실을 확인할 수 있는 방법 필요해서 넣은 헤더
- ex) Last-Modified: 2020년 11월 10일 10:00:00(응답할 때)
- 조건부 요청 헤더
- ex) if-modified-since: 2020년 11월 10일 10:00:00
- 캐시 유효 시간이 초과해도 서버의 데이터가 갱신되지 않으면, 304 Not Modified와 헤더 메타 정보만 응답(바디X)
- 장점
- 클라이언트는 서버가 보낸 응답 헤더 정보로 캐시의 메타 정보를 갱신
- 클라이언트는 캐시에 저장되어 있는 데이터 재활용
- 결과적으로 네트워크 다운로드가 발생하지만 용량이 적은 헤더 정보만 다운로드
검증 헤더와 조건부 요청2
- 검증 헤더
- 캐시 데이터와 서버 데이터가 같은지 검증하는 데이터
- Last-Modified , ETag
- 조건부 요청 헤더
- If-Modified-Since: Last-Modified와 함께 사용
- If-None-Match: ETag와 함께 사용
- Last-Modified, If-Modified-Since 단점
- 데이터를 수정해서 날짜가 다르지만, 같은 데이터를 수정해서 데이터 결과가 똑같은 경우
- 서버에서 별도의 캐시 로직을 관리하고 싶은 경우: ex) 스페이스나 주석처럼 크게 영향이 없는 변경에서 캐시를 유지하고 싶은 경우
- ETag(Entity Tag), If-None-Match
- 캐시 제어 로직을 서버에서 완전히 관리
- 캐시용 데이터에 임의의 고유한 버전 이름을 달아두고, 데이터가 변경되면 이 이름을 바꿈
- ETag만 서버에 보내서 같으면 유지, 다르면 다시 받기
- 캐시 제어 로직을 서버에서 완전히 관리
캐시와 조건부 요청 헤더
- 캐시 제어 헤더
- Cache-Control: 캐시 제어
- Pragma: 캐시 제어(하위 호환)
- Expires: 캐시 유효 기간(하위 호환)
- 대부분 Cache-Control 사용
- Cache-Control
- Cache-Control: max-age
- 캐시 유효 시간, 초 단위
- Cache-Control: no-cache
- 데이터는 캐시해도 되지만, 항상 원(origin) 서버에 검증하고 사용
- Cache-Control: no-store
- 데이터에 민감한 정보가 있으므로 저장하면 안됨(메모리에서 사용하고 최대한 빨리 삭제)
- Cache-Control: max-age
프록시 캐시
강의 내용
- Cache-Control - 기타 캐시 지시어(directives)
- Cache-Control: public
- 공용으로 사용하는 public 캐시(프록시 캐시)에 저장되도 됨
- Cache-Control: private
- 응답이 해당 사용자만을 위한 것임, private 캐시(웹 브라우저나 로컬에 저장되는 캐시)에 저장해야 함(기본값)
- Cache-Control: public
궁금증
- 프록시 캐시란?
- 인용 사이트
- 웹 캐시(프록시 서버)는 웹 사용자에 의해 빈번히 요청되는 데이터를 사용자와 지리적으로 가까운 웹캐시 서버에 보관해 빠른 서비스를 가능하게 한다.
- 동작 과정
- 브라우저가 웹 캐시와 TCP 연결을 설정하고 웹 캐시에 있는 객체에 대한 HTTP 요청을 보낸다.
- 웹 캐시는 객체의 사본이 캐시에 저장되어 있는지 확인한다. 저장되어 있다면 브라우저로 HTTP 응답 메세지와 함께 객체를 보낸다.
- 저장되어 있지 않다면 origin 서버로 TCP 연결을 설정한다. 이 연결로 브라우저가 요청한 객체에 대한 HTTP 요청을 보낸다. origin 서버는 웹 캐시로 HTTP 응답 메시지와 함께 객체를 보낸다
- 웹 캐시가 origin 서버로부터 객체를 수신할 때, 객체를 저장 장치에 복사하고 객체의 사본을 HTTP 응답 메세지와 함께 브라우저로 보낸다.
캐시 무효화
- 확실한 캐시 무효화 응답
- Cache-Control: no-cache, no-store, must-revalidate 와 Pragma: no-cache 같이
- no-cache, no-store, must-revalidate 같이 조합해서 사용해야지 확실하게 캐시를 무효화할 수 있다
- Cache-Control: no-cache => 데이터는 캐시해도 되지만, 항상 원 서버에 검증하고 사용(원 서버 말고 프록시 캐시에서 멋대로 판단 nono)
- Cache-Control: no-store => 메모리에서 사용하고 최대한 빨리 삭제
- Cache-Control: must-revalidate
- 캐시 만료후 최초 조회시 원 서버에 검증해야함
- 원 서버 접근 실패시 반드시 오류가 발생해야함 - 504(Gateway Timeout)
- must-revalidate는 캐시 유효 시간이라면 캐시를 사용함
- Pragma의 경우 하위 호완을 위해 사용
- no-cache, no-store, must-revalidate 같이 조합해서 사용해야지 확실하게 캐시를 무효화할 수 있다
- Cache-Control: no-cache, no-store, must-revalidate 와 Pragma: no-cache 같이
- no-cache vs must-revalidate
- no-cache: 원 서버에 접근할 수 없는 경우(순간 네트워크 단절) 캐시 서버 설정에 따라서 캐시 데이터를 반환할 수 있음(오류 보다는 오래된 데이타라도 보여주자)
- must-revalidate: 원 서버에 접근할 수 없는 경우, 항상 오류가 발생해야 함(매우 중요한 돈과 관련된 경우)