[네트워크] 인터넷 프로토콜 (IP, TCP/UDP, HTTP)
Computer Science/Server, 네트워크

[네트워크] 인터넷 프로토콜 (IP, TCP/UDP, HTTP)

반응형

네트워크 흐름을 이해하기 위해서는 웹 통신을 가능하게 한 HTTP 통신의 흐름을 파악하는 것이 중요합니다.

 

 

1. IP와 IP Packet

 

 

복잡한 인터넷 망 속 수많은 노드들을 지나 어떻게 클라이언트와 서버가 통신할 수 있는 것은, 출발지에서 목적지까지 데이터가 무사히 전달되기 위해선 규칙이 있기 때문입니다. (여기서 노드는 하나의 서버 컴퓨터를 의미합니다.)

그래서 흔히 말하는 IP(인터넷 프로토콜) 주소를 컴퓨터에 부여하여 이를 이용해 통신합니다. IP는 지정한 IP 주소(IP Address)에 패킷(Packet)이라는 통신 단위로 데이터 전달을 합니다.

 

IP 패킷에서 패킷은 pack과 bucket이 합쳐진 단어로 소포로 비유할 수 있습니다. IP 패킷은 이를 데이터 통신에 적용한 것이라고 보면 됩니다. IP 패킷은 우체국 송장처럼 전송 데이터를 무사히 전송하기 위해 출발지 IP, 목적지 IP와 같은 정보가 포함되어 있습니다.

이를 통해 복잡한 인터넷 망 사이에서도 정확한 목적지로 패킷을 전송할 수 있고, 서버에서 이에 대한 응답을 전달합니다.

 

 

IP 프로토콜 한계

첫 번째는 비연결성입니다.

만약 패킷을 받을 대상이 없거나 서비스 불능 상태여도 클라이언트는 서버의 상태를 파악할 방법이 없기 때문에 패킷을 그대로 전송하게 됩니다.

 

두번째는 비신뢰성입니다.

중간에 있는 서버가 데이터를 전달하던 중 장애가 생겨 패킷이 중간에 소실되더라도 클라이언트는 이를 파악할 방법이 없습니다.  또한 전달 데이터의 용량이 클 경우 이를 패킷 단위로 나눠 데이터를 전달하게 되는데 이때 패킷들은 중간에 서로 다른 노드를 통해 전달될 수 있습니다. 이렇게 되면 클라이언트가 의도하지 않은 순서로 서버에 패킷이 도착할 수 있습니다.

 

 

2. TCP vs UDP

IP 패킷에는 이와 같은 한계들이 존재합니다. 네트워크 계층 구조를 통해 이와 같은 한계를 어떻게 보완할 수 있습니다.

 

네트워크는 OSI 7계층 또는, TCP/IP 4계층으로 구분한다.

 

네트워크 프로토콜 계층은 다음과 같이 OSI 7계층과 TCP/IP 4 계층으로 나눌 수 있습니다.

IP 프로토콜 보다 더 높은 계층에 TCP 프로토콜이 존재하기 때문에 앞서 다룬 IP 프로토콜의 한계를 보완할 수 있습니다.

(TCP/IP 4 계층은 OSI 7 계층보다 먼저 개발되었으며 TCP/IP 프로토콜의 계층은 OSI 모델의 계층과 정확하게 일치하지는 않습니다.)

 

 

 

 

위 그림에서 채팅 프로그램에서 메시지를 보낼 때 어떤 일이 일어나는 것에 대한 것 입니다.

먼저 HTTP 메시지가 생성되면 Socket 라이브러리를 통해 전달됩니다. 프로그램이 네트워크에서 데이터를 송수신할 수 있도록, “네트워크 환경에 연결할 수 있게 만들어진 연결부“가 바로 네트워크 소켓(Socket)입니다. 그리고 IP 패킷을 생성하기 전 TCP 세그먼트를 생성합니다. 이렇게 생성된 TCP/IP 패킷은 LAN 카드와 같은 물리적 계층을 지나기 위해 이더넷 프레임 워크에 포함되어 서버로 전송됩니다.

 

 

TCP/IP 패킷

 

TCP 세그먼트에는 IP 패킷의 출발지 IP와 목적지 IP 정보를 보완할 수 있는 출발지 PORT, 목적지 PORT, 전송 제어, 순서, 검증 정보 등을 포함합니다.

 

TCP

 

전송 제어 프로토콜 (Transmission Control Protocol)1. 연결지향  -  TCP 3 way handshake(가상연결)2. 데이터 전달 보증3. 순서 보장4. 신뢰할 수 있는 프로토콜

 

TCP는 장치들 사이에 논리적인 접속을 성립하기 위하여 3 way handshake를 사용하는 연결지향형 프로토콜입니다.

 

연결 방식은 다음과 같습니다. 먼저 클라이언트는 서버에 접속을 요청하는 SYN 패킷을 보냅니다. 서버는 SYN요청을 받고 클라이언트에게 요청을 수락한다는 ACK(Acknowledgment) 와 SYN(Syncronize)가 설정된 패킷을 발송하고 클라이언트가 다시 ACK으로 응답하기를 기다립니다. 클라이언트가 서버에게 ACK을 보내면 이 이후로부터 연결이 성립되며 데이터를 전송할 수 있습니다. 만약 서버가 꺼져있다면 클라이언트가 SYN을 보내고 서버에서 응답이 없기 떄문에 데이터를 보내지 않습니다. 현재에는 최적화가 이루어져 3번 ACK을 보낼때 데이터를 함께 보내기도 합니다.

 

또한 TCP는 데이터 전송이 성공적으로 이루어진다면 이에 대한 응답을 돌려주기 때문에 IP 패킷의 한계인 비연결성을 보완할 수 있습니다.

 

만약 패킷이 순서대로 도착하지 않는다면 TCP 세그먼트에 있는 정보를 토대로 다시 패킷 전송을 요청함으로써 IP 패킷의 한계인 비신뢰성(순서를 보장하지 않음)을 보완할 수 있습니다.

 

 

UDP

사용자 데이터그램 프로토콜(User Datagram Protocol)

IP 프로토콜에 PORT, 체크섬 필드 정보만 추가된 단순한 프로토콜입니다.

 

앞서 TCP 특징과 비교해보면 신뢰성은 낮지만 3 way handshake 방식을 사용하지 않기 때문에 TCP와 비교해 빠른 속도를 보장합니다.

 

HTTP3는 UDP를 사용하며 이미 여러 기능이 구현된 TCP보다는 하얀 도화지처럼 커스터마이징이 가능하다는 장점이 있습니다. 아직 TCP와 UDP의 차이는, 좋은 기능이 다 들어있는 무거운 라이브러리와 필요한 기능만 들어있는 가벼운 라이브러리로 비교할 수 있겠습니다.

 

(체크섬(checksum)은 중복 검사의 한 형태로, 오류 정정을 통해, 공간(전자 통신)이나 시간(기억 장치) 속에서 송신된 자료의 무결성을 보호하는 단순한 방법.)

 

3. HTTP

HTTP/1.1, HTTP/2는 TCP 기반이며 HTTP/3는 UDP 기반 프로토콜입니다.

 

  1. 클라이언트 서버 구조
  2. 무상태 프로토콜, 비연결성
  3. HTTP 메세지
  4. 단순함, 확장가능

 

HTTP 역사

 

 

상태유지와 무상태

 

클라이언트가 서버에 요청을 보내면 서버는 그에 대한 응답을 보내는 클라이언트 서버 구조로 이루어져 있습니다. 

HTTP에서는 서버가 클라이언트의 상태를 보존하지 않는 무상태 프로토콜입니다. 

 

장점 : 서버 확장성 높음(스케일 아웃)

단점 : 클라이언트가 추가 데이터 전송

 

 

 

 

상태 유지는 서버가 중간에 바뀔 수 없는 단점이 있다.

서버1이 장애가 난다면 유지되던 상태정보가 다 날아가버리므로 처음부터 다시 서버에 요청해야 합니다.

 

 

 

 

무상태는 서버가 중간에 바뀌어도 상관이 없고, 요청이 늘어나면 서버를 쉽게 늘릴 수가 있다.

서버1에 장애가 생기더라도 다른 서버에서 응답을 전달하면 되기 때문에 클라이언트는 다시 요청할 필요가 없습니다.

 

 

 

무상태가 좋아보이지만 한계가 있습니다.

로그인이 필요없는 단순한 서비스 소개 화면같은 경우엔 무상태로 설계할 수 있지만

로그인이 필요한 서비스라면 유저의 상태를 유지해야 되기 때문에 브라우저 쿠키, 서버 세션, 토큰등을 이용해 상태를 유지합니다.

 

 

Connection Oriented vs Connectionless

 

TCP/IP의 경우 기본적으로 연결을 유지합니다.

연결을 유지하는 모델에서는 클라이언트는 요청을 보내지 않더라도 계속 연결을 유지해야 합니다. 이러한 경우 연결을 유지하는 서버의 자원이 계속 소모가 됩니다.

 

비 연결성을 가지는 HTTP에서는 실제로 요청을 주고 받을 때만 연결을 유지하고 응답을 주고나면 TCP/IP 연결을 끊습니다. 이를 통해 최소한의 자원으로 서버 유지를 가능하게 합니다.

 

HTTP 1.0 기준으로(옛날), HTTP는 연결을 유지하지 않는 모델입니다. 트래픽이 많지 않고, 빠른 응답을 제공할 수 있는 경우, 비연결성의 특징은 효율적으로 작동합니다.

예를 들어, 한시간동안 수천명이 서비스를 사용해도, 실제 서버에서는 초당 처리 요청갯수는 수십개에 불과합니다. 하지만 트래픽이 많고, 큰 규모의 서비스를 운영할 때에는 비연결성은 한계를 보입니다.

 

비 연결성은 다음과 같은 한계를 가집니다.

웹 브라우저로 사이트를 요청하면 HTML 뿐만 아니라 자바스크립트, css, 추가 이미지 등 수 많은 자원이 함께 다운로드됩니다. 해당 자원들을 각각 보낼때마다 연결끊고 다시 연결하고를 반복하는 것은 비효율적이기 때문에 지금은 HTTP 지속 연결(Persistent Connections)로 문제를 해결합니다.

 

HTTP 초기에는 각각의 자원을 다운로드하기 위해 연결과 종료를 반복해야 했습니다.

 

HTTP 지속 연결에서는 연결이 이루어지고 난 뒤 각각의 자원들을 요청하고 모든 자원에 대한 응답이 돌아온 후에 연결을 종료합니다.

반응형

'Computer Science > Server, 네트워크' 카테고리의 다른 글

[네트워크] 웹 캐시  (0) 2021.08.09
[네트워크] HTTP 헤더  (0) 2021.08.09
[Server] Express, Middleware  (0) 2021.08.07
[Server] OAuth 2.0  (0) 2021.08.04
[Server] 보안 인증 (Token-JWT)  (0) 2021.08.03