NHN Business Platform 웹플랫폼개발랩 박세훈
최근 Google의 SPDY 프로토콜을 Facebook에서도 지지하며 Facebook도 SPDY 구현을 시작했다는 기사가 발표됐습니다. 웹 속도를 빠르게 하기 위해 다양한 방법을 고안하고 제시하는 Google의 노력 중에서, 새로운 산업 표준을 만들 정도로 가장 빛을 보고 있는 것이 바로 SPDY가 아닐까 싶은데요. SPDY는 HTTP 2.0에 포함될 예정입니다.
SPDY는 'speedy'라는 단어를 기반으로 Google이 만든 조어로, Google이 자신들의 'Make the Web Faster' 노력의 하나로 제안한 새로운 프로토콜입니다. 이는 초창기 인터넷 환경에서 고안된 HTTP의 단점들을 보완하여, 지금과 앞으로의 인터넷 환경을 보다 효율적으로 이용할 수 있는 프로토콜로 제안된 것입니다.
이 글에서는 SPDY의 기능과 장점을 간단히 소개하고, SPDY 지원 현황을 살펴 본 후, SPDY 도입 시의 고려 사항에 대해 살펴보도록 하겠습니다.
HTTP는 1991년에 0.9 버전이 처음 발표되었고, 1996년에 1.0 버전, 1999년에 1.1 버전이 나온 뒤로 10년이 넘는 시간 동안 전혀 변화가 없었다. 그러나 오늘 날의 웹 페이지는 1990년대의 웹 페이지에 비하여 그 규모와 페이지당 HTTP 요청 개수가 20배 가량 증가했다. 표 1은 Google I/O 2012에서 Google이 발표한 자료에서 발췌한 것이다.
표 1 2010년과 2012년의 평균 웹 페이지 규모 비교
| 평균 페이지 크기 | 페이지당 평균 요청 개수 | 평균 도메인 개수 |
2010년 11월 15일 | 702KB | 74 | 10 |
2012년 5월 15일 | 1059KB | 84 | 12 |
1996년도의 Yahoo 메인 페이지 용량은 34KB 정도였다. 이는 2012년 평균 웹 페이지 용량의 30분 1 수준이다.
1990년대와의 비교는 물론이고, 근자인 2010년과 2012년을 비교해도 상당한 차이가 있다. 초고속 인터넷 보급과 함께 점점 더 미려한 사용자 UX 덕분에 페이지 크기와 요청 개수의 평균 값이 증가하고 있는 것이다.
이와 같이 과거에 비해 달라진 오늘날의 웹 페이지의 특징을 정리하면 다음과 같다.
예전과 달라진 오늘 날의 웹 환경을 고려하여 Google에서는 HTTP를 보완한 SPDY 프로토콜을 발표하게 된 것이다.
이 SPDY 프로토콜은 특히 전송 지연(latency) 문제의 해결에 주로 집중하고 있다.
전통적인 TCP/IP 계층 모델과 비교하여 SPDY의 계층을 표현하면 그림 1과 같다.
그림 1 HTTP와 SPDY 비교
SPDY의 특징을 간단히 살펴보자.
따라서 HTTPS로 작성된 웹 사이트만 적용 가능하다.
TLS는 SSL(Secure Sockets Layer)의 다음 버전이다. 같은 프로토콜의 예전 버전 이름과 현재 버전 이름이므로 종종 혼동되어 사용되며, 이 기사에서도 TLS와 SSL을 구별해서 사용하지는 않는다.
HTTP 헤더에는 요청마다 반복되는 내용이 매우 많으므로 헤더 압축만으로도 충분한 성능 향상 효과를 얻을 수 있다. Google의 발표 자료에 따르면 HTTP 헤더 압축으로 최초 요청 시에도 10~35%의 크기를 감소시킬 수 있고, 여러 번 요청이 있을 경우에는(long-lived 커넥션) 80~97%까지 헤더 크기를 감소시킬 수 있다고 한다. 또한 모바일과 같이 업로드 대역폭이 상대적으로 작은 경우에는 이런 HTTP 헤더 압축 방법이 특히 유용하다. 오늘날의 HTTP 헤더는 평균 2KB 가량이고, 점점 더 커지는 추세이기 때문에 HTTP 헤더 압축의 가치는 앞으로는 더 커질 것이라고 보고 있다.
프레임을 텍스트가 아닌 바이너리로 구성하므로 파싱이 더 빠르고, 오류 발생 가능성이 낮다.
하나의 커넥션 안에서 다수의 독립적인 스트림을 동시에 처리한다. 따라서 하나의 커넥션에서 한 번에 하나만의 요청을 처리하며, 요청에 대한 응답이 순차적으로 이뤄지는 HTTP와 달리 적은 수의 커넥션으로 다수의 요청, 응답을 동시에 처리할 수 있다. 또한 FIFO(First In, First Out)로 처리되기 때문에 하나가 지연되면 나머지 응답도 모두 지연되는 HTTP 파이프라이닝(pipelining)과는 달리, 각각의 요청, 응답이 모두 독립적으로 처리된다.
한 스트림이 진행 중이더라도 다른 스트림이 끼어드는(interleaving) 것을 허용하고 스트림의 우선순위 설정도 지원하므로, 우선순위가 낮은 데이터 전송 도중에 우선순위가 높은 데이터가 끼어들어서 더 빨리 전달되게 할 수 있다.
Comet, 롱 폴링(long-polling) 같은 것과는 달리 클라이언트의 요청이 없어도 서버에서 콘텐츠를 직접 push할 수 있다. inlining 같은 방법과는 달리 리소스 캐싱이 가능하며, inlining과 같거나 더 적은 대역폭을 사용한다. 다만 server push를 구현할 때에는 웹 서버 애플리케이션 로직에 대한 추가 구현이 필요하다.
server push와 같이 추가 구현을 요구하는 기능을 제외하면, SPDY 적용 자체를 위해 웹 사이트 자체가 바뀌어야 할 필요는 없다. 다만 브라우저와 서버가 SPDY를 지원해야만 한다. SPDY는 브라우저 사용자에게 완전히 투명하게 적용 가능하다. 즉, spdy:// 같은 프로토콜 scheme이 없다. 또한 브라우저에서도 SPDY 프로토콜 사용 여부에 대한 어떤 표시도 하지 않는다.
이와 같은 특징들을 가지고 HTTP와 SPDY의 차이점을 표로 나타내면 다음과 같다.
표 2 HTTP(1.1)와 SPDY 비교
| HTTP | SPDY |
Secure | Not Default | Default |
Header Compression | No | Yes |
Multiplexing | No | Yes |
Full-Duplex | No | Yes |
Prioritization | No(브라우저 자체 휴리스틱 사용) | Yes |
Server Push | No | Yes |
DNS Lookup | More | Less |
Connections | More | Less |
(자세한 내용은 Google I/O 2012 콘퍼런스 자료 36쪽을 참조한다.)
결국, SPDY는 HTTP의 데이터 전송 포맷과 커넥션 관리 부분을 고쳐서 TCP 커넥션을 보다 효율적으로 쓰도록 만든 것이라고 볼 수 있다.
Google의 SPDY Whitepaper(http://www.chromium.org/spdy/spdy-whitepaper/) 페이지의 'Table 1: Average page load times for top 25 websites' 표를 통해 SPDY가 HTTP+SSL에 비해 39~55%의 속도 향상을 보인다는 점을 확인할 수 있다.
왜 TLS를 필요로 하는가?
TLS 사용으로 인해 암호화/복호화 작업으로 인한 전송 지연이 발생함에도, 왜 SPDY는 TLS를 사용하고 있는가? 이 질문에 대해 Google의 SPDY Whitepaper에서는 다음과 같이 이유를 밝히고 있다.
"장기적으로 보아 웹 환경에서 보안성은 점점 더 강조될 것이므로, SPDY의 하위 프로토콜로 TLS를 지정하여 향후 더 나은 보안성을 얻고자 한다.
현재 네트워크 인프라와의 호환, 즉 기존의 프록시를 거치는 통신과 호환성 문제가 발생하지 않도록 하기 위해 TLS가 필요하다."
이와 같은 이유가 있으나, 실제 SPDY의 구현을 살펴보면 TLS의 NPN(Next Protocol Negotiation) 확장 기능에 SPDY가 크게 의존하고 있음을 알 수 있다. 이 TLS NPN 확장은 서버의 443 포트로 들어온 요청이 SPDY인지 여부 및 요청에서 사용하고 있는 SPDY 버전을 판별하여 이후의 통신을 SPDY로 처리할지 판단할 수 있게 한다. 만약 TLS NPN이 없다면 SPDY 사용을 위해 추가적인 RTT(round-trip time)가 필요할 것이다.
표준화 노력
SPDY는 공개된 프로토콜로 개발되고 있으며 HTTP/2.0의 한 방식으로 IETF(Internet Engineering Task Force)에 제안되어 있다. SPDY는 Google Chromium 프로젝트의 하위 프로젝트로 Chromium 클라이언트 구현 및 서버 도구는 모두 오픈소스로 개발되고 있다.
SPDY의 미래
SPDY는 현재 draft 3까지 발표됐으며, draft 4가 제작 중이다. draft 4에서 추가될 가능성이 높은 기능은 다음과 같다.
- Name resolution push
- Certificate data push
- Explicit proxy support
SPDY의 최종 목표는 하나의 페이지를 '하나의 커넥션 설정 시간 + 바이트/대역폭 시간' 내에 서비스하는 것이다.
SPDY 지원 브라우저, 서버, 라이브러리, 웹 서비스
현재 다양한 브라우저와 서버가 SPDY를 지원하고 있으며, SPDY를 제안한 Google은 이미 자사의 거의 모든 서비스를 SPDY로 제공하고 있다. 이들 SPDY 지원 브라우저, 서버, 라이브러리, 서비스 등을 정리해 본다.
SPDY 지원 브라우저
2012년 7월 현재, SPDY를 지원하는 브라우저 목록은 다음과 같다.
Chrome과 Chromium은 초기 버전부터 SPDY를 지원하고 있다. 다음 URI를 입력하면 현재 Chrome/Chromium에서 연결 중인 SPDY 세션을 확인할 수 있다. chrome://net-internals/#events&q=type:SPDY_SESSION%20is:active 예를 들어www.gmail.com에만 들어가도 여러 개의 SPDY 세션이 생성되는 것을 확인할 수 있다. Android 용의 모바일 Chrome도 SPDY를 지원한다.
11 버전부터 SPDY를 지원하기는 하지만 기본 설정으로 제공하지는 않았고, 13 버전부터 기본 설정으로 제공하고 있다. Firefox 설정을 표시하는 URI인 about:config를 입력하고 network.http.spdy.enabled 항목을 보면 SPDY 지원이 활성화됐는지 확인할 수 있다. Android용의 모바일 Firefox 14 버전도 SPDY를 지원한다.
Android 기반 eBook인 Kindle Fire에 탑재된 Silk 브라우저는 SPDY를 지원하고 있다. Amazon EC2 서비스와 SPDY를 이용해 통신한다.
Android 3.0(Honeycomb), 4.0 (Ice Cream Sandwich)의 기본 브라우저는 SPDY를 지원한다.
다음 URL에서 SPDY를 지원하는 브라우저에 대한 상세 정보를 확인할 수 있다.
SPDY 지원 서버 및 라이브러리
주요 웹 서버와 애플리케이션 서버에서 SPDY 지원을 활성화하고 있으며, SPDY를 구현한 라이브러리도 다양하게 개발되고 있다.
SPDY를 사용하는 서비스
앞서 언급한 것처럼 Google은 검색뿐만 아니라 Gmail, Google+ 등 자사의 거의 모든 서비스를 https로 전환하여 SPDY로 제공하고 있다. 또한 Google App Engine도 https를 사용하는 경우에는 SPDY를 지원한다. Twitter도 https로 서비스를 제공하면서 SPDY를 사용하고 있다.
그러나 실제로 현재의 수많은 웹 사이트 중에서 SPDY를 사용하는 사이트는 그다지 많지 않다. Netcraft의 2012년 5월 조사(http://news.netcraft.com/archives/2012/05/02/may-2012-web-server-survey.html)에 의하면 총 6.6억 개의 웹 사이트 중에서 339개 만이 SPDY를 사용하고 있다고 한다. 즉, 아직은 Google과 Twitter 외에는 SPDY를 사용하는 주요 사이트는 거의 없다고 할 수 있다.
SPDY가 그다지 효율적이지 않은 경우
SPDY가 항상 빠른 것은 아니다. 상황에 따라 SPDY로 얻을 수 있는 성능 이점이 거의 없을 수도 있다. 그런 상황들을 정리하면 다음과 같다.
SPDY는 반드시 SSL을 필요로 하므로 SSL 핸드셰이크 시간이 추가적으로 필요하다. 따라서 HTTP로 개발된 사이트를 SPDY 지원을 위해 HTTPS로 변경하는 경우 SSL 핸드셰이크 처리 시간으로 인해 뚜렷하게 성능 향상이 이뤄지지 않을 수도 있다.
SPDY는 도메인별로 동작한다. 즉 커넥션은 도메인 개수만큼 필요하고, 요청을 multiplexing하는 기능도 하나의 도메인 안에서만 가능하다. 또한 모든 도메인이 SPDY를 지원하게 만들기 어려우므로 도메인이 많은 경우에는 SPDY의 장점이 나타나기 어려워진다. 특히 CDN에서 SPDY를 지원하지 않는 경우에는 SPDY로 인한 성능 향상을 기대하기가 어렵게 된다.
모든 웹사이트에서 HTTP가 병목으로 작용하는 것이 아니다. 다른 리소스 다운로드를 먼저 해야 다음 리소스를 다운로드할 수 있게 되어 있는 등의 이유로 대부분의 페이지에서 HTTP는 병목이 아닌 경우가 많다.
SPDY는 RTT가 큰 경우에 더 큰 효율을 얻을 수 있다. IDC 내의 서버 간 통신처럼 RTT가 매우 작은 경우에는 이점이 별로 없다.
6개 이하의 리소스를 가지는 페이지라면 커넥션 재사용의 가치가 떨어지므로 이점이 별로 없다.
SPDY를 도입하는 경우 해야 할 일
SPDY를 최대한 효율적으로 적용하려면 다음과 같은 작업이 필요하다.
애플리케이션 레벨
SPDY 성능을 위해서 그리고 효율적인 인터넷 리소스 사용을 위해서는 가능한 한 적은 수의 커넥션을 사용하는 것이 유리하다. SPDY를 사용할 때, 적은 수의 커넥션을 사용해야 데이터를 더 나은 방법으로 패킷에 넣을 수 있고, 헤더 압축 효율이 좋아지며, 커넥션 상태를 덜 확인하고, 핸드셰이크도 적게 하는 등의 이득이 있다. 또한 인터넷 리소스 면에서는 커넥션 개수가 적어야 TCP 효율이 좋아지고 Bufferbloat 현상을 감소시킬 수 있다.
참고
Bufferbloat: 라우터나 스위치에서 패킷을 너무 오래 버퍼링하기 때문에 전체 네트워크의 전송 지연(latency)이 높아지고 처리량(throughput)도 줄어드는 현상을 말한다. 가능한 패킷을 폐기하지 않아야 한다는 인식과 계속 낮아지는 메모리 가격 때문에 라우터나 스위치의 버퍼 크기는 계속 커졌고, 이로 인해 가급적 빨리 폐기돼야 할 패킷이 더 오래 살아남게 됐다. 결국 TCP 혼잡 회피 알고리즘을 방해하여 오히려 전체 네트워크 성능이 낮아지는 결과를 만든 것이다.
hostname sharding은 흔히 웹 애플리케이션에서 브라우저의 동시 다운로드 개수 제한(일반적으로 hostname당 6개)을 피하기 위해 사용하는 일종의 편법이다. 앞서 설명한 단일 커넥션 사용을 권장하는 이유 때문에 SPDY를 쓰는 경우에는 hostname sharding이 불필요하다. 더구나 hostname sharding은 추가적인 DNS 쿼리를 발생시키고, 애플리케이션을 더 복잡하게 만든다.
- inlining 대신에 server push를 사용한다.
inlining은 웹 애플리케이션에서 RTT를 줄이기 위해 사용한다. 그러나 inlining은 웹 페이지가 보다 덜 캐시되게 하고 base64 인코딩 때문에 웹 페이지 크기를 크게 만든다. 직접 콘텐츠를 push하는 SPDY server push 기능을 사용하면 이로 인한 문제를 피할 수 있다.
SPDY의 기능 중에 요청 우선순위 기능을 사용해서 클라이언트가 서버에 리소스의 상대적인 우선순위를 알리도록 할 수 있다. 일반적으로 적용할 수 있는 간단한 휴리스틱 우선순위로는 'html > js, css > *'를 생각해 볼 수 있다.
SPDY 스펙에서 큰 크기의 프레임을 허용하지만, 때때로 작은 프레임이 바람직한 경우도 있다. 프레임이 작은 경우에 프레임 interleaving이 더 잘 동작하기 때문이다.
SSL 레벨
인증서 체인의 크기는 커넥션 초기화 성능에 상당한 영향을 미친다. 인증서 체인 내의 인증서가 많을수록 인증서 유효성 검증에 더 오랜 시간이 걸리고 initcwnd 내의 공간을 더 많이 차지하게 때문이다. 또한 서버가 완전한 인증서 체인을 제공하지 않는 경우에는 클라이언트는 중간에 있는 인증서를 가져오기 위해 추가적인 RTT를 사용하게 된다. 결국 크고 불완전한 인증서 체인을 사용할수록 애플리케이션이 커넥션을 사용할 수 있게 되기까지 더 오랜 시간이 걸리게 된다.
참고
initcwnd: TCP initial congestion window, TCP 혼잡 제어 알고리즘에서 사용되는 초기값. congestion window는 TCP 혼잡 제어 알고리즘에 따라 송신 측에서 크기를 조절하는 window로서, 수신 측에서 크기를 제한하는 일반적인 TCP window와는 다르다.
- 쓸 수 있다면 와일드카드(wildcard) 인증서(*.naver.com 같은 형태의 인증서)를 사용한다.
와일드카드 인증서를 사용할 수 있다면 커넥션 개수가 줄고, SPDY의 커넥션 공유를 사용할 수 있게 된다. 다만, 와일드카드 인증서는 인증 기관에서 제공하는 것이므로 인증 기관과의 협의 및 추가적인 비용이 발생할 수 있다.
- SSL 쓰기 버퍼의 크기가 너무 크지 않게 설정한다.
SSL 쓰기 버퍼가 너무 크면 TLS 애플리케이션 record는 여러 개의 패킷에 걸쳐진다. 애플리케이션은 전체 TLS 애플리케이션 record가 완성되어야 처리할 수 있으므로 여러 개의 패킷에 걸쳐진 record는 추가적인 전송 지연을 유발한다. Google 서버들은 2KB 크기의 버퍼를 사용하고 있다.
TCP 레벨
- 서버의 initcwnd는 최소 10 이상으로 설정한다.
initcwnd는 페이지의 최초 로딩 시간에 영향을 주는 주된 병목이다. HTTP만 쓴다면 여러 개의 커넥션을 동시에 열어서 'n × initcwnd'의 초기 congestion window 크기를 달성하는 형태로 이 문제를 회피할 수 있으나, SPDY에서는 단일 커넥션이 유리하므로 처음부터 initcwnd를 크게 하는 것이 좋다. 오래된 Linux 커널은 이 값이 2~3 정도의 값으로 고정되어 있고 이를 조절할 방법을 제공하지 않고 있다. 처음 이 값을 고려할 때의 TCP 네트워크 신뢰성과 대역폭에 따라 정해진 값이므로 현대의 보다 안정적이고 높은 대역폭의 TCP 네트워크에는 적합하지 않은 값이다. 최신 Linux 배포판은 10 이상의 기본 값을 사용하고 있다. Linux 커널 2.6.18부터 이 값을 조절할 수 있다고 알려져 있으나 실제 동작 여부는 Linux 배포판에 따라 다르므로 주의가 필요하다.
- tcp_slow_start_after_idle 설정을 끈다.
Linux 기본 설정은 tcp_slow_start_after_idle을 1로 설정하고 있는데, 이는 커넥션이 유휴(idle) 상태가 되면 congestion window를 다시 initcwnd 크기로 떨어뜨려서 TCP Slow Start를 다시 실행하게 한다. 이는 SPDY의 단일 커넥션의 이점을 죽이는 일이므로 이 설정을 꺼야 한다. sysctl 명령어를 이용해서 변경할 수 있다. HTTP keepalive 사용 시에도 이 설정을 끄는 것이 유리하다.
참고
TCP Slow Start: 처음에는 initcwnd 크기의 congestion window로 패킷을 보내면서 점점 congestion window 크기를 키워 네트워크가 허용하는 최대값 혹은 수신 측의 TCP window까지 키우는 것을 TCP Slow Start라 한다. initcwnd 값이 작으면 네트워크가 허용하는 최대 크기까지 도달하는 동안 더 많은 Round-Trip이 필요하므로 페이지 최초 로딩 시간이 더 길어진다.
마치며
이상에서 살펴본 바와 같이 SPDY를 실제로 도입하기에는 다양한 고민과 애플리케이션 및 서버 수정이 필요하다. 특히 도입에 들어가는 비용을 생각하지 않을 수 없는데, SPDY를 아직 지원하지 않는 Tomcat으로 작성된 웹 애플리케이션이라면 웹 애플리케이션 서버를 바꾸는 비용을 고려해야 하며, Server Push 기능의 추가 구현에 따른 비용도 생각해야 한다.
이 같은 SPDY 도입 자체 비용을 제외하고 당장 실제 서비스에서 SPDY 도입을 시도한다면 무엇을 가장 먼저 고려해야 할까? 3가지를 꼽아 본다.
HTTP만 사용하는 서비스는 SPDY의 이득이 적고, SSL 도입에 따른 추가 비용이 발생한다.
initcwnd 조절로 얻는 성능상의 차이가 크기 때문에, 가급적 initcwnd가 조절 가능하거나 10 이상의 기본 값을 가진 Linux로 교체할 수 있어야 한다. CentOS의 경우 5.6 버전까지는 initcwnd 조절이 되지 않는다. 6.1부터 조절 가능하고, 6.2부터는 기본 값 10을 가지고 있다.
- SPDY 지원 브라우저 사용자의 비율을 고려한다.
국내 서비스에서는 아직도 SPDY를 지원하지 않는 Internet Explorer 사용자가 태반이다. 모바일에서도 iOS는 아직 SPDY를 지원하지 않으며, Android는 3.0부터 지원을 시작하고 있다. 따라서, SPDY 지원 브라우저 사용자가 충분히 많아지기 전에는 SPDY의 성능 향상으로 얻는 이익과 SPDY 도입 비용을 잘 비교해야 할 것이다.
- NBP 웹플랫폼개발랩 박세훈
- SI에영화 <코드명 J>의 원작 소설 이 발표된 것은 1981년이다. 저자인 윌리엄 깁슨은 대량의 데이터를 전달하려면 사람의 두뇌를 써야 할 것이라고 생각했다. 30년이 지나 사람은 두뇌를 사용하는 대신 손톱보다 작고 훨씬 대용량인 메모리카드를 만들어냈다. IT 기술이 이렇게 빠르게 발전하고 그만큼 데이터양도 늘어나고 있지만 메모리카드와 비교도 안 되게 좁은 필자의 두뇌에는 아직도 채워야 할 내용이 많은 것 같다. 그래서 언제나 무언가를 채우기 위해 돌아다니고 두리번거리고 있다.
http
part results in all directives being used, in both parnt and child context – eis Jun 4 '13 at 21:40