웨이백 머신
본 서비스가 제공하는 내용 및 자료가 사실임을 보증하지 않습니다. 시스템은 언제나 실수를 할 수 있습니다. 중요한 의사결정 및 법리적 해석, 금전적 의사결정에 사용하지 마십시오.
웨이백 머신(Wayback Machine)은 미국 캘리포니아주 샌프란시스코에 본사를 둔 비영리 단체 인터넷 아카이브(Internet Archive)가 운영하는 월드 와이드 웹(WWW)의 디지털 아카이브다. 2001년 일반에 공개된 이 서비스는 과거의 웹사이트 기록을 보존하여 사용자가 특정 시점의 웹페이지 모습을 확인할 수 있게 한다. 설립자인 브루스터 케일과 브루스 길리엇은 사라진 웹 정보를 보존함으로써 지식에 대한 보편적 접근을 제공하고자 이 서비스를 개발했다.
역사 및 명칭 유래
웨이백 머신은 1996년부터 웹페이지 데이터를 수집하기 시작했으며, 2001년 10월에 공식적으로 서비스를 시작했다. '웨이백 머신'이라는 명칭은 1960년대 미국의 애니메이션 《더 불윙클 쇼》(The Bullwinkle Show)의 한 대목인 '피바디의 있을 법하지 않은 역사'에 등장하는 가상의 시간 여행 장치에서 유래했다. 만화 속 캐릭터들이 이 장치를 타고 과거의 역사적 사건을 목격하듯, 사용자들이 인터넷의 과거를 여행할 수 있다는 의미를 담고 있다.
기술적 특징
웨이백 머신은 ia-archiver라는 크롤링 로봇을 사용하여 웹사이트를 자동으로 수집하고 저장한다. 또한 사용자가 특정 웹페이지의 주소를 입력하여 수동으로 아카이빙을 요청할 수도 있다.
- 표준 준수: 웹사이트의
robots.txt설정을 철저히 준수한다. 해당 파일에서ia-archiver의 접근을 차단한 사이트는 아카이빙되지 않는다. - 데이터 보존 방식: 웹페이지를 이미지 형태가 아닌 소스 코드와 자원을 포함한 통째로 저장한다. 이로 인해 반응형 웹페이지의 경우 아카이브된 페이지에서도 기기 환경에 맞는 최적화된 화면을 볼 수 있다.
- 공개 주기: 수집된 데이터는 저장된 시점으로부터 약 6~12개월이 지난 후에 일반에 공개되는 것이 일반적이나, 사이트별 저장 주기에 따라 차이가 있다.
데이터 규모
웨이백 머신은 세계 최대 규모의 디지털 아카이브 중 하나다. 2009년 말 기준으로 약 382억 개의 웹페이지를 저장했으며, 이후 급격히 성장하여 2025년 10월 기준으로는 1조 개 이상의 웹페이지와 99페타바이트(PB)를 상회하는 데이터를 보유하고 있다.
한계 및 주의사항
기술적 한계
자체 크롤링이 아닌 사용자 요청에 의한 아카이빙 과정에서 버그가 발생하기도 한다. 아카이빙에 실패하거나 성공하더라도 엉뚱한 페이지가 표시되는 등의 오류가 보고된 바 있다.
보안 주의사항
웨이백 머신은 과거의 웹페이지를 있는 그대로 저장하여 보여주기 때문에, 당시 해당 사이트에 포함되어 있던 악성 코드나 바이러스까지 함께 보존될 수 있다. 사이트 자체는 안전한 공익 서비스이나, 아카이브된 페이지 내에서 파일을 다운로드하거나 개인정보를 입력하는 행위는 주의가 필요하다.