Professional Documents
Culture Documents
Untitled
Untitled
건물의
평면도를 복사할 때마다 복사본이 원본과 미묘하지만 분명하게 달랐던 것이다. 원본 건물에 있는 세 개의 방은 각각
그것의 면적을 지정하는 직사각형과 함께 표기되어 있었다. 방들은 각각 14.13, 21.11, 그리고 17.42 제곱 미터였다.
하지만 복사본에서는 모든 방이 14.13 제곱미터로 표기되어 있었다. 회사는 이 얼핏 이해하기 어려운 결과를
분석하기 위해 다비드 크리셀 (David Kriesel)이라는 컴퓨터 공학자에게 연락했다. 그들이 컴퓨터 공학자를 찾아
나선 것은 그 당시 최신 제록스 복사기가 물리적인 제로그래픽 프로세스 (xerographic process)라는, 1960 년대
당시에 대중화된 기술을 사용하지 않았기 때문이다. 이 기술 대신 그 복사기는 문서를 디지털의 형태로 스캔하여 얻은
이미지를 인쇄하는 방식으로 작동했다. 이를 거의 모든 디지털 이미지 파일이 공간 절약을 목적으로 압축된다는
사실과 함께 고려해보면, 그 수수께끼의 실마리가 드러난다.
파일 압축에는 두 가지의 과정이 필요하다. 첫째는 인코딩으로, 파일을 더 작은 포맷으로 변환하는 과정이다.
둘째는 디코딩으로, 앞선 과정을 거꾸로 수행하는 것이다. 만일 두 번째 과정을 통해 복구된 파일이 원본과
동일하다면, 우리는 그것을 무손실 압축이라고 부른다. 어떠한 정보도 손실되지 않은 것이다. 반면에, 복구된 파일이
원본의 근사치에 불과하다면 그것은 손실 압축이라 불린다. 무손실 압축은 주로 텍스트 파일과 컴퓨터 프로그램에
사용되는데, 이는 이들 영역에서는 단 하나의 잘못된 글자조차도 치명적인 문제를 일으킬 수 있기 때문이다 . 손실
압축은 주로 사진, 오디오, 그리고 비디오에 사용되는데, 이는 이들에게 완벽한 정확도가 요구되지 않기 때문이다.
우리는 대체로 사진, 음악, 혹은 영화가 완벽하게 재생되지 않더라도 알아차리지 못한다. 오직 압축율이 매우 높은
경우에만 우리는 그 손실을 인지하게 된다. 이러한 경우에 우리는 압축 아티팩트 (compression artifacts)라고
하는 현상을 보게 된다 (역주: 이는 학술적으로 사용되는 명칭이며, 일상 용어에서 화질 저하 혹은 디지털 풍화/
열화라고 한다). 작은 JPEG 와 MPEG 파일의 흐릿함, 낮은 비트레이트의 MP3 에서 듣게되는 작은 소리들이
이러한 아티팩트이다.
자, 이제 인터넷을 사용하지 못하는 것이 그렇게까지 끔찍하진 않다. 당신은 인터넷에서 필요한 모든 정보를
서버에 저장했다. 한 가지 문제가 있다면, 이 텍스트들이 고도로 압축되어 있는 탓에 정확하게 일치하는 문구를
검색할 수 없다는 것이다. 왜냐하면 저장된 텍스트는 더이상 이전의 텍스트와 동일하지 않기 때문이다. 당신은 이
문제를 해결하기 위해 인터페이스를 만든다. 그 인터페이스에 당신은 질문 형태의 쿼리를 입력하고, 서버에 저장된
정보의 요점을 기반으로 작성된 답변을 받는다.