KR 101964223 B 1

등록특허 10-1964223
(19) 대한민국특허청(KR) (45) 공고일자 2019년04월01일

(11) 등록번호 10-1964223
(12) 등록특허공보(B1) (24) 등록일자 2019년03월26일
(51) 국제특허분류(Int. Cl.) (73) 특허권자
H04L 29/06 (2006.01) A63F 13/35 (2014.01) 매직 립, 인코포레이티드
A63F 13/92 (2014.01) G06F 3/01 (2006.01) 미국 플로리다 플랜타티온 웨스트 선라이즈 블러
G06T 19/00 (2011.01) 바드 7500 (우: 33322)
(52) CPC특허분류 (72) 발명자
H04L 65/4015 (2013.01) 밀러, 사무엘, 에이.
A63F 13/35 (2015.01) 미국 30021 플로리다 헐리우드 헤이스 스트리트
(21) 출원번호 10-2017-7030368(분할) 4108
(22) 출원일자(국제) 2012년10월29일 (74) 대리인
심사청구일자 2017년10월30일 특허법인 남앤남
(85) 번역문제출일자 2017년10월20일
(65) 공개번호 10-2017-0122839
(43) 공개일자 2017년11월06일
(62) 원출원 특허 10-2014-7014448
원출원일자(국제) 2012년10월29일
(86) 국제출원번호 PCT/US2012/062500
(87) 국제공개번호 WO 2013/085639
국제공개일자 2013년06월13일
(30) 우선권주장
61/552,941 2011년10월28일 미국(US)
(56) 선행기술조사문헌
US06753857 B1*
US20080024594 A1*
*는 심사관에 의하여 인용된 문헌
전체 청구항 수 : 총 17 항 심사관 : 박보미

(54) 발명의 명칭 증강 및 가상 현실을 위한 시스템 및 방법
(57) 요 약
일 실시예는 둘 또는 그 초과의 사용자들이 가상 세계 데이터를 포함하는 가상 세계 내에서 대화하도록 가능케
하기 위한 시스템으로 지향되고, 상기 시스템은 하나 또는 그 초과의 컴퓨팅 디바이스들을 포함하는 컴퓨터 네트
워크를 포함하고, 상기 하나 또는 그 초과의 컴퓨팅 디바이스들은 메모리, 프로세싱 회로, 그리고 적어도 부분적
(뒷면에 계속)
대 표 도
-1-
등록특허 10-1964223
으로 상기 메모리에 저장되고, 상기 가상 세계 데이터의 적어도 일부분을 프로세싱하기 위해 상기 프로세싱 회

로에 의해 실행가능한 소프트웨어를 포함하고; 여기서, 상기 가상 세계 데이터의 적어도 제1 일부분은 제1 사용
자에 국한된 제1 사용자 가상 세계로부터 나오고, 여기서 상기 컴퓨터 네트워크는 제2 사용자로의 제시를 위해
상기 제1 일부분을 사용자 디바이스에 전송하도록 동작하고, 그래서 상기 제2 사용자는 상기 제2 사용자의 위치
로부터 상기 제1 일부분을 경험할 수 있고, 그래서 상기 제1 사용자 가상 세계의 양상들이 상기 제2 사용자에게
효과적으로 전달된다.
(52) CPC특허분류
A63F 13/92 (2015.01)
G06F 3/016 (2013.01)
G06F 3/017 (2013.01)
G06T 19/006 (2013.01)
H04L 67/38 (2013.01)
A63F 2300/1093 (2013.01)
A63F 2300/577 (2013.01)
A63F 2300/695 (2013.01)
A63F 2300/8082 (2013.01)
-2-
등록특허 10-1964223
명 세 서
청구범위
청구항 1
적어도 하나의 사용자가 가상 세계 데이터를 포함하는 가상 세계 내에서 대화(interact)하는 것을 가능케 하기

위한 시스템으로서,
하나 또는 그 초과의 컴퓨팅 디바이스들을 포함하는 컴퓨터 네트워크 ― 상기 하나 또는 그 초과의 컴퓨팅 디바

이스들은 메모리, 프로세싱 회로, 그리고 적어도 부분적으로 상기 메모리에 저장되고, 상기 가상 세계 데이터의
적어도 일부분을 프로세싱하기 위해 상기 프로세싱 회로에 의해 실행가능한 소프트웨어를 포함함 ―; 및
환경-감지 시스템 및 사용자-감지 시스템을 포함하는 제1 사용자 디바이스
를 포함하고,
상기 제1 사용자 디바이스는 상기 컴퓨터 네트워크에 동작가능하게 커플링되고,
상기 환경-감지 시스템은 로컬 환경 오디오 입력을 캡쳐하도록 구성되고,
상기 사용자-감지 시스템은 사용자 오디오 입력을 캡쳐하도록 구성되고,
상기 가상 세계 데이터의 적어도 제1 일부분은 상기 로컬 환경 오디오 입력 및 상기 사용자 오디오 입력 중 적

어도 하나의 오디오 입력이고,
상기 가상 세계는 상기 로컬 환경 오디오 입력 및 상기 사용자 오디오 입력 중 적어도 하나에 기초하여 상기 컴

퓨팅 디바이스들 중 적어도 하나에 의한 시각적 렌더링을 더 포함하는,
시스템.
청구항 2
제 1 항에 있어서,
상기 가상 세계의 적어도 일부분은 상기 가상 세계 데이터의 변화에 응답하여 변하는,
시스템.
청구항 3
상기 가상 세계의 적어도 일부분은 상기 제1 사용자 디바이스에 의해 캡쳐되는 상기 오디오 입력에서의 변화에

응답하여 변하는,
시스템.
청구항 4
삭제
청구항 5
상기 가상 세계의 상기 시각적 렌더링은 2-차원 포맷으로 제시되는,
시스템.
청구항 6
-3-
등록특허 10-1964223
상기 가상 세계의 상기 시각적 렌더링은 3-차원 포맷으로 제시되는,
시스템.
청구항 7
상기 사용자 디바이스는 증강 현실 모드에서 사용자와 상기 가상 세계 사이의 대화를 가능케 하기 위한 인터페

이스를 제공하도록 동작하는,
시스템.
청구항 8
상기 사용자 디바이스는 가상 현실 모드에서 사용자와 상기 가상 세계 사이의 대화를 가능케 하기 위한 인터페

이스를 제공하도록 동작가능한,
시스템.
청구항 9
상기 사용자 디바이스는 증강 및 가상 현실 모드의 결합에서 사용자와 상기 가상 세계 사이의 대화를 가능케 하

기 위한 인터페이스를 제공하도록 동작가능한,
시스템.
청구항 10
상기 가상 세계 데이터는 데이터 네트워크를 경유해 전송되는,
시스템.
청구항 11
제2 사용자가 상기 제2 사용자의 위치에서 상기 가상 세계 데이터의 상기 제1 일부분의 상기 오디오 입력을 들

을 수 있도록, 상기 컴퓨터 네트워크는 상기 제2 사용자에게로의 제시를 위하여 제2 사용자 디바이스에게 상기
가상 세계 데이터의 상기 제1 일부분을 전송하도록 동작가능한,
시스템.
청구항 12
적어도 하나의 사용자가 가상 세계 데이터를 포함하는 가상 세계와 대화하는 것을 가능케 하기 위한 시스템으로

서,
컴퓨터 네트워크에 동작가능하게 커플링되는 제1 사용자 디바이스 ― 상기 컴퓨터 네트워크는 하나 또는 그 초

과의 컴퓨팅 디바이스들을 포함하고, 상기 하나 또는 그 초과의 컴퓨팅 디바이스들은 메모리, 프로세싱 회로,
그리고 적어도 부분적으로 상기 메모리에 저장되고, 상기 가상 세계 데이터의 제1 일부분을 프로세싱하기 위해
상기 프로세싱 회로에 의해 실행가능한 소프트웨어를 포함함 ―;
상기 제1 사용자 디바이스에 동작가능하게 커플링되고 그리고 제1 사용자로부터 적어도 제1 입력을 캡쳐하도록

구성되는 사용자-감지 시스템 ― 상기 사용자-감지 시스템은 상기 컴퓨터 네트워크에 상기 제1 입력을 전송하도
록 구성됨 ―; 및
상기 제1 사용자 디바이스에 동작가능하게 커플링되고 그리고 로컬 환경으로부터 적어도 제2 입력을 캡쳐하도록
-4-
등록특허 10-1964223
구성되는 환경-감지 시스템 ― 상기 환경-감지 시스템은 상기 컴퓨터 네트워크에 상기 제2 입력을 전송하도록

구성됨 ―
을 포함하고,
상기 컴퓨터 네트워크는 상기 제1 입력 및 상기 제2 입력 중 적어도 하나에 기초하여 가상 세계 데이터를 변경

하도록 구성되고,
상기 제1 사용자 디바이스는 변경된 가상 세계 데이터에 기초하여 상기 제1 사용자에게 가상 콘텐츠를 제시하도

록 구성되는,
시스템.
청구항 13
상기 가상 콘텐츠는 시각 콘텐츠, 오디오 콘텐츠, 및 햅틱 콘텐츠로 구성되는 그룹으로부터 선택되는,
시스템.
청구항 14
상기 제1 사용자로부터의 상기 제1 입력은 제스처 데이터, 오디오 데이터, 지리적 위치 데이터, 및 광학 특성

데이터로 이루어진 그룹으로부터 선택되는,
시스템.
청구항 15
상기 로컬 환경으로부터의 상기 제2 입력은 상기 로컬 환경으로부터의 오디오 데이터 및 상기 로컬 환경에서의

물리적 객체로부터의 시각적 데이터로 이루어진 그룹으로부터 선택되는,
시스템.
청구항 16
상기 컴퓨터 네트워크와 상기 제1 사용자 디바이스 사이에 커플링되는 게이트웨이를 더 포함하는,
시스템.
청구항 17
상기 가상 콘텐츠를 수신하도록 구성되는 제2 사용자 디바이스를 더 포함하는,
시스템.
청구항 18
상기 제2 사용자 디바이스는 제2 사용자에게 상기 가상 콘텐츠를 제시하도록 구성되는,
시스템.
발명의 설명
-5-
등록특허 10-1964223
기 술 분 야
[0001] 본 출원은, 35 U.S.C. §119 하에서, 2011년 10월 28일자로 출원된 U.S. 임시 출원들 시리얼 번호 61/552,941
을 우선권으로 한다. 전술된 출원은 이로써 인용에 의해 본 출원에 그 전체가 포함된다.
[0002] 본 출원은 일반적으로, 하나 또는 그 초과의 사용자들에 대해 대화식(interactive) 가상 또는 증강 현실 환경들

을 용이하게 하도록 구성된 시스템들 및 방법들에 관한 것이다.
배 경 기 술
[0003] 가상 및 증강 현실 환경들은, 부분적으로, 환경을 설명하는 데이터를 이용하여 컴퓨터들에 의해 생성된다. 이
러한 데이터는, 예컨대 다양한 객체들을 설명할 수 있고, 사용자가 상기 다양한 객체들을 감지할 수 있고 상기
다양한 객체들과 대화할 수 있다. 이러한 객체들의 예들은, 사용자가 보도록 렌더링 및 디스플레이되는
객체들, 사용자가 듣도록 재생되는 오디오, 그리고 사용자가 느끼도록 하기 위한 촉각(tactile)(또는 햅틱) 피
드백을 포함한다. 사용자들은 다양한 시각적, 청각적 및 전략적(tactical) 수단들을 통해 가상 및 증강 현실
환경들을 감지할 수 있고 가상 및 증강 현실 환경들과 대화할 수 있다.
발명의 내용
[0004] 일 실시예는 둘 또는 그 초과의 사용자들이 가상 세계 데이터를 포함하는 가상 세계 내에서 대화하는 것을 가능
케 하기 위한 시스템으로 지향되고, 상기 시스템은 하나 또는 그 초과의 컴퓨팅 디바이스들을 포함하는 컴퓨터
네트워크를 포함하고, 상기 하나 또는 그 초과의 컴퓨팅 디바이스들은 메모리, 프로세싱 회로, 그리고 적어도
부분적으로 상기 메모리에 저장되고, 상기 가상 세계 데이터의 적어도 일부분을 프로세싱하기 위해 상기 프로세
싱 회로에 의해 실행가능한 소프트웨어를 포함하고; 여기서, 상기 가상 세계 데이터의 적어도 제1 일부분은 제1
사용자에 국한된 제1 사용자 가상 세계로부터 나오고, 여기서 상기 컴퓨터 네트워크는 제2 사용자로의 제시를
위해 상기 제1 일부분을 사용자 디바이스에 전송하도록 동작하고, 그래서 상기 제2 사용자는 상기 제2 사용자의
위치로부터 상기 제1 일부분을 경험할 수 있고, 그래서 상기 제1 사용자 가상 세계의 양상들이 상기 제2 사용자
에게 효과적으로 전달된다. 제1 사용자 및 제2 사용자는 상이한 물리적 위치들에 있을 수 있거나, 또는 실질상
동일한 물리적 위치에 있을 수 있다. 가상 세계의 적어도 일부분은 가상 세계 데이터의 변화에 응답하여 변하
도록 구성될 수 있다. 가상 세계의 적어도 일부분은 사용자 디바이스에 의해 감지된 물리적 객체에 응답하여
변하도록 구성될 수 있다. 가상 세계 데이터의 변화는 물리적 객체와 미리결정된 관계를 갖는 가상 객체를 표
현할 수 있다. 가상 세계 데이터의 변화는 미리결정된 관계에 따라 제2 사용자로의 제시를 위해 제2 사용자 디
바이스에 제시될 수 있다. 가상 세계는 사용자 디바이스 또는 컴퓨터 서버들 중 적어도 하나에 의해 렌더링되
도록 동작할 수 있다. 가상 세계는 2-차원 포맷으로 제시될 수 있다. 가상 세계는 3-차원 포맷으로 제시될 수
있다. 사용자 디바이스는 증강 현실 모드에서 사용자와 가상 세계 사이의 대화를 가능케 하기 위한 인터페이스
를 제공하도록 동작할 수 있다. 사용자 디바이스는 가상 현실 모드에서 사용자와 가상 세계 사이의 대화를 가
능케 하기 위한 인터페이스를 제공하도록 동작할 수 있다. 사용자 디바이스는 증강 및 가상 현실 모드의 결합
에서 사용자와 가상 세계 사이의 대화를 가능케 하기 위한 인터페이스를 제공하도록 동작할 수 있다. 가상 세
계 데이터는 데이터 네트워크를 경유해 전송될 수 있다. 컴퓨터 네트워크는 사용자 디바이스로부터 가상 세계
데이터의 적어도 일부분을 수신하도록 동작할 수 있다. 사용자 디바이스에 전송된 가상 세계 데이터의 적어도
일부분은 가상 세계의 적어도 일부분을 생성하기 위한 명령들을 포함할 수 있다. 가상 세계 데이터의 적어도
일부분은 프로세싱 또는 분배 중 적어도 하나를 위해 게이트웨이에 전송될 수 있다. 하나 또는 그 초과의 컴퓨
터 서버들 중 적어도 하나가 게이트웨이에 의해 분배된 가상 세계 데이터를 프로세싱하도록 동작할 수 있다.
[0005] 다른 실시예는, 음성 어조(voice inflection) 및 얼굴 인식 소프트웨어로부터의 선택적 입력을 갖는 웨어러블

(wearable) 디바이스 상의 데이터에 적어도 부분적으로 기초하여 원격 아바타들이 애니메이팅되는 가상 및/또는
증강 사용자 경험을 위한 시스템으로 지향된다.
[0006] 다른 실시예는, 카메라 포즈 또는 뷰포인트 포지션 및 벡터가 세계 섹터에서 어디에든지 배치될 수 있는 가상

및/또는 증강 사용자 경험을 위한 시스템으로 지향된다.
[0007] 다른 실시예는, 세계들 또는 그 일부분들이 관찰하는 사용자들에 대해 다양하고 선택가능한 규모들로 렌더링될
수 있는 가상 및/또는 증강 사용자 경험을 위한 시스템으로 지향된다.
[0008] 다른 실시예는, 포즈 태깅된 이미지(pose tagged image)들에 부가하여, 포인트들 또는 파라메트릭 라인들과 같
-6-
등록특허 10-1964223
은 피처들이 세계 모델에 대해 베이스 데이터로서 활용될 수 있는 가상 및/또는 증강 사용자 경험을 위한 시스

템으로 지향되고, 상기로부터, 세그먼트된 객체들 및 상기 세계 모델에의 상호 포함을 위해 소스 피처들을 태깅
하는 실세계 객체들의 파라메트릭 표현들을 생성하기 위해 소프트웨어 로봇들 또는 객체 인식기들이 활용될 수
있다.
도면의 간단한 설명
도 1은 다수의 사용자들에 대해 대화식 가상 또는 증강 현실 환경들을 용이하게 하기 위한 기재된 시스템의 대

표적 실시예를 예시한다.
도 2는 도 1에서 예시된 시스템과 대화하기 위한 사용자 디바이스의 예를 예시한다.
도 3은 모바일 웨어러블 사용자 디바이스의 예시적 실시예를 예시한다.
도 4는 도 3의 모바일 웨어러블 사용자 디바이스가 증강 모드로 동작하고 있을 때 사용자가 보는 객체들의 예를

예시한다.
도 5는 도 3의 모바일 웨어러블 사용자 디바이스가 가상 모드로 동작하고 있을 때 사용자가 보는 객체들의 예를

예시한다.
도 6은 도 3의 모바일 웨어러블 사용자 디바이스가 블렌드 가상 인터페이스 모드로 동작하고 있을 때 사용자가

보는 객체들의 예를 예시한다.
도 7은 상이한 지리적 위치들에 위치된 두 명의 사용자들 각각이 각자의 각각의 사용자 디바이스들을 통해 다른
사용자 및 공통 가상 세계와 대화하는 실시예를 예시한다.
도 8은 도 7의 실시예가 햅틱 디바이스의 사용을 포함하도록 확장되는 실시예를 예시한다.
도 9a는 제1 사용자가 블렌드 가상 인터페이스 모드로 디지털 세계와 인터페이싱하고 있고 제2 사용자가 가상

현실 모드로 동일한 디지털 세계와 인터페이싱하고 있는 혼합된 모드 인터페이싱의 예를 예시한다.
도 9b는 제1 사용자가 블렌드 가상 인터페이스 모드로 디지털 세계와 인터페이싱하고 있고 제2 사용자가 증강

현실 모드로 동일한 디지털 세계와 인터페이싱하고 있는 혼합된 모드 인터페이싱의 다른 예를 예시한다.
도 10은 증강 현실 모드로 시스템과 인터페이싱할 때 사용자의 뷰의 예시적 예시를 예시한다.
도 11은 사용자가 증강 현실 모드로 시스템과 인터페이싱하고 있을 때 물리적 객체에 의해 트리거링되는 가상

객체를 나타내는 사용자의 뷰의 예시적 예시를 예시한다.
도 12는 증강 현실 경험에 있는 한 명의 사용자가 가상 현실 경험에 있는 다른 사용자의 존재를 시각화시키는

증강 및 가상 현실 통합 구성의 일 실시예를 예시한다.
도 13은 시간 및/또는 콘틴전시 이벤트(contingency event) 기반 증강 현실 경험 구성의 일 실시예를 예시한다.
도 14는 가상 및/또는 증강 현실 경험들에 적절한 사용자 디스플레이 구성의 일 실시예를 예시한다.
도 15는 로컬 및 클라우드-기반 컴퓨팅 조정의 일 실시예를 예시한다.
도 16은 정합(registration) 구성들의 다양한 양상들을 예시한다.
발명을 실시하기 위한 구체적인 내용

[0011] 도 1을 참조하면, 시스템(100)은 아래에서 설명되는 프로세스들을 구현하기 위한 대표적 하드웨어이다. 이러한
대표적 시스템은, 하나 또는 그 초과의 높은 대역폭 인터페이스들(115)을 통해 연결된 하나 또는 그 초과의 컴
퓨터 서버들(110)로 구성된 컴퓨팅 네트워크(105)를 포함한다. 컴퓨팅 네트워크의 서버들은 같은 장소에 배치
될 필요가 없다. 하나 또는 그 초과의 서버들(110) 각각은 프로그램 명령들을 실행하기 위한 하나 또는 그 초
과의 프로세서들을 포함한다. 서버들은 또한, 프로그램 명령들, 그리고 상기 프로그램 명령들의 지시 하에서
상기 서버들에 의해 수행되는 프로세스들에 의해 사용되거나 그리고/또는 생성되는 데이터를 저장하기 위한 메
모리를 포함한다.
[0012] 컴퓨팅 네트워크(105)는 서버들(110) 사이, 그리고 하나 또는 그 초과의 데이터 네트워크 연결들(130)을 경유해
-7-
등록특허 10-1964223
서버들과 하나 또는 그 초과의 사용자 디바이스들(120) 사이에 데이터를 통신시킨다. 그러한 데이터 네트워크
들의 예들은, 제한 없이, 예컨대 인터넷으로 보통 지칭되는, 그러한 네트워크들 중 많은 네트워크들의 상호연결
을 포함하는 임의의 그리고 모든 타입들의 공중 및 전용 데이터 네트워크들 ― 모바일 및 유선 둘 다임 ― 을
포함한다. 도면에 의해 특정 미디어, 토폴로지 또는 프로토콜이 암시되는 것이 의도되지 않는다.
[0013] 사용자 디바이스들은 컴퓨팅 네트워크(105) 또는 서버들(110) 중 임의의 서버와 직접 통신하기 위해 구성된다.
대안적으로, 사용자 디바이스들(120)은, 데이터를 프로세싱하기 위해 그리고/또는 네트워크(105)와 하나 또는
그 초과의 로컬 사용자 디바이스들(120) 사이에 데이터를 통신하기 위해 특별히 프로그래밍된 로컬 게이트웨이
(140)를 통해, 원격 서버들(110)과 통신하고, 선택적으로 다른 사용자 디바이스들과 로컬로 통신한다.
[0014] 예시된 바와 같이, 게이트웨이(140)는 소프트웨어 명령들을 실행하기 위한 프로세서와 소프트웨어 명령들 및 데
이터를 저장하기 위한 메모리를 포함하는 별도의 하드웨어 컴포넌트로서 구현된다. 게이트웨이는, 컴퓨팅 네트
워크(105)를 포함하는 서버들(110)과 통신하기 위해 데이터 네트워크들에 대한 자신만의 유선 및/또는 무선 연
결을 갖는다. 대안적으로, 게이트웨이(140)는 사용자 디바이스(120)에 통합될 수 있고, 사용자 디바이스(120)
는 사용자에 의해 착용되거나 또는 운반된다. 예컨대, 게이트웨이(140)는, 사용자 디바이스(120)에 설치되고
사용자 디바이스(120)에 포함된 프로세서 상에서 실행되는 다운로드 가능한 소프트웨어 애플리케이션으로서 구
현될 수 있다. 일 실시예에서, 게이트웨이(140)는 데이터 네트워크(130)를 통해 컴퓨팅 네트워크(105)로의 액
세스를 하나 또는 그 초과의 사용자들에게 제공한다.
[0015] 서버들(110) 각각은, 예컨대, 데이터 및 소프트웨어 프로그램들을 저장하기 위한 작업 메모리 및 스토리지, 프
로그램 명령들을 실행하기 위한 마이크로프로세서들, 그래픽들 프로세서들, 그리고 그래픽들, 이미지들,
비디오, 오디오 및 멀티-미디어 파일들을 렌더링 및 생성하기 위한 다른 특별한 프로세서들을 포함한다. 컴퓨
팅 네트워크(105)는 서버들(110)에 의해 액세스되거나, 사용되거나, 또는 생성되는 데이터를 저장하기 위한 디
바이스들을 또한 포함할 수 있다.
[0016] 서버들, 그리고 선택적으로 사용자 디바이스들(120) 및 게이트웨이들(140) 상에서 실행되는 소프트웨어 프로그
램들은, 디지털 세계들(본 명세서에서, 가상 세계들로 또한 지칭됨)을 생성하는데 사용되고, 사용자들은 상기
디지털 세계들을 이용하여 사용자 디바이스들(120)과 대화한다. 디지털 세계는, 사용자들이 경험하고 대화하도
록 사용자 디바이스(120)를 통해 사용자에게 제시될 수 있는 가상의 존재하지 않는 엔티티들, 환경들 및 조건들
을 설명하거나 그리고/또는 정의하는 프로세스들 및 데이터에 의해 표현된다. 예컨대, 사용자가 보거나 또는
사용자에 의해 경험되는 장면(scene)에서 실례될 때 물리적으로 존재하는 것으로 보일 어떤 타입의 객체, 엔티
티 또는 아이템은 그 외양, 그 동작 ― 어떻게 사용자가 그것과 대화하도록 허가받는지 ―, 및 다른 특성들의
설명을 포함할 수 있다. 가상 세계(가상 객체들을 포함함)의 환경을 생성하는데 사용되는 데이터는, 예컨대,
대기 데이터, 지형 데이터, 날씨 데이터, 온도 데이터, 위치 데이터, 및 가상 환경을 정의하거나 그리고/또는
설명하는데 사용되는 다른 데이터를 포함할 수 있다. 부가하여, 가상 세계의 동작을 통제하는 다양한 조건들을
정의하는 데이터는, 예컨대, 물리학의 법칙들, 시간, 공간적 관계들, 및 가상 세계(가상 객체들을 포함함)의 동
작을 통제하는 다양한 조건들을 정의하거나 그리고/또는 생성하는데 사용될 수 있는 다른 데이터를 포함할 수
있다.
[0017] 디지털 세계의 엔티티, 객체, 조건, 특성, 동작 또는 다른 피처는, 맥락이 그렇지 않다고 나타내지 않는 한, 본
명세서에서 객체(예컨대, 디지털 객체, 가상 객체, 렌더링된 물리적 객체 등등)로 총칭적으로 지칭될 것이다.
객체들은, 이에 제한되지는 않지만 빌딩들, 플랜트들, 차량들, 사람들, 동물들, 창조물들, 머신들, 데이터, 비
디오, 텍스트, 픽처들, 및 다른 사용자들을 포함하는 임의의 타입의 생물 또는 무생물 객체일 수 있다. 객체들
은 또한, 물리적 세계에 실제로 존재하는 아이템들, 동작들 또는 조건들에 관한 정보를 저장하기 위해 디지털
세계에서 정의될 수 있다. 엔티티, 객체 또는 아이템을 설명하거나 또는 정의하거나, 또는 그 현재 상태를 저
장하는 데이터는, 일반적으로 본 명세서에서 객체 데이터로 지칭된다. 이러한 데이터는, 서버들(110)에 의해
또는 구현에 따라 게이트웨이(140) 또는 사용자 디바이스(120)에 의해, 객체의 인스턴스를 실례하고 사용자가
사용자 디바이스를 통해 경험하기에 적절한 방식으로 객체를 렌더링하기 위해 프로세싱된다.
[0018] 디지털 세계를 개발하거나 그리고/또는 큐레이팅(curating)하는 프로그래머들은 객체들, 그리고 상기 객체들이
실례되는 조건들을 생성하거나 또는 정의한다. 그러나, 디지털 세계는 다른 사람들이 객체들을 생성하거나 또
는 수정하도록 허용할 수 있다. 일단 객체가 실례되면, 객체의 상태는 디지털 세계를 경험하는 하나 또는 그
초과의 사용자들에 의해 변경되거나, 제어되거나 또는 조작되도록 허용될 수 있다.
[0019] 예컨대, 일 실시예에서, 디지털 세계의 개발, 제조, 및 관리는 일반적으로 하나 또는 그 초과의 시스템 관리 프
-8-
등록특허 10-1964223
로그래머들에 의해 제공된다. 몇몇의 실시예들에서, 이는, 디지털 세계들에서 스토리 라인들, 테마들 및 이벤
트들의 개발, 설계 및/또는 실행뿐만 아니라, 예컨대 필름, 디지털, 네트워크, 모바일, 증강 현실 및 라이브 엔
터테인먼트와 같은 다양한 형태들의 이벤트들 및 미디어를 통한 내러티브들의 분배를 포함할 수 있다. 시스템
관리 프로그래머들은 또한, 디지털 세계들 및 그와 연관된 사용자 커뮤니티들의 기술적 관리, 조정(moderation)
및 큐레이션뿐만 아니라, 네트워크 관리 인원에 의해 통상 수행되는 작업들도 다룰 수 있다.
[0020] 사용자들은, 일반적으로 사용자 디바이스(120)로서 지정되는 어떤 타입의 로컬 컴퓨팅 디바이스를 이용하여 하
나 또는 그 초과의 디지털 세계들과 대화한다. 그러한 사용자의 예들은, 이에 제한되지는 않지만, 스마트 폰,
태블릿 디바이스, HUD(heads-up display), 게임 콘솔, 또는 사용자에게 데이터를 통신할 수 있고 인터페이스 또
는 디스플레이를 제공할 수 있는 임의의 다른 디바이스, 뿐만 아니라 그러한 디바이스들의 결합들을 포함한다.
몇몇의 실시예들에서, 사용자 디바이스(120)는, 예컨대 키보드, 마우스, 조이스틱, 게임 제어기, 햅틱 인터페이
스 디바이스, 모션 캡쳐 제어기, Leap Motion, Inc.로부터 이용가능한 것들 또는 상표명 Kinect(RTM) 하에서
Microsoft로부터 이용가능한 것들과 같은 광학 추적 디바이스, 오디오 장비, 음성 장비, 프로젝터 시스템, 3D
디스플레이, 및 홀로그래픽 3D 콘택트 렌즈와 같은 로컬 주변 또는 입/출력 컴포넌트들을 포함할 수 있거나, 또
는 이들과 통신할 수 있다.
[0021] 시스템(100)과 대화하기 위한 사용자 디바이스(120)의 예가 도 2에서 예시된다. 도 2에 도시된 예시적 실시예
에서, 사용자(210)는 스마트 폰(220)을 통해 하나 또는 그 초과의 디지털 세계들과 인터페이싱할 수 있다. 게
이트웨이는, 스마트 폰(220) 상에서 저장되고 실행되는 소프트웨어 애플리케이션(230)에 의해 구현된다. 이러
한 특정 예에서, 데이터 네트워크(130)는 사용자 디바이스(즉, 스마트 폰(220))을 컴퓨터 네트워크(105)에 연결
시키는 무선 모바일 네트워크를 포함한다.
[0022] 바람직한 실시예의 하나의 구현에서, 시스템(100)은 많은 수의 동시 사용자들(예컨대, 수백만의 사용자들)을 지

원할 수 있고, 각각은, 어떤 타입의 사용자 디바이스(120)를 이용하여, 동일한 디지털 세계 또는 다수의 디지털
세계들과 인터페이싱한다.
[0023] 사용자 디바이스는, 사용자에게 제시되는 다른 사용자들 및 객체들(실제 또는 가상)을 포함하는 서버들(110)에
의해 생성되는 디지털 세계와 사용자 사이에 시각적, 청각적, 및/또는 물리적 대화를 가능케 하기 위한 인터페
이스를 사용자에게 제공한다. 상기 인터페이스는, 보일 수 있거나, 들릴 수 있거나 또는 다른 방식으로 감지될
수 있는 렌더링된 장면, 그리고 상기 장면과 실시간으로 대화하기 위한 능력을 사용자에게 제공한다. 사용자가
렌더링된 장면과 대화하는 방식은 사용자 디바이스의 능력들에 의해 지시될 수 있다. 예컨대, 사용자 디바이스
가 스마트 폰이면, 사용자 대화는 사용자가 터치 스크린에 접촉하는 것에 의해 구현될 수 있다. 다른 예에서,
사용자 디바이스가 컴퓨터 또는 게임 콘솔이면, 사용자 대화는, 키보드 또는 게임 제어기를 이용하여 구현될 수
있다. 사용자 디바이스들은 센서들과 같이 사용자 대화를 가능케 하는 부가의 컴포넌트들을 포함할 수 있고,
여기서 센서들에 의해 검출되는 객체들 및 정보(제스처들을 포함함)는, 사용자 디바이스를 이용하여 가상 세계
와의 사용자 대화를 표현하는 입력으로서 제공될 수 있다.
[0024] 렌더링된 장면은 예컨대 2-차원 또는 3-차원 시각적 디스플레이들(프로젝션들을 포함함), 사운드, 그리고 햅틱
또는 촉각 피드백과 같은 다양한 포맷들로 제시될 수 있다. 렌더링된 장면은, 예컨대 증강 현실, 가상 현실,
및 이들의 결합들을 포함하는 하나 또는 그 초과의 모드들로 사용자에 의해 인터페이싱될 수 있다. 렌더링된
장면의 포맷, 뿐만 아니라 인터페이스 모드들은, 다음 중 하나 또는 그 초과에 의해 지시될 수 있다: 사용자 디
바이스, 데이터 프로세싱 능력, 사용자 디바이스 접속성, 네트워크 용량 및 시스템 작업량. 많은 수의 사용자
들이 디지털 세계들과 동시에 대화하게 하는 것과 데이터 교환의 실시간 성질은, 컴퓨팅 네트워크(105), 서버들
(110), 게이트웨이 컴포넌트(140)(선택적), 및 사용자 디바이스(120)에 의해 가능케 된다.
[0025] 일 예에서, 컴퓨팅 네트워크(105)(IS)는 고속 연결들(예컨대, 높은 대역폭 인터페이스들(115))을 통해 연결된

단일 및/또는 멀티-코어 서버들(즉, 서버들(110))을 갖는 대규모 컴퓨팅 시스템으로 구성되었다. 컴퓨팅 네트
워크(105)는 클라우드 또는 그리드 네트워크를 형성할 수 있다. 서버들 각각은 메모리를 포함하거나, 또는 디
지털 세계의 객체들을 생성하거나, 설계하거나, 변경하거나, 또는 프로세싱하기 위한 데이터를 구현하기 위한
소프트웨어를 저장하기 위한 컴퓨터 판독가능 메모리와 커플링된다. 이러한 객체들 및 그들의 실례들은 동적일
수 있고, 존재가 드나들 수 있고, 시간에 따라 변할 수 있고, 그리고 다른 조건들에 응답하여 변할 수 있다.
객체들의 동적 능력들의 예들은 일반적으로 본 명세서에서 다양한 실시예들에 대하여 논의된다. 몇몇의 실시예
들에서, 시스템(100)과 인터페이싱하는 각각의 사용자는, 하나 또는 그 초과의 디지털 세계들 내에서, 객체 및/
또는 객체들의 콜렉션으로서 또한 표현될 수 있다.
-9-
등록특허 10-1964223
[0026] 또한, 컴퓨팅 네트워크(105) 내의 서버들(110)은 디지털 세계들 각각에 대해 컴퓨터 상태 데이터를 저장한다.
컴퓨터 상태 데이터(본 명세서에서, 상태 데이터로 또한 지칭됨)는 객체 데이터의 컴포넌트일 수 있고, 일반적
으로 주어진 인스턴스에서 객체의 인스턴스의 상태를 제때에 정의한다. 따라서, 컴퓨터 상태 데이터는 시간에
따라 변할 수 있고, 시스템(100)을 유지시키는 하나 또는 그 초과의 사용자들 및/또는 프로그래머들의 동작들에
의해 영향받을 수 있다. 사용자가 컴퓨터 상태 데이터(또는 디지털 세계들을 포함하는 다른 데이터)에 영향을
끼칠 수 있으므로, 사용자는 디지털 세계를 직접 변경하거나 또는 다른 방식으로 조작한다. 디지털 세계가 다
른 사용자들과 공유되거나 또는 다른 사용자들에 의해 인터페이싱된다면, 사용자의 동작들은 디지털 세계와 대
화하는 다른 사용자들이 경험하는 것에 영향을 끼칠 수 있다. 따라서, 몇몇의 실시예들에서, 사용자에 의해 이
루어지는 디지털 세계에 대한 변화들을 시스템(100)과 인터페이싱하는 다른 사용자들이 경험할 것이다.
[0027] 컴퓨팅 네트워크(105) 내의 하나 또는 그 초과의 서버들(110)에 저장된 데이터는, 일 실시예에서, 고속으로 그

리고 낮은 지연으로, 하나 또는 그 초과의 사용자 디바이스들(120) 및/또는 게이트웨이 컴포넌트들(140)에 전송
되거나 또는 배치된다. 일 실시예에서, 서버들에 의해 공유되는 객체 데이터는 전체일 수 있거나 또는 압축될
수 있고, 사용자의 로컬 컴퓨팅 디바이스(예컨대, 게이트웨이(140) 및/또는 사용자 디바이스(120))에 의해 렌더
링 및 시각화된 사용자 측 상에 전체 객체 데이터를 재생성하기 위한 명령들을 포함한다. 몇몇의
실시예들에서, 컴퓨팅 네트워크(105)의 서버들(110) 상에서 실행되는 소프트웨어는, 사용자의 특정 디바이스 및
대역폭의 함수로서, 디지털 세계 내의 객체들(또는 컴퓨팅 네트워크(105)에 의해 교환되는 임의의 다른 데이
터)에 대해, 자신이 생성하고 특정 사용자의 디바이스(120)에 전송하는 데이터를 적응시킬 수 있다. 예컨대,
사용자가 사용자 디바이스(120)를 통해 디지털 세계와 대화할 때, 서버(110)는, 사용자에 의해 사용되는 디바이
스의 특정 타입, 디바이스의 접속성, 및/또는 사용자 디바이스와 서버 사이의 이용가능한 대역폭을 인식할 수
있고, 디바이스에 전달되는 데이터를 적절하게 크기결정 및 밸런싱하여, 사용자 대화를 최적화할 수 있다. 이
의 예는, 전송된 데이터의 크기를 낮은 해상도 품질로 감소시키는 것을 포함할 수 있고, 그래서 데이터는 낮은
해상도 디스플레이를 갖는 특정 사용자 디바이스 상에서 디스플레이될 수 있다. 바람직한 실시예에서, 컴퓨팅
네트워크(105) 및/또는 게이트웨이 컴포넌트(140)는, 15개 프레임들/초 또는 그 초과로 그리고 높은 정의 품질
또는 그 초과의 해상도로 동작하는 인터페이스를 제시하기에 충분한 레이트로, 데이터를 사용자 디바이스(120)
에 전달한다.
[0028] 게이트웨이(140)는 하나 또는 그 초과의 사용자들에 대해 컴퓨팅 네트워크(105)로의 로컬 연결을 제공한다. 몇

몇의 실시예들에서, 게이트웨이(140)는, 도 2에 도시된 것과 같은 사용자 디바이스(120) 또는 다른 로컬 디바이
스 상에서 실행되는 다운로드 가능한 소프트웨어 애플리케이션에 의해 구현될 수 있다. 다른 실시예들에서, 게
이트웨이(140)는, 하드웨어 컴포넌트(상기 컴포넌트 상에 적절한 소프트웨어/펌웨어가 저장되어 있고, 상기 컴
포넌트는 프로세서를 가짐)에 의해 구현될 수 있고, 상기 하드웨어는, 사용자 디바이스(120)와 통신하거나 ―
그러나, 사용자 디바이스(120)에 포함되거나 또는 사용자 디바이스(120)에 끌리지는 않음 ― 또는 사용자 디바
이스(120)에 포함되거나 중 어느 한 쪽이다. 게이트웨이(140)는 데이터 네트워크(130)를 통해 컴퓨팅 네트워크
(105)와 통신하고, 컴퓨팅 네트워크(105)와 하나 또는 그 초과의 로컬 사용자 디바이스들(120) 사이의 데이터
교환을 제공한다. 아래에서 더욱 상세히 논의되는 바와 같이, 게이트웨이 컴포넌트(140)는 소프트웨어,
펌웨어, 메모리, 및 프로세싱 회로를 포함할 수 있고, 네트워크(105)와 하나 또는 그 초과의 로컬 사용자 디바
이스들(120) 사이에 통신되는 데이터를 프로세싱할 수 있다.
[0029] 몇몇의 실시예들에서, 게이트웨이 컴포넌트(140)는, 특정 사용자 디바이스(120)에 대해 최적 데이터 프로세싱

능력들을 허용하기 위해, 사용자 디바이스(120)와 컴퓨터 네트워크(105) 사이에 교환되는 데이터의 레이트를 모
니터링 및 레귤레이팅한다. 예컨대, 몇몇의 실시예들에서, 게이트웨이(140)는 디지털 세계의 정적 및 동적 양
상들 둘 다를, 심지어 사용자 디바이스와 연결된 인터페이스를 통해 사용자에게 제시되는 시야를 넘어서는 것들
도 버퍼링 및 다운로딩한다. 그러한 실시예에서, 정적 객체들(구조화된 데이터, 소프트웨어 구현된 방법들, 또
는 둘 다)의 인스턴스들은 메모리(게이트웨이 컴포넌트(140), 사용자 디바이스(120), 또는 둘 다에 국한됨)에
저장될 수 있고, 컴퓨팅 네트워크(105) 및/또는 사용자의 디바이스(120)에 의해 제공되는 데이터에 의해 표시되
는 바와 같은 로컬 사용자의 현재 포지션에 비하여 참조된다. 예컨대 다른 사용자들 및/또는 로컬 사용자에 의
해 제어되는 지능적 소프트웨어 에이전트들 및 객체들을 포함할 수 있는 동적 객체들의 인스턴스들은 고속 메모
리 버퍼에 저장된다. 사용자에게 제시되는 장면 내에서 2-차원 또는 3-차원 객체를 표현하는 동적 객체들은,
예컨대, 움직이고 있지만 변하고 있지는 않은 정적 형상 및 변하고 있는 동적 형상과 같은 컴포넌트 형상들로
쪼개질 수 있다. 변하고 있는 동적 객체의 일부는, 게이트웨이 컴포넌트(140)에 의해 매니징되는, 컴퓨팅 네트
워크(105)를 통해 서버(110)로부터의 실시간의 스레딩된 높은 우선순위 데이터 스트림에 의해 업데이트될 수 있
- 10 -
등록특허 10-1964223
다. 우선순위화된 스레딩된 데이터 스트림의 일 예로서, 사용자 눈의 60도 시야 내에 있는 데이터에는 더욱 주

변에 있는 데이터보다 더 높은 우선순위가 주어질 수 있다. 다른 예는, 배경에 있는 정적 객체들보다, 사용자
의 시야 내에 있는 동적 캐릭터들 및/또는 객체들을 우선순위화하는 것을 포함한다.
[0030] 컴퓨팅 네트워크(105)와 사용자 디바이스(120) 사이의 데이터 연결을 매니징하는 것에 부가하여, 게이트웨이 컴
포넌트(140)는 사용자 디바이스(120)에 제시될 수 있는 데이터를 저장할 수 있거나 그리고/또는 프로세싱할 수
있다. 예컨대, 몇몇의 실시예들에서, 게이트웨이 컴포넌트(140)는, 예컨대 사용자가 보도록 렌더링될 그래픽
객체들을 설명하는 압축된 데이터를 컴퓨팅 네트워크(105)로부터 수신할 수 있고, 컴퓨팅 네트워크(105)로부터
사용자 디바이스(120)에 전송되는 데이터 부하를 완화하기 위해 진보된 렌더링 기술들을 수행할 수 있다. 게이
트웨이(140)가 별도의 디바이스인 다른 예에서, 게이트웨이(140)는, 프로세싱을 위해 데이터를 컴퓨팅 네트워크
(105)에 전송하는 것이 아니라 객체의 로컬 인스턴스에 대한 데이터를 저장할 수 있거나 그리고/또는 프로세싱
할 수 있다.
[0031] 이제 도 3을 또한 참조하면, 디지털 세계들은 사용자의 디바이스의 능력들에 따라 좌우될 수 있는 다양한 포맷

들로 하나 또는 그 초과의 사용자들에 의해 경험될 수 있다. 몇몇의 실시예들에서, 사용자 디바이스(120)는 예
컨대 스마트 폰, 태블릿 디바이스, HUD(heads-up display), 게임 콘솔 또는 웨어러블 디바이스를 포함할 수 있
다. 일반적으로, 사용자 디바이스는, 디스플레이와 커플링된 디바이스 상의 메모리에 저장된 프로그램 코드를
실행하기 위한 프로세서 및 통신 인터페이스를 포함할 것이다. 사용자 디바이스의 예시적 실시예가 도 3에서
예시되고, 여기서 사용자 디바이스는 모바일 웨어러블 디바이스, 즉 헤드-장착 디스플레이 시스템(300)을 포함
한다. 본 기재의 실시예에 따라, 헤드-장착 디스플레이 시스템(300)은 사용자 인터페이스(302), 사용자-감지
시스템(304), 환경-감지 시스템(306), 및 프로세서(308)를 포함한다. 비록 프로세서(308)가 도 3에서 헤드-장
착 시스템(300)과 별도의 분리된 컴포넌트로서 도시되지만, 대안적 실시예에서, 프로세서(308)는 헤드-장착 시
스템(300)의 하나 또는 그 초과의 컴포넌트들과 통합될 수 있거나, 또는 예컨대 게이트웨이(140)와 같은 다른
시스템(100) 컴포넌트들에 통합될 수 있다.
[0032] 사용자 디바이스는, 디지털 세계와 대화하고 디지털 세계를 경험하기 위한 인터페이스(302)를 사용자에게 제시
한다. 그러한 대화는 사용자 및 디지털 세계를 수반할 수 있고, 하나 또는 그 초과의 다른 사용자들이 시스템
(100) 그리고 상기 디지털 세계 내의 객체들과 인터페이싱한다. 일반적으로, 인터페이스(302)는 이미지 및/또
는 오디오 감각 입력(그리고 몇몇의 실시예들에서, 물리적 감각 입력)을 사용자에게 제공한다. 따라서, 인터페
이스(302)는 스피커들(미도시), 그리고 몇몇의 실시예들에서 인간 시력 시스템의 더욱 자연스런 특성들을 구현
하는 3D 뷰잉 및/또는 입체적 3D 뷰잉을 가능케 할 수 있는 디스플레이 컴포넌트(303)를 포함할 수 있다. 몇몇
의 실시예들에서, 디스플레이 컴포넌트(303)는 투명 인터페이스(예컨대, 클리어 OLED)를 포함할 수 있고, 상기
투명 인터페이스는, "오프" 셋팅일 때, 광학 왜곡 또는 컴퓨팅 오버레이가 거의 없는 상태부터 광학 왜곡 또는
컴퓨팅 오버레이가 없는 상태로 사용자 주변의 물리적 환경의 광학적으로 정확한 뷰를 가능케 한다. 아래에 더
욱 상세히 논의되는 바와 같이, 인터페이스(302)는 다양한 시각적/인터페이스 성능 및 기능성을 허용하는 부가
의 셋팅들을 포함할 수 있다.
[0033] 사용자-감지 시스템(304)은, 몇몇의 실시예들에서, 시스템(300)을 착용한 개별 사용자에 관련된 특정 피처들,
특성들, 또는 정보를 검출하도록 동작하는 하나 또는 그 초과의 센서들(310)을 포함할 수 있다. 예컨대, 몇몇
의 실시예들에서, 센서들(310)은 예컨대 다음 중 하나 또는 그 초과와 같은 사용자의 실시간 광학 특성들/측정
들을 검출할 수 있는 카메라 또는 광학 검출/스캐닝 회로를 포함할 수 있다: 동공 수축/팽창, 각각의 동공의 각
도 측정/포지셔닝, 구화율, 눈 형상(눈 형상이 시간에 따라 변하기 때문) 및 다른 해부학적 데이터. 이러한 데
이터는, 사용자의 뷰잉 경험을 최적화하기 위해 인터페이스 시스템(100) 및/또는 헤드-장착 시스템(300)에 의해
사용될 수 있는 정보(예컨대, 사용자의 시각적 초점)를 제공할 수 있거나 또는 상기 정보를 계산하는데 사용될
수 있다. 예컨대, 일 실시예에서, 센서들(310) 각각은 사용자의 눈들 각각에 대해 동공 축소 레이트를 측정할
수 있다. 이러한 데이터는 프로세서(308)(또는 게이트웨이 컴포넌트(140) 또는 서버(110))에 전송될 수 있고,
여기서 데이터는 예컨대 인터페이스 디스플레이(303)의 밝기 셋팅에 대한 사용자의 반응을 결정하는데
사용된다. 인터페이스(302)는, 사용자의 반응에 따라, 예컨대 사용자의 반응이 디스플레이(303)의 밝기 레벨이
너무 높음을 표시한다면 디스플레이(303)를 디밍함으로써 조절될 수 있다. 사용자-감지 시스템(304)은 위에서
논의되거나 또는 도 3에서 예시된 것들 이외의 다른 컴포넌트들을 포함할 수 있다. 예컨대, 몇몇의 실시예들에
서, 사용자-감지 시스템(304)은 사용자로부터 음성 입력을 수신하기 위한 마이크로폰을 포함할 수 있다. 또한,
사용자 감지 시스템은 하나 또는 그 초과의 적외선 카메라 센서들, 하나 또는 그 초과의 가시 스펙트럼 카메라
센서들, 구조화된 광 방출기들 및/또는 센서들, 적외선 광 방출기들, 코히어런트 광 방출기들 및/또는 센서들,
- 11 -
등록특허 10-1964223
자이로(gyro)들, 가속도계들, 자력계들, 근접성 센서들, GPS 센서들, 초음파 방출기들 및 검출기들 및 햅틱 인
터페이스들을 포함할 수 있다.
[0034] 환경-감지 시스템(306)은 사용자 주변의 물리적 환경으로부터 데이터를 획득하기 위한 하나 또는 그 초과의 센
서들(312)을 포함한다. 센서들에 의해 검출되는 정보 또는 객체들은 입력으로서 사용자 디바이스에 제공될 수
있다. 몇몇의 실시예들에서, 이러한 입력은 가상 세계와의 사용자 대화를 표현할 수 있다. 예컨대, 데스크 상
의 가상 키보드를 보는 사용자는 마치 자신이 가상 키보드 상에서 타이핑하는 것처럼 자신의 손가락들을 이용하
여 제스처할 수 있다. 움직이는 손가락들의 모션이 센서들(312)에 의해 캡쳐될 수 있고, 입력으로서 사용자 디
바이스 또는 시스템에 제공될 수 있으며, 여기서 입력은 가상 세계를 변화시키는데 또는 새로운 가상 객체들을
생성하는데 사용될 수 있다. 예컨대, 손가락들의 모션은 타이핑으로서 (소프트웨어 프로그램을 이용하여) 인식
될 수 있고, 인식된 타이핑 제스처는 가상 키보드 상의 가상 키들의 알려진 위치와 결합될 수 있다. 그런
다음, 시스템은 사용자(또는 시스템과 인터페이싱하는 다른 사용자들)에게 디스플레이되는 가상 모니터를 렌더
링할 수 있고, 여기서 가상 모니터는 사용자에 의해 타이핑되는 텍스트를 디스플레이한다.
[0035] 센서들(312)은, 예컨대 연속적으로 및/또는 간헐적으로 프로젝팅되는 적외선의 구조화된 광을 통해, 예컨대 장
면 정보를 해석하기 위한 스캐너 또는 일반적으로 바깥쪽으로 면하는 카메라를 포함할 수 있다. 환경-감지 시
스템(306)은, 정적 객체들, 동적 객체들, 사람들, 제스처들 및 다양한 조명, 대기 및 음향 조건들을 포함하는
로컬 환경을 검출 및 정합함으로써 사용자 주변의 물리적 환경의 하나 또는 그 초과의 엘리먼트들을 맵핑하기
위해 사용될 수 있다. 따라서, 몇몇의 실시예들에서, 환경-감지 시스템(306)은, 로컬 컴퓨팅 시스템(예컨대,
게이트웨이 컴포넌트(140) 또는 프로세서(308)에 임베딩되고 센서들(312)에 의해 검출된 정보 또는 하나 또는
그 초과의 객체들을 디지털로 재구성하도록 동작하는 이미지-기반 3D 재구성 소프트웨어를 포함할 수 있다. 일
예시적 실시예에서, 환경-감지 시스템(306)은 다음 중 하나 또는 그 초과를 제공한다: 모션 캡쳐 데이터(제스처
인식을 포함함), 심도 감지, 얼굴 인식, 객체 인식, 고유 객체 피처 인식, 음성/오디오 인식 및 프로세싱, 음향
소스 로컬화, 잡음 감소, 적외선 또는 유사 레이저 프로젝션, 뿐만 아니라 단색 및/또는 색 CMOS 센서들(또는
다른 유사 센서들), 시야 센서들, 및 다양한 다른 광학-인핸싱 센서들. 환경-감지 시스템(306)이 위에서 논의
되거나 또는 도 3에서 예시된 것들 이외의 다른 컴포넌트들을 포함할 수 있음이 인정되어야 한다. 예컨대, 몇
몇의 실시예들에서, 환경-감지 시스템(306)은 로컬 환경으로부터 오디오를 수신하기 위한 마이크로폰을 포함할
수 있다. 또한, 사용자 감지 시스템은 하나 또는 그 초과의 적외선 카메라 센서들, 하나 또는 그 초과의 가시
스펙트럼 카메라 센서들, 구조 광 방출기들 및/또는 센서들, 적외선 광 방출기들, 코히어런트 광 방출기들 및/
또는 센서들, 자이로들, 가속도계들, 자력계들, 근접성 센서들, GPS 센서들, 초음파 방출기들 및 검출기들 및
햅틱 인터페이스들을 포함할 수 있다.
[0036] 위에서 언급된 바와 같이, 프로세서(308)는, 몇몇의 실시예들에서, 헤드-장착 시스템(300)의 다른 컴포넌트들과
통합될 수 있거나, 인터페이스 시스템(100)의 다른 컴포넌트들과 통합될 수 있거나, 또는 도 3에 도시된 바와
같이 분리된 디바이스(웨어러블 또는 사용자와 별도임)일 수 있다. 프로세서(308)는, 물리적 유선 연결을 통해
또는 예컨대 모바일 네트워크 연결들(셀룰러 텔레폰 및 데이터 네트워크들을 포함함), Wi-Fi 또는 블루투스와
같은 무선 연결을 통해, 헤드-장착 시스템(300)의 다양한 컴포넌트들 및/또는 인터페이스 시스템(100)의 컴포넌
트들에 연결될 수 있다. 프로세서(308)는 메모리 모듈, 집적된 그리고/또는 부가의 그래픽들 프로세싱 유닛,
무선 및/또는 유선 인터넷 접속성, 및 소스(예컨대, 컴퓨팅 네트워크(105), 사용자-감지 시스템(304), 환경-감
지 시스템(306), 또는 게이트웨이 컴포넌트(140))로부터의 데이터를 이미지 및 오디오 데이터로 변환할 수 있는
코덱 및/또는 펌웨어를 포함할 수 있고, 여기서 이미지들/비디오 및 오디오는 인터페이스(302)를 통해 사용자에
게 제시될 수 있다.
[0037] 프로세서(308)는 헤드장착 시스템(300)의 다양한 컴포넌트들에 대한 데이터 프로세싱뿐만 아니라, 헤드-장착 시
스템(300)과 게이트웨이 컴포넌트(140), 그리고 몇몇의 실시예들에서, 컴퓨팅 네트워크(105) 사이의 데이터 교
환을 다룬다. 예컨대, 프로세서(308)는 사용자와 컴퓨팅 네트워크(105) 사이의 데이터 스트리밍을 버퍼링 및
프로세싱하는데 사용될 수 있어, 이로써 매끄럽고 연속적이고 높은 피델리티 사용자 경험이 가능케 된다. 몇몇
의 실시예들에서, 프로세서(308)는 320×240 해상도에서 8개 프레임들/초 내지 높은 정의 해상도(1280×720)에
서 24개 프레임들/초 사이, 또는 그 초과, 예컨대 60-120개 프레임들/초 및 4k 해상도 그리고 그 초과(10k+ 해
상도 및 50,000개 프레임들/초)의 어디든지 달성하기에 충분한 레이트로 데이터를 프로세싱할 수 있다. 부가하
여, 프로세서(308)는, 컴퓨팅 네트워크(105)로부터 실시간으로 스트리밍되는 데이터가 아니라, 사용자에게 제시
될 수 있는 데이터를 저장할 수 있거나 그리고/또는 프로세싱할 수 있다. 예컨대, 몇몇의 실시예들에서, 프로
세서(308)는, 컴퓨팅 네트워크(105)로부터 압축된 데이터를 수신하고, 컴퓨팅 네트워크(105)로부터 사용자 디바
- 12 -
등록특허 10-1964223
이스(120)에 전송되는 데이터 부하를 완화하기 위해 진보된 렌더링 기술들(예컨대, 라이팅 또는 쉐이딩)을 수행
한다. 다른 예에서, 프로세서(308)는, 게이트웨이 컴포넌트(140) 또는 컴퓨팅 네트워크(105)에 데이터를 전송
하는 것이 아니라, 로컬 객체 데이터를 저장할 수 있거나 그리고/또는 프로세싱할 수 있다.
[0038] 몇몇의 실시예들에서, 헤드-장착 시스템(300)은 다양한 시각적/인터페이스 성능 및 기능을 허용하는 다양한 셋
팅들 또는 모드들을 포함할 수 있다. 모드들은 사용자에 의해 수동으로 선택될 수 있거나, 또는 헤드-장착 시
스템(300) 또는 게이트웨이 컴포넌트(140)의 컴포넌트들에 의해 자동으로 선택될 수 있다. 앞서 언급된 바와
같이, 헤드장착 시스템(300)의 일 예는 인터페이스(302)가 실질상 디지털 또는 가상 콘텐츠를 제공하지 않는 "
오프" 모드를 포함한다. 오프 모드에서, 디스플레이 컴포넌트(303)는 투명할 수 있어, 이로써 광학 왜곡 또는
컴퓨팅 오버레이가 거의 없는 상태부터 광학 왜곡 또는 컴퓨팅 오버레이가 없는 상태로 사용자 주변의 물리적
환경의 광학적으로 정확한 뷰가 가능케 된다.
[0039] 일 예시적 실시예에서, 헤드-장착 시스템(300)은 인터페이스(302)가 증강 현실 인터페이스를 제공하는 "증강"

모드를 포함한다. 증강 모드에서, 인터페이스 디스플레이(303)는 실질상 투명할 수 있어, 이로써 사용자가 로
컬 물리적 환경을 보는 것이 허용된다. 동시에, 컴퓨팅 네트워크(105), 프로세서(308), 및/또는 게이트웨이 컴
포넌트(140)에 의해 제공되는 가상 객체 데이터는, 물리적 로컬 환경과 결합하여, 디스플레이(303) 상에 제시된
다.
[0040] 도 4는 인터페이스(302)가 증강 모드로 동작하고 있을 때 사용자가 보는 객체들의 예시적 실시예를 예시한다.

도 4에 도시된 바와 같이, 인터페이스(302)는 물리적 객체(402) 및 가상 객체(404)를 제시한다. 도 4에 예시된
실시예에서, 물리적 객체(402)가 사용자의 로컬 환경에 존재하는 실제 물리적 객체인 반면에, 가상 객체(404)는
시스템(100)에 의해 생성되고 사용자 인터페이스(302)를 통해 디스플레이되는 객체이다. 몇몇의 실시예들에서,
가상 객체(404)는 물리적 환경 내의 고정된 포지션 또는 위치에 디스플레이될 수 있거나(예컨대, 물리적 환경에
위치된 특정 거리 사인 바로 옆에 서있는 가상 원숭이), 또는 사용자 인터페이스/디스플레이(303)에 비해 임의
의 포지션에 위치된 객체로서 사용자에게 디스플레이될 수 있다(예컨대, 디스플레이(303)의 상부 좌측 코너에
보일 수 있는 가상 시계 또는 온도계).
[0041] 몇몇의 실시예들에서, 가상 객체들은 사용자의 시야 내에서 또는 밖에서 물리적으로 제시되는 객체에 의해 트리
거링되거나 또는 상기 객체의 큐 오프(cue off)가 이루어지도록 만들어질 수 있다. 가상 객체(404)는 물리적
객체(402)에 의해 큐 오프되거나 또는 트리거링된다. 예컨대, 물리적 객체(402)는 실제로 스툴일 수 있고, 가
상 객체(404)는 스툴 상에 서있는 가상 동물로서 사용자에게(그리고, 몇몇의 실시예들에서, 시스템(100)과 인터
페이싱하는 다른 사용자들에게) 디스플레이될 수 있다. 그러한 실시예에서, 환경-감지 시스템(306)은, 다양한
피처들 및/또는 형상 패턴들(센서들(312)에 의해 캡쳐됨)을 인식하여 물리적 객체(402)를 스툴로서 식별하기 위
해, 예컨대 프로세서(308)에 저장된 소프트웨어 및/또는 펌웨어를 사용할 수 있다. 예컨대 스툴 상단과 같은
이러한 인식된 형상 패턴들은 가상 객체(404)의 배치를 트리거링하는데 사용될 수 있다. 다른 예들은 벽들, 테
이블들, 가구들, 자동차들, 빌딩들, 사람들, 바닥(floor)들, 플랜트들, 동물들 ― 볼 수 있고, 객체 또는 객체
들에 대한 어떤 관계에서 증강 현실 경험을 트리거링하는데 사용될 수 있는 임의의 객체 ― 을 포함한다.
[0042] 몇몇의 실시예들에서, 트리거링되는 특정 가상 객체(404)는 사용자에 의해 선택될 수 있거나, 또는 헤드-장착

시스템(300) 또는 인터페이스 시스템(100)의 다른 컴포넌트들에 의해 자동으로 선택될 수 있다. 부가하여, 가
상 객체(404)가 자동으로 트리거링되는 실시예들에서, 특정 가상 객체(404)는 가상 객체(404)가 큐 오프되거나
또는 트리거링되도록 하는 특정 물리적 객체(402)(또는 그 피처)에 기초하여 선택될 수 있다. 예컨대, 물리적
객체가 수영장 위에서 연장되는 다이빙 보드로서 식별된다면, 트리거링되는 가상 객체는 스노클, 수영복, 부상
(floatation) 디바이스, 또는 다른 관련 아이템들을 착용한 창조물일 수 있다.
[0043] 다른 예시적 실시예에서, 헤드-장착 시스템(300)은 인터페이스(302)가 가상 현실 인터페이스를 제공하는 "가상"

모드를 포함할 수 있다. 가상 모드에서, 물리적 환경은 디스플레이(303)로부터 생략되고, 컴퓨팅 네트워크
(105), 프로세서(308), 및/또는 게이트웨이 컴포넌트(140)에 의해 제공되는 가상 객체 데이터가 디스플레이
(303) 상에 제시된다. 물리적 환경의 생략은, 시각적 디스플레이(303)를 (예컨대, 커버를 통해) 물리적으로 차
단함으로써 또는 인터페이스(302)의 피처를 통해 ― 여기서, 디스플레이(303)는 불투명 셋팅으로 이행함 ― 달
성될 수 있다. 가상 모드에서, 라이브 및/또는 저장된 시각적 및 오디오 감각은 인터페이스(302)를 통해 사용
자에게 제시될 수 있고, 사용자는 인터페이스(302)의 가상 모드를 통해 디지털 세계(디지털 객체들, 다른 사용
자들 등등)를 경험하고 상기 디지털 세계와 대화한다. 따라서, 가상 모드에서 사용자에게 제공되는 인터페이스
는, 가상 디지털 세계를 포함하는 가상 객체 데이터로 구성된다.
- 13 -
등록특허 10-1964223
[0044] 도 5는 헤드장착 인터페이스(302)가 가상 모드로 동작하고 있을 때 사용자 인터페이스의 예시적 실시예를 예시

한다. 도 5에 도시된 바와 같이, 사용자 인터페이스는 디지털 객체들(510)로 구성된 가상 세계(500)를 제시하
고, 여기서 디지털 객체들(510)은 대기, 날씨, 지형, 빌딩들, 및 사람들을 포함할 수 있다. 비록 그것이 도 5
에서 예시되지 않지만, 디지털 객체들은 예컨대 플랜트들, 차량들, 동물들, 창조물들, 머신들, 인공 지능, 위치
정보, 그리고 가상 세계(500)를 정의하는 임의의 다른 객체 또는 정보를 또한 포함할 수 있다.
[0045] 다른 예시적 실시예에서, 헤드-장착 시스템(300)은 헤드-장착 시스템(300)의 다양한 피처들(뿐만 아니라, 가상
및 증강 모드들의 피처들)이 결합되어 하나 또는 그 초과의 맞춤(custom) 인터페이스 모드들이 생성될 수 있는
"블렌드" 모드를 포함할 수 있다. 일 예시적 맞춤 인터페이스 모드에서, 물리적 환경은 디스플레이(303)로부터
생략되고, 가상 객체 데이터는 가상 모드와 유사한 방식으로 디스플레이(303) 상에 제시된다. 그러나, 이러한
예시적 맞춤 인터페이스 모드에서, 가상 객체들은 완전히 가상일 수 있거나(즉, 가상 객체들은 로컬 물리적 환
경에 존재하지 않음), 또는 가상 객체들은 물리적 객체를 대신하여 인터페이스(302)에서 가상 객체로서 렌더링
된 실제 로컬 물리적 객체들일 수 있다. 따라서, 이러한 특정 맞춤 모드(본 명세서에서, 블렌드 가상 인터페이
스 모드로 지칭됨)에서, 라이브 및/또는 저장된 시각적 및 오디오 감각은 인터페이스(302)를 통해 사용자에게
제시될 수 있고, 사용자는 완전히 가상의 객체들 및 렌더링된 물리적 객체들을 포함하는 디지털 세계를 경험하
고 상기 디지털 세계와 대화한다.
[0046] 도 6은 블렌드 가상 인터페이스 모드에 따라 동작하는 사용자 인터페이스의 예시적 실시예를 예시한다. 도 6에
도시된 바와 같이, 사용자 인터페이스는 완전히 가상의 객체들(610) 및 렌더링된 물리적 객체들(620)(장면에 다
른 방식으로 물리적으로 존재하는 객체들의 렌더링들)로 구성된 가상 세계(600)를 제시한다. 도 6에 예시된 예
에 따라, 렌더링된 물리적 개체들(620)은 빌딩(620A), 땅(620B), 및 플랫폼(620C)을 포함하고, 객체들이 렌더링
됨을 사용자에게 표시하기 위해 볼드체의 아웃라인(630)으로 도시된다. 부가하여, 완전히 가상의 객체들(610)
은 부가의 사용자(610A), 구름들(610B), 태양(610C), 및 플랫폼(620C) 위의 불꽃들(610D)을 포함한다. 완전히
가상의 객체들(610)이 예컨대 대기, 날씨, 지형, 빌딩들, 사람들, 플랜트들, 차량들, 동물들, 창조물들,
머신들, 인공 지능, 위치 정보, 및 가상 세계(600)를 정의하지만 로컬 물리적 환경에 존재하는 객체들로부터 렌
더링되지 않은 임의의 다른 객체 또는 정보를 포함할 수 있다는 것이 인정되어야 한다. 반대로, 렌더링된 물리
적 객체들(620)은 인터페이스(302)에서 가상 객체로서 렌더링된 실제 로컬 물리적 객체들이다. 볼드체의 아웃
라인(630)은 렌더링된 물리적 객체들을 사용자에게 표시하기 위한 일 예를 표현한다. 이와 같이, 렌더링된 물
리적 객체들은 본 명세서에서 기재된 것들 이외의 방법들을 사용하여 이와 같이 표시될 수 있다.
[0047] 몇몇의 실시예들에서, 렌더링된 물리적 객체들(620)은, 환경-감지 시스템(306)의 센서들(312)을 이용하여(또는
모션 또는 이미지 캡쳐 시스템과 같은 다른 디바이스들을 이용하여) 검출될 수 있고, 예컨대 프로세싱 회로
(308)에 저장된 소프트웨어 및/또는 펌웨어에 의해 디지털 객체 데이터로 변환될 수 있다. 따라서, 사용자가
블렌드 가상 인터페이스 모드로 시스템(100)과 인터페이싱하므로, 다양한 물리적 객체들이 렌더링된 물리적 객
체들로서 사용자에게 디스플레이될 수 있다. 이는, 로컬 물리적 환경을 여전히 안전하게 탐험할 수 있도록 하
면서, 사용자가 시스템(100)과 인터페이싱하도록 하기에 특히 유용할 수 있다. 몇몇의 실시예들에서,
사용자는, 렌더링된 물리적 객체들을 선택적으로 제거하거나 또는 인터페이스 디스플레이(303)에 부가할 수 있
다.
[0048] 다른 예시적 맞춤 인터페이스 모드에서, 인터페이스 디스플레이(303)는 실질상 투명할 수 있어, 이로써 다양한
로컬 물리적 객체들이 렌더링된 물리적 객체들로서 사용자에게 디스플레이되면서, 사용자가 로컬 물리적 환경을
보게 된다. 이러한 예시적 맞춤 인터페이스 모드는, 앞선 예에 대하여 위에서 논의된 바와 같이 가상 객체들
중 하나 또는 그 초과가 렌더링된 물리적 객체들일 수 있다는 점을 제외하고, 증강 모드와 유사하다.
[0049] 전술된 예시적 맞춤 인터페이스 모드들은 헤드-장착 시스템(300)의 블렌드 모드에 의해 제공될 수 있는 다양한
맞춤 인터페이스 모드들 중 소수의 예시적 실시예들을 표현한다. 따라서, 본 기재의 범위로부터 벗어남 없이,
위에서 논의된 다양한 모드들 그리고 헤드장착 시스템(300)의 컴포넌트들에 의해 제공되는 기능성 및 피처들의
다양한 결합으로부터 다양한 다른 맞춤 인터페이스 모드들이 생성될 수 있다.
[0050] 본 명세서에서 논의되는 실시예들은 단지 오프 모드, 증강 모드, 가상 모드, 또는 블렌드 모드로 동작하는 인터
페이스를 제공하기 위한 소수의 예들을 설명하며, 헤드-장착 시스템(300)의 컴포넌트들의 기능성 또는 각각의
인터페이스 모드들의 범위 또는 콘텐츠를 제한하려고 의도되지 않는다. 예컨대, 몇몇의 실시예들에서, 가상 객
체들은 사용자에게 디스플레이되는 데이터(시간, 온도, 고도 등등), 시스템(100)에 의해 생성되거나 그리고/또
는 선택되는 객체들, 사용자에 의해 생성되거나 그리고/또는 선택되는 객체들, 또는 심지어 시스템(100)과 인터
- 14 -
등록특허 10-1964223
페이싱하는 다른 사용자들을 표현하는 객체들을 포함할 수 있다. 부가하여, 가상 객체들은 물리적 객체들의 확
장(예컨대, 물리적 플랫폼으로부터 성장하는 가상 조각)을 포함할 수 있고, 시각적으로 물리적 객체에 연결될
수 있거나 또는 물리적 객체로부터 연결해제될 수 있다.
[0051] 또한, 가상 객체들은 동적일 수 있고, 시간에 따라 변할 수 있고, 사용자 또는 다른 사용자들, 물리적 객체들,
그리고 다른 가상 객체들 사이의 다양한 관계들(예컨대, 위치, 거리 등등)에 따라 변할 수 있고, 그리고/또는
헤드-장착 시스템(300), 게이트웨이 컴포넌트(140) 또는 서버들(110)의 소프트웨어 및/또는 펌웨어에서 특정된
다른 변수들에 따라 변할 수 있다. 예컨대, 특정 실시예들에서, 가상 객체는 사용자 디바이스 또는 그 컴포넌
트에 응답할 수 있고(예컨대, 햅틱 디바이스가 가상 볼 바로 옆에 배치될 때, 상기 가상 볼이 움직임), 물리적
또는 구두 사용자 대화에 응답할 수 있고(예컨대, 가상 창조물이, 사용자가 상기 가상 창조물에 접근할 때 달아
나거나, 또는 사용자가 상기 가상 창조물에게 말할 때 말함) ― 의자가 가상 창조물에 던져지고, 상기 창조물이
상기 의자를 피함 ―, 다른 가상 객체들에 응답할 수 있고(예컨대, 제1 가상 창조물이 제2 가상 창조물을 볼 때
상기 제1 가상 창조물이 반응함), 위치, 거리, 온도, 시간 등등과 같은 물리적 변수들 또는 사용자의 환경의 다
른 물리적 객체들에 반응할 수 있다(예컨대, 물리적 자동차가 지날 때, 물리적 거리에 서있도록 도시된 가상 창
조물이 평편하게 됨).
[0052] 본 명세서에서 논의되는 다양한 모드들은 헤드-장착 시스템(300) 이외의 사용자 디바이스들에 적용될 수 있다.
예컨대, 증강 현실 인터페이스가 모바일 폰 또는 태블릿 디바이스를 통해 제공될 수 있다. 그러한 실시예에서,
폰 또는 태블릿은 카메라를 사용하여, 사용자 주변의 물리적 환경을 캡쳐할 수 있고, 가상 객체들은 폰/태블릿
디스플레이 스크린 상에 오버레이될 수 있다. 부가하여, 가상 모드는, 폰/태블릿의 디스플레이 스크린 상에 디
지털 세계를 디스플레이함으로써 제공될 수 있다. 따라서, 이러한 모드들은, 본 명세서에서 논의되는 폰/태블
릿의 컴포넌트들뿐만 아니라 사용자 디바이스에 연결되거나 또는 사용자 디바이스와 함께 사용되는 다른 컴포넌
트들을 이용하여 위에서 설명된 바와 같은 다양한 맞춤 인터페이스 모드들을 생성하기 위해서 블렌딩될 수
있다. 예컨대, 블렌드 가상 인터페이스 모드는, 컴퓨터 모니터, 텔레비전 스크린, 또는 모션 또는 이미지 캡쳐
시스템과 함께 동작하는 카메라가 없는 다른 디바이스에 의해 제공될 수 있다. 이러한 예시적 실시예에서, 가
상 세계는 모니터/스크린으로부터 보일 수 있고, 객체 검출 및 렌더링은 모션 또는 이미지 캡쳐 시스템에 의해
수행될 수 있다.
[0053] 도 7은 본 기재의 예시적 실시예를 예시하고, 여기서 상이한 지리적 위치들에 위치된 두 명의 사용자들 각각은
각자의 각각의 사용자 디바이스들을 통해 다른 사용자 그리고 공통 가상 세계와 대화한다. 이러한 실시예에서,
두 명의 사용자들(701 및 702)은 가상 볼(703)(임의의 타입의 가상 객체)을 왔다갔다 던지고 있고, 여기서 각각
의 사용자는 가상 세계에 대해 다른 사용자의 영향을 관찰할 수 있다(예컨대, 각각의 사용자는, 가상 볼이 방향
들을 바꾸고 다른 사용자에 의해 잡히고 등등을 관찰함). 가상 객체들(즉, 가상 볼(703))의 움직임 및 위치가
컴퓨팅 네트워크(105)의 서버들(110)에 의해 추적되기 때문에, 시스템(100)은 몇몇의 실시예들에서 각각의 사용
자에 대한 볼(703)의 도달의 정확한 위치 및 타이밍을 사용자들(701 및 702)에게 통신할 수 있다. 예컨대, 제1
사용자(701)가 런던에 위치된다면, 사용자(701)는 시스템(100)에 의해 계산된 속도로 로스앤젤레스에 위치된 제
2 사용자(702)에게 볼(703)을 던질 수 있다. 따라서, 시스템(100)은 볼의 도달의 정확한 시간 및 위치를 (예컨
대, e-메일, 텍스트 메시지, 인스턴트 메시지 등등을 통해) 제2 사용자(702)에게 통신할 수 있다. 이와 같이,
제2 사용자(702)는 자신의 디바이스를 사용하여, 볼(703)이 특정된 시간에 도달하고 위치되는 것을 볼 수 있다.
또한, 하나 또는 그 초과의 사용자들은 지구-위치 맵핑 소프트웨어(또는 유사한 소프트웨어)를 사용하여, 상기
하나 또는 그 초과의 사용자들이 지구에 걸쳐서 가상으로 여행함에 따라 하나 또는 그 초과의 가상 객체들을 추
적할 수 있다. 이의 예는, 3D 헤드-장착 디스플레이를 착용한 사용자가 하늘을 올려다보고 실세계 상에
중첩된, 머리 위를 날고 있는 가상 비행기를 보는 것일 수 있다. 가상 비행기는 사용자에 의해, 지능적 소프트
웨어 에이전트들(사용자 디바이스 또는 게이트웨이 상에서 실행되는 소프트웨어), 로컬 및/또는 원격일 수 있는
다른 사용자들, 및/또는 이러한 결합들 중 임의의 결합에 의해 이동될 수 있다.
[0054] 앞서 언급된 바와 같이, 사용자 디바이스는 햅틱 인터페이스 디바이스를 포함할 수 있고, 여기서 햅틱 디바이스
가 가상 객체에 비해 임의의 물리적 공간적 위치에 위치되는 것으로 시스템(100)에 의해 결정될 때, 햅틱 인터
페이스 디바이스는 피드백(예컨대, 저항, 진동, 광들, 사운드 등등)을 사용자에게 제공한다. 예컨대, 도 7에
대하여 위에서 설명된 실시예는, 도 8에 도시된 바와 같은 햅틱 디바이스(802)의 사용을 포함하도록 확장될 수
있다.
[0055] 이러한 예시적 실시예에서, 햅틱 디바이스(802)는 가상 세계에서 야구용 배트로서 디스플레이될 수 있다. 볼
(703)이 도달할 때, 사용자(702)는 가상 볼(703)에 햅틱 디바이스(802)를 스윙할 수 있다. 시스템(100)이 햅틱
- 15 -
등록특허 10-1964223
디바이스(802)에 의해 제공되는 가상 배트가 볼(703)과 "접촉"했다고 결정한다면, 햅틱 디바이스(802)는 진동할

수 있거나 또는 다른 피드백을 사용자(702)에게 제공할 수 있고, 가상 볼(703)은 볼-대-배트 접촉의 검출된 속
도, 방향, 및 타이밍에 따라 시스템(100)에 의해 계산된 방향으로 가상 배트에 맞고 튀어나올 수 있다.
[0056] 몇몇의 실시예들에서, 기재된 시스템(100)은 혼합 모드 인터페이싱을 용이하게 할 수 있고, 여기서 다수의 사용
자들은 상이한 인터페이스 모드들(예컨대, 증강, 가상, 블렌드 등등)을 이용하여 공통 가상 세계(그리고 그 내
에 포함된 가상 객체들)와 인터페이싱할 수 있다. 예컨대, 가상 인터페이스 모드로 특정 가상 세계와 인터페이
싱하는 제1 사용자가 증강 현실 모드로 동일한 가상 세계와 인터페이싱하는 제2 사용자와 대화할 수 있다.
[0057] 도 9a는 제1 사용자(901)(블렌드 가상 인터페이스 모드로 시스템(100)의 디지털 세계와 인터페이싱함) 및 제1

객체(902)가 완전한 가상 현실 모드로 시스템(100)의 동일한 디지털 세계와 인터페이싱하는 제2 사용자(922)에
게 가상 객체로서 보이는 예를 예시한다. 위에서 설명된 바와 같이, 블렌드 가상 인터페이스 모드를 통해 디지
털 세계와 인터페이싱할 때, 로컬 물리적 객체들(예컨대, 제1 사용자(901) 및 제1 객체(902))은 가상 세계에서
가상 객체들로서 스캐닝 및 렌더링될 수 있다. 제1 사용자(901)는 예컨대 모션 캡쳐 시스템 또는 유사 디바이
스에 의해 스캐닝될 수 있고, 가상 세계에서 (모션 캡쳐 시스템, 게이트웨이 컴포넌트(140), 사용자 디바이스
(120), 시스템 서버들(110) 또는 다른 디바이스들에 저장된 소프트웨어/펌웨어에 의해) 제1 렌더링된 물리적 객
체(931)로서 렌더링될 수 있다. 유사하게, 제1 객체(902)는 예컨대 헤드-장착 인터페이스(300)의 환경-감지 시
스템(306)에 의해 스캐닝될 수 있고, 가상 세계에서 (프로세서(308), 게이트웨이 컴포넌트(140), 시스템 서버들
(110) 또는 다른 디바이스들에 저장된 소프트웨어/펌웨어에 의해) 제2 렌더링된 물리적 객체(932)로서 렌더링될
수 있다. 제1 사용자(901) 및 제1 객체(902)는 도 9a의 제1 일부분(910)에서 물리적 세계의 물리적 객체들로서
도시된다. 도 9a의 제2 일부분(920)에서, 제1 사용자(901) 및 제1 객체(902)는 그들이 완전 가상 현실 모드로
시스템(100)의 동일한 디지털 세계와 인터페이싱하는 제2 사용자(922)에게 제1 렌더링된 물리적 객체(931) 및
제2 렌더링된 물리적 객체(932)로서 보이기 때문에 도시된다.
[0058] 도 9b는 혼합 모드 인터페이싱의 다른 예시적 실시예를 예시하며, 여기서 제1 사용자(901)는 위에서 논의된 바
와 같은 블렌드 가상 인터페이스 모드로 디지털 세계와 인터페이싱하고 있고, 제2 사용자(922)는 증강 현실 모
드로 동일한 디지털 세계(그리고 제2 사용자의 물리적 로컬 환경(925))와 인터페이싱하고 있다. 도 9b의 실시
예에서, 제1 사용자(901) 및 제1 객체(902)는 제1 물리적 위치(915)에 위치되고, 제2 사용자(922)는 제1 위치
(915)로부터의 어떤 거리만큼 분리된 상이한 제2의 물리적 위치(925)에 위치된다. 이러한 실시예에서, 가상 객
체들(931 및 932)은 제2 위치(925)에 대응하는 가상 세계 내의 위치로 실시간(또는 거의 실시간)으로 이동
(transpose)될 수 있다. 따라서, 제2 사용자(922)는, 제2 사용자의 물리적 로컬 환경(925)에서, 제1 사용자
(901) 및 제1 객체(902)를 각각 표현하는 렌더링된 물리적 객체들(931 및 932)을 관찰할 수 있고 상기 렌더링된
물리적 객체들(931 및 932)과 대화할 수 있다.
[0059] 도 10은 증강 현실 모드로 시스템(100)과 인터페이싱할 때 사용자의 뷰의 예시적 예시를 예시한다. 도 10에 도
시된 바와 같이, 사용자는 로컬 물리적 환경(즉, 다수의 빌딩들을 갖는 도시)뿐만 아니라 가상
캐릭터(1010)(즉, 가상 객체)를 본다. 가상 캐릭터(1010)의 포지션은 2D 시각적 타겟(예컨대, 게시판, 엽서 또
는 잡지) 및/또는 빌딩들, 자동차들, 사람들, 동물들, 비행기들, 빌딩의 일부분들, 및/또는 임의의 3D 물리적
객체, 가상 객체와 같은 하나 또는 그 초과의 3D 기준 프레임들, 및/또는 이들의 결합들에 의해 트리거링될 수
있다. 도 10에 예시된 예에서, 도시에서 빌딩들의 알려진 포지션은 가상 캐릭터(1010)를 렌더링하기 위한 정합
기점들 및/또는 정보 및 키 피처들을 제공할 수 있다. 부가하여, 사용자의 지리공간적(geospatial) 위치(예컨
대, GPS, 애티튜드(attitude)/포지션 센서들 등등에 의해 제공됨) 또는 빌딩들에 대한 모바일 위치는, 가상 캐
릭터(들)(1010)를 디스플레이하는데 사용되는 데이터의 송신을 트리거링하기 위해 컴퓨팅 네트워크(105)에 의해
사용되는 데이터를 포함할 수 있다. 몇몇의 실시예들에서, 가상 캐릭터(1010)를 디스플레이하는데 사용되는 데
이터는, 렌더링된 캐릭터(1010) 및/또는 가상 캐릭터(1010) 또는 그 일부분들을 렌더링하기 위한 명령들(게이트
웨이 컴포넌트(140) 및/또는 사용자 디바이스(120)에 의해 수행될 것임)을 포함할 수 있다. 몇몇의 실시예들에
서, 사용자의 지리공간적 위치가 이용가능하지 않거나 또는 알려지지 않았다면, 서버(110), 게이트웨이 컴포넌
트(140), 및/또는 사용자 디바이스(120)는 여전히, 시간의 함수로서 사용자의 최종 알려진 포지션 및/또는 다른
파라미터들을 이용하여 특정 가상 객체들 및/또는 물리적 객체들이 어디에 위치될 수 있는지를 추정하는 추정
알고리즘을 이용하여 가상 객체(1010)를 디스플레이할 수 있다. 이는, 사용자의 센서들이 가려지게 되거나 그
리고/또는 다른 기능 불량들을 경험한다면 임의의 가상 객체들의 포지션을 결정하는데 또한 사용될 수 있다.
[0060] 몇몇의 실시예들에서, 가상 캐릭터들 또는 가상 객체들은 가상 조각상을 포함할 수 있고, 여기서 가상 조각상의
렌더링은 물리적 객체에 의해 트리거링된다. 예컨대, 이제 도 11을 참조하면, 가상 조각상(1110)이 실제 물리
- 16 -
등록특허 10-1964223
적 플랫폼(1120)에 의해 트리거링될 수 있다. 조각상(1110)의 트리거링은 사용자 디바이스 또는 시스템(100)의

다른 컴포넌트들에 의해 검출된 시각적 객체 또는 피처(예컨대, 기점들, 설계 피처들, 기하학적 구조, 패턴들,
물리적 위치, 고도 등등)에 응답하는 것일 수 있다. 사용자가 사용자 디바이스 없이 플랫폼(1120)을 볼 때, 사
용자는 조각상(1110)이 없는 플랫폼(1120)을 본다. 그러나 사용자가 사용자 디바이스를 통해 플랫폼(1120)을
볼 때, 사용자는 도 11에 도시된 바와 같이 플랫폼(1120) 상의 조각상(1110)을 본다. 조각상(1110)은 가상 객
체이고, 그러므로 정적일 수 있거나, 애니메이팅될 수 있거나, 시간에 따라 또는 사용자의 뷰잉 포지션에 대하
여 변할 수 있거나, 또는 심지어 특정 사용자가 조각상(1110)을 보고 있을 때에 따라 변할 수 있다. 예컨대,
사용자가 작은 어린이라면, 조각상은 개일 수 있고; 그러나, 관찰자가 성인 남자라면, 조각상은 도 11에 도시된
바와 같이 대형 로봇일 수 있다. 이들은 사용자 종속적 및/또는 상태 종속적 경험들의 예들이다. 이는, 하나
또는 그 초과의 사용자들이 하나 또는 그 초과의 가상 객체들을 단독으로 그리고/또는 물리적 객체들과 결합하
여 인지하고 가상 객체들의 맞춤화된 및 개인화된 버전들을 경험하는 것을 가능케 할 것이다. 조각상(1110)(또
는 그 일부분들)은, 예컨대 사용자 디바이스 상에 설치된 소프트웨어/펌웨어를 포함하는 시스템의 다양한 컴포
넌트들에 의해 렌더링될 수 있다. 가상 객체(즉, 조각상(1110))의 정합 피처들과 함께, 사용자 디바이스의 위
치 및 고도를 표시하는 데이터를 이용하여, 가상 객체(즉, 조각상(1110))는 물리적 객체(즉, 플랫폼(1120))와
관계를 형성한다. 예컨대, 하나 또는 그 초과의 물리적 객체들과 하나 또는 그 초과의 가상 객체들 사이의 관
계는 하나 또는 그 초과의 다른 가상 객체들에의 거리, 포지셔닝, 시간, 지리적-위치, 근접성의 함수일 수 있거
나, 그리고/또는 임의의 종류의 가상 및/또는 물리적 데이터를 포함하는 임의의 다른 기능적 관계일 수 있다.
몇몇의 실시예들에서, 사용자 디바이스의 이미지 인식 소프트웨어는 디지털-대-물리적 객체 관계를 추가로 개선
시킬 수 있다.
[0061] 기재된 시스템 및 방법에 의해 제공되는 대화식 인터페이스는, 예컨대 하나 또는 그 초과의 가상 환경들 및 객
체들과 대화하는 것, 다른 사용자들과 대화하는 것, 뿐만 아니라 광고들, 음악 콘서트들, 및 영화들을 포함하는
다양한 형태들의 미디어 콘텐츠를 경험하는 것과 같은 다양한 동작들을 용이하게 하도록 구현될 수 있다. 따라
서, 기재된 시스템은, 사용자가 미디어 콘텐츠를 보거나 또는 들을 뿐만 아니라, 오히려 미디어 콘텐츠에 액티
브하게 참여하고 경험하도록, 사용자 대화를 용이하게 한다. 몇몇의 실시예들에서, 사용자 참여는 기존 콘텐츠
를 변경하는 것 또는 하나 또는 그 초과의 가상 세계들에서 렌더링될 새로운 콘텐츠를 생성하는 것을 포함할 수
있다. 몇몇의 실시예들에서, 콘텐츠를 생성하는 사용자들 및/또는 미디어 콘텐츠는 하나 또는 그 초과의 가상
세계들의 신화창조(mythopoeia)에 맞춰 테마가 정해질 수 있다.
[0062] 일 예에서, 음악가들(또는 다른 사용자들)은 특정 가상 세계와 대화하는 사용자들에게 렌더링될 음악 콘텐츠를

생성할 수 있다. 음악 콘텐츠는 예컨대 다양한 싱글들, EP들, 앨범들, 비디오들, 단편 영화들, 및 콘서트 공연
들을 포함할 수 있다. 일 예에서, 음악가들에 의해 수행되는 가상 콘서트를 동시에 경험하기 위해 많은 수의
사용자들이 시스템(100)과 인터페이싱할 수 있다.
[0063] 몇몇의 실시예들에서, 생성된 미디어는 특정 엔티티(예컨대, 밴드, 아티스트, 사용자 등등)와 연관된 고유 식별
자 코드를 포함할 수 있다. 코드는 알파뉴메릭 캐릭터들의 세트, UPC 코드들, QR 코드들, 2D 이미지 트리거들,
3D 물리적 객체 피처 트리거들, 또는 다른 디지털 마크, 뿐만 아니라 사운드, 이미지, 및/또는 둘 다의 형태일
수 있다. 몇몇의 실시예들에서, 코드는 또한 시스템(100)을 이용하여 인터페이싱될 수 있는 디지털 미디어와
함께 임베딩될 수 있다. 사용자는 (예컨대, 요금의 지불을 통해) 코드를 획득할 수 있고, 상기 코드를 교환
(redeem)하여, 식별자 코드와 연관된 엔티티에 의해 생성되는 미디어 콘텐츠에 액세스할 수 있다. 미디어 콘텐
츠는 사용자의 인터페이스에 부가될 수 있거나 또는 사용자의 인터페이스로부터 제거될 수 있다.
[0064] 일 실시예에서, 하나의 컴퓨팅 시스템으로부터 다른 컴퓨팅 시스템으로, 예컨대 클라우드 컴퓨팅 시스템으로부
터 사용자에 커플링된 로컬 프로세서로, 실시간 또는 거의 실시간의 비디오 데이터를 낮은 지연으로 전달하는
컴퓨테이션 및 대역폭 제한들을 방지하기 위해, 다양한 형상들 및 기하학적 구조들에 관한 파라메트릭 정보가,
표면들을 정의하기 위해 트랜스퍼 및 활용될 수 있고, 동시에 정적 또는 동적 세부사항, 예컨대 파라메트릭적으
로 재생된 얼굴 기하학적 구조에 따라 맵핑된 사람의 얼굴의 비트맵-기반 비디오 세부사항을 유발하기 위해 이
러한 표면들에 텍스처들이 트랜스퍼 및 부가될 수 있다. 다른 예로서, 시스템이 사람의 얼굴을 인식하도록 구
성되고 사람의 아바타가 증강 세계에 위치됨을 알고 있다면, 시스템은 하나의 비교적 큰 셋업 트랜스퍼에서 적
절한 세계 정보 및 사람의 아바타 정보를 전달하도록 구성될 수 있고, 그 이후, 로컬 렌더링을 위한, 도 3에 묘
사된 것(308)과 같은 로컬 컴퓨팅 시스템으로의 나머지 트랜스퍼들은 사람의 뼈대 구조의 모션 파라미터들 및
사람의 얼굴의 움직이는 비트맵들 ― 전부는 실시간 비디오의 초기 셋업 트랜스퍼 또는 전달에 비해 더 낮은 대
역폭의 크기 순서들로 있음 ― 과 같은 파라미터 및 텍스처 업데이트들로 제한될 수 있다. 따라서, 클라우드-
- 17 -
등록특허 10-1964223
기반 및 로컬 컴퓨팅 자산들은 통합된 방식으로 사용될 수 있고, 이때 클라우드는 비교적 낮은 지연을 요구하지
않는 컴퓨테이션을 다루고, 로컬 프로세싱 자산들은 낮은 지연이 귀한 작업들을 다루며, 그러한 경우에서 로컬
시스템들에 트랜스퍼된 데이터의 형태는 바람직하게, 그러한 데이터의 양의 형태로 인해(즉, 파라메트릭 정보,
텍스처들 등등 대 모든 각각의 것의 실시간 비디오) 비교적 낮은 대역폭에서 전달된다.
[0065] 도 15를 미리 참조하면, 개략도가 클라우드 컴퓨팅 자산들(46)과 로컬 프로세싱 자산들(308, 120) 사이의 조정
을 예시한다. 일 실시예에서, 클라우드(46) 자산들은 예컨대 유선 또는 무선 네트워킹(무선은 이동성을 위해
바람직하고, 유선은 원해질 수 있는 특정 고-대역폭 또는 높은-데이터-볼륨 트랜스퍼들을 위해 바람직함)을 통
해, 로컬 컴퓨팅 자산들(120, 308), 예컨대 사용자의 헤드(120) 또는 벨트(308)에 커플링되도록 구성된 구조물
에 하우징될 수 있는 프로세서 및 메모리 구성들 중 하나 또는 둘 다에 직접(40, 42) 동작 가능하게
커플링된다. 사용자에 국한된 이러한 컴퓨팅 자산들은 유선 및/또는 무선 접속성 구성들(44)을 통해 서로에 동
작 가능하게 또한 커플링될 수 있다. 일 실시예에서, 낮은-관성 및 작은-사이즈의 헤드 장착 서브시스템(120)
을 유지하기 위해, 사용자와 클라우드(46) 사이의 주요 트랜스퍼가 벨트-기반 서브시스템(308)과 클라우드 사이
의 링크를 통해 이루어질 수 있고, 이때 헤드 장착 서브시스템(120)은 주로, 예컨대 퍼스널 컴퓨팅 주변 접속성
애플리케이션들에서 현재 사용되는 바와 같이, "UWB(ultra-wideband)" 접속성과 같은 무선 접속성을 이용하여
벨트-기반 서브시스템(308)에 데이터-테더링(data-tethering)된다.
[0066] 효율적인 로컬 및 원격 프로세싱 조정, 그리고 사용자에 대한 적절한 디스플레이 디바이스, 예컨대 사용자 인터
페이스(302) 또는 도 3에서 특징으로 된 사용자 "디스플레이 디바이스"를 이용하여, 도 14를 참조하여 아래에
설명되는 디스플레이 디바이스(14), 또는 그 변형들, 사용자의 현재 실제 또는 가상 위치에 적절한 하나의 세계
의 양상들은 사용자에게 트랜스퍼 또는 "전달"될 수 있고 효율적인 방식으로 업데이트될 수 있다. 정말로, 증
강 현실 모드로 가상 현실 시스템("VRS(virtual reality system)")을 활용하는 한 명의 사람과 제1 사람에 국한
된 동일 세계를 탐험하기 위해 완전히 가상의 모드로 VRS를 활용하는 다른 사람을 이용한 일 실시예에서, 두 명
의 사용자들은 다양한 방식들로 상기 세계에서 서로를 경험할 수 있다. 예컨대, 도 12를 참조하면, 도 11을 참
조하여 설명된 것과 유사한 시나리오가 묘사되며, 이때 완전한 가상 현실 시나리오로부터 묘사된 증강 현실 세
계를 통과 날고 있는 제2 사용자의 아바타(2)의 시각화의 부가가 있다. 다시 말해, 도 12에 묘사된 장면은 제1
사람에 대해 증강 현실에서 경험 및 디스플레이될 수 있다 ― 이때, 상기 장면에서 로컬 세계 주변의 실제 물리
적 엘리먼트들, 예컨대 땅, 배경의 빌딩들, 조각상 플랫폼(1120)에 부가하여, 두 개의 증강 현실 엘리먼트들(조
각상(1110) 및 제2 사람의 날고 있는 호박 벌 아바타(2))이 디스플레이됨 ―. 아바타(2)가 제1 사람에 국한된
세계를 통해 날아감에 따라 제1 사람이 제2 사람의 아바타(2)의 진전을 시각화하도록 하기 위해 동적 업데이팅
이 활용될 수 있다.
[0067] 다시, 위에서 설명된 바와 같은 구성 ― 여기서, 클라우드 컴퓨팅 자원들 상에 상주할 수 있고 그곳으로부터 분
배될 수 있는 하나의 세계 모델이 존재함 ― 을 이용하여, 그러한 세계가 거의 실시간 비디오 데이터 등등을 전
달하려고 노력하는데 바람직한 비교적 낮은 대역폭 형태로 하나 또는 그 초과의 사용자들에게 "전달가능"할 수
있다. (즉, 도 12에 도시된 바와 같은) 조각상 가까이 서있는 사람의 증강 경험이 클라우드-기반 세계 모델에
의해 통보될 수 있고, 그의 서브세트가, 뷰를 완성시키기 위해, 상기 사용자들 및 각자의 로컬 디스플레이 디바
이스에게 이르기까지 전달될 수 있다. 데스크 상에 놓인 퍼스널 컴퓨터만큼 단순할 수 있는 원격 디스플레이
디바이스에 앉아 있는 사람이 클라우드로부터 정보의 그 동일한 섹션을 효율적으로 다운로딩할 수 있고, 그것이
각자의 디스플레이 상에서 렌더링되게 할 수 있다. 정말로, 조각상 가까이 있는 공원에 실제로 존재하는 한 명
의 사람이 상기 공원에서 산책 삼아 원격-위치된 친구를 취할 수 있고, 이때 친구는 가상 및 증강 현실을 통해
연결된다. 시스템은 어디에 거리가 있는지 ― 여기서, 나무들이 있음 ―, 어디에 조각상이 있는지 ― 그러나,
클라우드 상의 그 정보를 이용함 ― 를 알 필요가 있을 것이고, 연결된 친구는 시나리오의 양상들을 클라우드로
부터 다운로드할 수 있고, 그런 다음 공원에 실제로 있는 사람에 비해 로컬인 증강 현실을 따라서 걷기를 시작
할 수 있다.
[0068] 도 13을 참조하면, 시간 및/또는 다른 콘틴전시 파라미터 기반 실시예가 묘사되고, 여기서 사람은 가상 및/또는
증강 현실 인터페이스, 예컨대 사용자 인터페이스(302) 또는 도 3에서 특징으로 된 사용자 디스플레이 디바이스
와 관계를 맺고, 도 14를 참조하여 아래에서 설명되는 디스플레이 디바이스(14) 또는 그 변형들이 시스템을 활
용하고 있고(4) 한 컵의 커피를 주문하기 위해 커피 점포에 들어간다(6). VRS는, 증강 및/또는 가상 현실에서
의 디스플레이 인핸스먼트들, 예컨대 커피 점포에서 문들의 강조된 위치들 또는 적절한 커피 메뉴의 버블 윈도
우들을 사람에게 제공하기 위해, 로컬로 그리고/또는 원격으로, 감지 및 데이터 수집 능력들을 활용하도록 구성
될 수 있다(8). 사람이 자신이 주문한 한 컵의 커피를 받을 때, 또는 어떤 다른 적절한 파라미터의 시스템에
- 18 -
등록특허 10-1964223
의한 검출시, 시스템은 로컬 환경에서 디스플레이 디바이스를 이용하여 하나 또는 그 초과의 시간-기반 증강 또

는 가상 현실 이미지들, 비디오, 및/또는 사운드, 예컨대 정적이든 또는 동적이든 정글 사운드들 및 다른 효과
들이 있거나 또는 없는, 벽들 및 천장들로부터 마다가스카르 정글 장면을 디스플레이(10)하도록 구성될 수
있다. 사용자에 대한 그러한 제시는, 타이밍 파라미터에 기초하여(즉, 전체 커피 컵이 인식되고 사용자에게 건
네지고 5분 후; 시스템이 사용자가 점포의 정문을 통과해 걸어감을 인식하고 10분 후 등등) 또는 다른 파라미터
에 기초하여, 예컨대 사용자가 컵으로부터 마지막 한 모금의 커피를 삼킨 이후 커피 컵의 뒤집힌 방향에 주의함
으로써 사용자가 커피를 마저 마셨다는 시스템에 의한 인식 ― 또는, 사용자가 점포의 정문을 떠났다는 시스템
에 의한 인식 ― 에 기초하여 중단될 수 있다(12).
[0069] 도 14를 참조하면, 하우징 또는 프레임(84)에 의해 사용자의 헤드 또는 눈들에 장착될 수 있는 디스플레이 렌즈

(82)를 포함하는 적절한 사용자 디스플레이 디바이스(14)의 일 실시예가 도시된다. 디스플레이 렌즈(82)는, 증
강 현실 구성에서 로컬 환경으로부터 적어도 어떤 광의 송신을 또한 허용하면서, 사용자의 눈들(20) 앞쪽에 하
우징(84)에 의해 포지셔닝되고, 프로젝팅된 광(38)을 눈들(20)로 산란시키도록 그리고 빔 형상화를 용이하게 하
도록 구성된 하나 또는 그 초과의 투명 미러들을 포함할 수 있다(가상 현실 구성에서는, 예컨대 어두워진 바이
저, 차단 커튼, 모든 검은색 LCD 패널 모드 등등에 의해, 디스플레이 시스템(14)이 로컬 환경으로부터의 실질상
모든 광을 차단할 수 있는 것이 원해질 수 있다). 묘사된 실시예에서, 두 개의 광시야각 머신 비전 카메라들
(16)이 사용자 주변의 환경을 이미징하기 위해 하우징(84)에 커플링되고; 일 실시예에서, 이러한 카메라들(16)
은 듀얼 캡쳐 가시 광/적외선 광 카메라들이다. 또한, 묘사된 실시예는, 도시된 바와 같이 광(38)을 눈들(20)
로 프로젝팅하도록 구성된 옵틱들 및 디스플레이 미러들을 갖는 한 쌍의 스캐닝된-레이저 형상화된-파면(즉, 심
도에 대해) 광 프로젝터 모듈들을 포함한다. 또한, 묘사된 실시예는, 적외선 광원들(26, 예컨대 "LED(light
emitting diode)" 들)과 쌍을 이루는 두 개의 미니어처 적외선 카메라들(24)을 포함하고, 상기 두 개의 미니어
처 적외선 카메라들(24)은 렌더링 및 사용자 입력을 지원하기 위해 사용자의 눈들(20)을 추적할 수 있도록 구성
된다. 시스템(14)은 추가로 센서 어셈블리(39)를 특징으로 하고, 상기 센서 어셈블리(39)는 X, Y, 및 Z 축 가
속도계 능력뿐만 아니라 자기 나침반 그리고 바람직하게 비교적 고주파수, 예컨대 200㎐에서 데이터를 제공하는
X, Y, 및 Z 축 자이로 능력을 포함할 수 있다. 또한, 묘사된 시스템(14)은 헤드 포즈 프로세서(36), 예컨대 캡
쳐 디바이스들(16)로부터 출력된 광시야각 이미지 정보로부터 실시간 또는 거의 실시간 사용자 헤드 포즈를 계
산하도록 구성될 수 있는 ASIC(application specific integrated circuit), FPGA(field programmable gate
array), 및/또는 ARM(advanced reduced-instruction-set machine) 프로세서를 포함한다. 또한, 센서 어셈블리
(39)로부터의 자이로, 나침반, 및/또는 가속도계 데이터로부터 포즈를 도출하기 위해 디지털 및/또는 아날로그
프로세싱을 실행하도록 구성된 다른 프로세서(32)가 도시된다. 또한, 묘사된 실시예는, 포즈 및 포지셔닝을 돕
기 위한 GPS(37, global positioning satellite) 서브시스템을 특징으로 한다. 마지막으로, 묘사된 실시예는,
세계의 사용자의 뷰를 위해, 스캐너들의 동작 및 사용자의 눈들로의 이미징을 용이하게 하기 위해 사용자에 국
한된 렌더링 정보를 제공하도록 구성된 소프트웨어 프로그램을 실행하는 하드웨어를 특징으로 할 수 있는 렌더
링 엔진(34)을 포함한다. 렌더링 엔진(34)이 센서 포즈 프로세서(32), 이미지 포즈 프로세서(36), 눈 추적 카
메라들(24), 및 프로젝팅 서브시스템(18)에 동작 가능하게 커플링(81, 70, 76/78, 80; 즉, 유선 또는 무선 접속
성을 통해)되어, 렌더링된 증강 및/또는 가상 현실 객체들의 광이 망막 스캐닝 디스플레이와 유사한 방식으로
스캐닝된 레이저 어레인지먼트(18)를 이용하여 프로젝팅된다. 프로젝팅된 광 빔(38)의 파면은 휘거나 또는 포
커싱되어, 증강 및/또는 가상 현실 객체의 원하는 초점 거리와 일치될 수 있다. 미니 적외선 카메라들(24)은,
렌더링 및 사용자 입력을 지원하기 위해 눈들을 추적하는데 활용될 수 있다(즉, 자신이 얼마만큼 심도로 포커싱
하는지를 사용자가 찾고 있는 경우; 아래에 논의되는 바와 같이, 눈 가장자리(verge)는 초점 심도를 추적하는데
활용될 수 있다). GPS(37), 자이로들, 나침반, 및 가속도계들(39)은 코스(course) 및/또는 고속 포즈 추정치들
을 제공하는데 활용될 수 있다. 연관된 클라우드 컴퓨팅 자원으로부터의 데이터와 함께, 카메라(16) 이미지들
및 포즈는, 로컬 세계를 맵핑하도록 그리고 가상 또는 증강 현실 커뮤니티와 사용자 뷰들을 공유하는데 활용될
수 있다. 도 14에서 특징으로 된 디스플레이 시스템(14)의 하드웨어 중 많은 하드웨어들이 사용자의 눈들(20)
및 디스플레이(82)에 인접한 하우징(84)에 직접 커플링된 것으로 묘사되지만, 묘사된 하드웨어 컴포넌트들은,
예컨대 도 3에서 도시된 바와 같이 벨트-장착 컴포넌트와 같은 다른 컴포넌트들에 장착될 수 있거나 또는 상기
다른 컴포넌트들 내에 하우징될 수 있다. 일 실시예에서, 도 14에서 특징으로 된 시스템(14)의 컴포넌트들 전
부는, 이미지 포즈 프로세서(36), 센서 포즈 프로세서(32) 및 렌더링 엔진(34)을 제외하고서, 디스플레이 하우
징(84)에 직접 커플링되고, 이미지 포즈 프로세서(36), 센서 포즈 프로세서(32) 및 렌더링 엔진(34)과, 시스템
(14)의 나머지 컴포넌트들 사이의 통신은 무선 통신, 예컨대 초광대역 또는 유선 통신에 의해 이루어질 수
있다. 묘사된 하우징(84)은 바람직하게 헤드-장착되고, 사용자에 의해 착용가능하다. 상기 하우징(84)은
- 19 -
등록특허 10-1964223
또한, 사용자의 귀들에 삽입될 수 있고, 도 13을 참조하여 지칭된 정글 사운드들과 같은 증강 또는 가상 현실

경험에 적절할 수 있는 사운드를 사용자에게 제공하는데 활용될 수 있는 것들과 같은 스피커들, 그리고 사용자
에 국한된 사운드들을 캡쳐하는데 활용될 수 있는 마이크로폰들을 특징으로 할 수 있다.
[0070] 사용자의 눈들(20)로의 광(38)의 프로젝션에 관하여, 일 실시예에서, 미니 카메라들(24)은 사용자의 눈들(20)의
중심들이 어디에서 기하학적으로, 일반적으로 눈들(20)의 초점 포지션 또는 "초점 심도"와 일치하려고 가까이
향하는지를 측정하는데 활용될 수 있다. 눈들이 가까이 향하는 포인트들 전부의 3-차원 표면은 "호롭터
(horopter)"로 불린다. 초점 거리는 유한 개수의 심도들을 사용할 수 있거나, 또한 무한으로 가변적일 수
있다. 폭주(vergence) 거리로부터 프로젝팅된 광은 대상(subject) 눈(20)으로 포커싱되는 것으로 보이고, 반면
에 폭주 거리 앞쪽 또는 뒤쪽의 광은 흐릿해진다. 추가로, 눈이 어디에 포커싱하는지와 무관하게, 약 0.7 밀리
미터 미만의 빔 지름을 갖는 공간적으로 코히어런트한 광이 인간 눈에 의해 정확하게 리졸빙됨이 발견되었고;
이러한 이해가 주어진다면, 적절한 초점 심도의 환상(illution)을 생성하기 위해, 미니 카메라들(24)을 이용하
여 눈 폭주가 추적될 수 있고, 렌더링 엔진(34) 및 프로젝션 서브시스템(18)은 초점이 맞는 호롭터 상에 또는
그에 가까이 있는 객체들 전부 그리고 가변하는 디포커스 정도들(즉, 의도적으로-생성된 흐려짐을 이용하여)에
있는 다른 객체들 전부를 렌더링하는데 활용될 수 있다. 코히어런트한 광을 눈으로 프로젝팅하도록 구성된 시-
스루 광 가이드 광학 엘리먼트가 Lumus, Inc.와 같은 공급자들에 의해 제공될 수 있다. 바람직하게, 시스템
(14)은 초당 약 60프레임들 또는 그 초과의 프레임 레이트로 사용자에게 렌더링한다. 위에서 설명된 바와
같이, 바람직하게, 미니 카메라들(24)은 눈 추적을 위해 활용될 수 있고, 소프트웨어는 폭주 기하학적 구조뿐만
아니라 사용자 입력들로서의 역할을 하기 위해 포커스 위치 큐(cue)들도 픽업하도록 구성될 수 있다. 바람직하
게, 그러한 시스템은 낮 또는 밤 사용에 적절한 밝기 및 콘트래스트를 이용하여 구성된다. 일 실시예에서, 그
러한 시스템은 바람직하게, 시각적 객체 정렬을 위해 약 20 밀리세컨드 미만의 지연, 각도 정렬에 대해 약 0.1
도 미만의 지연, 그리고 해상도에 대해 약 1 아크 분(arc minute) ― 상기는 대략 인간 눈의 한계임 ― 의 지연
을 갖는다. 디스플레이 시스템(14)은 로컬화 시스템에 통합될 수 있고, 상기 로컬화 시스템은 GPS 엘리먼트,
광학 추적, 나침반, 가속도계, 및/또는 포지션 및 포즈 결정을 돕기 위한 다른 데이터 소스들을 수반할 수
있고; 로컬화 정보는, 적절한 세계의 사용자의 뷰로 정확한 렌더링을 용이하게 하는데 활용될 수 있다(즉, 그러
한 정보는 안경들이 그들이 실세계에 대하여 어디에 있는지를 아는 것을 용이하게 할 것이다).
[0071] 다른 적절한 디스플레이 디바이스는, 이에 제한되지는 않지만, 데스크톱 및 모바일 컴퓨터들, 스마트폰들, 3-D
관점 뷰잉을 용이하게 하거나 또는 시뮬레이팅하기 위해 소프트웨어 및 하드웨어 피처들로 부가로 인핸싱될 수
있는 스마트폰들(예컨대, 일 실시예에서, 프레임이 스마트폰에 제거가능하게 커플링될 수 있고, 상기 프레임은
200㎐ 자이로 및 가속도계 센서 서브세트, 광시야각 렌즈들을 갖는 두 개의 소형 머신 비전 카메라들, 및 ARM
프로세서 ― 도 14에서 특징으로 된 구성의 기능 중 몇몇을 시뮬레이팅하기 위해 ― 를 특징으로 함), 태블릿
컴퓨터들, 스마트폰들에 대해 위에서 설명된 바와 같이 인핸싱될 수 있는 태블릿 컴퓨터들, 부가의 프로세싱 및
감지 하드웨어로 인핸싱된 태블릿 컴퓨터들, 증강 및 가상 뷰포인트들(확대 옵틱들, 미러들, 콘택트 렌즈들, 또
는 광 구조화 엘리먼트들을 통한 시각적 수용)을 디스플레이하기 위해 스마트폰들 및/또는 태블릿들을 사용하는
헤드-장착 시스템들, 광 방출 엘리먼트들(LCD들, OLED들, 수직-공동-표면-방출 레이저들, 스티어드 레이저 빔들
등등)의 넌-시-스루 디스플레이들, 인간들이 자연 세계 및 인공적으로 생성된 이미지들을 보도록 동시 허용하는
시-스루 디스플레이들(예컨대, 광-가이드 광학 엘리먼트들, 클로즈-포커스 콘택트 렌즈들로 비추는 투명 및 편
광 OLED들, 스티어드 레이저 빔들 등등), 발광 엘리먼트들을 갖는 콘택트 렌즈들(예컨대, 상표명 Ioptik RTM 하
에서, WA의 벨뷰의 Innovega, Inc.로부터 이용가능한 것들; 그들은 특별히 무료의 안경들 컴포넌트들과 결합될
수 있음), 발광 엘리먼트들을 갖는 임플란트 가능한 디바이스들, 그리고 인간 뇌의 광학 수용체들을 자극하는
임플란트 가능한 디바이스들을 포함한다.
[0072] 도 3 및 도 14에 묘사된 것과 같은 시스템을 이용하여, 3-D 포인트들이 환경으로부터 캡쳐될 수 있고, 그러한
이미지들 또는 포인트들을 캡쳐하는 카메라들의 포즈(즉, 세계에 대한 원점 포지션 정보 및/또는 벡터)가 결정
될 수 있어, 그래서 이러한 포즈 정보를 이용하여, 이러한 포인트들 또는 이미지들이 "태깅(tagging)"될 수 있
거나 또는 연관될 수 있다. 그런 다음, 제2 카메라에 의해 캡쳐된 포인트들이 상기 제2 카메라의 포즈를 결정
하는데 활용될 수 있다. 다시 말해, 제1 카메라로부터의 태깅된 이미지들과의 비교들에 기초하여 제2 카메라가
지향될 수 있거나 그리고/또는 로컬화될 수 있다. 그런 다음, 이러한 지식은, 텍스처들을 추출하고, 맵들을 만
들고, 실세계의 가상 복사본을 생성하는데 활용될 수 있다(왜냐하면 그런 다음, 정합되는 곳 주변에 두 개의
카메라들이 있기 때문이다). 그래서, 베이스 레벨에서, 일 실시예에서, 당신은 3-D 포인트들 및 상기 포인트
들을 생성한 2-D 이미지들 둘 다를 캡쳐하는데 활용될 수 있는 사람-착용 시스템을 갖고, 이러한 포인트들 및
이미지들은 클라우드 스토리지 및 프로세싱 자원에 전송될 수 있다. 상기 포인트들 및 이미지들은 또한, 임베
- 20 -
등록특허 10-1964223
딩된 포즈 정보와 함께 로컬로 캐싱(caching)(즉, 태깅된 이미지들을 캐싱)될 수 있고; 그래서 클라우드는 3-D
포인트들을 따라서, 준비된(즉, 이용가능한 캐시에 있는) 태깅된 2-D 이미지들(즉, 3-D 포즈를 이용하여
태깅됨)을 가질 수 있다. 사용자가 동적인 무엇을 관찰하고 있다면, 상기 사용자는 모션에 적절한 부가의 정보
를 클라우드까지 또한 전송할 수 있다(예컨대, 다른 사람의 얼굴을 쳐다보고 있다면, 사용자는 얼굴의 텍스처
맵을 취할 수 있고, 심지어 주위 세계가 다른 방식으로 기본적으로 정적이더라도, 최적화된 주파수로, 상기 텍
스처 맵을 밀어올릴 수 있다).
[0073] 전체 포즈 추적 계산을 감소시키기 위해, 클라우드 시스템은 포즈에 대한 기점들로서만 몇몇의 포인트들을 저장
하도록 구성될 수 있다. 일반적으로, 사용자가 방 주위를 움직임에 따라 몇몇의 아웃라인 피처들이 사용자의
환경에 있는 주요한 아이템들, 예컨대 벽들, 테이블 등등을 추적할 수 있게 하는 것이 원해질 수 있고, 사용자
는 세계를 "공유"할 수 있기를 원할 수 있고 어떤 다른 사용자가 상기 방 안으로 걸어가게 할 수 있고 그러한
포인트들을 또한 보게 할 수 있기를 원할 수 있다. 그러한 유용하고 핵심적인 포인트들은 "기점들"로 지칭될
수 있는데, 그 이유는 상기 포인트들이 앵커링 포인트들로서 꽤 유용하기 때문이다 ― 상기 포인트들은, 머신
비전을 이용하여 인식될 수 있고 사용자 하드웨어의 상이한 피스들 상에서 일관성 있게 그리고 반복적으로 세계
로부터 추출될 수 있는 피처들에 관련됨 ―. 따라서, 이러한 기점들은 바람직하게, 추가의 사용을 위해 클라우
드에 저장될 수 있다.
[0074] 일 실시예에서, 적절한 세계를 통틀어 기점들의 비교적 균등한 분배를 갖는 것이 바람직한데, 그 이유는 기점들
이 카메라들이 위치를 인식하는데 쉽게 사용할 수 있는 아이템들의 종류들이기 때문이다.
[0075] 일 실시예에서, 적절한 클라우드 컴퓨팅 구성은, 기점 개선 및 세계 생성 둘 다를 위해 다양한 사용자들로부터

최선의 데이터를 사용하기 위해, 3-D 포인트들 및 임의의 연관된 메타 데이터의 데이터베이스를 주기적으로 그
루밍(grooming)하도록 구성될 수 있다. 다시 말해, 시스템은, 적절한 세계 내에서 보고 활동하는 다양한 사용
자들로부터의 입력들을 사용함으로써 최선의 데이터세트를 얻도록 구성될 수 있다. 일 실시예에서, 데이터베이
스는 본질적으로 프랙탈(fractal)하다 ― 사용자들이 객체들에 더 가까이 움직임에 따라, 클라우드는 더 높은
해상도 정보를 그러한 사용자들에게 전달함 ―. 사용자가 더욱 가까이 객체를 맵핑함에 따라, 그 데이터는 클
라우드에 전송되고, 클라우드는 새로운 3-D 포인트들 및 이미지-기반 텍스처 맵들을, 그들이 데이터베이스에 이
전에 저장된 것보다 더 우수하다면, 데이터베이스에 부가할 수 있다. 이 모두는 많은 사용자들로부터 동시에
일어나도록 구성될 수 있다.
[0076] 위에서 설명된 바와 같이, 증강 또는 가상 현실 경험은 특정 타입들의 객체들을 인식하는 것에 기초할 수 있다.
예컨대, 특정 객체가 그러한 객체를 인식 및 이해하기 위하여 심도를 갖는다는 것을 이해하는 것이 중요할 수
있다. 인식기 소프트웨어 객체들("인식기들")은 클라우드 또는 로컬 자원들 상에 배치되어, 사용자가 세계에서
데이터를 탐험함에 따라 플랫폼들 중 어느 한 쪽 또는 둘 다 상에서 다양한 객체들의 인식을 구체적으로 도울
수 있다. 예컨대, 시스템이 3-D 포인트 클라우드들 및 포즈-태깅된 이미지들을 포함하는 세계 모델에 대한 데
이터를 갖는다면 그리고 그 상에 다수의 포인트들뿐만 아니라 데스크의 이미지를 갖는 데스크가 있다면, 관찰되
고 있는 것이 정말로 인간들이 알고 있는 데스크와 같은 데스크라는 결정이 없을 수 있다. 다시 말해, 공간에
서 몇몇의 3-D 포인트들 및 데스크의 대부분을 나타내는, 공간에서 떨어진 어딘가로부터의 이미지는, 데스크가
관찰되고 있음을 즉각적으로 인식하기에 충분하지 않을 수 있다. 이러한 식별을 돕기 위해, 특정 객체 인식기
가 생성될 수 있고, 상기 특정 객체 인식기는 원시(raw) 3-D 포인트 클라우드에 들어갈 것이고, 포인트들의 세
트를 세그멘팅할 것이고, 예컨대 데스크의 상단 표면의 비행기를 추출할 것이다. 유사하게, 인식기는 3-D 포인
트들로부터 벽을 세그멘팅하도록 생성될 수 있어, 그래서 사용자는 가상 또는 증강 현실에서 월페이퍼를 바꿀
수 있거나 또는 벽의 일부를 제거할 수 있고, 실세계에서 실제로는 그곳에 없는 다른 방으로의 입구를 가질 수
있다. 그러한 인식기들은 세계 모델의 데이터 내에서 동작하고, 세계 모델을 크로울링(crawling)하고 상기 세
계 모델을 의미론적 정보 또는 공간에서 포인트들 사이에 존재하는 것으로 믿어지는 것에 관한 온톨로지
(ontology)로 가득 채우는 소프트웨어 "로봇들"로서 생각될 수 있다. 그러한 인식기들 또는 소프트웨어 로봇들
은, 각자의 전체 존재가 데이터의 적절한 세계를 도는 것 그리고 자신이 믿는 것들이 벽들, 또는 의자들, 또는
다른 아이템들이라는 발견들이 되도록 구성될 수 있다. 상기 인식기들 또는 소프트웨어 로봇들은, 포인트들 세
트를 "이 포인트들 세트는 벽에 속한다"라는 기능적 등가물로 태깅하도록 구성될 수 있고, 포인트들에 무엇이
있는지에 관하여 시스템에 상호 통보하기 위해 포즈-태깅된 이미지 분석 및 포인트-기반 알고리즘의 결합을 포
함할 수 있다.
[0077] 객체 인식기들은, 관점에 따라, 많은 가변되는 유용성의 목적으로 생성될 수 있다. 예컨대, 일 실시예에서, 스
타벅스와 같은 커피 조달업자는 데이터의 적절한 세계들 내에서 스타벅스 커피 컵들의 정확한 인식기를 생성하
- 21 -
등록특허 10-1964223
는데 투자할 수 있다. 그러한 인식기는, 스타벅스 커피 컵들을 대규모 및 소규모로 검색하는 데이터의 세계들
을 크로울링하도록 구성될 수 있고, 그래서 상기 스타벅스 커피 컵들은 적절한 근처 공간에서 동작할 때 세그멘
팅될 수 있고 사용자에게 식별될 수 있다(즉, 아마도, 사용자가 특정 시간 기간 동안 자신의 스타벅스 컵을 쳐
다볼 때 코너 바로 주위의 스타벅스 아울렛에서 사용자에게 커피를 제공하기 위해). 세그멘팅된 컵을
이용하여, 사용자가 상기 컵을 자신의 데스크 상에서 움직일 때가 신속하게 인식될 수 있다. 그러한 인식기들
은, 클라우드 컴퓨팅 자원들 및 데이터 상에서 뿐만 아니라, 로컬 자원들 및 데이터 상에서도, 또는 이용가능한
컴퓨테이셔널 자원들에 따라 클라우드 및 로컬 둘 다에서 실행되거나 또는 동작하도록 구성될 수 있다. 일 실
시예에서, 클라우드 상에 세계 모델의 글로벌 복사본이 존재하지만 ― 상기 클라우드는 상기 글로벌 모델에 기
여하는 수백만의 사용자들을 가짐 ―, 특정 타운에서 특정 개인의 사무실처럼 하위-세계들 또는 더 작은 세계들
에 대해, 글로벌 세계의 대부분은 상기 사무실이 어떻게 보이는지 주의하지 않을 것이고, 그래서 시스템은, 데
이터를 그루밍하도록 그리고 주어진 사용자에게 로컬로 가장 적절한 것으로 믿어지는 로컬 캐시 정보로 움직이
도록 구성될 수 있다. 일 실시예에서, 예컨대, 사용자가 데스크로 걸어갈 때, 관련 정보(예컨대, 상기 사용자
의 테이블 상에서 특정 컵의 세그멘테이션)가 상기 사용자의 로컬 컴퓨팅 자원들 상에만 있고 클라우드 상에는
없도록 구성될 수 있는데, 그 이유는 테이블들 상의 컵들과 같이 종종 움직이는 것들로서 식별되는 객체들은 클
라우드 모델에 부담을 지울 필요가 없고 클라우드와 로컬 자원들 사이에 송신 부담을 지울 필요가 없기 때문이
다. 따라서, 클라우드 컴퓨팅 자원은 3-D 포인트들 및 이미지들을 세그멘팅하도록 구성될 수 있고 ― 따라서,
이동가능한 것들로부터 영구적(즉, 일반적으로 움직이지 않는) 객체들이 팩토링(factoring)됨 ―, 이는 연관된
데이터가 잔류할 곳, 연관된 데이터가 프로세싱될 곳에 영향을 끼칠 수 있고, 더욱 영구적인 객체들에 적절한
특정 데이터에 대해 착용가능한/로컬 시스템으로부터 프로세싱 부담을 제거할 수 있고, 위치의 한 번의 프로세
싱을 허용할 수 있고 ― 그런 다음, 상기 위치는 무제한의 다른 사용자들에 의해 공유될 수 있음 ―, 데이터의
다수의 소스들이, 특정 물리적 위치에서 고정 및 이동가능한 객체들의 데이터베이스를 동시에 구축하도록 할 수
있고, 객체-특정 기점들 및 텍스처 맵들을 생성하기 위해 배경으로부터 객체들을 세그멘팅할 수 있다.
[0078] 일 실시예에서, 시스템이, 특정 객체들의 아이덴티티에 관한 입력에 대해 사용자에게 질의하도록 구성될 수 있

어(예컨대, 시스템은 "저것은 스타벅스 커피 컵입니까?"와 같은 질문을 사용자에게 제시할 수 있음), 그래서 사
용자는 시스템을 트레이닝할 수 있고, 시스템이 의미론적 정보를 실세계에 있는 객체들과 연관시키도록 할 수
있다. 온톨로지는, 세계로부터 세그멘팅된 객체들이 무엇을 할 수 있는지, 그들이 어떻게 행동하는지 등등에
관한 안내를 제공할 수 있다. 일 실시예에서, 시스템에 대한 특정 사용자 입력을 용이하게 하기 위해, 시스템
은 가상 또는 실제 키패드, 예컨대 무선 연결된 키패드, 스마트폰의 키패드로의 접속성 등등을 특징으로 할 수
있다.
[0079] 시스템은 가상 또는 증강 현실에서 방으로 걸어들어오는 임의의 사용자와 기본 엘리먼트들(벽들, 윈도우들, 데

스크 기하학적 구조 등등)을 공유하도록 구성될 수 있고, 일 실시예에서, 그 사람의 시스템은, 자신의 특정 관
점으로부터 이미지들을 취하도록 그리고 상기 이미지들을 클라우드에 업로딩하도록 구성될 것이다. 그런 다음,
클라우드에는 데이터의 이전 세트 및 새로운 세트가 부가되고, 클라우드는 최적화 루틴들을 실행할 수 있고 개
별 객체들 상에 존재하는 기점들을 설정할 수 있다.
[0080] GPS 및 다른 로컬화 정보가 그러한 프로세싱에 대한 입력들로서 활용될 수 있다. 추가로, 사용자의 온라인 달
력 또는 페이스북 계정 정보와 같은 다른 컴퓨팅 시스템들 및 데이터가 입력들로서 활용될 수 있다(예컨대, 일
실시예에서, 클라우드 및/또는 로컬 시스템이, 항공권들에 대한 사용자의 달력의 콘텐츠, 날짜들, 및 목적지들
을 분석하도록 구성될 수 있어, 그래서 시간에 따라, 주어진 목적지에서 사용자의 도달 시간에 대해
준비되도록, 정보가 클라우드로부터 사용자의 로컬 시스템들로 움직여질 수 있다).
[0081] 일 실시예에서, QR 코드들 등등과 같은 태그들이, 비-통계적 포즈 계산, 보안/액세스 제어, 특별 정보의 통신,
공간적 메시징, 비-통계적 객체 인식 등등과 함께 사용되기 위해 세계에 삽입될 수 있다.
[0082] 일 실시예에서, 클라우드 자원들은, "전달가능한 세계들"을 참조하여 위에서 설명된 바와 같이 실세계 및 가상
세계의 디지털 모델들을 사용자들 사이에서 전달하도록 구성될 수 있고, 이때 모델들은 파라미터들 및 텍스처들
에 기초하여 개별 사용자들에 의해 렌더링된다. 이는, 실시간 비디오의 전달에 대해 대역폭을 감소시키고, 장
면의 가상 뷰포인트들의 렌더링을 허용하고, 수백만 또는 그 초과의 사용자들이, 그들이 볼 필요가 있는 데이터
(예컨대, 비디오)를 그들 각각에게 전송하지 않고, 하나의 가상 수집(gathering)에 참여하도록 하는데, 그 이유
는 각자의 뷰들이 각자의 로컬 컴퓨팅 자원들에 의해 렌더링되기 때문이다.
[0083] 가상 현실 시스템("VRS")은 다음 중 하나 또는 그 초과를 통해 사용자 위치 및 시야("포즈"로서 함께 알려짐)를
- 22 -
등록특허 10-1964223
정합시키도록 구성될 수 있다: 카메라들을 이용한 실시간 메트릭 컴퓨터 비전, 동시 로컬화 및 맵핑 기술들, 맵
들, 그리고 센서들, 예컨대 자이로들, 가속도계들, 나침반, 기압계, GPS, 무선 신호 강도 삼각측량, 비행 시간
신호 분석, LIDAR 레인징(ranging), RADAR 레인징, 주행거리 측정, 및 음탐 레인징(sonar ranging)으로부터의
데이터. 착용가능한 디바이스 시스템은 동시에 맵핑시키고 지향시키도록 구성될 수 있다. 예컨대, 알려지지
않은 환경들에서, VRS는, 사용자 포즈 계산들에 적절한 기점 포인트들, 세계 모델링을 위한 다른 포인트들, 세
계의 텍스처 맵들을 제공하기 위한 이미지들을 알아내는, 환경에 관한 정보를 수집하도록 구성될 수 있다. 기
점 포인트들은 포즈를 광학적으로 계산하는데 사용될 수 있다. 세계가 더욱 상세하게 맵핑됨에 따라, 더욱 많
은 객체들이 세그멘팅될 수 있고 그들만의 텍스처 맵들에 주어질 수 있지만, 세계는 여전히 바람직하게, 낮은
해상도 텍스처 맵들을 이용하여 단순한 다각형들로 낮은 공간적 해상도로 표현가능하다. 위에서 논의된 것들과
같은 다른 센서들이 이러한 모델링 수고를 지원하는데 활용될 수 있다. 세계는 본질적으로 프랙탈할 수 있고,
여기서 움직이는 것 또는 다른 방식으로 더 나은 뷰를 추구하는 것(뷰포인트들, "감독" 모드들, 줌잉(zooming)
등등을 통해)은 클라우드 자원들로부터 고-해상도 정보를 요청한다. 객체들에 더 가까이 움직이는 것은 더 높
은 해상도 데이터를 캡쳐하고, 상기 더 높은 해상도 데이터는 클라우드에 전송될 수 있으며, 상기 클라우드는
세계 모델에서 사이 사이트(interstitial site)들에 새로운 데이터를 계산 및/또는 삽입할 수 있다.
[0084] 도 16을 참조하면, 착용가능한 시스템은 이미지 정보를 캡쳐하도록 그리고 기점들 및 인식된 포인트들을 추출하
도록 구성될 수 있다(52). 착용가능한 로컬 시스템은, 아래에 언급되는 포즈 계산 기술들 중 하나를 이용하여
포즈를 계산할 수 있다. 클라우드는, 더욱 정적인 3-D 배경으로부터 3-D 객체들을 세그멘팅하기 위해 이미지들
및 기점들을 사용하도록 구성될 수 있고(54); 이미지들은 객체들 및 세계에 대한 텍스처들 맵들을 제공한다(텍
스처들은 실시간 비디오들일 수 있다). 클라우드 자원들은, 세계 정합을 위해 이용가능한 정적 기점들 및 텍스
처들을 저장하고 만들도록 구성될 수 있다(56). 클라우드 자원들은 정합을 위한 최적 포인트 밀도에 대해 포인
트 클라우드를 그루밍하도록 구성될 수 있다. 클라우드 자원들은 객체 정합 및 조작을 위해 이용가능한 객체
기점들 및 텍스처들을 저장하고 만들 수 있고(60); 클라우드는 정합을 위한 최적 밀도에 대해 포인트 클라우드
들을 그루밍할 수 있다. 클라우드 자원은, 객체들의 프랙탈 고체 모델들을 생성하기 위해 유효한 포인트들 및
텍스처들 전부를 사용하도록 구성될 수 있고(62); 클라우드는 최적 기점 밀도에 대해 포인트 클라우드 정보를
그루밍할 수 있다. 클라우드 자원은, 세그멘팅된 객체들의 아이덴티티 및 세계에 관한 트레이닝을 위해 사용자
들에게 질의하도록 구성될 수 있고(64); 온톨로지 데이터베이스는, 객체들 및 세계를 동작가능한 특징들로 가득
채우기 위해 답변들을 사용할 수 있다.
[0085] 정합 및 맵핑의 다음의 특정 모드들은 광학 또는 카메라 시스템으로부터 결정된 포즈를 표현하는 용어 "O-포
즈"; 센서들로부터 결정된 포즈(즉, 위에서 논의된 바와 같이, GPS, 자이로, 나침반, 가속도계 등등의 데이터의
결합과 같음)를 표현하는 용어 "s-포즈"; 및 클라우드 컴퓨팅 및 데이터 관리 자원을 표현하는 용어 "MLC"를 특
징으로 한다.
[0086] 1. 지향(orient): 새로운 환경의 기본 맵을 만든다
[0087] 목적: 환경이 맵핑되지 않는다면 또는 (등가물) MLC에 연결되지 않는다면 포즈를 설정한다.
[0088] · 이미지로부터 포인트들을 추출하고, 프레임마다 추적하고, S-포즈를 이용하여 기점들을 삼각측량한다.
[0089] · S-포즈를 사용하는데, 그 이유는 그곳에 기점들이 없기 때문이다
[0090] · 지속성에 기초하여 불량 기점들을 걸러 낸다.
[0091] · 이것은 가장 기본적인 모드이다: 상기 가장 기본적인 모드는 항상 낮은-정확도 포즈를 위해 동작할 것이다.
시간 및 어떤 상대적 모션을 거의 사용하지 않고, 상기 가장 기본적인 모드는 O-포즈 및/또는 맵핑에 대해 최소
기점 세트를 설정할 것이다.
[0092] · O-포즈가 신뢰성이 있자마자, 이 모드에서 나온다.
[0093] 2. 맵 및 O-포즈: 환경을 맵핑한다
[0094] 목적: 높은-정확도 포즈를 설정하고, 환경을 맵핑하고, (이미지들을 갖는) 맵을 MLC에 제공한다.
[0095] · 성숙한 세계 기점들로부터 O-포즈를 계산한다. O-포즈 솔루션의 체크로서 그리고 계산을 가속화하기 위해
S-포즈를 사용한다(O-포즈는 비-선형 기울기 검색이다).
[0096] · 성숙한 기점들은 MLC로부터 나올 수 있거나, 또는 로컬로 결정된 것들일 수 있다.
- 23 -
등록특허 10-1964223
[0097] · 이미지로부터 포인트들을 추출하고, 프레임마다 추적하고, O-포즈를 이용하여 기점들을 삼각측량한다.
[0098] · 지속성에 기초하여 불량 기점들을 걸러 낸다.
[0099] · MLC에 기점들 및 포즈-태깅된 이미지들을 제공한다.
[0100] · 마지막 세 개의 단계들은 실시간으로 일어날 필요가 없다.
[0101] 3. O-포즈: 포즈를 결정한다
[0102] 목적: 최소 프로세싱 파워를 이용하여, 이미 맵핑된 환경에서, 높은-정확도 포즈를 설정한다.
[0103] · n에서의 포즈를 추정하기 위해 역사적 S-포즈 및 O-포즈(n-1, n-2, n-3 등등)을 사용한다.
[0104] · n에서의 포즈를 사용하여, 기점들을 n에서 캡쳐된 이미지로 프로젝팅하고, 그런 다음 프로젝션으로부터 이미
지 마스크를 생성한다.
[0105] · 마스킹된 구역들로부터 포인트들을 추출한다(이미지의 마스킹된 서브세트들로부터만 포인트들을 검색/추출함

으로써, 프로세싱 부담이 크게 감소했다).
[0106] · 추출된 포인트들 및 성숙한 세계 기점들로부터 O-포즈를 계산한다.
[0107] · n+1에서의 포즈를 추정하기 위해, n에서의 S-포즈 및 O-포즈를 사용한다.
[0108] · 옵션: 포즈-태깅된 이미지들/비디오를 MLC 클라우드에 제공한다.
[0109] 4. 수퍼 레스(Super Res): 수퍼 해상도 화상(imagery) 및 기점들을 결정한다
[0110] 목적: 수퍼-해상도 화상 및 기점들을 생성한다.
[0111] · 수퍼-해상도 이미지들을 생성하기 위한, 복합 포즈-태깅된 이미지들.
[0112] · 기점 포지션 추정을 인핸싱하기 위해, 수퍼-해상도 이미지들을 사용한다.
[0113] · 수퍼 해상도 기점들 및 화상으로부터 O-포즈 추정들을 반복한다.
[0114] · 옵션: 착용가능한 디바이스(실시간으로) 또는 MLC(더 나은 세계를 위해) 상에서 위의 단계들을 루핑

(looping)한다.
[0115] 일 실시예에서, VLS 시스템은, 특정 베이스 기능뿐만 아니라, 특정한 전문화된 기능성들을 제공하기 위해 VLS를
통해 분배될 수 있는 "apps" 또는 애플리케이션들에 의해 용이하게 되는 기능성을 갖도록 구성될 수 있다. 예
컨대, 전문화된 기능성을 제공하기 위해, 다음의 apps가 대상 VLS에 설치될 수 있다:
[0116] 화가 특유의 렌더링들 app. 아티스트들은 세계 ― 그들이 상기 세계를 봄 ― 를 표현하는 이미지 트랜스폼들을
생성한다. 사용자들이 이러한 트랜스폼들을 인에이블링하고, 따라서 아티스트들 눈들을 "통해" 세계를 보게 된
다.
[0117] 테이블 상단 모델링 app. 사용자들은 테이블 상에 놓인 물리적 객체들로부터 객체들을 "구축"한다.
[0118] 가상 존재 app. 사용자들은 공간의 가상 모델을 다른 사용자에게 전달하고, 상기 다른 사용자는 그런 다음 가

상 아바타를 이용하여 공간 주위에서 움직인다.
[0119] 아바타 이모션(emotion) app. 미묘한 음성 어조, 사소한 헤드 움직임, 바디 온도, 심박수 등등의 측정들이 가
상-존재 아바타들 상에 미묘한 효과들을 애니메이팅한다. 인간 상태 정보를 디지털화하는 것 그리고 그것을 원
격 아바타에게 전달하는 것은 비디오보다 대역폭을 덜 사용한다. 부가하여, 그러한 데이터는, 이모션 능력이
있는 비-인간 아바타들에게 맵핑가능하다. 예컨대, 개 아바타는, 흥분한 음성 어조들에 기초하여 자신의 꼬리
를 흔듦으로써 흥분을 나타낼 수 있다.
[0120] 모두를 서버에 다시 전송하는 것과 대조적으로, 데이터를 움직이는데 효율적 메쉬 타입 네트워크가 바람직할 수
있다. 그러나, 많은 메쉬 네트워크들은 차선 성능을 갖는데, 그 이유는 포지셔널 정보 및 토폴로지가 잘 특징
화되지 않기 때문이다. 일 실시예에서, 시스템은 비교적 높은 정확도로 사용자들 전부의 위치를 결정하는데 활
용될 수 있고, 따라서 메쉬 네트워크 구성은 고성능을 위해 활용될 수 있다.
[0121] 일 실시예에서, 시스템은 검색을 위해 활용될 수 있다. 예컨대, 증강 현실을 이용하여, 사용자들은 물리적 세
계의 많은 양상들에 관련된 콘텐츠를 생성할 것이고 남길 것이다. 이러한 콘텐츠 중 많은 콘텐츠는 텍스트가
- 24 -
등록특허 10-1964223
아니고, 따라서 통상적 방법들에 의해 쉽게 검색되지 않는다. 시스템은, 검색 및 참조 목적으로, 퍼스널 및 소

셜 네트워크 콘텐츠에 대해 계속 추적하기 위한 설비를 제공하도록 구성될 수 있다.
[0122] 일 실시예에서, 디스플레이 디바이스가 연속적 프레임들을 통해 2-D 포인트들을 추적하고, 그런 다음 벡터-값
함수(vector-valued function)를 그러한 포인트들의 시간 에볼루션에 피팅한다면, 어느 시점에도(예컨대, 프레
임들 사이) 또는 가까운 미래의 어떤 포인트에서(시간상 앞으로, 벡터-값 함수를 프로젝팅함으로써. 이는, 고-
해상도 포스트-프로세싱의 생성을 허용하고, 다음 차례의 이미지가 실제 캡쳐되기 이전에 미래 포즈의 예측을
허용(예컨대, 카메라 프레임 레이트를 두 배로 하지 않고, 정합 속도를 두 배로 하는 것이 가능)함) 벡터 값 함
수를 샘플링하는 것이 가능하다.
[0123] (헤드-고정된 또는 세계-고정된 렌더링들과 대조적으로) 바디-고정된 렌더링을 위해, 바디의 정확한 뷰가 원해
진다. 바디를 측정하는 것이 아니라, 일 실시예에서, 사용자의 헤드의 평균 포지션을 통해 그 위치를 도출하는
것이 가능하다. 사용자의 얼굴이 대부분의 시간에 앞으로 향한다면, 헤드 포지션의 여러 날의 평균이 그 방향
을 드러낼 것이다. 중력 벡터와 함께, 이는, 바디-고정된 렌더링을 위해 합리적으로 안정적인 조정 프레임을
제공한다. 이러한 긴-지속기간 조정 프레임에 대하여 헤드 포지션의 현재 측정치들을 사용하는 것은, ― 여분
의 계측을 사용하지 않고도 ― 사용자의 바디 상의/주위의 객체들의 일관된 렌더링을 허용한다. 이러한 실시예
의 구현을 위해, 헤드 방향-벡터의 단일 레지스터 평균들이 시작될 수 있고, 델타-t로 나뉜 데이터의 러닝 합이
현재 평균 헤드 포지션을 줄 것이다. 하루 n-5, 하루 n-4, 하루 n-3, 하루 n-2, 하루 n-1에 시작되는 5개 정도
의 레지스터들을 유지하는 것은, 유일하게 과거 "n" 날들의 평균들을 롤링(rolling)하는 용도를 허용한다.
[0124] 일 실시예에서, 장면이 스케일링 다운될 수 있고 실제보다 더 작은 공간에서 사용자에게 제시될 수 있다. 예컨
대, 거대한 공간(즉, 예컨대 축구 스타디움)에서 렌더링되어야 하는 장면이 존재하는 상황에서, 대등한 거대한
공간이 존재하지 않을 수 있거나, 또는 그러한 대형 공간이 사용자에게 불편할 수 있다. 일 실시예에서, 시스
템이 장면의 스케일을 감소시키도록 구성될 수 있어, 그래서 사용자는 장면을 미니어처로 볼 수 있다. 예컨대,
신들의 시선(gods-eye-view) 비디오 게임, 또는 세계 챔피온 축구 게임이 스케일링되지 않은 필드에서 발생되게
될 수 있거나 또는 스케일링 다운되고 거실 바닥에 제시되게 될 수 있다. 시스템은, 렌더링 관점, 스케일, 및
연관된 수용 거리를 간단히 시프트하도록 구성될 수 있다.
[0125] 또한, 시스템은, 가상 또는 증강 현실 객체들의 포커스를 조작함으로써, 그들을 강조함으로써, 콘트래스트, 밝

기, 스케일 등등을 변경함으로써 제시된 장면 내의 특정 아이템들에 사용자의 관심이 끌리도록 구성될 수 있다.
[0126] 바람직하게, 시스템은 다음의 모드들을 달성하도록 구성될 수 있다:
[0127] 오픈 공간 렌더링:
[0128] · 구조화된 환경으로부터 핵심적인 포인트들을 잡고, 그런 다음 ML 렌더링들을 이용하여 그 사이의 공간을 채
운다.
[0129] · 잠재적 장소들: 스테이지들, 출력 공간들, 대형 실내 공간들(스타디움들).
[0130] 객체 포장(wrapping):
[0131] · 실세계에서 3D 객체를 인식하고, 그런 다음 그들을 증강한다
[0132] · 여기서 "인식"은 화상을 앵커링하기에 충분한 높은 정확도를 갖는 3D 블로브(blob)를 식별하는 것을 의미한
다.
[0133] · 두 개의 타입들의 인식이 있다: 1) 객체의 타입(예컨대, "얼굴")을 분류하는 것; 2) 객체의 특정 인스턴스
(예컨대, Joe, 사람)를 분류하는 것.
[0134] · 다양한 물건들에 대한 인식기들 소프트웨어 객체들을 구축한다: 벽들, 천장들, 바닥들, 얼굴들, 도로들, 하
늘, 고층건물들, 랜치 하우스들, 테이블들, 의자들, 자동차들, 도로 표지판들, 게시판들, 문들, 윈도우들, 책꽂
이들 등등
[0135] · 몇몇의 인식기들은 타입 Ⅰ이고, 일반적 기능성, 예컨대 "나의 비디오를 저 벽에 놓아라", "저것은 개이다"
를 갖는다.
[0136] · 다른 인식기들은 타입 Ⅱ이고, 특정 기능성, 예컨대 "나의 TV는 천장으로부터 3.2피트에 나의 거실 벽에 있

다", "저것은 Fido이다"을 갖는다(이는, 일반적 인식기의 더욱 유능한 버전이다)
- 25 -
등록특허 10-1964223
[0137] · 인식기를 소프트웨어 객체들로서 구축하는 것은, 기능성의 계량된 릴리스, 그리고 경험의 더 미세한 그레인
드(grained) 제어를 허용한다
[0138] 바디 중심 렌더링
[0139] · 사용자들 바디에 고정된 가상 객체들을 렌더링한다
[0140] · 몇몇의 물건들은, 디지털 공구 벨트처럼, 사용자의 바디 주위에 부유해야 한다.
[0141] · 이는, 단지 헤드가 아니라, 바디가 어디에 있는지를 알 것을 요구한다. 사용자들 헤드 포지션의 장기 평균
을 가짐으로써 바디 포지션이 합리적으로 정확하게 획득될 수 있다(헤드들은 보통, 땅과 평행하게 앞으로 향한
다).
[0142] · 사소한 경우는 헤드 주위에서 부유하는 객체들이다.
[0143] 투명도/컷어웨이
[0144] · 타입 Ⅱ로 인식된 객체들에 대해, 컷-어웨이들을 나타낸다
[0145] · 타입 Ⅱ로 인식된 객체들을 3D 모델들의 온라인 데이터베이스에 링크시킨다.
[0146] · 자동차들 및 공동 시설들과 같이 공통으로 이용가능한 3D 모델들을 갖는 객체들로 시작해야 한다.
[0147] 가상 존재
[0148] · 원격의 사람들의 아바타들을 오픈 공간들로 페인팅한다.
[0149] · "오픈 공간 렌더링"의 서브세트(위).
[0150] · 사용자들은 로컬 환경의 개략적인 기하학적 구조를 생성하고, 기하학적 구조 및 텍스처 맵들 둘 다

를 다른 사용자들에게 반복적으로 전송한다.
[0151] · 사용자들은 다른 사용자들이 각자의 환경으로 들어가도록하기 위한 허가를 승인해야 한다.
[0152] · 미묘한 음성 큐(queue)들, 손 추적, 및 헤드 모션이 원격 아바타에게 전송된다. 아바타는 이러한

퍼지 입력들로부터 애니메이팅된다.
[0153] · 상기는 대역폭을 최소화시킨다.
[0154] · 벽을 다른 방으로의 "입구"로 만든다
[0155] · 다른 방법에서와 같이, 기하학적 구조 및 텍스처 맵을 전달한다.
[0156] · 로컬 방에서 아바타를 나타내는 대신에, 인식된 객체(예컨대, 벽)를 다른 사용자의 환경으로의 입구
로서 지정한다. 이러한 방식으로, 다수의 사람들이 자신들만의 방들에 앉을 수 있고, 다른 사용자들의 환경들
을 벽들을 "통해" 본다.
[0157] 가상 뷰포인트들
[0158] · 카메라들(사람들)의 그룹이 상이한 관점들로부터 장면을 볼 때 밀집한 디지털 영역 모델이 생성된다. 이러
한 풍부한 디지털 모델은 적어도 하나의 카메라가 볼 수 있는 어떠한 유리한 포인트로부터도 렌더링가능하다.
[0159] · 예. 사람들이 결혼식에 있다. 장면은 참석자들 전부에 의해 공동으로 모델링된다. 인식기들은 움직이는
것들과 상이하게 고정 객체들을 구별하고 텍스처 맵핑한다(예컨대, 벽들은 안정적인 텍스처 맵을 갖고, 사람들
은 더 높은 주파수로 움직이는 텍스처 맵들을 갖는다.)
[0160] · 실시간으로 업데이트되는 풍부한 디지털 모델을 이용하여, 임의의 관점으로부터 장면이 렌더링가능하다. 뒤
의 참석자는 더 나은 뷰를 위해 앞쪽의 줄로 하늘을 날 수 있다.
[0161] · 참석자들은 각자의 움직이는 아바타를 나타낼 수 있거나, 또는 각자의 관점이 숨겨지게 할 수 있다.
[0162] · 부지 밖의 참석자들은 각자의 아바타를 이용하여서든 또는 주최자들이 허가하는 경우이든 눈에 보이지 않게

"좌석"을 찾을 수 있다.
[0163] · 극도로 높은 대역폭을 요구할 것 같다. 개념상, 고주파수 데이터가 고속 로컬 무선 상에서 대중을 통과해
- 26 -
등록특허 10-1964223
빠르게 이동된다. 저주파수 데이터는 MLC로부터 나온다.
[0164] · 참석자들 전부가 높은 정확도 포지션 정보를 갖기 때문에, 로컬 네트워킹을 위해 최적 라우팅 경로를 만드는
것은 사소하다.
[0165] 메시징
[0166] · 단순한 침묵 메시징이 바람직할 수 있다
[0167] · 이를 위해 그리고 다른 애플리케이션들을 위해, 더 미세한 화음화 키보드를 갖는 것이 바람직할 수 있다.
[0168] · 촉각 글로브 솔루션들이 인핸스드 성능을 제공할 수 있다.
[0169] 완전한 가상 현실(VR):
[0170] · 어두워진 비전 시스템을 이용하여, 실세계 상에 오버레이되지 않은 뷰를 나타낸다.
[0171] · 정합 시스템이 헤드 포지션을 추적하기에 여전히 필요하다.
[0172] · "침상 모드"는 사용자가 날도록 한다.
[0173] · "걷기 모드"는 실세계의 객체들을 가상 객체들로서 재-렌더링하고, 그래서 사용자는 실세계와 충돌하지 않는
다.
[0174] · 바디의 일부들을 렌더링하는 것이 불신의 중단을 위해 필수적이다. 이는, 방법이 FOV에서 바디 일부들을 추
적하고 렌더링하도록 함을 의미한다.
[0175] · 비-시스루 바이저는 직접적인 오버레이 없이 가능하지 않은 많은 이미지 인핸스먼트 장점들을 갖는 VR의 형
태이다
[0176] · 와이드 FOV, 아마도 심지어 뒤를 보는 능력
[0177] ·"수퍼 비전"의 다양한 형태들: 망원경, 시스루, 적외선, 신의 눈 등등.
[0178] 일 실시예에서, 가상 및/또는 증강 사용자 경험을 위한 시스템은, 사용자들과 연관된 원격 아바타들이 적절한
소프트웨어 모듈들에 의해 전달되는 바와 같이 음성 어조 분석 및 얼굴 인식 분석과 같은 소스들로부터의 입력
을 이용하는 착용가능한 디바이스 상의 데이터에 적어도 부분적으로 기초하여 애니메이팅될 수 있도록
구성된다. 예컨대, 다시 도 12를 참조하면, 벌 아바타(2)는, 사용자의 얼굴 상의 미소의 얼굴 인식에
기초하여, 또는 사용자로부터 로컬로 음성 샘플들을 캡쳐할 수 있는 마이크로폰들로의 음성 입력들을 분석하도
록 구성된 소프트웨어에 의해 결정되는 바와 같이, 음성 또는 스피킹의 친숙한 톤에 기초하여 친숙한 미소를 갖
도록 애니메이팅될 수 있다. 추가로, 아바타 캐릭터는, 아바타가 특정 이모션을 표현할 것 같은 방식으로 애니
메이팅될 수 있다. 예컨대, 아바타가 개인 실시예에서, 인간 사용자에 국한된 시스템에 의해 검출되는 행복한
미소 또는 톤은 개 아바타의 흔드는 꼬리로서 아바타에서 표현될 수 있다.
[0179] 본 발명의 다양한 예시적 실시예들이 본 명세서에서 설명된다. 비-제한적인 의미로 이러한 예들이 참조된다.
이러한 예들은, 본 발명의 더욱 광범위하게 적용가능한 양상들을 예시하기 위해 제공된다. 본 발명의 사상 및
범위로부터 벗어남 없이, 설명된 본 발명에 다양한 변경들이 이루어질 수 있고, 등가물들이 치환될 수 있다.
부가하여, 특정 상황, 재료, 물질의 구성, 프로세스, 프로세스 동작(들) 또는 단계(들)를 본 발명의 목적(들),
사상 또는 범위로 적응시키기 위해 많은 수정들이 이루어질 수 있다. 추가로, 기술분야의 당업자들에 의해 인
정될 바와 같이, 본 발명들의 범위 또는 사상으로부터 벗어남 없이, 본 발명에서 설명 및 예시된 개별 변형들의
그 각각은 이산적인 컴포넌트들 및 피처들을 갖고, 상기 피처들은 다른 여러 실시예들 중 임의의 실시예의 피처
들로부터 쉽게 분리될 수 있거나 또는 다른 여러 실시예들 중 임의의 실시예의 피처들과 쉽게 결합될 수 있다.
그러한 수정들 전부는, 이러한 기재와 연관된 청구항들의 범위 내에 있는 것으로 의도된다.
[0180] 본 발명의 대상 디바이스들을 이용하여 수행될 수 있는 방법들을 포함한다. 방법들은 그러한 적절한 디바이스
를 제공하는 동작을 포함할 수 있다. 그러한 제공은 최종 사용자에 의해 수행될 수 있다. 다시 말해, 대상 방
법에서 필수 디바이스를 제공하기 위해, "제공하는" 동작은 단지, 최종 사용자가 획득하거나, 액세스하거나, 접
근하거나, 포지셔닝하거나, 셋-업하거나, 활성화하거나, 파워-업하거나 또는 다른 방식으로 동작할 것을 요구한
다. 본 명세서에서 언급된 방법들은 논리적으로 가능한, 언급된 이벤트들의 임의의 순서로, 뿐만 아니라 이벤
트들의 언급된 순서로 수행될 수 있다.
- 27 -
등록특허 10-1964223
[0181] 재료 선택 및 제조에 관한 세부사항들과 함께, 본 발명의 예시적 양상들이 위에서 전개되었다. 본 발명의 다른
세부사항들에 대해서와 같이, 이들은 위에서-인용된 특허들 및 공보들과 관련하여 인정될 수 있을 뿐만 아니라
기술분야의 당업자들에 의해 일반적으로 알려질 수 있거나 또는 인정될 수 있다. 동일한 내용이, 공통으로 또
는 논리적으로 사용되는 바와 같이 부가의 동작들 면에서 본 발명의 방법-기반 양상들에 대하여 적용될 수
있다.
[0182] 부가하여, 본 발명이 다양한 피처들을 선택적으로 포함하는 여러 예들을 참조하여 설명되었지만, 본 발명은 본
발명의 각각의 변형에 대하여 고려된 바와 같이 설명되거나 또는 표시되는 것으로 제한되지 않을 것이다. 본
발명의 참인 사상 및 범위로부터 벗어남 없이, 설명된 본 발명에 다양한 변경들이 이루어질 수 있고, 등가물들
(본 명세서에서 언급되든지 또는 어떤 간결성을 위해 포함되지 않든지)이 치환될 수 있다. 부가하여, 값들의
범위가 제공되는 경우, 그 범위의 상한치와 하한치 사이 그리고 그 언급된 범위에 있는 임의의 다른 언급된 또
는 중간의 값 사이의 모든 각각의 중간 값이 본 발명 내에 포함된다는 것이 이해된다.
[0183] 또한, 설명된 본 발명의 변형들의 임의의 선택적 피처가 본 명세서에서 설명된 피처들 중 임의의 하나 또는 그
초과와 독립적으로 또는 결합하여 전개 및 청구될 수 있다는 것이 고려된다. 단일 항목에 대한 참조는 복수의
동일한 아이템들이 존재할 가능성을 포함한다. 더욱 구체적으로, 본 명세서에서 그리고 그에 연관된 청구항들
에서 사용된 바와 같이, 단수 형태들 "하나의", "임의의", "상기" 및 "그"는 그렇지 않다고 구체적으로 언급되
지 않는 한 복수의 지시 대상물들을 포함한다. 다시 말해, 관사들의 사용은 위의 설명뿐만 아니라 이러한 기재
와 연관된 청구항들에서 대상 아이템의 "적어도 하나"를 허용한다. 그러한 청구항들이 임의의 선택적 엘리먼트
를 배제하도록 드래프트될 수 있음이 추가로 주의된다. 이와 같이, 이러한 진술은, 청구항 엘리먼트들의 언급
또는 "네거티브" 제한의 사용과 관련하여 "오로지", "유일하게" 등등으로서 그러한 배타적 용어의 사용을 위해
선행하는 기초로서의 역할을 하도록 의도된다.
[0184] 그러한 배타적 용어의 사용 없이, 이러한 기재와 연관된 청구항들에서 용어 "포함하는"은 임의의 부가의 엘리먼
트의 포함 ― 주어진 개수의 엘리먼트들이 그러한 청구항들에 열거되는지와 무관하게 ― 을 허용할 것이거나,
또는 피처의 부가가 그러한 청구항들에서 전개되는 엘리먼트의 성질을 트랜스폼하는 것으로서 간주될 수 있다.
본 명세서에서 구체적으로 정의된 바를 제외하고, 본 명세서에 사용된 모든 기술적 민 과학적 용어들은, 청구항
유효함을 유지하면서, 가능한 한 넓은, 보통 이해되는 의미로서 주어질 것이다.
[0185] 본 발명의 폭넓음은 제공된 예들 및/또는 대상 사양으로 제한되는 것이 아니라, 이러한 기재와 연관된 청구항
언어의 범위에 의해서만 제한된다.
- 28 -
등록특허 10-1964223
도면
도면1
- 29 -
등록특허 10-1964223
도면2
- 30 -
등록특허 10-1964223
도면3
도면4
- 31 -
등록특허 10-1964223
도면5
도면6
도면7
- 32 -
등록특허 10-1964223
도면8
- 33 -
등록특허 10-1964223
도면9a
- 34 -
등록특허 10-1964223
도면9b
도면10
- 35 -
등록특허 10-1964223
도면11
도면12
- 36 -
등록특허 10-1964223
도면13
- 37 -
등록특허 10-1964223
도면14
- 38 -
등록특허 10-1964223
도면15
- 39 -
등록특허 10-1964223
도면16
- 40 -

KR 101964223 B 1

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

KR 101964223 B 1

Uploaded by

Copyright:

Available Formats

등록특허 10-1964223

(19) 대한민국특허청(KR) (45) 공고일자 2019년04월01일

전체 청구항 수 : 총 17 항 심사관 : 박보미

으로 상기 메모리에 저장되고, 상기 가상 세계 데이터의 적어도 일부분을 프로세싱하기 위해 상기 프로세싱 회

적어도 하나의 사용자가 가상 세계 데이터를 포함하는 가상 세계 내에서 대화(interact)하는 것을 가능케 하기

하나 또는 그 초과의 컴퓨팅 디바이스들을 포함하는 컴퓨터 네트워크 ― 상기 하나 또는 그 초과의 컴퓨팅 디바

환경-감지 시스템 및 사용자-감지 시스템을 포함하는 제1 사용자 디바이스

상기 제1 사용자 디바이스는 상기 컴퓨터 네트워크에 동작가능하게 커플링되고,

상기 환경-감지 시스템은 로컬 환경 오디오 입력을 캡쳐하도록 구성되고,

상기 사용자-감지 시스템은 사용자 오디오 입력을 캡쳐하도록 구성되고,

상기 가상 세계 데이터의 적어도 제1 일부분은 상기 로컬 환경 오디오 입력 및 상기 사용자 오디오 입력 중 적

상기 가상 세계는 상기 로컬 환경 오디오 입력 및 상기 사용자 오디오 입력 중 적어도 하나에 기초하여 상기 컴

상기 가상 세계의 적어도 일부분은 상기 가상 세계 데이터의 변화에 응답하여 변하는,

상기 가상 세계의 적어도 일부분은 상기 제1 사용자 디바이스에 의해 캡쳐되는 상기 오디오 입력에서의 변화에

상기 가상 세계의 상기 시각적 렌더링은 2-차원 포맷으로 제시되는,

상기 가상 세계의 상기 시각적 렌더링은 3-차원 포맷으로 제시되는,

상기 사용자 디바이스는 증강 현실 모드에서 사용자와 상기 가상 세계 사이의 대화를 가능케 하기 위한 인터페

상기 사용자 디바이스는 가상 현실 모드에서 사용자와 상기 가상 세계 사이의 대화를 가능케 하기 위한 인터페

상기 사용자 디바이스는 증강 및 가상 현실 모드의 결합에서 사용자와 상기 가상 세계 사이의 대화를 가능케 하

상기 가상 세계 데이터는 데이터 네트워크를 경유해 전송되는,

제2 사용자가 상기 제2 사용자의 위치에서 상기 가상 세계 데이터의 상기 제1 일부분의 상기 오디오 입력을 들

적어도 하나의 사용자가 가상 세계 데이터를 포함하는 가상 세계와 대화하는 것을 가능케 하기 위한 시스템으로

컴퓨터 네트워크에 동작가능하게 커플링되는 제1 사용자 디바이스 ― 상기 컴퓨터 네트워크는 하나 또는 그 초

상기 제1 사용자 디바이스에 동작가능하게 커플링되고 그리고 제1 사용자로부터 적어도 제1 입력을 캡쳐하도록

상기 제1 사용자 디바이스에 동작가능하게 커플링되고 그리고 로컬 환경으로부터 적어도 제2 입력을 캡쳐하도록

구성되는 환경-감지 시스템 ― 상기 환경-감지 시스템은 상기 컴퓨터 네트워크에 상기 제2 입력을 전송하도록

상기 컴퓨터 네트워크는 상기 제1 입력 및 상기 제2 입력 중 적어도 하나에 기초하여 가상 세계 데이터를 변경

상기 제1 사용자 디바이스는 변경된 가상 세계 데이터에 기초하여 상기 제1 사용자에게 가상 콘텐츠를 제시하도

상기 가상 콘텐츠는 시각 콘텐츠, 오디오 콘텐츠, 및 햅틱 콘텐츠로 구성되는 그룹으로부터 선택되는,

상기 제1 사용자로부터의 상기 제1 입력은 제스처 데이터, 오디오 데이터, 지리적 위치 데이터, 및 광학 특성

상기 로컬 환경으로부터의 상기 제2 입력은 상기 로컬 환경으로부터의 오디오 데이터 및 상기 로컬 환경에서의

상기 컴퓨터 네트워크와 상기 제1 사용자 디바이스 사이에 커플링되는 게이트웨이를 더 포함하는,

상기 가상 콘텐츠를 수신하도록 구성되는 제2 사용자 디바이스를 더 포함하는,

상기 제2 사용자 디바이스는 제2 사용자에게 상기 가상 콘텐츠를 제시하도록 구성되는,

[0002] 본 출원은 일반적으로, 하나 또는 그 초과의 사용자들에 대해 대화식(interactive) 가상 또는 증강 현실 환경들

[0005] 다른 실시예는, 음성 어조(voice inflection) 및 얼굴 인식 소프트웨어로부터의 선택적 입력을 갖는 웨어러블

[0006] 다른 실시예는, 카메라 포즈 또는 뷰포인트 포지션 및 벡터가 세계 섹터에서 어디에든지 배치될 수 있는 가상

은 피처들이 세계 모델에 대해 베이스 데이터로서 활용될 수 있는 가상 및/또는 증강 사용자 경험을 위한 시스

도 1은 다수의 사용자들에 대해 대화식 가상 또는 증강 현실 환경들을 용이하게 하기 위한 기재된 시스템의 대

도 2는 도 1에서 예시된 시스템과 대화하기 위한 사용자 디바이스의 예를 예시한다.

도 3은 모바일 웨어러블 사용자 디바이스의 예시적 실시예를 예시한다.

도 4는 도 3의 모바일 웨어러블 사용자 디바이스가 증강 모드로 동작하고 있을 때 사용자가 보는 객체들의 예를

도 5는 도 3의 모바일 웨어러블 사용자 디바이스가 가상 모드로 동작하고 있을 때 사용자가 보는 객체들의 예를

도 6은 도 3의 모바일 웨어러블 사용자 디바이스가 블렌드 가상 인터페이스 모드로 동작하고 있을 때 사용자가

도 8은 도 7의 실시예가 햅틱 디바이스의 사용을 포함하도록 확장되는 실시예를 예시한다.

도 9a는 제1 사용자가 블렌드 가상 인터페이스 모드로 디지털 세계와 인터페이싱하고 있고 제2 사용자가 가상

도 9b는 제1 사용자가 블렌드 가상 인터페이스 모드로 디지털 세계와 인터페이싱하고 있고 제2 사용자가 증강

도 10은 증강 현실 모드로 시스템과 인터페이싱할 때 사용자의 뷰의 예시적 예시를 예시한다.

도 11은 사용자가 증강 현실 모드로 시스템과 인터페이싱하고 있을 때 물리적 객체에 의해 트리거링되는 가상

도 12는 증강 현실 경험에 있는 한 명의 사용자가 가상 현실 경험에 있는 다른 사용자의 존재를 시각화시키는

도 13은 시간 및/또는 콘틴전시 이벤트(contingency event) 기반 증강 현실 경험 구성의 일 실시예를 예시한다.

도 14는 가상 및/또는 증강 현실 경험들에 적절한 사용자 디스플레이 구성의 일 실시예를 예시한다.

도 15는 로컬 및 클라우드-기반 컴퓨팅 조정의 일 실시예를 예시한다.

도 16은 정합(registration) 구성들의 다양한 양상들을 예시한다.

발명을 실시하기 위한 구체적인 내용

[0022] 바람직한 실시예의 하나의 구현에서, 시스템(100)은 많은 수의 동시 사용자들(예컨대, 수백만의 사용자들)을 지

[0025] 일 예에서, 컴퓨팅 네트워크(105)(IS)는 고속 연결들(예컨대, 높은 대역폭 인터페이스들(115))을 통해 연결된

[0027] 컴퓨팅 네트워크(105) 내의 하나 또는 그 초과의 서버들(110)에 저장된 데이터는, 일 실시예에서, 고속으로 그

[0028] 게이트웨이(140)는 하나 또는 그 초과의 사용자들에 대해 컴퓨팅 네트워크(105)로의 로컬 연결을 제공한다. 몇

[0029] 몇몇의 실시예들에서, 게이트웨이 컴포넌트(140)는, 특정 사용자 디바이스(120)에 대해 최적 데이터 프로세싱

다. 우선순위화된 스레딩된 데이터 스트림의 일 예로서, 사용자 눈의 60도 시야 내에 있는 데이터에는 더욱 주

[0031] 이제 도 3을 또한 참조하면, 디지털 세계들은 사용자의 디바이스의 능력들에 따라 좌우될 수 있는 다양한 포맷

[0039] 일 예시적 실시예에서, 헤드-장착 시스템(300)은 인터페이스(302)가 증강 현실 인터페이스를 제공하는 "증강"