
오픈AI 오퍼레이터 기능이 도대체 뭐지? OpenAI의 Operator는 웹 브라우저를 인간처럼 사용할 수 있는 혁신적인 AI 에이전트로, 다음과 같은 주요 기능을 제공합니다. 한번 어떤 기능이 우선 있는지 살펴보죠!
-
키보드 입력과 마우스 클릭을 통해 웹 브라우저를 직접 제어합니다.
-
API 통합 없이도 거의 모든 웹사이트와 상호작용할 수 있습니다.
-
양식 작성, 주문, 예약 등 복잡한 다단계 작업을 자동으로 수행합니다.
-
웹페이지의 스크린샷을 분석하여 버튼, 메뉴, 양식 등을 인식하고 상호작용합니다.
-
그래픽 사용자 인터페이스(GUI)를 이해하고 조작할 수 있습니다.
오늘은 시각적 AI 기능을 조금 자세히 예를 들어 볼까요?
사용자가 Operator에게 “나이키 에어맥스 90 신발을 주문해줘”라고 요청했다고 가정해 보겠습니다.
-
-
Operator는 유명한 온라인 쇼핑몰 웹사이트로 이동합니다.
-
시각적 AI가 페이지를 스캔하여 검색창을 식별합니다.
-
“나이키 에어맥스 90″을 검색창에 입력합니다.
-
-
-
검색 결과 페이지에서 시각적 AI가 상품 이미지, 가격, 별점 등을 인식합니다.
-
가장 적절한 상품을 선택하고 클릭합니다.
-
-
-
상품 페이지에서 시각적 AI가 사이즈 선택 드롭다운, 색상 옵션, “장바구니 담기” 버튼 등을 식별합니다.
-
사용자의 선호도나 일반적인 선택을 바탕으로 옵션을 선택합니다.
-
-
-
“장바구니 담기” 버튼을 클릭한 후, 팝업이나 새 페이지의 “결제하기” 버튼을 인식합니다.
-
결제 페이지로 이동합니다.
-
-
-
결제 페이지에서 주소, 신용카드 정보 등의 입력 필드를 식별합니다.
-
보안상의 이유로 사용자에게 직접 정보 입력을 요청합니다.
-
-
-
주문 완료 후 확인 페이지에서 주문 번호, 예상 배송일 등의 중요 정보를 시각적으로 인식하고 추출합니다.
-
이 정보를 사용자에게 보고합니다.
-
이 과정에서 Operator의 시각적 AI는 계속해서 페이지의 변화를 모니터링하고, 예상치 못한 팝업이나 에러 메시지에 대응하며, 필요한 경우 사용자의 개입을 요청합니다. 이러한 방식으로 복잡한 웹 쇼핑 과정을 자동화하면서도 정확성과 안전성을 유지할 수 있습니다.
-
여러 탭을 동시에 열어 다양한 작업을 병렬로 처리할 수 있습니다.
-
예를 들어, 한 쪽에서 캠핑 예약을 진행하면서 다른 쪽에서 개인화된 제품을 주문할 수 있습니다.
-
민감한 작업(로그인, 결제 등)에서는 사용자에게 제어권을 넘깁니다.
-
오류 발생 시 자체적으로 교정하거나 사용자의 개입을 요청합니다.
-
주어진 목표를 달성하기 위해 최적의 방법을 스스로 판단하고 선택할 수 있습니다.
-
복잡한 문제를 해결하거나 예상치 못한 상황에서도 효과적으로 작업을 수행합니다.
-
특정 웹사이트나 작업에 대한 맞춤형 명령을 추가할 수 있습니다.
-
반복적인 작업을 위한 프롬프트 저장 기능을 제공합니다.
그럼 사용자 맞춤설정이 무엇인지 예를 들어 보겠습니다.
사용자가 매주 특정 온라인 슈퍼마켓에서 비슷한 식료품을 주문한다고 가정해보겠습니다.
-
-
사용자는 “주간 식료품 주문”이라는 맞춤형 명령을 생성합니다.
-
이 명령에는 자주 구매하는 품목 리스트, 선호하는 브랜드, 수량 등이 포함됩니다.
-
-
-
사용자가 자주 이용하는 온라인 슈퍼마켓 웹사이트의 URL을 지정합니다.
-
로그인 정보(사용자 이름만)를 안전하게 저장합니다.
-
-
-
특정 카테고리나 할인 섹션을 먼저 확인하도록 설정합니다.
-
예산 제한을 설정하여 총 주문 금액이 이를 초과하지 않도록 합니다.
-
-
-
매주 특정 요일과 시간에 자동으로 주문을 실행하도록 예약합니다.
-
-
-
품절 상품에 대한 대체 옵션을 미리 지정합니다.
-
특정 금액 이상의 구매나 새로운 품목 추가 시 사용자 확인을 요청하도록 설정합니다.
-
-
-
선호하는 결제 방법을 지정합니다(예: 특정 신용카드 사용).
-
보안을 위해 결제 단계에서는 항상 사용자 확인을 요청하도록 설정합니다.
-
-
-
주문 완료 후 이메일이나 메시지로 주문 내역을 자동 전송하도록 설정합니다.
-
특별 할인이나 프로모션이 있을 경우 알림을 받도록 합니다.
-
이러한 맞춤 설정을 통해 사용자는 “주간 식료품 주문 실행”이라는 간단한 명령만으로 복잡한 주문 프로세스를 자동화할 수 있습니다. Operator는 설정된 지침에 따라 웹사이트를 탐색하고, 상품을 선택하며, 결제를 진행합니다.
이는 사용자의 시간을 절약하고 일관된 쇼핑 경험을 제공하는 동시에, 필요한 경우 사용자의 개입을 요청하여 정확성과 안전성을 보장합니다.
Operator는 이러한 기능들을 통해 사용자의 생산성을 크게 향상시키고, 반복적인 웹 작업을 효율적으로 자동화할 수 있습니다
구체적인 사용가능 시기
현재 OpenAI의 Operator는 미국 내 ChatGPT Pro 사용자들에게만 제한적으로 제공되고 있습니다. 일반 사용자들의 접근 가능 시기에 대해 구체적인 날짜는 아직 발표되지 않았지만, OpenAI는 다음과 같은 계획을 밝혔습니다:
안전성과 사용성이 충분히 검증된 후 Plus, Team, Enterprise 사용자들에게 확대 제공할 예정입니다.
궁극적으로는 ChatGPT에 Operator 기능을 통합하여 더 많은 사용자가 이용할 수 있도록 할 계획입니다.
OpenAI는 “규모에 맞는 안전성과 사용성에 대한 확신”이 생길 때까지 점진적으로 확대할 것이라고 밝혔습니다.
현재로서는 일반 사용자들이 Operator를 사용할 수 있는 정확한 시기를 예측하기 어렵습니다.
OpenAI는 제한된 사용자 그룹을 통해 피드백을 수집하고 기능을 개선한 후에 점진적으로 확대할 계획이므로, 일반 사용자들의 접근은 이러한 과정이 충분히 진행된 후에 가능할 것으로 보입니다.
Wide AI GPT에서 더 알아보기
구독을 신청하면 최신 게시물을 이메일로 받아볼 수 있습니다.