
클로드3와 제미니의 장단점 분석 5가지
2024년 3월 4일, 앤트로픽은 가장 진보된 대형 언어 모델 – 클로드 3 Claude 3모델을 발표.
클로드 3 대형 언어 모델은 벤치마크에서의 성능과 20만 토큰의 컨텍스트 창이 가장 큰 특징이다. 한마디로 성능이 다른 AI 챗봇을 능가한다는 것이다.
이에 견줄만한 것이 있을까? 있다면 전문가들은 클로드 3 모델과 대부분의 벤치마크에서 가끔 더 뛰어난 성능을 보이는 또 다른 대형 언어 모델은 Google의 Gemini다.
클로드 3
클로드를 이해하기 위해서는 간단한 몇가지 상식을 아는것이 필요하다.
Claude 3는 Anthropic에서 개발하여 2024년 3월 4일에 출시된 대규모 언어 모델 제품군
Claude 3 모델은 각기 다른 작업에 맞게 설계된 세 가지 크기가 있다: 하이쿠, 소네트, 오푸스
클로드 3 모델에 액세스하려면 Anthropic의 공식 웹사이트를 이용하거나 TextCortex 에서 제노챗을 사용할 수 있다. 그러나 굳이 제노챗을 이용하는것은 번거로우므로, 공식 웹사이트를 이용하는것을 추천한다. 간단하기 때문이다.
여기서 잠시 안내말씀 드립니다.
Wide AI GPT는 양질의 서비스를 제공하기 위해 여러분의 자발적인 참여를 바랍니다. 즐겨찾기에 고정해 두시기 바랍니다. 저희는 페이지에 뜬 광고를 기반으로 운영하는 회사입니다. 따라서 여러분의 간단한 도움이 필요합니다. 간단합니다. 지금 보는 화면에서 뜬 광고를 살짝 한번 누르신 후, 계속 글을 재밌게 읽어주시면 됩니다. 감사합니다.
구글 제미니
이에 반하여 제미니는 어떠한지 그 대표적 특성을 알아보자.
제미니는 챗봇을 비롯한 다양한 Google 서비스를 지원하는 AI 모델
클로드와 제미니의 장단점
텍스트 및 코드 기반 작업에서는 클로드 3가 구글 제미니보다 성능이 뛰어나지만, 시각 기반 작업에서는 제미니가 클로드 3보다 낫다. 한마디로 시각적인 이미지나 영상에서는 제미니가 낫다는 것이다.
그렇다면 사용자 입장에서 어떤것이 더 충실하게 명령을 따를까? 우리는 이점을 매우 중요한 사용자 입장에서의 편리성으로 대부분 믿고 있다. 제 아무리 똑똑하더라도, 명령을 거부하거나, 제멋대로 해석한다면 사용자는 더이상 질려서 그리고 실망스러워 사용을 중단하는 것이 초기 AI 사용자들이 말하는 가장 큰 불만사항이었기 때문일것이다.
현재 수많은 비교 테스트 결과, 그 우위는 아무래도 클로드 3가 우위이다. 왜냐하면 클로드 3는 구글 제미니보다 프롬프트와 지침을 더 잘 따른다.
여기까지가 사용자가 우선 어떤것을 사용하는것이 더 편리하고 시간절감인지 비교할때 우선 알아야 할 사항이다.
아래부터는 각각의 특징과 세부사항, 가격, 그리고 장점을 알아보도록 하자.
클로드 3 개요
Claude 3는 자연어 처리, 머신 러닝, 딥 러닝 등의 알고리즘을 사용하여 작동한다. 이말을 이해한다면 이것이 바로 대규모 언어 모델 LLM을 활용한다는 뜻이라는것을 말하는것이다. Claude 3를 사용하면 텍스트 기반 출력을 생성하거나 기본적인 코딩 작업을 완료할 수 있다.
여기에서 가장 중요한 점은 Claude 3가 궁극적으로 목표로 하는것인데 바로 고급 추론과 신속한 추론 능력을 제공하는 것이다. 아마도 대부분의 사용자들은 이 점때문에 클로드 3를 가장 만족해하고 있는것이다. 또 대부분 그렇게 받아들이고 있다.
클로드 3 모델
클로드 3 대형 언어 모델은 다양한 작업에 맞게 설계된 세 가지 크기로 제공된다: 하이쿠, 소네트, 오푸스
하이쿠 모델은 기본적인 작업을 완료하는 데 이상적이지만, 소네트 모델은 GPT-3.5를 대체할 수 있는 그리고 좀 더 나은 모델이다. Claude 3 Opus 모델은 GPT-4보다 더 고급 기능을 제공한다고 보여진다. 복잡한 작업을 완료하고 자동화해야 하는 경우 Claude 3 Opus를 사용하는 것이 좋다.
클로드 3에 액세스하는 방법
Claude 3 모델을 이용하려면 Anthropic의 공식 웹사이트에서 계정을 생성만 하면 된다. 간편하다. 그런 다음 클로드 3 소네트 모델에 액세스하여 무료로 체험이 가능하다. 클로드 3 오푸스 모델을 이용하려면 월 20달러의 구독이 필요하다. 아직 국내에서는 전문가들 외에는 그다지 많은 사용자는 없다고 한다.
클로드 3 가격
클로드 3 소네트 모델은 무료로 사용할 수 있지만, 오퍼스 모델을 이용하려면 월 20달러의 클로드 프로 구독을 구매해야 한다고 했는데 가격을 조금 더 알아보자. 또한 Claude 3 모델을 API 로 사용하려면 다음 요금을 지불해야 한다.
- 하이쿠 백만 토큰 입력당 0.25달러, 백만 토큰 출력당 1.25달러
- 소네트: 백만 토큰 입력당 3달러, 백만 토큰 출력당 15달러
- 오퍼스: 백만 토큰 입력당 15달러, 백만 토큰 출력당 75 달러
즉, 가격은 현재로서는 여타 다른 챗봇에 비해 클로드가 약간 비싸게 책정되어 있다.
구글 제미니 개요
Gemini는 Google에서 개발 및 발표한 대형 언어 모델로, 클로드와 마찬가지로 세 가지 크기가 있다: 나노, 프로, 울트라
구글의 제미니 울트라 모델은 코딩, 언어 이해, 추론 등의 기술에서 GPT-4와 경쟁하려고 만들었다. 구글은 제미니 모델을 개발한 후 AI 챗봇에 통합하여 모든 사용자에게 제공하기 시작했다.
Gemini AI는 Google에서 개발하여 Google 챗봇을 비롯한 대부분의 서비스에서 사용되는 AI 모델.
Google Gemini는 번역, 텍스트 생성, 요약, 코드 생성 등의 작업에 능숙하며 텍스트, 시각 및 오디오 입력도 지원한다. 또한 Google Gemini를 사용하여 시각적 콘텐츠도 생성할 수 있다.
구글 제미니 모델
구글 제미니는 클로드 3와 마찬가지로 다양한 작업을 위한 세 가지 크기를 제공.
- 제미니 나노: 모바일 디바이스용으로 개발된 이 모델은 기본적인 작업을 완료하도록 설계.
- 제미니 프로: Gemini 제품군의 중간 모델인 이 모델은 복잡한 작업을 효율적이고 비용 효율적으로 완료하도록 설계.
- 제미니 울트라: Google의 가장 고급 모델인 Gemini Ultra는 복잡한 글쓰기 및 코딩 작업을 높은 완성도로 완료하고 자동화하도록 설계
제미니에 액세스하는 방법
불과 얼마전까지만 해도 Google 바드라고 알려진 AI 챗봇 인터페이스를 통해 Google의 Gemini Pro 모델에 액세스할 수 있었다. Gemini Pro 모델을 사용하기 위해 비용을 지불할 필요는 없다. 그러나 Gemini Ultra 모델에 액세스하려면 월 20달러의 Gemini Advanced 구독을 구매해야 한다. Android 시스템이 지원되는 모든 모바일 기기에서 Gemini Nano 모델에 액세스할 수 있다.
클로드 3 와 제미니 비교
비교 자체가 참 많은 변수와 환경이 있는 항목이다. 그리고 각자의 요구조건이나 업무환경, 목표치가 달라서 일관된 비교 결과치는 사실 근거가 없을 수 있다. 다만, 성능비교는 교차적으로 같은 질문을 주고서 얼마나 충실한지 비교하는 것이 가장 일반적 비교방식이다. 즉 벤치마크 방식이다.
앤트로픽의 클로드 3와 구글의 제미니는 모두 다양한 작업을 완료하는 데 효과적인 AI 모델은 분명하다. 그러나 두 AI 모델 모두 서로 장단점이 있다. 지금부터 Anthropic의 클로드 3와 Google의 제미니의 유사점과 차이점을 자세히 살펴보자.
성능 및 벤치마크
여러 테스트에서 클로드 3 오푸스 모델이 제미니 울트라 모델보다 더 나은 성적을 보였다. 이러한 테스트에는 언어 이해력 테스트(MMLU), 추리력 테스트(GPQA), 수학 테스트(GSM8K), 코딩 테스트(HumanEval), 텍스트 추리력 테스트(DROP)가 포함되었다.
코딩 및 텍스트 생성
복잡한 코딩과 텍스트 생성이 필요한 작업이라면 Gemini 1.0 Ultra보다 Claude 3 Opus 모델이 더 나은 선택이라고 전하고 있다. 하지만 비전 기능에 관해서는 상황이 달라진다.
비전 기능
Claude 3 모델은 텍스트 및 코드 기반 작업에 이상적인 솔루션이지만, Gemini 1.0 Ultra는 다이어그램, 이미지 및 시각적 작업에 더 적합한 선택이다. 따라서 제미니 울트라 모델이 클로드 3 오퍼스 모델보다 시각적 작업을 처리하는 데 더 효과적이다.
프롬프트 이해도
AI 모델이 사용자의 프롬프트를 더 잘 이해할수록 즉 잘 읽을 수 있어야 사용자 질문에 더 맞게 출력을 생성할 수 있다. 프롬프트 이해도에 있어서는 Claude 3 Opus 모델이 가장 높은 점수를 받았다. Claude 3 Opus 모델은 MMLU 벤치마크에서 86.8%의 점수를 받은 반면, Gemini 1.0 Ultra 모델은 83.7%의 점수를 받았다고 최신 벤치마크 테스트가 보여준다.
결론
전반적으로 텍스트 또는 코드 기반 작업을 하는 경우 Claude 3가 더 나은 선택이며, 이미지가 포함된 작업을 하는 경우 Gemini가 더 나은 선택이라고 할 수 있다.
또한 Claude 3 모델은 컨텍스트 창이 20만~100만 토큰으로 더 큰 크기의 입력을 분석할 수 있다.
이렇게 본다면, 학술적이거나 분석을 요하는 추론작업에서는 클로드 3가 대세인것을 알 수있다.
추가정보
Wide AI GPT에서 더 알아보기
구독을 신청하면 최신 게시물을 이메일로 받아볼 수 있습니다.