
딥시크에 이은 다음 충격파는? 현재 알리바바가 개발중인 큐원 아닐까라고 합니다. 알리바바 큐원 성능 기능을 챗GPT 퍼플렉시티와 비교합니다.
알리바바 큐원 Alibaba Qwen 성능
알리바바의 최신 AI 모델 ‘큐원 Qwen 2.5-맥스’는 매우 높은 성능을 보이고 있습니다. 이 모델은 20조 개 이상의 토큰으로 사전 학습되었으며, 알리바바는 이 모델이 오픈AI의 GPT-4o, 딥시크-V3, 메타의 라마(LLaMA)-3.1-405B를 거의 모든 영역에서 능가한다고 주장하고 있습니다.
사실일까요? 일단 알아봅시다.
구체적으로, 큐원 2.5-맥스는 다음과 같은 성능을 보여주고 있습니다:
-
아레나-하드, 라이브벤치, 라이브코드벤치, GPQA-다이아몬드 등의 벤치마크에서 딥시크 V3보다 우수한 성능을 발휘했습니다. (주: 아레나-하드, 라이브벤치, 라이브코드벤치, GPQA-다이아몬드는 모두 인공지능 언어 모델의 성능을 평가하기 위한 최신 벤치마크)
-
지식, 프로그래밍, 종합능력 평가, 인간 선호도 조정 등 11개 부문의 벤치마크 테스트에서 모든 영역의 성능이 비교 모델을 앞섰다고 합니다.
-
코드 생성 및 일반적인 AI 성능 평가에서 오픈AI의 GPT-4, 앤스로픽의 ‘클로드 3.5 소네트’와 경쟁할 수 있는 수준의 성능을 기록했습니다.
흠, 이건 우리가 본것은 아니니까, 사실확인이 필요한 영역이라, 우린 참고만 하는게 좋겠지요?
딥시크를 능가한다라? 흠 좀 더 알아보죠.
중요한것은, 이전 버전인 큐원2 모델은 생성형 AI 기반 챗봇 평가 기관인 슈퍼클루의 평가에서 오픈AI와 앤트로픽에 이어 세계 3위를 기록한 바 있습니다. 이는 알리바바의 AI 모델이 글로벌 시장에서도 경쟁력 있는 성능을 보여주고 있음을 시사합니다.
큐원 챗지피티 퍼플렉시티 성능 비교
큐원(Qwen), 챗지피티(ChatGPT), 퍼플렉시티(Perplexity)는 각각 고유한 특징과 장단점을 가진 AI 모델입니다. 이 세 모델을 비교해보겠습니다.
성능 및 기능
큐원
- 알리바바에서 개발한 최신 AI 모델로, 20조 개 이상의 토큰으로 사전 학습되었습니다.
- 오픈AI의 GPT-4, 딥시크-V3, 메타의 라마(LLaMA)-3.1-405B를 거의 모든 영역에서 능가한다고 주장됩니다.
- 코드 생성 및 일반적인 AI 성능 평가에서 GPT-4, 클로드 3.5 소네트와 경쟁할 수 있는 수준의 성능을 보입니다.
챗지피티
- 다양한 대화형 AI 용도에 적합한 범용 AI 플랫폼입니다.
- 다중 모달 기능, 즉, 텍스트, 이미지, 오디오 처리, 을 제공합니다.
- DALL-E 이미지 생성 기능이 통합되어 있습니다.
- 플러그인 및 맞춤형 GPT 기능을 제공합니다.
- 글쓰기 작문 및 콘텐츠 생성 능력이 뛰어납니다.
퍼플렉시티
- 정확하고 정보가 풍부한 응답을 제공하는 데 중점을 둔 연구 지향적 AI 도구입니다.
- 실시간 웹 검색 기능을 제공합니다.
- 소스 인용을 제공하여 정보의 신뢰성을 높입니다.
- Copilot 대화형 검색 기능을 제공합니다.
- 다양한 콘텐츠(코드, 표, 수학 문제 등) 처리 능력이 있습니다.
장단점 비교
큐원
장점:
- 최신 기술을 적용한 고성능 모델
- 다양한 영역에서 우수한 성능 발휘
단점:
- 아직 널리 사용되지 않아 실제 사용자 피드백이 제한적
챗지피티
장점:
- 뛰어난 대화 능력, 특히 글짓기 및 대화, 다국어 능력
- 다중 모달 상호작용
- 지속적인 업데이트와 개선
- 입증된 성능 및 높은 인지도
단점:
- 전문적인 정보에 대해서는 정확도가 떨어질 수 있음
- 다중 모달 기능이 아직 완벽하지 않다는 평가
퍼플렉시티
장점:
- 정확하고 출처가 있는 답변 제공
- 실시간 정보 업데이트
- 리서치 및 연구 목적에 적합
단점:
- 일상적 대화에는 덜 효과적
- 상세한 정보가 때로는 과도할 수 있음
API?
API 사용료를 비교하면,
큐원: 입력 $1.6, 출력 $6.4 / 1M 토큰당
챗지피티: 입력 $15, 출력 $60 / 1M 토큰당
너무 차이가 나네요 열배 차이가 납니다!!
중국 인공지능 현황: 두바오
현재 중국에서 가장 인기 있는 AI 챗봇은 바이트댄스의 ‘두바오(Doubao)’입니다.
두바오는 다음과 같은 특징을 가지고 있습니다:
월간 활성 사용자 수가 5,100만 명으로, 바이두의 ‘원신이옌(Wenxiaoyan)’ 1,250만 명을 크게 앞서고 있습니다.
iOS 누적 다운로드 수에서 900만 건을 기록하여, 바이두의 ‘어니(Ernie)’ 800만 건을 추월했습니다.
텍스트 생성뿐만 아니라 사운드, 이미지, 비디오 생성, 데이터 분석, 온라인 검색 등 다양한 기능을 무료로 제공합니다.
사용자 친화적인 디자인과 다양한 기능으로 인해 정기적으로 사용되고 있습니다.
출시 이후 3개월 만에 20개 이상의 새로운 기능과 개선 사항이 추가되었습니다
중국은 앞으로도 4-5개의 인공지능을 준비한다는데, 우리나라 기업들의 분발을 바랍니다.
정보유출 위험은?
중국의 인공지능, 특히 딥시크 DeepSeek는 심각한 정보 유출 위험이 있는 것으로 보입니다. 이미 대만, 미국, 이탈리아, 일본에서 차단을 하려는 금지 조항을 준비중입니다. 주요 우려사항은 다음과 같습니다:
- 데이터 전송: 딥시크의 대형 모델(671B)을 사용할 때 모든 데이터가 중국 서버로 전송됩니다.
- 광범위한 개인정보 수집: 딥시크는 이용자의 이름, 생년월일, 이메일뿐만 아니라 입력한 텍스트, 이미지, 오디오 파일까지 수집합니다.
- 중국 내 데이터 저장: 수집된 사용자 정보는 중국 내 딥시크 보안 서버에 저장됩니다.
- 국가 안보 위협: 대만, 일본 등 여러 국가에서 딥시크 사용이 국가 안보에 위협이 될 수 있다고 우려하고 있습니다.
- 법적 문제: 중국의 사이버 안보법에 따라 딥시크는 정부 요청 시 영장 없이도 데이터를 제공해야 할 수 있습니다.
이러한 우려로 인해 대만, 일본 등 여러 국가에서 정부 기관의 딥시크 사용을 금지하고 있으며, 기업들도 사용을 자제하는 추세입니다.
앞으로 중국의 인공지능은 다소 성능보다 보안문제에 대하여 우리가 알고 써야 안전하지 않을까 싶습니다.
Wide AI GPT에서 더 알아보기
구독을 신청하면 최신 게시물을 이메일로 받아볼 수 있습니다.