보고 듣고 말하는 GPT-4o 멀티모달 AI 챗봇

지난 새벽 OpenAI는 새로운 GPT-4o 모델을 공개했습니다.

여기서 ‘o’는 ‘옴니(omni)’로 사전적으로는 ‘모든 것’을 뜻한다.

텍스트, 오디오, 이미지 인식을 통합하여 상호작용이 가능한 멀티모달(Multimodal)이라는 점에서 매우 어울리는 이름입니다.

기존 GPT-4와 차이점은 무엇인가요?

현재 PC와 모바일 앱을 모두 지원합니다.

OpenAI가 다양한 기능을 시연하는 영상에서 가장 눈에 띄는 것은 사용자와의 실시간 음성 대화다.

물론 이전에도 음성모드를 지원했지만 응답속도는 5.4초 정도로 느렸지만 GPT-4o는 평균 320ms 이내에 응답한다.

이는 실제 사람과의 대화 속도와 비슷하다고 한다.

하지만 한국어로 된 질문은 대부분 1초 이상이 걸립니다.

광고 이후 계속됩니다.

다음 주제 작성자 취소 GPT-4o AI 챗봇 리뷰 재생 좋아요 117개 좋아요 공유 0:00:00 재생 음소거 00:00 02:00 실시간 설정 전체 화면 해상도 자동 480p 자막 비활성화 재생 속도 1.0x (기본) 해상도 자동 ( 480p) 1080p HD 720p HD 480p 270p 144p 자막 설정 비활성화 옵션 글꼴 크기 배경색 재생 속도 0.5x 1.0x (기본값) 1.5x 2.0x 알 수 없는 오류가 발생했습니다.

도움말이 음소거되었습니다.

도움말 라이센스 이 영상은 고화질로 재생할 수 있습니다.

설정에서 해상도를 변경해보세요. 자세히보기 0:00:00 GPT-4o AI 챗봇 리뷰 간단히 테스트해본 결과, 매력적일 뿐만 아니라 조금 무섭기도 했습니다.

GPT-4o와 영화 ‘Emily Goes to Paris’에 관해 대화를 나눴습니다.

극중 캐릭터 이름이 기억나지 않아서 관련 정보를 줬더니 바로 ‘아, 가브리엘?’이라고 대답하더군요. 이러한 새로운 사용자 경험과 인터랙션은 대표적인 기능 중 하나입니다.

현재 5가지 음성이 제공되며, 영어뿐만 아니라 다른 언어도 지원됩니다.

여기에 인상적인 점은 목소리의 다양성은 물론, 인간처럼 다양한 톤과 속도로 감정을 표현하는 능력이다.

음성 대화는 텍스트로 별도로 녹음됩니다.

이 부분은 2013년 개봉한 영화 ‘그녀’가 생각나는 부분이다.

지금은 사용자에게 직접 톤을 바꿔달라고 요청해야 하는데, 머지않아 격려가 필요할 때는 자동으로 톤을 바꿔줄 수 있지 않을까 싶다.

또는 답장을 통해 사용자를 위로하거나 축하 메시지를 전달해야 할 경우. 그런데 우리는 그러한 상황을 어떻게 알고 판단할 수 있는가? 이는 스마트폰 마이크에 포착된 사용자의 음성(오디오), 전면 카메라에 포착된 얼굴(이미지) 등 다양한 입력 데이터를 종합적으로 고려하는 멀티모달 AI 챗봇이기 때문에 가능하다.

현재 시연 영상에 등장하는 기기의 카메라를 활용한 VISION 기능은 사용할 수 없으니 주의하시기 바랍니다.

GPT-4o는 GPT-4와 비슷한 수준의 지식을 갖고 있지만 처리 속도와 성능이 크게 향상됐다.

OpenAI에 따르면 GPT-4 Turbo보다 ​​2배 이상 빠르지만 비용은 절반으로 줄었습니다.

그리고 앞으로는 무료 사용자가 새로운 멀티모달 AI를 사용할 수 있도록 허용하고 시간당 질문할 수 있는 질문 수를 제한할 계획입니다.

그렇다면 유료 사용자는 어떨까요? 횟수만 늘어날 뿐 성능에는 차이가 없다고 합니다.

(현재 3시간마다 최대 80개의 메시지 전송 가능) 본문에 소개된 음성 대화 외에도 외국어 음성을 실시간으로 번역하는 기능(참고로 AI보다 훨씬 빠르고 정확함) ​​삼성 갤럭시 S24 시리즈에 적용되는 기능), 그래프 및 차트 업로드 데이터를 추출하는 기능, 일부 결과(문자 등)를 유지한 채 추가 요청을 반영하는 기능 등 다양한 기능이 추가되어 완성도가 높아졌습니다.

)는 Dali 3 생성 이미지 AI 기능을 사용할 때 기존 프롬프트를 통해 생성됩니다.

각 방법과 활용팁은 충분히 활용해보고 다른 컨텐츠에서 공유하도록 하겠습니다.

지금까지 도입된 GPT-4o는 현재 유료 요금제로만 이용 가능하다.

물론, 앞서 말씀드렸던 것처럼 무료 유저들도 곧 사용할 수 있게 되겠지만, 남들보다 조금 더 빠르게 어떻게, 어디서 사용할 수 있는지 테스트해보고 싶다면 아래 컨텐츠를 통해 저렴한 가격에 사용해 보세요!
Chatgpt 유료 Dali 3 이용 방법 사진 만드는 방법 유료 가격 할인 이용 방법 이번 글에서는 ChatGPT Plus 유료 요금제에 포함된 DALL·E 3(이하 Dali 3) 이용 및 저장 방법에 대해 알아보겠습니다.

정가의 50%… blog.naver.com