보고 듣고 말하는 GPT-4o 멀티모달 AI 챗봇
지난 새벽 OpenAI는 새로운 GPT-4o 모델을 공개했습니다. 여기서 ‘o’는 ‘옴니(omni)’로 사전적으로는 ‘모든 것’을 뜻한다. 텍스트, 오디오, 이미지 인식을 통합하여 상호작용이 가능한 멀티모달(Multimodal)이라는 점에서 매우 어울리는 이름입니다. 기존 GPT-4와 차이점은 무엇인가요? 현재 PC와 모바일 앱을 모두 지원합니다. OpenAI가 다양한 기능을 시연하는 영상에서 가장 눈에 띄는 것은 사용자와의 실시간 음성 대화다. 물론 이전에도 음성모드를 지원했지만 응답속도는 5.4초 … Read more