티스토리 뷰

최신 AI 모델 GPT-4o 발표

 

최신 AI 모델 GPT-4o이 발표되었습니다. 대폭 개선된 LLM 모델을 접하게 되네요. 개선된 사항이 궁금해 아침부터 조사를 해봤습니다. 저처럼 궁금한 분들은 아래 내용을 확인해 보세요.

 

최신 AI 모델 GPT-4o (GPT 4o) 발표
최신 AI 모델 GPT-4o (GPT 4o) 발표

 

OpenAI의 최신 AI 모델 GPT-4o는 ChatGPT와 함께 제공되어 GPT-4 수준의 인텔리전스를 제공합니다. 이 멀티 모달 AI는 텍스트, 음성, 시각 기능을 포함하며, ChatGPT OpenAI 사용자에게 향상된 기능을 무료로 제공합니다. GPT-4o는 OpenAI와 마이크로소프트의 협력으로 개발되었습니다

.

GPT-4o은 ChatGPT에 더 많은 인텔리전스와 고급 도구를 무료로 배포할 예정입니다. GPT-4o는 GPT-4 수준의 인텔리전스를 제공하면서도 훨씬 더 빠르고 텍스트, 음성, 시각 전반에서 기능이 향상된 최신 플래그십 모델이라고 합니다.

 

아래부터는 공식적으로 공개된 아티클을 번역하여 알기 쉽게 정리한 내용입니다.

 


핵심 요약

 

1. GPT-4o는 GPT-4 수준의 인텔리전스를 제공하며 텍스트, 음성, 시각 전반에서 기능이 향상된 최신 모델입니다.

2. GPT-4o는 이미지 번역, 음식 역사 및 의미 파악, 실시간 스포츠 경기 규칙 설명 등 고급 기능을 지원합니다.

3. 전 세계적으로 고급 AI 접근성을 높이기 위해 50개 이상의 언어를 지원합니다.

4. ChatGPT Plus 및 팀 사용자에게 GPT-4o를 배포하며, 곧 엔터프라이즈 사용자에게도 제공될 예정입니다.

5. 새로운 데스크톱 앱을 통해 사용자들은 더욱 원활하게 ChatGPT를 활용할 수 있습니다.

6. GPT-4o는 텍스트, 비전, 오디오 전반을 아우르는 단일 모델로, 더욱 자연스러운 인간-컴퓨터 상호작용을 제공합니다.

7. 멀티 모달리티에 걸친 모델 안전성을 강화하여 더욱 안전한 사용 환경을 제공합니다.

 


목차


    GPT 4o 이란?

     

    GPT-4o는 GPT-4의 인텔리전스를 유지하면서도 훨씬 더 빠른 성능을 자랑합니다.

    텍스트, 음성, 시각 전반에서 기능이 향상되었는데 사용자가 공유하는 이미지를 이해하고 논의하는 데 있어 뛰어난 성능을 보여줍니다.

     

    예를 들어, 다른 언어로 된 메뉴 사진을 찍어 GPT-4o와 대화하여 번역하고, 음식의 역사와 의미에 대해 알아볼 수 있습니다.

     

    GPT-4o는 더 자연스러운 실시간 음성 대화와 실시간 동영상 지원을 제공할 예정입니다. 실시간 스포츠 경기를 보여주며 규칙을 설명해 달라고 요청할 수도 있습니다. 이러한 새로운 기능은 앞으로 몇 주 내에 알파 버전으로 출시될 계획이며, 플러스 사용자들을 위한 초기 접근 권한을 제공할 것입니다.

     

    최신 AI 모델 GPT-4o (GPT 4o) 발표 (출처 : 이데일리TV)

     

     

    몇 가지 극명하게 차별화되는 부분은 저작권 문제로 본 글에 삽입할 수가 없어 아래 버튼을 만들었습니다.

     

    아래 버튼을 누르면 라이브 내용을 지금 바로 확인할 수 있습니다.

     

     

     

    아래 버튼을 누르면 AI와의 화상채팅 예시를 지금 바로 확인할 수 있습니다.

     

     

     

     

    아래 버튼을 누르면 AI의 상황인식, 노래를 지금 바로 확인할 수 있습니다.

     

     

     


    GPT-4o 기능

     

    이미지 및 텍스트 번역

    GPT 4o는 텍스트뿐만 아니라 이미지를 통해서도 고급 번역 기능을 제공합니다. 예를 들어, 사용자가 메뉴 사진을 찍으면 GPT-4o가 이를 번역하고, 해당 음식의 역사와 문화적 배경을 설명해 줄 수 있습니다.

     

    실시간 음성 및 비디오 대화

    GPT-4o는 실시간 음성 및 비디오 대화를 지원합니다. 사용자는 실시간 스포츠 경기를 GPT 4o에 보여주며 규칙 설명을 요청할 수 있으며, 더 자연스러운 음성 대화가 가능합니다.

     

    고급 데이터 분석

    GPT-4o는 데이터 분석 및 차트 생성을 지원합니다. 사용자는 데이터 파일을 업로드하여 요약, 작성 또는 분석을 요청할 수 있습니다.

     

    최신 AI 모델 GPT-4o (GPT 4o) 발표 (출처 : Pip_install_techtips)

     


    고급 AI 접근성 향상

     

    OpenAI는 고급 AI에 대한 접근성을 높이기 위해 GPT-4o의 언어 기능을 개선했습니다. GPT-4o는 50개 이상의 언어를 지원하며, 가입 및 로그인, 사용자 설정 등에서 이 기능이 적용됩니다. ChatGPT Plus 및 팀 사용자에게는 이미 배포가 시작되었으며, 곧 엔터프라이즈 사용자에게도 제공될 예정입니다. 또한, 사용량 제한이 있는 ChatGPT Free에도 적용됩니다.

     

    최신 AI 모델 GPT-4o (GPT 4o) 발표최신 AI 모델 GPT-4o (GPT 4o) 발표최신 AI 모델 GPT-4o (GPT 4o) 발표
    최신 AI 모델 GPT-4o (GPT 4o) 발표

     


    GPT 4o의 성능 및 응답 시간

     

    GPT-4o는 기존 모델에 비해 비전과 오디오 이해도가 뛰어나며, 텍스트, 오디오, 이미지의 조합을 입력으로 받아들여 빠르고 정확한 출력을 생성합니다. 오디오 입력에 대한 응답 시간은 평균 232밀리 초로, 이는 인간의 응답 시간과 유사합니다.

     

    기존 모델과의 비교

    GPT-4 Turbo와 비교했을 때, GPT-4o는 영어 텍스트와 코드에서는 동일한 성능을 보이며, 비영어권 언어에서는 상당한 개선을 이루었습니다. API를 통해서는 훨씬 빠르게 작동하며 비용이 50% 저렴합니다.

     


    GPT-4o의 안전성 및 한계

     

    GPT 4o는 여러 모달리티에 걸쳐 설계에 의해 안전성이 내장되어 있으며, 훈련 데이터 필터링 및 훈련 후 모델 행동 개선을 통해 안전성을 강화했습니다. 특히 음성 출력에 대한 새로운 안전 시스템을 마련하였습니다.

     

    모델 평가 및 안전 조치

    GPT-4o는 사이버 보안, CBRN(화학, 생물, 방사선, 핵), 설득력, 모델 자율성에 대한 평가에서 중간 위험 이상을 기록하지 않았습니다. 70명 이상의 외부 전문가들이 참여한 광범위한 레드 팀 테스트를 거쳐 모델의 안전성을 확인했습니다.

     

    최신 AI 모델 GPT-4o (GPT 4o) 발표최신 AI 모델 GPT-4o (GPT 4o) 발표최신 AI 모델 GPT-4o (GPT 4o) 발표
    최신 AI 모델 GPT-4o (GPT 4o) 발표


    ChatGPT와의 통합

     

    OpenAI는 ChatGPT 사용자에게 더 빠른 언어 모델을 제공하기 위해 GPT-4o를 무료로 배포하고 있습니다. Plus 사용자는 무료 사용자보다 최대 5배 더 많은 메시지 한도를 적용받으며, 팀 및 엔터프라이즈 사용자는 더 높은 한도를 적용받게 됩니다.

     

    새로운 기능

    ChatGPT Free 사용자는 GPT-4 수준의 인텔리전스 경험, 모델과 웹에서 응답받기, 데이터 분석 및 차트 생성, 촬영한 사진에 대해 대화하기, 파일 업로드를 통한 요약, 작성 또는 분석 지원, GPT 및 GPT 스토어 검색 및 사용, 메모리 기능을 통해 더 유용한 경험 구축 등의 기능에 액세스 할 수 있습니다.

     


    새로운 데스크톱 앱

     

    OpenAI는 무료 및 유료 사용자 모두를 위해, 컴퓨터에서 수행 중인 모든 작업에 원활하게 통합되도록 설계된 새로운 macOS용 ChatGPT 데스크톱 앱을 출시했습니다. 간단한 키보드 단축키(Option + 스페이스)로 ChatGPT에 즉시 질문할 수 있습니다. 앱에서 바로 스크린숏을 찍고 토론할 수도 있습니다.

     

    음성 대화 기능

    이제 컴퓨터에서 바로 ChatGPT와 음성 대화를 할 수 있으며, 출시 당시부터 제공되었던 음성 모드부터 시작하여 향후 출시될 GPT 4o의 새로운 오디오 및 비디오 기능을 통해 음성 대화를 할 수 있습니다. 회사에 대한 새로운 아이디어를 브레인스토밍하거나, 면접을 준비하거나, 토론하고 싶은 주제가 있을 때 데스크톱 앱의 오른쪽 하단에 있는 헤드폰 아이콘을 탭 하여 음성 대화를 시작할 수 있습니다.

     


    GPT 4o의 실용성 및 벤치마크 평가

     

    GPT-4o는 텍스트, 비전, 오디오 전반을 아우르는 단일 모델로, 이러한 모든 모달리티를 결합한 최초의 모델입니다. 전통적인 벤치마크로 측정한 결과, GPT-4o는 텍스트, 추론, 코딩 지능에서 GPT-4 Turbo 수준의 성능을 달성했으며, 다국어, 오디오, 비전 기능에서 새로운 최고 기록을 세웠습니다.

     

    성능 평가

    1. 텍스트 평가

    GPT 4o는 0샷 COT MMLU(일반 지식 질문)에서 최고 점수를 기록했습니다.

     

    2. 오디오 ASR 성능

    모든 언어, 자원이 부족한 언어에서 'Whisper-V3' 대비하여 음성 인식 성능을 크게 향상했습니다.

     

    3. 오디오 번역 성능

    '신규 최첨단 기술'을 제시하며 MLS 벤치마크에서 'Whisper-V3'보다 뛰어난 성능을 발휘했습니다.

     

    4. 비전 이해 평가

    시각적 인식 벤치마크에서 최첨단 성능을 달성했습니다.

     

    최신 AI 모델 GPT-4o (GPT 4o) 발표최신 AI 모델 GPT-4o (GPT 4o) 발표최신 AI 모델 GPT-4o (GPT 4o) 발표
    최신 AI 모델 GPT-4o (GPT 4o) 발표


    결론

     

    GPT 4o는 OpenAI가 제공하는 최신 AI 모델로, GPT-4 수준의 인텔리전스를 유지하면서도 훨씬 빠른 성능을 자랑합니다. 텍스트, 음성, 시각 전반에서 기능이 향상되어 사용자가 이미지를 이해하고 논의하는 데 뛰어난 성능을 발휘합니다.

     

    실시간 음성 및 비디오 대화를 지원하며, 데이터 분석 및 차트 생성 등 고급 기능을 제공합니다. 전 세계적으로 고급 AI 접근성을 높이기 위해 50개 이상의 언어를 지원하며, 가입 및 로그인, 사용자 설정 등에서 이 기능이 적용됩니다. ChatGPT Plus 및 팀 사용자에게는 이미 배포가 시작되었으며, 곧 엔터프라이즈 사용자에게도 제공될 예정입니다. 또한, 사용량 제한이 있는 ChatGPT Free에도 적용됩니다.

     

    최신 AI 모델 GPT-4o (GPT 4o) 발표최신 AI 모델 GPT-4o (GPT 4o) 발표최신 AI 모델 GPT-4o (GPT 4o) 발표
    최신 AI 모델 GPT-4o (GPT 4o) 발표

     

    GPT 4o는 기존 모델에 비해 비전과 오디오 이해도가 뛰어나며, 텍스트, 오디오, 이미지의 조합을 입력으로 받아들여 빠르고 정확한 출력을 생성합니다. 오디오 입력에 대한 응답 시간은 평균 232밀리 초로, 이는 인간의 응답 시간과 유사합니다.

     

    GPT-4 Turbo와 비교했을 때, GPT-4o는 영어 텍스트와 코드에서는 동일한 성능을 보이며, 비영어권 언어에서는 상당한 개선을 이루었습니다. API를 통해서는 훨씬 빠르게 작동하며 비용이 50% 저렴합니다.

     

    GPT-4o는 여러 모달리티에 걸쳐 설계에 의해 안전성이 내장되어 있으며, 훈련 데이터 필터링 및 훈련 후 모델 행동 개선을 통해 안전성을 강화했습니다. 특히 음성 출력에 대한 새로운 안전 시스템을 마련하였습니다.

     

    모델 평가 및 안전 조치에 따라, GPT-4o는 사이버 보안, CBRN(화학, 생물, 방사선, 핵), 설득력, 모델 자율성에 대한 평가에서 중간 위험 이상을 기록하지 않았습니다. 70명 이상의 외부 전문가들이 참여한 광범위한 레드 팀 테스트를 거쳐 모델의 안전성을 확인했습니다.

     

     

    OpenAI는 ChatGPT 사용자에게 더 빠른 언어 모델을 제공하기 위해 GPT-4o를 무료로 배포하고 있습니다. Plus 사용자는 무료 사용자보다 최대 5배 더 많은 메시지 한도를 적용받으며, 팀 및 엔터프라이즈 사용자는 더 높은 한도를 적용받게 됩니다.

     

    ChatGPT Free 사용자는 GPT-4 수준의 인텔리전스 경험, 모델과 웹에서 응답받기, 데이터 분석 및 차트 생성, 촬영한 사진에 대해 대화하기, 파일 업로드를 통한 요약, 작성 또는 분석 지원, GPT 및 GPT 스토어 검색 및 사용, 메모리 기능을 통해 더 유용한 경험 구축 등의 기능에 액세스 할 수 있습니다.

     

    최신 AI 모델 GPT-4o (GPT 4o) 발표최신 AI 모델 GPT-4o (GPT 4o) 발표최신 AI 모델 GPT-4o (GPT 4o) 발표
    최신 AI 모델 GPT-4o (GPT 4o) 발표

     

    OpenAI는 무료 및 유료 사용자 모두를 위해, 컴퓨터에서 수행 중인 모든 작업에 원활하게 통합되도록 설계된 새로운 macOS용 ChatGPT 데스크톱 앱을 출시했습니다. 간단한 키보드 단축키(Option + 스페이스)로 ChatGPT에 즉시 질문할 수 있습니다.

     

    앱에서 바로 스크린샷을 찍고 토론할 수도 있습니다. 이제 컴퓨터에서 바로 ChatGPT와 음성 대화를 할 수 있으며, 출시 당시부터 제공되었던 음성 모드부터 시작하여 향후 출시될 GPT 4o의 새로운 오디오 및 비디오 기능을 통해 음성 대화를 할 수 있습니다.

     

    회사에 대한 새로운 아이디어를 브레인스토밍하거나, 면접을 준비하거나, 토론하고 싶은 주제가 있을 때 데스크톱 앱의 오른쪽 하단에 있는 헤드폰 아이콘을 탭 하여 음성 대화를 시작할 수 있습니다.

     

    최신 AI 모델 GPT-4o (GPT 4o) 발표최신 AI 모델 GPT-4o (GPT 4o) 발표최신 AI 모델 GPT-4o (GPT 4o) 발표
    최신 AI 모델 GPT-4o (GPT 4o) 발표

     

    GPT 4o는 텍스트, 비전, 오디오 전반을 아우르는 단일 모델로, 이러한 모든 모달리티를 결합한 최초의 모델입니다. 전통적인 벤치마크로 측정한 결과, GPT 4o는 텍스트, 추론, 코딩 지능에서 GPT-4 Turbo 수준의 성능을 달성했으며, 다국어, 오디오, 비전 기능에서 새로운 최고 기록을 세웠습니다.

     

    성능 평가에서는 텍스트 평가, 오디오 ASR 성능, 오디오 번역 성능, 비전 이해 평가에서 각각 최고 점수를 기록하며, 새로운 최첨단 기술을 제시했습니다.

     

     

    GPT-4o는 OpenAI의 사명에 맞게 AI 기술을 발전시키고 모든 사람이 접근할 수 있도록 하는 데 주력합니다. GPT-4o는 GPT-4 수준의 인텔리전스를 제공하면서도 텍스트, 음성, 시각 전반에서 기능이 향상된 최신 모델입니다. 이미지를 이해하고 논의하는 능력이 뛰어나며, 실시간 음성 및 비디오 대화를 지원합니다. OpenAI는 이러한 고급 기능을 전 세계적으로 더 많은 사람들이 사용할 수 있도록 접근성을 높이고 있습니다.

     

    GPT-4o의 주요 기능은 이미지 및 텍스트 번역, 실시간 음성 및 비디오 대화, 고급 데이터 분석 등입니다. 이 모델은 기존 모델에 비해 비전과 오디오 이해도가 뛰어나며, 텍스트, 오디오, 이미지의 조합을 입력으로 받아들여 빠르고 정확한 출력을 생성합니다.

     

    OpenAI는 ChatGPT 사용자에게 더 빠른 언어 모델을 제공하기 위해 GPT-4o를 무료로 배포하고 있습니다. Plus 사용자는 무료 사용자보다 최대 5배 더 많은 메시지 한도를 적용받으며, 팀 및 엔터프라이즈 사용자는 더 높은 한도를 적용받게 됩니다.

     

    새로운 macOS용 ChatGPT 데스크톱 앱은 사용자들이 더욱 원활하게 ChatGPT를 활용할 수 있도록 도와줍니다. 간단한 키보드 단축키(Option + 스페이스)로 ChatGPT에 즉시 질문할 수 있으며, 앱에서 바로 스크린샷을 찍고 토론할 수도 있습니다.

     

    최신 AI 모델 GPT-4o (GPT 4o) 발표최신 AI 모델 GPT-4o (GPT 4o) 발표최신 AI 모델 GPT-4o (GPT 4o) 발표
    최신 AI 모델 GPT-4o (GPT 4o) 발표

     

    컴퓨터에서 바로 ChatGPT와 음성 대화를 할 수 있으며, 출시 당시부터 제공되었던 음성 모드부터 시작하여 향후 출시될 GPT 4o의 새로운 오디오 및 비디오 기능을 통해 음성 대화를 할 수 있습니다.

     

    결론적으로, GPT 4o는 OpenAI의 최신 AI 모델로, GPT-4 수준의 인텔리전스를 유지하면서도 훨씬 빠른 성능을 자랑합니다. 텍스트, 음성, 시각 전반에서 기능이 향상되어 사용자가 이미지를 이해하고 논의하는 데 뛰어난 성능을 발휘합니다.

     

    실시간 음성 및 비디오 대화를 지원하며, 데이터 분석 및 차트 생성 등 고급 기능을 제공합니다. 전 세계적으로 고급 AI 접근성을 높이기 위해 50개 이상의 언어를 지원하며, 무료 및 유료 사용자 모두를 위한 새로운 데스크톱 앱을 통해 더욱 원활하게 ChatGPT를 활용할 수 있습니다.

     

    OpenAI는 GPT 4o를 통해 AI 기술의 새로운 도약을 이루며, 모든 사람이 이 혁신적인 기술을 통해 혜택을 누릴 수 있도록 최선을 다하고 있습니다.

     

     

    어떤가요.

    잘 확인해 보셨나요? 실제 생활에 쓰임새가 많을 것 같은 느낌입니다.

    이 글을 읽으시고 실제 응용처를 고민하실 때 많은 도움이 되시기 바랍니다.