OpenAI가 역대 최대 규모이자 최고의 성능을 자랑하는 대화형 인공지능 모델 GPT-4.5를 리서치 프리뷰(Research Preview)로 공개했다. GPT-4.5는 기존 모델 대비 비지도 학습(Unsupervised Learning)을 대폭 확장하여 패턴 인식, 추론, 창의적 통찰력 등 다양한 분야에서 한층 향상된 성능을 제공한다.
더욱 자연스러운 사용자 경험 제공
초기 테스트 결과, GPT-4.5는 이전 모델보다 자연스러운 상호작용이 가능하며, 폭넓은 지식 기반과 향상된 사용자 의도 파악 능력을 갖추었다. 특히 GPT-4.5는 작문, 프로그래밍, 문제 해결과 같은 분야에서 뛰어난 성능을 보이며, 기존 모델 대비 환각 현상(잘못된 정보를 만들어 내는 현상)도 대폭 감소할 것으로 기대된다.
비지도 학습(Unsupervised Learning)과 추론(Reasoning) 기능 확장
OpenAI는 GPT-4.5를 통해 비지도 학습(Unsupervised Learning)과 추론(Reasoning) 두 가지 핵심 인공지능 패러다임을 더욱 확장했다. 비지도 학습은 AI가 세계에 대한 직관적이고 정확한 모델을 구축할 수 있게 하며, 추론 기능 확장은 AI가 보다 복잡한 문제를 해결하는 능력을 제공한다. GPT-4.5는 Microsoft Azure AI 슈퍼컴퓨터를 통해 훈련되었으며, 그 결과 환각 현상이 줄어들고 신뢰성이 증가했다.
높은 정확도와 신뢰성 확보
GPT-4.5는 보다 깊고 정확한 세계 지식을 제공하여 기존 모델 대비 월등한 성과를 보였으며, 환각률 또한 낮춰 신뢰성을 크게 높였다. 인간과의 상호작용에서 감성지능(Emotional Intelligence, EQ)이 뛰어나, 작문, 코딩, 창의적 아이디어 개발 등 다양한 분야에서 실질적인 도움을 줄 것으로 기대된다.
다양한 사용자 환경 지원
GPT-4.5는 이미 ChatGPT Pro 사용자와 전 세계 개발자에게 제공되며, 웹 기반 파일 업로드 및 이미지 입력을 통한 시각적 정보 처리 기능을 지원한다. 다만 음성 모드나 비디오, 화면 공유 등 멀티모달 기능은 아직 지원하지 않고 있다.
인간 협업을 위한 교육
모델을 확장하고 더 복잡한 문제를 해결함에 따라 인간의 필요와 의도를 더 잘 이해하도록 가르치는 것이 점점 더 중요해지고 있다. GPT-4.5의 경우 더 작은 모델에서 파생된 데이터로 더 크고 더 강력한 모델을 훈련할 수 있는 새롭고 확장 가능한 기술을 개발했다. 이러한 기술은 GPT-4.5의 조종성, 뉘앙스에 대한 이해 및 자연스러운 대화를 향상시킨다.
창의적이고 효율적인 작업 지원 가능
이 모델은 특히 쓰기 지원, 학습 도움, 창의적 브레인스토밍뿐 아니라 에이전트 기반 작업 자동화에서도 강력한 성능을 입증하고 있어, 향후 더욱 다양한 영역에서의 활용 가능성이 주목받고 있다.
OpenAI는 GPT-4.5가 AI 기술의 새로운 지평을 열 것으로 기대하며, 전 세계 프로 사용자와 개발자들이 이 모델을 사용하면서 새로운 가능성을 발견할 수 있기를 기대한다고 밝혔다.
--------------------------------------------------------------------
ChatGPT에서 GPT-4.5를 사용하는 방법
ChatGPT Pro 사용자는 웹, 모바일 및 데스크톱의 모델 선택기에서 GPT-4.5를 선택할 수 있다. 금주에 Plus 및 Team 사용자에게 배포하고, 다음 주에 Enterprise 및 Edu 사용자에게 배포될 예정이다.
GPT-4.5는 검색을 통해 최신 정보에 액세스할 수 있고 파일 및 이미지 업로드를 지원하며 캔버스를 사용하여 작성 및 코드 작업을 할 수 있다. 그러나 GPT-4.5는 현재 ChatGPT에서 음성 모드, 비디오 및 화면 공유와 같은 다중 모드 기능을 지원하지 않는다. 앞으로 AI가 "제대로 작동"할 수 있도록 사용자 경험을 단순화하기 위해 노력할 것이라고 한다.
API에서 GPT-4.5를 사용하는 방법
또한 Chat Completions API, Assistants API 및 Batch API에서 GPT-4.5를 모든 개발자를 대상으로 미리 보고 있다. 유료 사용 계층(새 창에서 열림). 이 모델은 함수 호출, 구조적 출력, 스트리밍 및 시스템 메시지와 같은 주요 기능을 지원한다. 또한 이미지 입력을 통해 비전 기능을 지원한다.
초기 테스트를 기반으로 개발자는 GPT-4.5가 쓰기 도움말, 커뮤니케이션, 학습, 코칭 및 브레인스토밍과 같은 더 높은 감성 지능과 창의성의 이점을 활용하는 애플리케이션에 특히 유용하다는 것을 알 수 있다. 또한 다단계 코딩 워크플로우 및 복잡한 작업 자동화를 포함한 에이전트 계획 및 실행에 대한 강력한 기능을 보여준다.
GPT-4.5는 매우 크고 컴퓨팅 집약적인 모델이므로 GPT-4o보다 비싸고 대체하지 않는다. 이 때문에 현재 기능을 지원하는 것과 미래 모델을 구축하는 것의 균형을 맞추기 위해 장기적으로 API에서 계속 제공할지 여부를 평가하고 있다. 우리는 실제 환경에서 그 강점, 기능 및 잠재적인 응용 프로그램에 대해 더 많이 배우기를 기대한다. GPT-4.5가 사용 사례에 고유한 가치를 제공한다면 피드백(새 창에서 열림) 우리의 결정을 안내하는 데 중요한 역할을 할 것이다.
