본문 바로가기
🟣 AI & ML

OpenAI, 복잡한 작업의 추론에 특화된 'OpenAI o1' 모델 미리보기 공개

by 제리강 2024. 9. 13.

 

TL;DR

OpenAI에서 오늘 추론 특화 모델 'OpenAI o1'을 공개했습니다. 현재의 거대 언어 모델(LLM)들은 방대한 분야의 일반 지식을 학습하다보니 특정 분야의 깊이 있는 사고가 필요한 문제 해결에는 어려움을 겪는 모습을 보였습니다. OpenAI는 이러한 문제를 인식하고, 생각 사슬(Chain of thought)과 같은 알고리즘 등을 활용해 추론 능력을 특화시킨 모델을 별도의 제품 라인으로 출시했습니다. 특히, 소개 영상 중 Korean Cipher 라는 이름의 영상에서는 암호처럼 변형된 한국어를 해석해내는 재밌는 능력을 볼 수 있습니다. LLM 강의 영상에서도 보았던 한국인 OpenAI의 정형원 연구원님이 보이는 것이 반갑습니다. 

 
 
원문 링크:
https://openai.com/index/introducing-openai-o1-preview
 

Introducing OpenAI o1-preview

OpenAI o1-preview 소개

  • OpenAI는 복잡한 문제 해결을 위한 새로운 추론 모델 시리즈를 개발.
  • 이 모델은 응답 전에 더 많은 시간을 들여 사고하고, 과학, 코딩, 수학 등에서 더 어려운 문제를 해결할 수 있음.
  • 이번에 ChatGPT 및 API에서 첫 번째 모델을 미리보기 형태로 공개함. 정기적인 업데이트와 개선이 예정되어 있음.

 
 

작동 방식

  • 이 모델들은 사람이 문제를 해결하는 방식처럼, 응답 전에 문제를 깊이 사고하도록 학습됨. 학습을 통해 사고 과정을 정교화하고, 다양한 전략을 시도하며, 실수를 인식하는 방법을 배움.
  • 테스트 결과, 다음 모델 업데이트는 물리, 화학, 생물학의 어려운 벤치마크 과제에서 박사 과정 학생들과 비슷한 성능을 보임.
  • 특히 수학과 코딩 분야에서 뛰어난 성과를 보임. 국제 수학 올림피아드(IMO) 예선에서 GPT-4o는 13%의 문제를 맞췄으나, 추론 모델은 83%를 해결함. 코딩 능력은 Codeforces 대회에서 89번째 백분위수에 도달.
  • 초기 모델이므로 웹 검색이나 파일 및 이미지 업로드 기능 등 ChatGPT의 유용한 기능들이 아직 포함되지 않음.
  • 복잡한 추론 작업에서 중요한 발전을 이루었으며, 이는 AI 능력의 새로운 수준을 나타냄.
  • 이를 기념해 새로운 모델 시리즈를 OpenAI o1로 명명하고 번호를 1부터 다시 시작함.

 

안전성

  • 새로운 모델 개발의 일환으로, 추론 능력을 활용한 새로운 안전 훈련 방식을 도입함. 이를 통해 안전 및 정렬(alignment) 지침을 보다 효과적으로 준수할 수 있게 함.
  • 모델의 안전성을 평가하는 한 가지 방법은 사용자가 안전 규칙을 우회하려 할 때 모델이 얼마나 잘 지침을 따르는지 테스트하는 것임. 탈옥(jailbreaking) 테스트에서 GPT-4o는 0-100 점 만점에 22점을 받았지만, o1-preview 모델은 84점을 기록함.
  • 새로운 모델의 능력에 맞춰 안전성 작업, 내부 거버넌스, 그리고 연방 정부와의 협력을 강화함. 이를 위해 프레임워크를 사용한 엄격한 테스트와 평가, 최상위 수준 레드 팀 테스트, 이사회 차원의 검토 과정을 도입함.
  • AI 안전성에 대한 약속을 지키기 위해 최근 미국과 영국 AI 안전 연구소와 공식 협약을 체결했으며, 연구소에 이 모델의 연구 버전을 조기 제공하는 등 협약을 실천하기 시작함.

 

권장 사용자

  • 향상된 추론 능력은 과학, 코딩, 수학 등 복잡한 문제를 다루는 분야에서 특히 유용함.
  • 예를 들어, o1 모델은 의료 연구자가 세포 시퀀싱 데이터에 주석을 추가할 때(annotate), 물리학자가 양자 광학에 필요한 복잡한 수학 공식을 생성할 때, 그리고 개발자가 여러 단계의 워크플로우를 구축하고 실행할 때 활용 가능함.
 

 

OpenAI o1-mini

  • o1 시리즈는 복잡한 코드 생성 및 디버깅에 뛰어남.
  • 개발자들에게 더 효율적인 솔루션을 제공하기 위해, OpenAI o1-mini라는 더 빠르고 저렴한 추론 모델도 출시.
  • o1-mini는 코딩 작업에 특히 효과적이며, o1-preview보다 80% 저렴.
  • 이 작은 모델은 폭넓은 일반 지식이 필요하지 않은 추론 작업에 적합한 강력하고 비용 효율적인 선택지임.

 

 

OpenAI o1 사용 방법

  • ChatGPT Plus와 Team 사용자는 오늘부터 ChatGPT에서 o1 모델을 사용할 수 있음.
  • o1-preview와 o1-mini는 모델 선택 메뉴에서 수동으로 선택 가능.
  • 현재 o1-preview는 주 30개 메시지, o1-mini는 주 50개 메시지로 제한됨. 이 제한을 늘리고, ChatGPT가 자동으로 적합한 모델을 선택하는 기능을 개발 중.
  • ChatGPT Enterprise와 Edu(교육) 사용자는 다음 주부터 두 모델에 모두 접근 가능.
  • API 사용 티어 5에 해당하는 개발자들은 오늘부터 API에서 두 모델로 프로토타입을 시작할 수 있으며, 분당 20개의 요청(RPM) 제한이 있음. 추가 테스트 후 이 제한을 늘릴 계획.
  • 현재 API는 함수 호출, 스트리밍, 시스템 메시지 지원 등의 기능을 포함하지 않음.
  • o1-mini는 ChatGPT 무료 사용자도 곧 사용할 수 있도록 계획 중임.

 

다음 단계

  • 이번 출시된 모델은 ChatGPT 및 API에서 제공되는 추론 모델의 초기 미리보기 버전.
  • 모델 업데이트 외에도 웹 검색, 파일 및 이미지 업로드 등의 기능을 추가해 더욱 유용하게 만들 계획임.
  • OpenAI o1 시리즈뿐만 아니라 기존 GPT 시리즈 모델도 계속해서 개발하고 출시할 예정.

 

관련 영상 링크

https://www.youtube.com/watch?v=3k89FMJhZ00 (Building OpenAI o1)
https://www.youtube.com/watch?v=eZDmDn6Iq9Y (Korean Cipher with OpenAI o1)
https://www.youtube.com/watch?v=wyuZzLfDhD8 (Scott Wu: OpenAI o1 & Coding)
https://www.youtube.com/watch?v=T0IrhzrhR40 (Video Game Coding with OpenAI o1)
https://www.youtube.com/watch?v=MAZyQ-38b8M (Math with OpenAI o1)
https://www.youtube.com/watch?v=AjmkEvuNl7w (Writing Puzzles with OpenAI o1)
https://www.youtube.com/watch?v=7GaKl6HwZ50 (HTML Snake with OpenAI o1)
https://www.youtube.com/watch?v=5rFzKdAdpOg (Catherine Brownstein: OpenAI o1 & Genetics)
https://www.youtube.com/watch?v=50W4YeQdnSg (Coding with OpenAI o1)
https://www.youtube.com/watch?v=3BkQI3nIiB8 (Reasoning with OpenAI o1)
https://www.youtube.com/watch?v=1tX5aea0La4 (Counting with OpenAI o1)
 
 
 

댓글