불편한 진실
오픈AI, 새 모델 'o1'…"논증 능력 대학원생 수준" 본문
트랜스포머 알고리즘을 적용한 생성형 인공지능(AI)은 기본적으로 대규모 데이터를 학습한 뒤 질문과 가장 연관성이 높은 단어를 차례대로 추론(inference)해 내놓는다. 실제 사실 여부를 따지기보다는 연관성을 찾기 때문에 사실이 아닌 내용을 뻔뻔하게 내놓는 ‘환각 현상’에서 자유로울 수 없다.
반면 논증 기능이 적용된 o1은 사람이 어려운 질문에 답하기 전 오랫동안 생각하는 것과 마찬가지로 답변을 위해 생각의 사슬을 사용한다. 까다로운 단계를 간단한 단계로 세분화하고, 현재의 접근 방식이 효과가 없을 때 다른 접근 방식을 시도한다.
예를 들어 “직우상 얻떤 번역깃돋 일끌 슈 없쥐많 한국인듦은 쉽게 앗랍볼 수 있는 한끌의 암혼화 방펍잇 잊댜. 몹음과 짜움위 따양한 편환우로 읨미는 윳이함면설 푯먼적읍롬 댜륵케 포위계 많둔는 빵씩잎타”라는 문장을 GPT-4o에 입력하면 1~2초 만에 “이 문장은 타이핑 오류가 많아 정확한 의미를 파악하기 어렵지만, 대략적인 내용은 한국어의 복잡한 음운 변화와 번역에 관한 주제일 가능성이 있습니다”라는 답이 나온다.
반면 같은 내용을 o1에 제시하면 약 20초 동안 내용 이해, 단어 분석, 복호화, 해결책 찾기 등의 과정을 거쳐 “지구상 어떤 번역기도 읽을 수 없지만 한국인들은 쉽게 알아볼 수 있는 한국의 암호화 방법이 있다. 모음과 자음의 다양한 변환으로 의미는 유지하면서 표면적으로 다르게 보이게 만드는 방식이다”라고 정확한 답을 내놓는다.
오픈AI는 논증 능력 덕분에 o1이 수학과 과학 분야에서 뛰어난 능력을 보였다고 설명했다. 미국 수학경시대회(AIME) 문제로 모델을 평가한 결과 GPT-4o는 12%의 문제만 풀었지만, o1은 83%를 기록했다. 오픈AI가 공개한 데모 영상에서 o1은 프롬프트만으로 게임을 프로그래밍하기도 했다. 물리학자들이 복잡한 수학 공식을 만들거나 의료 연구자들의 실험을 지원하는 데 o1을 효과적으로 활용할 수 있다는 것이다.
o1처럼 논증 기능이 발전하면 생성형 AI가 단순히 답변을 주는 수준을 넘어 명령에 필요한 업무를 수행하는 ‘AI 에이전트’로 진화할 수 있다. 지금은 “휴가 계획을 세워줘”라고 입력하면 추천하는 여행지와 가볼 만한 곳을 알려주는 정도에 그치지만 AI 에이전트가 되면 비행기 표 예매와 호텔 예약 같은 업무까지 알아서 할 수 있다.
오픈AI는 o1을 기반으로 ‘인간보다 똑똑한 AI’라고 불리는 인공일반지능(AGI) 개발에 한 단계 더 나아간다는 계획이다. 오픈AI는 AI 능력을 수준에 따라 다섯 단계로 나누고 AGI를 AI 모델 5단계이자 최종 목표로 설정했다. 샘 올트먼 오픈AI 최고경영자(CEO)는 “o1은 새로운 패러다임”이라며 “복잡한 문제를 추론할 수 있는 AI 모델”이라고 말했다. 다만 “이 기술은 여전히 결함이 있고 제한적”이라며 AGI까지는 아직 더 많은 시간이 필요하다는 점을 시사했다.
'IT' 카테고리의 다른 글
10명 중 4명만 "챗GPT 검색 믿는다" (0) | 2024.02.28 |
---|---|
애플은 아이폰 미니 시리즈를 공식적으로 단종시킬 예정 (0) | 2023.09.18 |
오늘까지 chatGPT가 이룬 것 (0) | 2023.01.25 |
2월 1일 공개될 갤럭시 S23 울트라 상세 스펙 유출 (0) | 2023.01.06 |
WSJ에 따르면 애플의 탈중국 첫 번째 선택지는 인도다. (0) | 2022.05.23 |