성능 개선됐다더니 환각률 48%”…챗GPT 새 모델 무슨 일 > 갤러리

본문 바로가기

회원메뉴

성능 개선됐다더니 환각률 48%”…챗GPT 새 모델 무슨 일

페이지 정보

작성자 성수현 댓글 0건 조회 1회 작성일 25-04-23 11:03

본문

청주웨딩박람회 오픈AI가 최근 공개한 추론형 인공지능(AI) 모델 챗GPT ‘o3’와 ‘o4-미니’가 이전 세대보다 강력해진 성능을 갖췄지만, 환각(hallucination) 현상은 더 심해진 것으로 나타났다. 환각은 생성형 AI가 실제 존재하지 않는 정보를 사실처럼 만들어내는 현상을 말한다. 4월 20일 미국 정보기술(IT) 전문매체 테크크런치는 오픈AI의 자체 벤치마크 테스트인 ‘퍼슨 QA’ 평가 결과를 인용해 o3와 o4-미니 모델이 각각 33%와 48%의 환각 반응률을 보였다고 보도했다. 이전 추론 모델인 o1과 o3-미니 모델의 환각 반응률은 각각 16%와 14.8%다. 전작과 비교하면 신작 모델 환각 반응이 거의 2배 이상 증가한 셈이다. 심지어 비추론 모델인 GPT-4o보다도 o3, o4-미니에서 환각이 더 자주 발생한 것으로 드러났다. 앞서 오픈AI는 4월 16일(현지 시각) “역대 가장 뛰어난 추론 모델이자 챗GPT의 마지막 독립형 AI 추론 모델이 될 것”이라고 홍보하며 o3·o4-미니 모델을 공개했다. 두 모델은 수학·코딩·과학 분야 테스트에서 기존 모델 대비 우수한 성능을 냈다. 이미지와 텍스트를 함께 해석하는 대학 수준 문제에 o3는 82.9%, o4-미니는 81.6%의 정답률을 기록했다..

댓글목록

등록된 댓글이 없습니다.

서비스이용약관   개인정보처리방침
회사명 이노첵(INOCHECK) 주소 서울시 송파구 가락로 43, 2층 1호
사업자 등록번호 645-24-00890 대표 신비아 팩스 02-423-7836
통신판매업신고번호 제2019-서울송파-1577호 개인정보 보호책임자 신비아
Copyright © 2019 이노첵(INOCHECK). All Rights Reserved.

CS CENTER

Tel. 1566-9357 Email. inocheck@naver.com

평일 10:00~17:00
점심시간 12:00~13:00
토요일 / 일요일 / 공휴일 휴무