와... 어제 IT 업계가 완전 뒤집어졌다
아침에 눈 뜨자마자 폰 확인하는데 카톡방이 난리였다.
개발자 친구가 새벽 3시에 링크 하나 던지면서 "이거 실화냐" 하고 보낸 거 보니까 앤트로픽이 Claude Opus 4.1을 전격 공개했단다. 그런데 이게 그냥 업데이트가 아니라, AI 코딩 능력 측정하는 시험에서 74.5%라는 말도 안 되는 점수를 받았다는 거야.
처음엔 그래서 뭐 어쩌라고... 했는데 친구 설명 듣고 나니까 이해가 됐다. 이전 최고 기록이 72.7%였는데 갑자기 74.5%가 나왔다는 건, 마치 수능 만점자가 거의 없던 시절에 갑자기 만점자가 10명씩 나온 것 같은 충격이라고.

74.5%가 뭔데 그렇게 난리야
솔직히 나도 처음엔 몰랐다. 74.5%면 그냥 B+ 정도 아닌가 싶었거든.
그런데 이게 SWE-bench Verified라는 시험인데, 실제 GitHub에 올라온 버그 500개를 AI한테 고치라고 시키는 거래. 남이 짠 코드 보고 뭐가 문제인지 찾아서, 다른 부분 안 건드리고 딱 그 부분만 고치는 거.
개발자 친구 말로는 신입 개발자들도 이거 50% 넘기기 어렵다고. 근데 Claude가 74.5%를 찍었다니... 거의 중급 개발자 수준이라는 거지.
더 소름 돋는 건 Rakuten이라는 일본 회사에서 실제로 테스트해봤는데, Claude한테 프로젝트 하나 던져줬더니 7시간 동안 혼자서 코딩하고 있더래. 사람이 쉬지도 않고 7시간 코딩하면 미치거든? 근데 AI는 지치지도 않고 계속 하는 거야.

ChatGPT 만든 회사는 지금 뭐해?
여기서 더 재밌는 건 OpenAI 반응이야.
사실 IT 업계에서는 OpenAI가 8월 중에 GPT-5 발표할 거라는 소문이 쫙 퍼져 있었어. 근데 앤트로픽이 먼저 치고 나간 거지. 완전 선빵 날린 격.
현재 GPT-4.1 점수가 54.6%래. Claude랑 20%나 차이 나는 거야. 이 정도 차이면 그냥 게임 끝난 거 아닌가 싶은데, OpenAI 입장에서는 GPT-5로 역전해야 하는 상황이 된 거지.
근데 내부 소식통 얘기로는 GPT-5가 나와도 그렇게 획기적이진 않을 거래. 점진적 개선 정도? 아무래도 OpenAI가 요즘 다른 프로젝트에 신경 쓰느라 순수 AI 모델 개발이 좀 늦어진 것 같다는 분석도 나오고.

그래서 우리한테 뭐가 좋아지는데
이런 거 보면 항상 드는 생각이 "그래서 나한테 뭐가 좋은데?"잖아.
일단 당장 체감할 수 있는 건 이런 거야. 우리가 쓰는 앱들 있잖아? 인스타, 유튜브, 배달앱 같은 거. 이런 앱들에 버그 생기면 개발자들이 밤새서 고치는데, 이제 AI가 대신 고쳐준다는 거야. 더 빨리, 더 정확하게.
그리고 스타트업들이 좋아하겠더라. 개발자 한 명 연봉이 얼마인지 알아? 신입도 5천은 기본이야. 근데 이제 AI한테 월 몇십만원 주고 시키면 되니까, 아이디어만 있으면 뭐든 만들 수 있는 시대가 온 거지.
실제로 우리 학교 선배가 창업 준비 중인데, 원래 개발자 구하느라 고생했는데 이제 Claude한테 "우리 서비스 앱 좀 만들어줘" 하니까 진짜 만들어준대. 물론 아직 완벽하진 않지만, 기본 틀은 다 잡아준다고.
가격은... 음 좀 비싸긴 해
근데 이런 좋은 게 공짜일 리 없지.
Claude Opus 4.1 가격이 입력 100만 토큰당 15달러, 출력은 75달러래. 토큰이 뭔지 모르겠다면, 대충 한글 3-5자가 1토큰 정도라고 생각하면 돼. A4 한 장 정도 쓰면 몇천원 나간다는 거야.
일반인이 쓰기엔 좀 부담스럽지? 그래서 보통은 Claude Pro 구독하는데, 이건 월 2만 6천원 정도. 넷플릭스 프리미엄이랑 비슷한 가격이야. 근데 Pro도 무제한은 아니고 사용량 제한이 있어서, 막 쓰다 보면 "오늘은 여기까지만 쓸 수 있습니다" 이런 메시지 뜬대.
GPT-4.1은 훨씬 싸긴 해. 입력 2달러, 출력 8달러. 그래도 성능 차이를 생각하면... 글쎄, 각자 판단해야 할 것 같아.
유튜브 반응이 진짜 재밌어
어제부터 유튜브에 관련 영상이 미친 듯이 올라오고 있어.
한 유튜버가 "Claude vs GPT 실시간 대결" 영상 올렸는데 조회수가 하루 만에 50만. 같은 코딩 문제 줬더니 Claude는 5분 만에 해결, GPT는 15분 걸리고도 에러 났대.
댓글들이 더 웃겨. "헐 이제 개발자 안 부러워" "코딩 학원 다니는 내 인생..."
"근데 이러다 개발자들 다 실업자 되는 거 아님?" "AI가 AI 만드는 날도 오겠네"
특히 "Execute Automation"이라는 채널에서 올린 영상 제목이 "Claude Opus 4.1 CRUSHES Sonnet & Gemini" 인데, 진짜 찐 개발자가 써본 후기라 신빙성 있더라.
Extended Thinking이라는 무기
근데 Claude의 진짜 무서운 점은 따로 있어.
"Extended Thinking"이라는 모드가 있는데, 복잡한 문제 만나면 최대 6만 4천 토큰까지 써가면서 깊게 생각한대. 인간으로 치면 "어 이거 좀 어렵네, 차근차근 생각해보자" 하는 거랑 똑같은 거야.
이 모드 켜면 대학원 수준 물리 문제를 83.3% 맞추고, 고급 수학은 90% 맞춘대. 이 정도면 거의... 아니 그냥 대부분 사람보다 똑똑한 거 아냐?
친구가 농담으로 "이제 수학 과외 선생님도 AI로 바꿔야 하나" 했는데, 농담이 아닐 수도 있겠더라.

앞으로 어떻게 될까
지금 이 순간은 Claude가 1등이야. 근데 이 바닥이 얼마나 빨리 바뀌는지 알아?
3개월 전만 해도 다른 모델이 최고였고, 6개월 전엔 또 다른 게 최고였어. 이번 달 안에 GPT-5 나올 수도 있고, 구글이 Gemini 3 발표한다는 소문도 있고, 메타도 뭔가 준비 중이래.
연말쯤 되면 80%, 아니 90% 넘는 AI가 나올 수도 있어. 그때쯤 되면 정말로... 코딩이란 게 "AI한테 뭘 만들고 싶은지 설명하는 일"로 바뀔지도 몰라.
내가 느끼는 솔직한 심정
나는 코딩 전공은 아니지만, 주변에 개발자 지망생 친구들이 많아.
걔들 반응이 진짜 복잡하더라. 한편으론 "와 이제 코딩 더 쉬워지겠다" 하면서도, "그럼 우리는 뭐 먹고 살지?" 하는 불안감도 있고.
근데 나는 오히려 기회라고 생각해. 이제 코딩 몰라도 아이디어만 있으면 뭐든 만들 수 있잖아. 예전엔 "앱 하나 만들려면 개발자 구해야 하는데..." 하면서 포기했던 것들이 이제는 가능해진 거야.
우리 세대가 제일 운 좋은 것 같기도 해. AI 없던 시대도 알고, AI 시대도 경험하고. 적응만 잘하면 오히려 더 많은 기회가 있을 것 같아.
마무리하며
Claude Opus 4.1의 74.5%는 시작일 뿐이야.
앞으로 몇 달 안에 더 놀라운 일들이 벌어질 거고, 우리는 그 변화의 한가운데 서 있어. GPT-5가 나올지, 구글이 뭘 준비하고 있을지는 솔직히 아무도 몰라.
확실한 건 하나야. AI 시대는 이미 왔고, 우리는 적응해야 해. 두려워하기보다는 이 도구를 어떻게 활용할지 고민하는 사람이 결국 앞서나갈 거라고 생각해.
2025년 8월 5일. 이 날짜는 아마 오래 기억될 것 같아. AI가 인간 개발자를 넘어선 날로.
'픽돌이 정보' 카테고리의 다른 글
| 귀멸의 칼날 '무한성편' 개봉 가이드: 예매 전 딱 이것만 보세요 (0) | 2025.08.12 |
|---|---|
| GPT-5 드디어 베일을 벗다 – 2년 반 만에 돌아온 차세대 AI (0) | 2025.08.08 |
| 2025년 8월 애니 추천 TOP 5 - 지금 가장 핫한 여름 신작 애니메이션 순위 (0) | 2025.08.04 |
| 2025년 로블록스 인기 게임 순위 TOP 10! 진짜 재미있는 게임들만 골라봤어요 (0) | 2025.07.30 |
| 귀멸의칼날 무한성편 8월 22일 개봉! 일본에서 무한열차 기록 박살낸 이유 (0) | 2025.07.29 |