AI가 연구 논문을 쓴다? 이제 익숙한 이야기다. 하지만 AI가 직접 코드를 짜고 실행하고 결과를 해석하는 시대라면 얘기가 달라진다. Anthropic 경제연구팀이 1,260명의 사회과학자를 대상으로 “코딩 에이전트” 사용 실태를 조사했다. 결과는 예상보다 복잡하고, 생각보다 불평등했다.

이 조사는 뭘 묻고 있나요?

2026년 2~3월, 양적 사회과학자 1,260명에게 이메일 설문을 돌렸습니다. 경제학, 정치학, 사회학이 각각 약 20%씩 차지했고 경영학, 심리학, 공중보건, 교육학, 커뮤니케이션 등도 포함됐습니다. 정교수와 부교수가 약 40%, 조교수 25%, 박사과정생이 약 30%를 차지하는 구성이었어요.

주된 질문은 두 가지였습니다. “AI를 연구에 어떻게 쓰고 있나요?” 그리고 “코딩 에이전트라는 새로운 도구는 얼마나 퍼져 있나요?” 여기서 코딩 에이전트란 Claude Code, Codex, Cursor처럼 명령어를 주면 스스로 코드를 작성하고 실행하는 도구를 말합니다.

AI 챗봇은 많이 쓰는데, 코딩 에이전트는 아니네요?

네, 격차가 극심합니다. “연구에 생성형 AI를 써본 적이 있나요?”라는 질문에 81%가 그렇다고 답했어요. 거의 대부분이라고 봐도 되죠. 그런데 “코딩 에이전트를 주당 1회 이상 정기적으로 사용하나요?”라는 질문에는 20%만이 그렇다고 했습니다. 5명 중 4명은 아직 손대지 않은 거죠.

조사 시점이 Claude Code와 Opus 4.6이 화제가 된 지 약 두 달 뒤였다는 점을 감안하면, 관심은 높아도 실제 채택으로 이어지는 비율은 아직 낮습니다. 참가자들이 애초에 AI 도구에 관심 있는 사람들이었다는 점을 생각하면, 전체 학계에서의 채택률은 더 낮을 가능성이 높아요.

그 20% 중에는 어떤 도구를 쓰나요?

단연 Claude Code가 압도적입니다. 코딩 에이전트 사용자의 86%가 Claude Code를 쓴다고 답했어요. 그 다음이 Codex로 31%였습니다. Cursor 등 다른 도구는 소수에 그쳤습니다.

학과별로 차이가 크다고요?

매우 큽니다. 경제학자의 39%가 코딩 에이전트를 정기적으로 사용하는 반면, 교육학자는 4%, 공중보건은 6%, 커뮤니케이션은 6%에 불과했어요. 정치학은 25%로 중간 위치였습니다.

이 차이는 일반적인 AI 사용에서도 비슷하게 나타나지만, 코딩 에이전트 채택에서 더 가파르게 벌어집니다. 경제학이나 정치학처럼 데이터 분석과 코딩이 연구의 핵심인 분야일수록 도입이 빠르다는 해석이 가능해요.

성별, 연차, 소속 대학에 따른 격차도 있다면서요?

이게 아마 가장 흥미로운 발견 중 하나입니다. 남성 이름을 가진 연구자의 코딩 에이전트 채택률이 여성 이름을 가진 연구자의 두 배 이상이었어요. 이 격차는 단순히 “AI를 한 번이라도 써봤는가”와는 다른 차원의 문제입니다. AI를 써본 사람들 안에서도, 코딩 에이전트까지 넘어가는 비율에서 성차가 더 벌어지거든요.

경력별로는 박사과정생과 박사후연구원의 채택률이 가장 높았고, 정교수로 갈수록 절반 이하로 떨어졌습니다. 젊은 연구자일수록 기술에 익숙하고, 직접 코드와 데이터를 다루며, 연구 실적 압박이 크기 때문으로 보입니다.

소속 대학 간 격차도 있었습니다. 상위 25개 대학 소속 연구자가 그 외 대학 소속보다 40% 더 높은 채택률을 보였어요. 모든 차이가 통계적으로 유의미했습니다(p < 0.05).

연구자들은 AI로 뭘 하고 있나요? 논문을 쓰나요?

의외로 글쓰기는 주된 용도가 아닙니다. 코딩 에이전트 사용자의 97%가 “코드 생성”에 쓴다고 했어요. 압도적이죠. 그 다음이 텍스트 편집, 연구 방법론 조언, 선행 연구 탐색 순이었습니다.

초안 작성, 즉 “글쓰기”에 AI를 쓰는 사람은 전체 AI 사용자의 3분의 1에 불과했습니다. 경제학과 경영학에서만 비교적 활발하게 초안 작성에 AI를 활용하는 편이었어요. 학술계 AI 논쟁이 “AI가 쓴 논문”에 집중되어 있지만, 실제로는 코드와 편집이 압도적인 실사용처라는 거죠.

코딩 에이전트를 쓰는 사람이 더 많이 내고 있나요?

조사 결과를 보면, 코딩 에이전트 사용자가 비사용자보다 더 많은 워킹페이퍼를 게시하고, 더 많은 연구 프로젝트를 시작하며, 더 많은 연구기금 신청을 했습니다. 숫자로 보면 워킹페이퍼 게시가 약 75% 더 많고, 프로젝트 시작은 약 10% 더 많았어요.

하지만 여기서 중요한 한계가 있습니다. 이건 인과관계가 아니라는 거죠. 코딩 에이전트를 먼저 도입한 사람들은 원래 더 생산적인 연구자였을 수 있습니다. 논문 제출 건수에서는 유의미한 차이가 없었어요. 코딩 에이전트가 프로젝트 시작과 워킹페이퍼 단계에는 도움이 되지만, 저널 제출이라는 “마지막 1마일”에는 아직 영향이 없다는 해석도 가능합니다.

연구자들은 AI가 사회과학에 도움이 될 거라고 보나요?

흥미로운 딜레마가 나타납니다. “AI가 논문 생산성을 높이는가?”라는 질문에는 88%가 긍정적이었고, 절반이 8점 이상(10점 만점)을 줬어요.

그런데 “AI가 사회과학 전체를 더 나아지게 할 것인가?”라는 질문에는 반응이 확연히 식었습니다. 응답자의 70%가 “논문 생산성”보다 “학문 전체에 미치는 영향”에 대해 더 비관적이었어요.

연구자들이 느끼는 불안은 구체적입니다. 논문이 쏟아지면 동료 심사가 과부하에 걸리고, 관심의 경쟁이 치열해지며, 누군가는 AI를 활용해 선택적 보고나 안일한 증분적 연구 같은 기존 문제를 악화할 수 있다는 거죠.

이 조사의 한계는 뭔가요?

몇 가지를 짚어야 합니다. 첫째, 응답자들이 애초에 AI에 관심 있는 연구자들이었습니다. Claude Max 계정 접근을 제공하는 연구에 참가하도록 모집됐으니까요. 그래서 전체 학계보다 AI 사용과 낙관주의가 과대평가되었을 수 있어요.

둘째, 생산성 비교는 순수하게 기술적인 것입니다. 코딩 에이전트 사용자와 비사용자 사이에는 측정할 수 없는 여러 차이가 있을 거고, 이걸 통제하기 어렵습니다.

셋째, 이 조사는 프로젝트의 “수량”만 봤지 “질”은 보지 않았습니다. AI가 만들어낸 연구가 질적으로 어떤지는 아직 열린 질문이에요.

그 다음은 뭐가 되나요?

이 설문은 더 큰 연구의 첫 단계입니다. Anthropic 연구팀은 현재 무작위 대조 실험(RCT)을 진행 중이에요. 연구자들에게 Claude Code 접근권을 무작위로 제공하고, 실제로 생산성에 어떤 인과적 영향이 있는지를 측정하는 거죠. 이 실험 결과는 향후 공개될 예정입니다.

코딩 에이전트가 사회과학에 미치는 영향은 이제 막 시작된 이야기입니다. 누가 쓰고 누가 안 쓰는지, 그리고 그 차이가 만들어내는 파급효과는 앞으로 몇 년간 학계의 핵심 질문이 될 겁니다.