Skip Navigation
Skip to contents

E-NEWSLETTER No.155 December 2023

기획특집

◎ 연구자들이 필수적으로 알아야 하는 ChatGPT와 언어모델에 대한 이해

구 요 한Command Space 대표

인공지능 기술의 진보, 특히 ChatGPT와 같은 생성형 인공지능(generative AI), 대규모 언어 모델(large language model, LLM)의 발전은 연구 및 논문 작성 분야에 혁신적인 변화를 가져오고 있다. 이러한 언어 모델은 텍스트 형태 변환에 뛰어난 능력을 보여주며, 실제로 긴 글을 요약하거나 간결하게 작성된 개요를 긴 텍스트로 만들어낼 수 있다. 영어 작성 시 문법적 오류가 거의 없다는 것을 본다면 연구자들에게 이전에는 경험하지 못한 수준의 지원과 가능성이 대두되었다. 연구 분야에서는 새로운 전망을 열어주며, 연구 방법론에 혁신적인 전환점을 제공한다.

ChatGPT는 전 세계 웹 문서의 내용을 기반으로 구축되었다. 사용자의 입장에서 본다면, 수많은 문서에서 동의한 공통적으로 나타난 내용에 가중치를 두어 패러미터(parameter)를 구성하고 학습된 언어모델로 이해할 수 있다. 언급 횟수가 높은 지식을 학습한 ChatGPT는 선행 연구와 실험 결과를 파악하고, 새로운 연구를 기획하는 데 도움을 줄 수 있다. 전세계 인구가 상식적으로 알고 있는 내용을 물어보면 굉장히 전문가답고 확신에 찬 말투로 대답을 한다. 인용수가 높은 논문의 제목이나 내용을 이야기할 때에도 그러하다. 하지만 언어모델 훈련에 투입된 문서의 학습 시기가 2021년 9월, 2년 전에 머물러 있다보니 최신 연구 동향이나 이론적 발견을 반영하는 데에는 한계가 있다. 이는 연구자들이 사용 시 반드시 고려해야 할 중요한 부분이다.
언어모델의 특징을 이해하면 ChatGPT의 학술적 효용 가치는 양 극단의 집단에서 증가하는 것을 알 수 있다. 초심자(novice)의 수준에서 언어모델의 결과물은 매우 유용한 학습 도구가 된다. 새로운 분야를 학습하거나, 기존에 수없이 많이 논의된 이론적 배경과 정보를 연결하는 것에 탁월하다. 또한 특정 분야의 전문가(expert)인 경우에도 장점이 두드러지는데, 최근 논의된 이론적 발견이나 연구 동향을 알고 있는 연구자가 사용한다면 ChatGPT가 알 수 없는 정보를 제공하고 미세 조정(fine tuning)을 한 수정된 버전의 언어 모델을 개인화하여 사용할 수 있다.

현재 OpenAI의 언어모델은 여러 가지 버전으로 제공되고 있다. 크게는 GPT의 버전을 3.5와 4.0으로 나눌 수 있는데, 버전이 높은 모델일수록 추론 능력과 간명성에서 이점을 가진다. 이는 사용 언어에서도 드러나는데 학습된 문서의 양에 기반하여 훈련되어있기 때문에 한국어보다 영어로 소통할 때 탁월하고 통찰력있는 대답을 들을 수 있게 된다. OpenAI의 기술 보고서에 따르면 [GPT 4.0 영어] - [GPT 4.0 한국어] - [GPT 3.5 영어] - [GPT 3.5 한국어] 내림차순으로 언어 모델의 성능이 평가되었다. ChatGPT Plus로 유료 결제(월 20달러)를 하게 되면 언어모델의 버전(GPT 4.0은 유료 사용자만 사용 가능) 뿐만아니라 연구 프로세스에 필요한 추가 기능(인터넷 검색, 플러그인, GPT 챗봇, 이미지 생성모델 DALL·E 3 등)을 사용할 수 있다.

연구에 있어 가장 민감하게 논의되는 이슈는 언어모델의 환각(hallucination)이다. 이는 사실이 아닌 내용을 사실인 것처럼 그럴싸한 언어로 포장하게 되는 현상이다. 앞서 논의한 바와 같이 연구자가 사실에 기반한 정보와 연구 결과를 사전에 알고 있었다면 GPT 모델의 환각 여부를 판단할 수 있고 정정해줄 수 있다. 추가적으로는 이러한 한계를 극복하기 위해 연구자들은 인터넷 검색, 학술 데이터베이스 접근 기능, 3rd Party의 서비스의 사용을 고려해볼 수 있다. GPT 상에서 Bing 검색 기능을 사용하거나 WebPilot(플러그인, GPT 챗봇 모두 사용 가능)을 통해 구글 검색을 사용할 수도 있다. ResearGPT 챗봇이나 ScholarAI, Consensus Search, Paperpile 플러그인을 통해 ChatGPT에서 학술DB의 접근이 가능하게 할 수도 있고, SciSpace나 Perplexity를 사용하여 외부에서 GPT API(application programming interface)를 사용해 논문 리뷰, 작성 프로세스를 보조할 수 있다.

논문 작성을 포함한 연구 프로세스에서 ChatGPT의 효과적인 사용을 위해서는 'Prompt Engineering'의 중요성을 인식해야 한다. ChatGPT에게 던지는 질문이 '프롬프트(prompt)'이고 받는 대답은 '컴플리션(completion)'이다. 좋은 질문이 좋은 대답을 만들어낼 수 있듯이 어떤 내용을 입력해야 연구자가 원하는 결과를 받을 수 있는지를 알고 있어야 한다. 이중에서도 페르소나 패턴(persona pattern)이 중요한데, 언어 모델이 수행해야 할 역할과 제공해야 할 정보를 정확히 설정하는 것을 의미한다. 예를 들어, 학술지의 방향성, 저자 가이드라인, 주요 주제 등의 정보를 GPT에게 제공한다면, GPT는 연구자나 저널 편집장처럼 연구에 도움을 줄 수 있다. 그러나 생성된 결과물을 그대로 사용하는 것은 윤리적 문제를 야기할 수 있으므로 연구자는 개인적인 윤리적 판단과 수정을 통해 이를 해결해야 한다.

GPT는 입력된 정보에 따라 출력이 결정되는 함수와 같다. 연구 맥락, 선행 연구 고찰, 연구 결과의 인사이트가 입력되면, 실제로 사용할 수 있는 효용가치가 높은 글을 작성할 수 있다. 기록되지 않는 것은 기억되지 않는다는 점에서, 지식 관리가 필수적인 시대가 되었다. 단순한 메모가 아닌 지식의 연결을 입력하고 정리할 수 있는 노트테이킹 앱(Obsidian, LogSeq, Capacities 등)을 사용하면 생성형 인공지능의 사용성을 극대화할 수 있다. 특히 옵시디언(Obsidian)의 경우에는 GPT API를 입력하고 앱 자체에서 언어모델을 호출해 사용할 수 있다.

종합적으로, ChatGPT의 활용은 연구 방법론과 논문 작성에 혁신을 가져다준다. 연구자들은 이러한 도구의 능력과 한계를 이해하고, 적절한 추가 도구를 활용하여 깊이 있는 연구 결과를 도출해야 한다. 이러한 접근 방식은 연구 분야에서의 지속적인 진보를 가능하게 하며, 미래 지향적인 연구를 위한 중요한 기반을 마련한다. 100만큼의 노력을 했을때 얻어지는 일반적인 결과가 100이라면, 생성형 인공지능을 통한 사용 경험은 20%의 노력으로 70-80% 정도의 초안(draft)을 얻을 수 있는 것과 같다. 언어모델은 인력을 대체하는 것이 아니라 휴먼 인터페이스의 한계를 극복하고 강화하는 것으로 이해하는 것이 바람직하다.


<그림 1> 생성형 인공지능 활용을 통해 구축 가능한 새로운 연구 패러다임


대한의학회(https://www.kams.or.kr)
(06653) 서울특별시 서초구 반포대로 14길 42, 6층/7층 (서초동, 하이앤드타워)