당신은 어떻게 '말'을 배웠나요?
태어나자마자 부모님과 가족들이 나에게 들려준 따뜻한 말들,
친구들과 어울리며 자연스럽게 배운 말들...
일상 생활 속에서 무수히 많은 말을 접하면서
스스로 말을 사용하는 방법을 배웠을 거예요.
언어를 사용하는 원리를 밝히거나,
다양한 목적으로 사용하기 위해서는
대규모의 언어 데이터가 필요합니다.
이런 데이터를 '말뭉치' 또는 '코퍼스(Corpus)'라고 합니다.
말뭉치는 컴퓨터를 이용해 언어를 연구하거나,
인공지능을 연구하고 개발하는 데에도 사용되는
조금 특이한 모양의 데이터지만,
말뭉치를 만드는 재료는 여러분이 일상에서 사용하는 '말'입니다.
당신이 바로 말뭉치를 만드는 사람이고,
인공지능에게 '말'을 가르치는 부모이자 친구입니다.