09-2. 언어학의 역사적 발전
이 문서는 단독으로 읽을 수 있다. 언어학이 시대마다 어떻게 언어를 다뤄왔는지를 따라간다.
이 문서를 왜 보는가?
“보편문법”, “구조주의”, “코퍼스 언어학” — 이 용어들은 무관해 보이지만, 모두 앞 시대의 한계에 대한 반응으로 차례차례 나타난 흐름이다. 시대순으로 보면 왜 어떤 이론이 유행했고 왜 다른 이론이 그것을 대체했는지가 보인다.
실생활 비유: 언어학사는 언어를 보는 현미경의 진화다. 처음엔 “올바른 사용법”만 보던 시대에서, 점점 구조·의미·인지·뇌·빅데이터까지 본다.
큰 그림 — 8개 흐름
[BC ~AD 1500] 고대·중세 — 규범 문법, 종교 텍스트 분석
[1500~1800] 근대 초기 — 보편문법, 어원 사색
[1800~1900] 비교언어학 — 인도유럽어족의 발견
[1900~1930] 소쉬르의 구조주의 혁명
[1930~1950] 미국 구조주의·기술언어학
[1957~1990] 촘스키의 생성문법 혁명
[1980~ ] 인지·기능·사회언어학의 다양화
[2000~ ] 코퍼스·NLP·LLM 시대
1. 고대·중세 — 규범 문법과 종교 텍스트
1-1. 인도의 파니니(BC 5~4세기)
저서: *아슈타디야이(Aṣṭādhyāyī)*
의의: 산스크리트어의 정확한 문법을 약 4,000개 규칙으로 형식화.
방법: 추상 규칙·생성 규칙의 사용 — 2,500년 후 촘스키 생성문법과 놀랍게 닮음.
영향: "언어를 형식 시스템으로 다루는 첫 시도".
⚠️ 파니니의 작업은 언어학사상 가장 정교한 고대 작업으로 평가된다. 서양 문법학보다 약 2,000년 앞섬.
1-2. 그리스·로마 — 규범 문법
플라톤 *크라튈로스* — 단어와 사물의 관계: 자연인가 관습인가
아리스토텔레스 — 명사·동사 분류, 진리치 분석의 출발
디오니시오스 트락스 (BC 2C) — 그리스어 문법서. 8품사 분류의 원조.
영향: 라틴어 문법으로 이어져 중세 유럽 학교 교육의 표준이 됨.
1-3. 중세 — 종교 텍스트 보존
이슬람 세계: 코란 보존을 위한 아랍어 문법학(시바와이 8세기)
유럽: 라틴어 문법학 — 성경 해석·교회 라틴어 표준화
의의: "언어의 정확성"을 학문적으로 다루는 전통 형성.
한계: "정해진 규범"에 묶여 다양성·변화를 못 다룸.
2. 근대 초기 — 보편문법의 꿈 (1500~1800)
2-1. 포르 루아얄 문법 (1660)
배경: 데카르트 합리주의의 영향.
저서: *일반·이성적 문법(Grammaire générale et raisonnée)*
주장:
- 모든 언어 뒤에는 보편적 이성·논리 구조가 있다
- 표면의 차이는 그 보편 구조의 변형
의의: 후일 촘스키가 *데카르트적 언어학*에서 자기 보편문법의 선조로 인용.
2-2. 비글 항해 시대 — 다양성의 발견
유럽인들이 세계 여러 언어와 만나면서:
- 언어의 거대한 다양성 인식
- "라틴어 문법으로 세상 모든 언어를 분석할 수 없다"는 자각
- 비교언어학의 토대 형성
3. 19세기 — 비교언어학과 인도유럽어족
3-1. 윌리엄 존스 경 (1786)
사건: 콜카타에서 산스크리트·그리스어·라틴어의 유사성 발견.
명문: "산스크리트는... 그리스어보다 완벽하고 라틴어보다 풍부하며,
이 셋은 공통의 원천에서 유래했을 것이다."
의의: 인도유럽어족 가설의 출발.
3-2. 19세기 비교언어학자들
프란츠 보프 — 산스크리트와 유럽어 비교 문법(1816)
야코프 그림 — *그림의 법칙*(1822): 게르만어의 자음 변화 규칙
독일 신문법학파(Junggrammatiker, 1870s):
- "음 변화는 예외 없는 법칙이다"
- 과학적 방법론의 정초
그림의 법칙(Grimm’s Law) = 인도유럽어 → 게르만어로 갈 때 자음이 체계적으로 바뀐 규칙. 예: pater(라틴) → father(영어), tres(라틴) → three(영어).
3-3. 결과 — 어족 지도 그리기
주요 어족 분류:
인도유럽어족 — 영어·독일어·산스크리트·페르시아어·러시아어 등
중국티베트어족 — 중국어·티베트어
아프로아시아어족 — 아랍어·히브리어·이집트어
알타이어족 — 터키어·몽골어 (한국어·일본어 포함 여부 논쟁)
한국어·일본어:
알타이어족설 → 약함, 현재는 "고립어 또는 작은 어족" 견해 우세.
4. 소쉬르(1857~1913) — 구조주의 혁명
4-1. 패러다임 전환
저서: *일반언어학 강의* (1916, 사후 학생들이 강의록 정리)
핵심 주장:
- 언어 = 기호의 체계(system of signs)
- 기호 = 시니피앙(signifier, 형식) + 시니피에(signified, 의미)의 짝
- 의미는 다른 기호와의 차이에서 발생 ("색깔" 의미는 다른 색깔과의 차이)
- 기호와 의미의 결합은 자의적(arbitrary)
핵심 구분:
공시(Synchronic) vs 통시(Diachronic):
공시 = 한 시점의 시스템 분석 (이게 진짜 언어학)
통시 = 시간 변화 추적 (19세기 비교언어학)
랑그(Langue) vs 파롤(Parole):
랑그 = 사회의 공유 시스템
파롤 = 개인의 실제 발화
4-2. 영향
- 20세기 구조주의 인문학(레비스트로스 인류학·라캉 정신분석)의 토대
- 기호학(semiotics)의 출발
- "차이의 체계"라는 발상이 후기구조주의·해체주의로 확장
5. 미국 구조주의·기술언어학 (1930~1950)
5-1. 보아스, 사피어, 워프
프란츠 보아스(1858~1942):
- 아메리카 원주민 언어 기록·분석
- "유럽 언어 범주를 보편으로 가정하지 말라"
에드워드 사피어(1884~1939):
- 보아스의 제자
- 언어와 문화의 깊은 연결 강조
벤자민 리 워프(1897~1941):
- 사피어의 제자
- "언어가 사고를 형성한다"는 가설(약/강한 사피어-워프)
- 호피족 시간 표현 연구
사피어-워프 가설(Sapir-Whorf Hypothesis) = 언어 구조가 화자의 사고·세계관에 영향을 준다는 주장. 강한 형태(언어가 사고를 결정)는 비판받음, 약한 형태(언어가 사고에 영향)는 부분 지지.
5-2. 블룸필드와 행동주의 영향
레너드 블룸필드 *Language* (1933):
- 미국 구조주의의 표준 교재
- 행동주의의 영향: "관찰 가능한 발화만 다룬다"
- 의미는 다루기 어려운 영역으로 간주
방법:
- 발화 수집 → 음소·형태소 추출 → 분포 분석
- "엄격히 객관적" 방법론
한계: 의미·이해를 다루기 어려움 → 촘스키 혁명의 표적이 됨.
6. 촘스키의 생성문법 혁명 (1957~1990)
6-1. 1957년 — 통사 구조(Syntactic Structures)
배경: 행동주의 언어학(블룸필드)의 한계 — 한 번도 들어보지 못한 새 문장을 어떻게 만드나?
주장:
- 인간은 무한히 많은 문장을 만들 수 있다 (창조성, creativity)
- 이건 자극·반응·강화로 설명 안 됨
- 마음 안에 "내적 문법(생성 규칙)"이 있어야 함
생성문법(Generative Grammar):
유한한 규칙 → 무한한 문장
파니니의 형식 시스템과 유사한 발상
6-2. 1959년 — 스키너 비판
서평: 촘스키 — 스키너 *Verbal Behavior* 비판
의의: "행동주의는 언어를 설명할 수 없다"는 결정타.
결과: 인지혁명의 시작점 중 하나.
6-3. 보편문법(Universal Grammar) — 1960~
주장:
- 아이가 짧은 시간에 적은 입력으로 언어를 익힘 → 타고난 구조 필요
- "언어 습득 장치(LAD)"가 뇌에 있다
- 표면 차이에도 모든 언어가 같은 깊은 구조를 공유
이론의 진화:
표준 이론(1965, *통사 이론의 양상*)
지배·결속 이론(1981, GB Theory)
최소주의 프로그램(1995, Minimalist Program)
6-4. 영향과 비판
영향:
- 50년간 언어학 주류
- 인지과학·심리학·철학에 거대 영향
- 컴퓨터 언어학의 토대
비판:
- "보편 자질" 후보가 시대마다 바뀜
- 데이터보다 직관에 의존한다는 비판
- 아래 7장의 인지·기능·코퍼스가 도전
7. 인지·기능·사회언어학 — 1980~
7-1. 인지언어학(Cognitive Linguistics)
대표: 조지 레이코프, 로널드 랭아커
주장:
- 언어는 일반 인지 능력의 일부, 별도 모듈이 아님
- 은유(metaphor)는 사고의 핵심 도구
- 의미는 신체 경험에 뿌리(embodied cognition)
대표 연구:
레이코프·존슨 *삶으로서의 은유*(1980):
- "시간은 돈이다" (시간을 절약/낭비/투자)
- "논쟁은 전쟁이다" (공격/방어/이기다)
→ 은유는 언어 장식이 아니라 사고 구조 자체.
7-2. 기능주의(Functionalism)
주장:
- 언어 형태는 그 기능(의사소통)에 의해 형성됨
- 형식적 분석만으로 부족, 사용 맥락이 중요
대표:
- 사이먼 다익(Functional Discourse Grammar)
- 탤미의 인지 의미론
7-3. 사회언어학(Sociolinguistics)
대표: 윌리엄 라보프(William Labov)
주장: 언어 변이는 사회 변수와 체계적으로 연관.
라보프의 1966년 뉴욕 백화점 실험:
- 같은 말("fourth floor")의 발음이 백화점 등급(고급/중급/저가)에 따라 다름
- 고급일수록 "r" 발음 분명
- → 사회 계층이 언어 변이를 만든다
영향:
- 언어 변화·변이 연구 활성화
- "언어 정확성"의 권력 함의 분석
8. 코퍼스·NLP·LLM 시대 (2000~ )
8-1. 코퍼스 언어학(Corpus Linguistics)
배경: 컴퓨터로 거대 텍스트 데이터 분석 가능.
방법:
- 수억~수십억 단어 코퍼스 구축 (예: Brown Corpus, COCA, 세종 코퍼스)
- 빈도 분석, 연어(collocation) 추출, 변이 분석
의의:
- 직관 대신 데이터에 기반한 언어 분석
- 사전 편찬·언어 교육·NLP의 토대
연어(Collocation) = 함께 자주 나타나는 단어 쌍. 예: “strong tea”는 자연스럽지만 “powerful tea”는 어색. 의미는 같아도 사용 빈도가 다름.
8-2. 자연어처리(NLP)와 통계적 모델
1990s~2010s:
- 통계적 기계 번역
- 품사 태깅·파싱의 자동화
- 검색 엔진의 발전
2010년대:
- 딥러닝 도입(word2vec, 2013)
- 단어를 벡터로 표현 → 의미를 수학적으로 다룸
- 신경망 기계 번역(2016~) — 통계 번역 대체
2017~:
- Transformer 아키텍처(*Attention is All You Need*, 2017)
- BERT, GPT-2/3/4, Claude 등 LLM 폭발
8-3. LLM이 언어학에 던진 도전
[1] "보편문법 없이도 언어가 학습되나?"
- LLM은 보편문법을 명시적으로 가르치지 않아도 문법을 익힘
- 촘스키파의 큰 도전
[2] "의미는 통계적 패턴인가?"
- LLM의 단어 벡터가 의미의 많은 측면을 포착
- 그러나 "진짜 이해"인지는 논쟁
[3] 언어학의 역할 변화
- "이론 만드는 학문"에서 "데이터·모델 분석하는 학문"으로 일부 이동
- 그러나 LLM의 한계 분석에서 언어학적 통찰이 다시 필요해짐
시대를 관통하는 변화
| 차원 | 19세기 | 20세기 중반 | 21세기 |
|---|---|---|---|
| 무엇을 보나 | 어족·역사 변화 | 구조·문법 시스템 | 사용·인지·통계 |
| 방법 | 비교 재구성 | 직관·구조 분석 | 코퍼스·뇌영상·신경망 |
| 언어관 | 진화·계보 | 형식 시스템 | 인지·사회·통계의 합 |
| 인접 분야 | 역사학·민속학 | 논리학·수학 | 인지과학·AI·뇌과학 |
자기 점검 체크리스트
□ 파니니가 왜 "고대 가장 정교한 언어학자"로 평가되는지 안다
□ 19세기 비교언어학과 인도유럽어족 가설의 의의를 안다
□ 소쉬르의 시니피앙·시니피에·랑그·파롤·공시·통시를 외운다
□ 사피어-워프 가설의 강한·약한 형태 차이를 안다
□ 촘스키의 행동주의 비판이 인지혁명을 어떻게 시작했는지 안다
□ 보편문법(UG)의 핵심 주장과 비판을 함께 말할 수 있다
□ 인지언어학(레이코프)이 형식주의에 어떻게 다른 답을 줬는지 안다
□ 사회언어학(라보프)이 언어와 계층의 관계를 어떻게 보여줬는지 안다
□ 코퍼스 언어학·LLM이 언어학에 던진 도전을 안다
Comments
// admin login