반응형

사원수(Quaternion)란? ~허수에서 출발하는 차원확장~

 

0. 개요

사원수(Quaternion)라는 개념에 대해서 알고 계신가요?

처음 들어보시는 분들도 많으실 거라 생각하는데요, 이 수는 4개의 요소로 '공간'을 나타내는 한가지 방법이랍니다.(그래서 4개의=사, 요소=원, 해서 사원수죠!)

'공간을 나타내는 방법'하면 대표적으로 떠오르는게 '벡터'가 있으실텐데, 이것도 사원수에서 출발한 개념인 걸 알고계실까요!?

그렇다면 이 사원수는 어떻게 발견되게 되었을까요!?

그리고 어떻게 쓰는 걸까요!?

지금부터 따라오시죠! 팔로팔로미~

 

 

1. 허수 발견의 역사

그 전에, 일단 사원수는 '허수(imaginary number)'를 사용합니다.

간단하게 "현실 세계에서는 있을 수 없는 수!"라고 해서 '비다/없다/헛되다/가짜'를 뜻하는 '허(虛)'를 붙인거죠.

영어로도 '가상으로만 있는 수'라는 뜻에서 'imaginary number'라고 부릅니다.

그리고 수학적으로는 $ \sqrt{-1} $을 뜻하죠. 현실세계에서는 무언가를 제곱하면 '무조건' 양수가 나와서, 그 역연산인 제곱근을 사용할 때는 그 대상이 무조건 양수여야만 하는데, 현실에서 절대로 나올 수 없는 '제곱해서 음수가 나오는 수'를 정의한 거니까요.

 

가만히 생각해보면, 현재 우리들도 이해하기 어려운 '헛 것'을 과거 사람들은 쉽게 받아들일 수 있었을까요? 심지어 처음 보는 개념인데요!

그래서 이 허수를 발견하고 받아들이는데는 참 많은 시간이 필요했답니다.

간단하게 정리해보자면,

  • 카르다노(Gerolamo Cardano, 1545)는 3차방정식의 근의 공식을 발견했는데요, 이 삼차방정식의 근을 푸는 공식에서 실수해가 존재함에도 불구하고 중간 계산 과정에 $ \sqrt{-121} $과 같은 형태가 스쳐지나가고는 했죠. 일단 최종 계산상 사라지니까 그냥 기계적으로 풀기는 할 수 있었지만, 당시에 이 "음수 제곱근"은 의미 불명 상태로 남아있었습니다.
    => 허수의 발견
  • 라파엘 봄벨리(Rafael Bombelli, 1572)는 이 '기계적'이고 '규칙적'인 계산을 아예 연산 규칙으로 정립하여서 복소수 연산의 실제적 출발점을 세웠다고 볼 수 있습니다.
    => 복소수 연산 정립
  • 오일러(Euler)와 드무아브르(de Moivre)는 18세기에,
    (오일러 공식) $ e^{ix} = \cos x + i \sin x $
    (드무아브르 공식) $ (\cos x + i \sin x)^n = \cos nx + i \sin nx $
    등의 공식을 통해 복소수를 해석학적으로 확장하였습니다.
    => 복소수가 단순 기이한 수가 아니라, 삼각함수, 지수함수와 연결된 분석 도구로 자리잡기 시작
  • 가우스(Carl Friedrich Gauss, 1799)는 복소수를 수로서 명확히 인정하고, 복소평면 상에서의 시각적 표현을 개념화하였습니다. 여기서 복소평면이란, 말만 좀 거창할 뿐이지 원래 실수를 표현하던 수평선에 수직으로 허수축을 하나 더 붙여 좌표평면처럼 만든 것입니다.
    => 이후 복소수는 “실수와는 다른 차원의 수”가 아닌, "실수의 확장된 체계"로 인정되기 시작합니다.

 

 

2. 복소평면으로 확장

그리고 여기서 평면상에서의 시작적 표현 하면 빠질 수 없는 분이 바로 르네 데카르트(René Descartes)죠.

데카르트는 1637년 2차원 평면좌표계(수직좌표계)를 처음으로 수학적으로 체계화했는데요, 그 발견 일화가 좀 재밌습니다.

데카르트는 누워있기를 매우 좋아했다고 합니다. 그러다 어느날 파리가 천장 아래서 날아다니는 모습을 유심히 보다가 좌표계를 떠올렸다고 합니다. 파리가 점, 천장이 평면이고 파리의 위치를 기술하려면 수직좌표계를 쓰면 파리의 위치를 명확하게 기술할 수 있기때문이죠!

어찌되었든, 이렇게 평면좌표계가 만들어지고나서 당연히 '공간'을 나타내고 싶어했습니다만...

다들 그냥 '축하나 더해서 공간으로 확장하면 되지'하는 수준이고, 이 공간상에서의 회전과 같은 명확한 연산법이 발견되지 않고있었습니다.

 

 

3. 공간으로의 확장

그리고 여기서 오늘의 주제를 만든 윌리엄 로완 해밀턴(Sir William Rowan Hamilton, 1843) 경이 등장합니다.(영국에서 작위를 받아 Sir가 붙고 한국어로 '경'이 붙죠)

데카르트의 평면좌표계처럼 1차원이었던 실수체계에서 가우스가 허수축을 도입해서 복소수가 2차원이 되며 평면을 표현할 수 있게 되고, 또한 여기에서 허수의 곱셈이 바로 좌표의 회전을 나타내게 되니(실수 1에서 $i$를 곱하면 바로 허수축으로 90도 회전이 일어나고, 여기서 다시 i를 곱하면, $ i^2 $이니 -1이 되며 원래 1에서 180도 회전, 다시 $i$를 곱하면 $-i$가되며 270도 회전, 다시 $i$를 곱하면 360도 회전이 되죠?) 해밀턴 경은 "오? 이거 잘하면 3차원에서 회전 연산을 내가 만들 수 있겠는걸!?"하면서 연구에 착수합니다.(평행이동은 각 요소별 덧셈/뺄셈이고 증감은 곱셈/나눗셈이니(=간단하니) 회전연산이 엄청 중요한 걸 알 수 있습니다.)

그러나... 다른 사람들의 생각처럼 '그냥 2차원에다가 축하나 더 넣으면 3차원 아냐?'하는 식으로 복소평면에 허수축을 하나 더 도입하여 3차원을 만든 초기 (가칭)'삼원수'는 실패로 끝납니다.

왤까요?

회전을 보자면, 2차원 평면에서는 평면 위에서 회전하는 딱 한가지 회전 방식 밖에 없습니다.[좀 더 있어보이게 말하자면, 평면을 정의하는 법선벡터를 기준으로 회전하는 방법밖에 없죠]

그러나 3차원이 되면, 회전하는 방향이 세가지가 됩니다.(Roll/Pitch/Yaw라고도 하고, 쉽게 x축 기준 회전/y축 기준 회전/z축 기준 회전 이라고도 하죠)

결국 축 하나 추가됐을 뿐이지만, 회전하는 방향은 세가지가 되어버리는거죠..

이걸 수학적 살펴보자면
$ a+bi+cj $형태로 3차원 표현을 시도하면 $ i^2 = j^2 = -1 $이 될겁니다.(다시 말해, i축으로 회전가능하고 j축으로 회전 가능하다는 말입니다.)
그렇다면 복소평면에서처럼 $i$를 곱할수록 $i$축 방향으로 90도가 돌아가고, $j$를 곱할수록 $j$축 방향으로 90도가 돌아가는건 정의가 되는데...

이렇게 돌아가겠죠?

 


$ij$의 곱 정의에서 문제가 발생합니다.

$i$의 제곱이 $i$축으로 회전, $j$의 제곱이 $j$축으로 회전을 정의한다면, 같은 논리로 $ij$는 $i$축으로 회전 후 $j$축으로 회전을 뜻하겠죠?

근데 $i, \ j$모두 허수니까 곱하면 $-1$이겠네요?

엥.. 근데... 이렇게 정의가 되어 버리면, $ i $축 위에 있는 점이 $ j $축으로 가는게 아니라 다시 실수축(-1)으로 와버리네요!?

심지어 공간이니까 i->j로 움직일 수도 있지만, j->i로 움직일 수도 있는거 아닌가요?

그러나 현재 상황에서는 $ji$도 -1로 정의가 되면서, 아까와 똑같은 값으로 실수축으로 가버리는 문제가 발생합니다.

와... 문제가 아주 심각합니다.

 

그렇게 처음 생각이었던, 삼원수가 실패로 돌아가고... 그러던 어느 1843년 10월 16일...

집에서 시름시름 앓던 해밀턴 경..(그랬는지는 모르겠지만)

아내가 보다 못해 나가서 산책이나 하자고 꼬드기고(팩트는 알 수 없다는 거임..)

해밀턴은 부인과 함께 더블린의 왕립 운하를 따라 터덜터덜 걷(고는 있었으나 머릿속으로는 계속해서 삼원수의 곱셈에 대해 생각하고 있)던 중 뭔가 삐로링! 하면서 번뜩 아이디어가 떠오릅니다!

 

이 모든 문제는..! 바로..! 허수축을 하나 더 추가하면 해결이 된다는 사실을..!!

그리고 허수축을 하나 더 추가하면 i->j랑 j->i도 표현할 수 있다는 것을..!(단순히 부호바꿔주면 되겠죠?)

 

정말 엄청난 영감은 끊임없이 고민하던 중 한순간에 오는 것!

그래서 해밀턴은 이 아이디어를 놓치지 않기 위해 '기록'을 하기로하고 종이를 찾았으나... 종이가 없었다..!

해밀턴의 선택은..!?

바로 근처에 있던 브로엄 교(Brougham bridge)의 난간에 칼로 새겨 놓았다고 합니다.

집에 들고가지 못하니 의미 없는거 아닌가.. 싶기도 하지만, '절대 까먹고 싶지 않다'는 바람이면 이해할 수 있을 것 같습니다.

그래서 뭐라고 새겨 놓았냐면..

$ i^2 = j^2 = k^2 = ijk = -1 $

인데.. 암호같지만, 여기까지 따라오셨으면 다 아시죠?

일단 i랑 j는 위에서 살펴봤고, 여기서 k라고 하는 허수를 하나 더 추가했다는 말이고,

두번째로 $ ijk=-1 $ 이게 진짜입니다. 바로 여기에서 회전법칙을 깔끔하게 정리해버립니다.

잘 보세요. 허수 세개를 곱했는데 -1입니다. 이상하지않아요? 허수의 정의 상 제곱해야 -1인데 말이죠?

자, 바로 여기서 아까 설명했던 문제 중 i->j, j->i를 해결해버린겁니다.

즉, 이 모든 수식을 정리해보면 $ ij = k, \ jk = i, \ ki=j, \ ji=-k, \ kj = -i, \ ik=-j $로 정리되면서 ijk=-1이 바로 풀리죠?

그래서 3차원을 나타내기 위해 허수축 하나만 추가하면 안됐던거고, 두 개를 추가해서 허수축 하나당 회전 방향 하나 씩을 할당해야 했던 거랍니다.

[여담이지만, 여기서 해밀턴은 처음에는 복소평면에서처럼 각 허수를 한번씩 곱해주면 '그 허수 방향'으로 회전하는 것을 생각했을 겁니다. 그러나 논지가 진행되면서 '그 허수 방향'으로 회전하는게 아니라 '그 허수를 축'으로 회전한다는 걸 발견했을 겁니다. 물론 공리가 틀리진 않았기에, 회전하긴 합니다만 생각한 것과 다른 방향, 다른 각도로 회전하면서 알게되지 않았을까요?]

 

 

4. 사원수의 이해

이렇게 해서 공간 상에서 실수축을 아예 빼버리고, 허수축으로만 구성을 함으로써 해밀턴의 사원수는 성공적인 첫 발을 떼게 됩니다.

 

그럼 실수축은 아예 역할이  없어진거냐? 하면

아니죠! 애초에, 처음 시작부터 실수축은 '기준점'의 역할을 했었습니다(복소평면에서 부터 삼원수 확장 까지도)

'이 점부터 돌려!' 같은 느낌이었던거죠

이거는 공간으로 확장되면서도 마찬가지의 역할을 가집니다.

공간상에서 딱 찍혀있는 애는 실수가 없어도 되지만, 얘를 공간상에서 '회전'시키려는 순간 말이 달라지게 됩니다.

단순 허수값만 가진애랑 곱해버리면, 얘는 회전을 하긴 합니다.
근데, 사원수에서 실수란건 '질량'이나 '관성'같은 존재인거라 얘가 없으면 그냥 '다 회전해!'하는 식이고 얘가 크면클수록 '아 너 허수만큼 회전을 하긴 하되, 나 좀 무거운 애야~' 해버리는거죠.
그래서 허수가 지정한 만큼 회전을 못해버리는 사태가 발생합니다.

그리고 더 재밌는건 실수 이기때문에 음수도 가능하다는 부분입니다.
그러나 앞서 얘시로 든 '질량'에 대해 '음수 질량'이라는게 조금 걸린다면, 개념을 조금 더 확장해서 '회전 강도 조절 다이얼'이라고 생각해 봅시다.

  • 0이면 딱 정한 기본회전(순수 허수 곱=180도 회전)을 보여줍니다.
  • 근데 다이얼을 +로 돌리면, 회전에 '제동'을 가하는 개념이 되어, 다이얼을 많이 돌릴수록 그 억제력이 강해져서 점점 0도로 수렴해버리죠.
  • 그럼 반대로 -로 돌리면? 반대로 회전에 '부스트'를 거는 개념이 되어, 정해진 180도를 넘어서 '과회전'하는 겁니다. 다이얼을 많이 돌릴수록 360도 가까이까지 돌아가겠죠?

[45도는? 더 들어가지 맙시다... 머리아파요.. 그래도 궁금하면 대략 무게가 12인데 얘를 5만큼의 힘으로 돌리면 45도가 돌아갑니다..]

 

중간결론: 사원수는 두가지로 나뉜다!

  1. $ v $ 공간상에 찍힌 점($ ai+bj+ck $) [a.k.a 실수 없는 애=회전 당할 사원수]
  2. $ q $ 어떻게 회전하세요($ d+ei+fj+gk $) [a.k.a 다이얼 달린 애=회전 시킬 사원수]

 

 

5. 사원수의 계산

지금까지 공간상에 찍힌 점($ ai+bj+ck $) [a.k.a 실수 없는 애=회전 당할 사원수]

어떻게 회전하세요($ d+ei+fj+gk $) [a.k.a 다이얼 달린 애=회전 시킬 사원수]

를 살펴보았습니다.그리고 이 두개를 곱하면 '공간상에 찍힌 점'이 돌아! 갈거라고 생각했지만... 사실은

'회전 시킬 사원수'만 곱한다고 돌아가지 않습니다...

'엥? 아까 돌아간다며! 사기꾼아!'

라고 하신다면 좀만 기다려보세요. 왜그런지 설명들어갑니다!

 

자, 잘 보셔요.

원래 점이 있었습니다.

우리는 얘를 그냥 공간상에 '점!'이라고 볼수도 있지만, 'i로 얼마만큼, j로 얼마만큼, k로 얼마만큼에 있는 점!'이라고도 볼 수 있습니다.

 

자 여기다가 그냥 '회전 시킬 사원수'만 곱해버리면 무슨일이 발생하냐면.. 차원이 확장됩니다!

 

'어머 이게 무슨 차원폭발하는 소리양?' 하시겠지만..

실제로 점은 3차원 공간에 있는데, 회전시킬애는 '무게'(혹은 '정도')까지 더해줘서 4차원입니다.

 

그리고 이 두개를 그냥 곱하면 정상적으로 3차원에 있던 애가 4차원의 이상한 애가 되어버려요... 호앵...

 

그럼 어떻게 다시 현실로 돌려놓냐면... 다시 '차원축소' 시켜주면 됩니다!

아 뭐 PCA나 이런 거창한 차원축소 아니구요...

그냥 곱했던 애로 다시 나눠버리면 얘가 다시 정신을 차립니다.

4차원에서 헤롱거리던애가 다시 3차원 복귀하는거죠.

 

그리고 차원 확장되면서 반쯤 돌아버린애가 다시 원래 차원으로 돌아오면서 반쯤 더 돌아서 말그대로 '훼까닥' 돌아버리는 겁니다!

다시 말해서 얘가 이상한 약 먹고 정신 나가서 어디 갔다가 다시 약먹고 정신차리니까 '오엥? 내가 여기왜있슴?'하는 상태란 것!

 

근데1: 곱했던거 다시 나누면 그냥 또이또이 쌤쌤 그게그거 아님? 이라고 하는 당신. 짝짝짝.

아님1: 교환법칙(캬 이것도 있어보이는 말)이 성립하면 당연한 소린데, 안타깝게도 이 사원수는 교환법칙이 성립 안해요. 아까 보셨잖아요? ij랑 ji는 달라서 순서대로 연산하면 결과가 그게 그거가 아니게 되는거에요.

근데2: 그래 뭐 그건 이해했다치는데, 그래도 개념상 곱했던거 다시 나누면 역연산이니까 다시 원점으로 돌아와야 하는거 아님!?

아님2: 아, '아님1'을 제대로 이해못한거에오... 일단 또이또이가 아니구요! 그리고 조금 어렵지만 부가설명해보자면, 사실 '나눈다'고 했지만, 얘는 복소수랍니다. 복소수 나눗셈은 켤레복소수라는걸로 분모 싸그리 정리해버리고 분자 바꿔서 곱하면 그게 나눗셈이에요. 감 오시나요? '그냥 나눈게 아니라', '다른 무언가를 곱해줌'이라는 개념인거죠. 그래서 이렇게 곱해주면, 실수항은 사라지는데 원래 의미(회전)은 남아있게 되는거죠!

 

자, 이제 예시를 한번 풀어볼까요?

공간 위에 i+j라고 하는 점을 i축을 기준으로 90도(1+i죠?) 돌려봅시다.

 

 

그러면, $ (1+i)(i+j)(1+i)^{-1} $일 것이고

$ = (i+j+i \cdot i+i \cdot j)(1+i)^{-1} $ (곱하는 순서 바뀌면 안돼요!)

$ = (i+j-1+k)\frac{1}{1+i} $

$ = (i+j-1+k)\frac{1-i}{(1+i)(1-i)} \ = \ \frac{(i+j-1+k)(1-i)}{2} $

$ = \frac{(i+j-1+k)-(ii+ji-i+ki)}{2} \ = \ \frac{(i+j-1+k)-(-1-k-i+j)}{2} \ = \ \frac{2i+2k}{2} $

$ = i+k $

네, 실제로 i+j점을 i축을 중심으로 90도 돌리면 i+k가 되겠죠?

 

중간결론: 사원수 공간에서 점을 회전시키고 싶으면 회전 시킬 사원수를 곱하고 다시 나눠줘야한다!

$ v' = q v q^{-1} $

 

 

6. 사원수의 정규화

여기서 좀 더 어렵게 가보겠습니다!

사실 우리는 대게 가볍게 그냥 '회전 시킬 사원수 곱하고 나눠뿌자'하지만, 사실 회전사원수는 딱 그 최소 단위로 만들어주어야 좋습니다.

 

네? 뭔말이냐구요? 보세요. 3.

3은 최소 단위가 뭘까요? 라고 하면 대답할 수 있는 분?

어렵게 생각해서 다 대답 못하는시는 겁니다.

1이에요. 1+1+1? =3이죠.

그래서 우리는 아주 재밌게 최소단위*몇배 로 모든 개념을 쓸 수 있습니다! 3도 3*1이죠!

 

그럼 다시 생각해봐서. 3을 최소단위로 만들어주려면? 3으로 나누면 될겁니다!

 

똑같습니다. 이 사원수도 '크기'라는게 있습니다.( $ |\ a+bi+cj+dk\ | = \sqrt{a^2+b^2+c^2+d^2}$ ) 뭐 그냥 막 쓰면 '3'같은 애죠.

근데, 얘를 최소단위로 만들어줘야 사실 '회전'에서 의미있는 뜻을 알 수 있어요!

그래서 그냥 '회전시킬 사원수'를 '크기'로 나눠주면 '최소단위'가 됩니다.

이거를 '정규화'라고 해요.

 

근데, 일반 계산에선 의미 없어요.. 왜냐면 곱하고 나눠주니까요... 또륵..

'아까는 곱하고 나누는거 쌤쌤 아니라며!'라고 하신다면, 얘는 교환법칙이 성립해요...(허수가 들어가는 연산이 비가환이고, 대수적으로 곱해지는 수들은 가환이에요..) 그래서 의미가 없어요...

그래서 연산에서는 의미가 없는데, 그 '회전'자체를 분석하고 싶으면 해줘야합니다...

 

중간결론: 회전시킬 사원수를 정규화하면 그 의미를 알 수 있다.

$ |q| = \frac{q}{\sqrt{a^2+b^2+c^2+d^2}} $

 

 

7. 사원수의 회전 정도

아까 사원수를 정규화하면 그 의미를 알 수 있다고 했는데, 그건 뭔 뜻이냐하면...

아까 해밀턴 이전에 오일러나 드무아브르가 삼각함수와 허수를 엮었던거 기억나시나요?

비슷하게 사원수도 삼각함수랑 엮이는데, 허수부를 하나의 벡터로 본다면

$ |q| = \cos \left(\frac{\theta}{2}\right) + \overrightarrow{u} \sin \left(\frac{\theta}{2}\right) $

이런 관계식이 성립합니다.

따라서 정규화된 사원수를 분석하면 어디로 어느정도 각도를 돌리는 친구인지 알 수 있게 되죠.

그리고 더 나아가서 아까 곱하고 나누는 연산에서 두번 회전을 적용해주는게 여기서도 보입니다. 즉 돌릴 각 $ \theta $를 반으로 나누어서 가지기 때문이죠.

한가지 더, 아까 '다이얼'이라고 표기했던게 cos부분인데, 실제로 cos값이 커질수록 그에 해당하는 각 $ \theta $는 작아지는 걸 아실 수 있겠죠?

 

 

8. 사원수 그 이후

사원수는 이후 선형대수학에 큰 영향을 미쳤는데요

벡터 라는 말도 사실 해밀턴이 처음 만든 말로, 실수부를 제외한 허수부 즉 공간상에서 표현되는 부분을 벡터부(vector part)라고 명칭했고실수부는 스칼라부라고 했습니다.(그래서 공간벡터를 i, j, k라고 명명하는게 여기서 출발한 겁니다.)


그리고 사원수는 계산하면 스칼라부와 벡터부로 연산이 진행되는데, 후대에 이를 가리켜 스칼라부로 곱해지는 부분을 내적(inner product)라고 칭하고(Peano, 1898) 벡터부로 곱해지는 부분을 외적(outer product)라고 명명(Grassman, 19C 중반)하게 됩니다.

 

 

9. 마무리

사원수는 거의 처음, 공간에 대한 직접적인 연산을 가능하게 만든 체계입니다.

그러나 계산이 너무 복잡하고, 허수를 사용하는데다, 교환법칙도 성립하지 않는 등의 문제를 안고 있었습니다.

그리고 이것을 개선하기위해 등장한 것이 선형대수학, 벡터 미적분학 등이죠.

그래서 요새는 참 선형대수학이 엄청나게 발전하여(특히나 AI관련으로 더욱 가속화 되었죠) 사원수가 잊혀진 것 같으나, 그럼에도 불구하고 로봇공학과 같은 특수한 영역에서는 아직도 사용되고 있답니다.

특히나 오일러 각을 이용하여 공간을 표현할 때 생기는 짐벌락(Gimbal lock)이 없다는 장점도 있죠.

반응형
반응형

어서오세요! 힐베르트 호텔에! ~무한의 세계로 떠나는 여행~

자연수가 클까? 유리수가 클까?

 

 

0. 무한 호텔에 오신 것을 환영합니다!

안녕하세요! 어서오세요! 여기는 힐베르트 그랜드 호텔(Hilbert Grand Hotel)입니다!

이 호텔은 정말 말그대로 '그랜드(Grand)'해서 방이 정말 많아요!
진짜 말그대로 방이 무한히 많답니다.

게다가 엄청난 성업중!
오늘도 평화로운 힐베르트 호텔호텔호텔. 모든 방에 손님이 꽉 차 있습니다. 빈방이 하나도 없죠. 🏨

그런데 새로운 손님 한 명이 찾아옵니다.
"형님들 안녕하십니까?"
어라? 방이 꽉차있는데 어쩌죠? 입장 거절 확정인가요?

그런데 말입니다. 지배인 형님 등장하셨죠. 끝났습니다.
당황하지 않고 입을 여시죠.
"1번 방 손님은 2번 방으로, 2번 방 손님은 3번 방으로..."
마법처럼 모든 손님에게 자신의 방 번호에 +1을 더한 방으로 강제 이주 들어갑니다.
이제 1번방 비었죠? 새 손님 입장 확정입니다.
끝났습니다. 입장하시죠.

이처럼 '꽉 찼지만' 항상 공간을 더 만들 수 있는 것이 바로 무한의 신비입니다. 여기서 한 가지 궁금증이 생깁니다.

"아니, 한 명이 더 와도, 심지어 무한 명이 더 와도 수용이 가능한 이 무한에도 '크기'라는 게 있을까? 무한끼리 크기를 비교할 수 있다는 게 말이 될까?"

놀랍게도, 대답은 "네, 가능합니다." 입니다.

모든 무한이 다 같은 레벨의 무한은 아니라는 사실. 믿겨지시나요?

"무한대는 다 똑같은 거 아니야?" 라고 생각했다면 큰 오산! 오늘은 무한의 세계로 떠나 어떤 무한이 더 '큰지' 비교해보는 신기한 여행을 시작하겠습니다. 

미리 힌트를 좀 드리자면, 수학자 게오르그 칸토어가 발견한 '일대일 대응'이라는 마법 같은 방법만 알면 누구나 이 무한의 크기를 이해할 수 있답니다.


 

1. 자연수가 더 클까요, 짝수가 더 클까요?


자, 일단 자연수가 더 큰지, 짝수가 더 큰지 생각해 볼까요?

자연수는 짝수와 홀수로 이루어져 있고, 따라서 일견 짝수가 자연수보다 크기가 더 작을 것 같습니다.

"당연히 자연수가 더 많지! 짝수는 자연수에 포함되잖아?" 라고 자연스럽게 말하게 될 것입니다.

직관적으로는 그렇게 생각하기 쉽습니다.

하지만 무한의 세계에서는 우리의 직관이 항상 통하지는 않습니다.

두 집합의 크기를 비교하는 방법은 바로 일대일로 짝을 지어보는 것입니다.

하나도 남거나 모자라지 않게 짝을 지을 수 있다면 두 집합의 크기는 같다고 봅니다.

즉, 일대일대응을 시켜서 대응이 된다면 두 집합의 크기가 같은것이죠!


자, 자연수와 짝수를 한번 짝지어 볼까요?

자연수 1 에는 짝수 2를

자연수 2 에는 짝수 4를

자연수 3 에는 짝수 6을

...

자연수 n 에는 짝수 2n을

어떤가요? 모든 자연수는 자신만의 짝꿍 짝수를 가질 수 있고, 어떤 짝수도 짝꿍이 없는 경우가 없습니다.

이렇게 빈틈없이 일대일로 대응시킬 수 있으므로, 놀랍게도 자연수의 개수와 짝수의 개수는 같습니다.



결론: 자연수와 짝수의 '무한'은 같은 크기다!

 

 

2. 정수가 더 클까요, 자연수가 더 클까요?


이번엔 0과 음수까지 포함하는 정수와 자연수를 비교해 봅시다.

정수는 자연수(양의 정수)와 0, 그리고 음의 정수까지 있으니 당연히 더 많아 보이죠?

하지만 이번에도 일대일 대응의 마법을 사용해 보겠습니다.


이렇게 짝을 지어보면 어떨까요?

자연수 1 에는 정수 0을

자연수 2 에는 정수 -1을

자연수 3 에는 정수 1을

자연수 4 에는 정수 -2를

자연수 5 에는 정수 2를

...


즉, 홀수 자연수 n에 대해서는 (n-1)/2를 대응하고, 짝수 자연수 n에 대해서는 -n/2를 대응하면 나오는 규칙이죠!

이런 규칙으로 자연수를 양의 정수와 음의 정수에 번갈아 가며 대응시키면, 모든 정수는 자신만의 자연수 짝을 찾을 수 있습니다.(1:1 대응 성립) 따라서 정수와 자연수도 같은 크기의 무한입니다.

결론: 정수와 자연수의 '무한'도 같은 크기다!

 

 

3. 유리수가 더 클까요, 자연수가 더 클까요?


그럼 이제 집합의 크기를 좀 더 키워봅시다.
수의 체계에서 정수보다 큰 집합은? 네 유리수죠!
그럼 유리수는 자연수보다 커질까요? 아니면 지금처럼 같은 크기일까요?

유리수는 이제 분수가 들어가기 시작하면서 간단한 수식계산 같은 조작으로는 이제 조금 버겁기 시작합니다.

그러나 세상에는 똑똑한 사람이 참 많은 것 같습니다.

이 분수를 전부 기약분수(p/q)로 만든 뒤, 분자(p)의 값을 x값에, 분모(q)의 값을 y값에 대응시킵니다.

기약분수의 꼴이므로 본모도 정수(0이 아닌), 분자도 정수임을 이용한 것이죠.

이렇게 좌표위에 하나씩 찍어주면... 정수 격자점 위에 점이 하나씩 찍힐 것입니다.

다음 그림처럼 말이죠.



기약분수니까, 점 (p, q)에서 p, q가 공약수를 가지는 격자점은 공백이 됩니다.

또한, (0, q)는 q가 1일 때만 기약분수로 간주하기 때문에, q가 다른 값은 모두 공백이 됩니다.


자, 이렇게 그리고보니까 이 파란색으로 x표 쳐진 격자점 하나하나를 '셀 수 있게' 되었네요?

일단 0을 첫번째로 세고, (1,1)을 두번째로 세고, (-1,1)을 세번째로 세고, (2, 1)을 네번째로 세고.....

결국 자연수와 1:1 대응을 시킬 수 있습니다.

결론: 유리수와 자연수의 '무한'도 같은 크기다!


여기서 중간 정리 하자면, 무한의 크기는 자연수=정수=유리수 입니다.

 

 

4. 실수가 더 클까요, 자연수가 더 클까요?


이제 정말 흥미로운 질문입니다. 유리수와 무리수를 모두 포함하는 '빽빽한' 수의 집합인 실수와 자연수를 비교해 보겠습니다. 지금까지의 결과처럼 이번에도 두 집합의 크기가 같을까요?

결론부터 말하자면, 실수가 자연수보다 훨씬 더 큰 무한입니다.

어떻게 이럴수가 있죠!?

수학자 칸토어는 '대각선 논법'이라는 기발한 방법으로 이를 증명했습니다.

간단히 설명하자면, 모든 실수를 목록으로 만들어 자연수와 일대일로 짝을 지었다고 '가정'해 봅시다.

그리고 그 목록에 존재하지 않는 새로운 실수를 하나 만들어내는 것입니다.(그러면 가정이 무너지겠죠!?)


자세히 살펴볼까요?

  1. 일단, 지금까지 모든 집합은 자연수와 크기가 같았으니 일단 실수도 자연수와 크기가 같다고 가정합니다.
  2. 그렇다면 모든 실수는 자연수와 1:1 대응일 것입니다.(크기가 같다 = 1:1 대응이다)
  3. 이는 (0, 1)사이에서도 무조건 성립해야겠죠?(모든 수를 셀 수 있으니까 0에서 1사이에 모든 수도 셀 수 있어야 할 것입니다)
    그렇다면 그 리스트는 다음과 같겠죠?
    $ \begin{vmatrix}
    1: && 0.\textcolor{blue}{a_{11}}a_{12}a_{13} \dots \\
    2: && 0.a_{21}\textcolor{blue}{a_{22}}a_{23} \dots \\
    3: && 0.a_{31}a_{32}\textcolor{blue}{a_{33}} \dots \\
    \vdots && \vdots
    \end{vmatrix} $
  4. 이제 우리는 여기서 '네가 세지 못한 수가 존재한다!'는 것을 보여줄 것입니다. 그리고 이걸 보여주는 순간 원래 가정이 무너지면서 '셀 수 없음'이 반대로 증명되는거죠.(이걸 귀류법이라고 한답니다)
  5. 일단 '이 안에 있는 수와 다르다(=리스트에 없는 수다)'는 것을 보여주기위해 각 순서의 소수점 이하 자리를 취하겠습니다.
    뭔 말인고 하니, 이제 우리는 새로운 수를 이렇게 만들 겁니다(이렇게 대각선으로 수를 모아서 만든다고 '대각선 논증'입니다.)
    $ 0.\textcolor{blue}{a_{11}a_{22}a_{33}} \dots $
    그리고 이 수를 변형하겠습니다.

    10진수체계로 보면, $ a $가 1이면 2로 바꾸고, 1이 아니면 1로 바꿉니다.
    2진수체계라면, $ a $를 그냥 바로 보수취해줍니다. 1은 0으로, 0은 1로.
    요지는 원래숫자를 다른 숫자로 바꿔주는 겁니다.

자, 이제 모든게 다 끝났습니다.

만약 이 수($0.a_1a_2a_3\dots$)들의 집합이 셀 수 있다면, 변형한 이 수도 그동안 셌던 수 안에 있어야 합니다.
그러나 이 변형한 수가 그동안 셌던 수 안에 없다면..? 이 수는 셀 수 있다는 가정이 무너져 버리면서 '셀 수 없다'가 되어버립니다.

결과를 까 볼까요?

결과적으로 만들어진 이 수는 지금까지 셌던 모든 수와 n번째 자리가 달라서 그 어느 수와도 같아질 수가 없습니다. 즉, 목록에 존재하지 않는 새로운 실수가 하나 만들어 진거죠!

이 방법으로 목록에 있는 어떤 실수와도 다른 새로운 실수를 끝없이 만들어 낼 수 있음을 보였습니다. 이는 애초에 실수 전체를 자연수와 일대일로 짝짓는 것이 불가능하다는 것을 의미합니다.

결론: 모든 실수를 셀 수 있다고 가정하여 하나의 수 목록을 만들었다고 가정하면, 대각선 논법을 통해 만들어진 새로운 수는 우리가 가정한 목록에 존재하지 않는 수 이므로, 가정이 거짓으로 증명된다.(귀류법) 따라서 실수는 셀 수 없으며, 자연수보다 '한 단계 더 높은' 크기의 무한이다!

 

 

5. 가산무한, 알레프 제로($ \aleph_0 $)


수학자들은 자연수처럼 하나하나 셀 수 있는 무한을 '가산무한(countable infinity)'이라고 부릅니다. 그리고 이 가산무한의 크기를 나타내는 기호로 히브리 문자 첫 글자인 '알레프(ℵ)'에 0을 붙여 알레프 제로($ \aleph_0 $)라고 이름 붙였습니다.

지금까지 살펴본 것처럼, 자연수, 짝수, 정수, 그리고 심지어 분수로 표현 가능한 유리수까지 모두 알레프 제로($ \aleph_0 $)라는 같은 크기의 무한에 속합니다.

 

 

6. 그렇다면 실수는?


자연수와 짝을 지을 수 없었던 실수의 무한은 알레프 제로($ \aleph_0 $)보다 더 큰 무한입니다.
이를 '비가산무한(uncountable infinity)'이라고 부르며, 그 크기는 $ 2^{\aleph_0} $입니다.

더 자세히 알고 싶으시다면... 아래 더 보기를 눌러주세요. 그러나 그냥 '실수는 자연수보다 큰 무한집한이네~'하고 넘어가셔도 무방합니다.

더보기

더 보기를 클릭하신 용자분. 환영합니다.

 

이제 좀 더 자세히 알아보도록 하죠.

 

일단, 아까 위에서 대각선 논법에서 살펴봤듯이 이미 0에서 1사이의 수 만으로도 가산무한이 깨지는 것을 보셨을 겁니다.

즉, 이말은 0과 1사이에서 모든 논지를 전개시켜도 무방하다는 의미가 됩니다.

 

그렇다면 [0, 1]구간에서 모든 실수를 2진수로 변환시켜봅시다.

소수점이하가 전부 이진수로 변하면서, 무한이진소수로 표현이 되겠죠?

그리고 이 변한 이진소수는 각자 유일할 것입니다.(물론 0.1 = 0.011111... 같은 '한가지 수를 나타내는 두가지 표현'이 나올 수 있습니다. 그러나 이런 '주소가 두 개인' 숫자들은 전체 실수의 개수에 비하면 무시할 수 있을 만큼 적어서 괜찮습니다.)

 

자, 이제 두가지 방법으로 실수의 크기를 찾아 볼 건데요, 첫번째는 아주 쉽게 직관적으로 이해해보기, 두번째는 집합론적으로 따라가며 이해해보기 입니다.

 

 

1. 매우 쉽게 생각하기(중복순열)

네, 여기서 수학적 엄밀함을 일단 약간은 내려놓고, 쉽게 생각해봅시다.(엄밀함을 내려놓는다고, 틀린말을 하는 건 아닙니다. 개념적 지름길? 같은 느낌이죠)

일단 소수점 이하 자릿수에 들어갈 수 있는 수는 무조건 0 아니면 1입니다.

그리고 소수점 이하 N자리까지 나열한다고 생각하면,

중복순열로 $ _{2} \Pi _{N} $이겠죠?

그리고 이거는 수식으로 $ 2^{N} $입니다. 그리고 N은 무조건 자연수일 수 밖에 업죠. '소수점이하 몇 번째 자리'를 나타내기 때문에요.

 

그렇다면, 아까 자연수 N은 크기가 뭐라고 했죠? $ \aleph_0 $였죠?

그렇다면 실수의 크기는?

네, 자연스럽게 $ 2^{\aleph_0} $라고 유도됩니다.

 

집합론적으로 유도한 것이 아니고, 사실 중복순열은 '유한'에서 정의되는 개념이라 약간의 cheating이긴 합니다만, 수학에서는 오히려 직관적 개념으로 이해하는게 쉬울 때도 있습니다.

 

 

2. 집합론적으로 생각하기

[0, 1] 사이의 모든 실수는 소수점 아래로 0 또는 1이 무한히 나열되는 이진수열로 표현될 수 있다고 했죠?

  • 1/3 = -> (0, 1, 0, 1, 0, 1, ...)
  • 1/2 = -> (1, 0, 0, 0, 0, 0, ...)
  • = -> (0, 0, 1, 0, 0, 1, ...)

 

여기서 각 숫자는 '무한한 선택의 결과물'로 볼 수 있습니다.

  • 첫 번째 자리에 0을 쓸까, 1을 쓸까? (2가지 선택)
  • 두 번째 자리에 0을 쓸까, 1을 쓸까? (2가지 선택)
  • 세 번째 자리에 0을 쓸까, 1을 쓸까? (2가지 선택)
  • ...
  • 번째 자리에 0을 쓸까, 1을 쓸까? (2가지 선택)
  • 이 선택을 무한히 계속합니다.

 

이것을 집합론의 언어로 표현한 것이 바로 $ \{0,\ 1\}^\mathbb{N} $ 입니다.

  • {0, 1}: 각 자리에서 선택할 수 있는 기호의 집합 (0 또는 1)
  • $\mathbb{N}$: 자연수 집합 {1, 2, 3, ...}을 의미하며, 여기서는 '첫 번째, 두 번째, 세 번째,...'와 같이 자리의 위치를 나타냅니다.
  • $\{0,\ 1\}^\mathbb{N}$: $\mathbb{N}$의 각 원소(각 자리)에 {0, 1}의 원소(0 또는 1)를 하나씩 대응시키는 모든 가능한 함수(경우의 수)의 집합을 의미합니다. 즉, '모든 가능한 무한 이진수열의 집합'을 뜻하는 기호입니다.

그리고 집합론에서 $2^{|A|}$는 A의 멱집합(Power Set), 즉 A의 모든 부분집합들의 집합의 크기를 의미합니다. (여기서 $ |A| $표시는 집합 A의 크기를 뜻합니다)

자, 이 두가지 개념을 가지고 실수의 크기를 유도해 봅시다.

 

핵심 아이디어는 결국 두 개념 '$\{0,\ 1\}^\mathbb{N}$' 과 '자연수의 모든 부분집합'을 1:1로 연결하는 것입니다.

$ \{0,\ 1\}^\mathbb{N} $에 속하는 하나의 무한 이진수열이, 자연수의 부분집합 하나와 완벽하게 짝을 이룰 수 있다면 믿으시겠습니까?

예를 들어보죠. 어떤 이진수열 s = (1, 0, 1, 1, 0, ...) 가 있다고 합시다.

이 수열을 가지고 자연수의 부분집합을 만드는 규칙을 정하는 거예요. "n번째 숫자가 1이면, 자연수 n을 부분집합에 포함시킨다!"

  • 첫 번째 숫자(1)가 1이니까 -> 1을 포함
  • 두 번째 숫자(2)가 0이니까 -> 2는 미포함
  • 세 번째 숫자(3)가 1이니까 -> 3을 포함
  • 네 번째 숫자(4)가 1이니까 -> 4를 포함
  • 다섯 번째 숫자(5)가 0이니까 -> 5는 미포함
  • ... 이렇게 무한히 계속합니다.

결과적으로, 이진수열 s = (1, 0, 1, 1, 0, ...) 는 자연수의 부분집합 {1, 3, 4, ...} 와 정확히 짝을 이룹니다.

이 관계는 완벽한 1:1 대응입니다.

  • 어떤 무한 이진수열을 가져와도, 그에 해당하는 부분집합은 유일하게 단 하나 존재합니다.
  • 반대로, 자연수의 어떤 부분집합을 가져와도(예: {2, 5, 6}), 그에 해당하는 이진수열 (0, 1, 0, 0, 1, 1, ...)은 유일하게 단 하나 존재합니다.

따라서 $ \{0,\ 1\}^\mathbb{N} $(모든 무한 이진수열의 집합)의 개수자연수의 모든 부분집합의 개수와 정확히 같습니다.

 

자연수의 집합 $\mathbb{N}$의 크기가 $ \aleph_0 $이므로, 자연수의 모든 부분집합의 개수는 $2^{\aleph_0}$입니다. 그러므로 $ \{0,\ 1\}^\mathbb{N}$의 크기(=실수 $\mathbb{R}$의 크기} 역시 $2^{\aleph_0}$ 됩니다.

 

하나 더 나아가서, '왜 우리는 $ \{0,\ 1\}^\mathbb{N}$의 크기의 크기를 본건데 이게 왜 실수 $\mathbb{R}$의 크기와 같은데염?'이라면, $ \tan(\pi(x-\frac{1}{2})) $와 같은 함수를 통과시키면, 0과 1 사이값이 실수 전체로 확장될 수 있기 때문입니다.


이는 $ \aleph_0 $보다 명백히 더 큰 '비가산 무한'입니다. 이 크기가 $ \aleph_0 $ 바로 다음 크기의 무한인 $ \aleph_1 $과 같은지는 연속체 가설에 따라 달라지기에(연속체 가설은 ZFC 공리계에서는 독립적이다. 즉, ZFC로부터 참도, 거짓도 증명할 수 없다.) 아직 해결되지 않은 문제입니다.
이 크기는 또한 연속체의 농도($\mathfrak{c}$)와 같은 다른 기호로도 표현합니다.

 

 

7. 결론


놀랍게도 무한에도 서로 다른 등급이 존재한다는 사실!

무한이라고 다 같은 무한이 아닙니다.
어떤 무한은 셀 수 있고,
어떤 무한은 셀 수조차 없습니다.



칸토어는 바로 이걸 처음으로 엄밀하게 증명해낸 수학자입니다.

그의 손끝에서 ‘무한의 계층 구조’가 드러난 거죠.

반응형
반응형

동전을 굴리면 더 많이 굴러간다? – 동전 역설(Coin Paradox)

 

0. 들어가며

두 개의 똑같은 동전이 있습니다. 하나는 바닥에 가만히 두고, 다른 하나를 그 동전 주위에 미끄러짐 없이 착 붙여서 한 바퀴 굴려보세요. 자, 굴러간 동전은 스스로 몇 바퀴를 돌았을까요? 🤔

대부분의 사람들은 "당연히 한 바퀴지!"라고 대답할 겁니다. 굴러간 거리가 고정된 동전의 둘레와 같으니까요. 하지만 정답은 놀랍게도 두 바퀴입니다.

이해가 안 가시나요? 직접 동전을 놓고 해보면 정말 두 바퀴를 도는 것을 보고 머리가 띵해지는 경험을 할 수 있습니다.

"동전을 굴렸을 때, 실제로는 반대편 동전이 더 많이 굴러간다?"

이 직관에 반하는 현상은 바로 Coin Paradox, Coin Rotation Paradox 또는 Rolling Coin Paradox. 즉, 동전 역설이라고 합니다.
수학적으로는 간단한 곡선의 길이 계산일 뿐이지만, 물리적 직관과의 차이 때문에 많은 사람들을 혼란에 빠뜨립니다.

 

실제로 1982년 미국 SAT math에서 이것을 이용한 문제가 출제되었습니다.

SAT는 매년 약 200만명이 치르는 미국판 수능이라고 볼 수 있는데요.(뭐 수능과 다른점은 sat는 1년에 여러번 봅니다)

1982년도 전체 16회 SAT시험 중 30만명이 본 5월 시험에서 출제가 되었었죠.

맞춘 사람은 단 3명이었다고 하는데요, 그 이유는 '보기가 없었기 때문'입니다.(즉, 이 3명만 College Board에 이의제기를 신청했고, College Board는 문제를 무효화하고 결국 전체 재채점했다고 하네요..)

결국 문제를 냈던 사람조차도 틀렸다는건데.. 일단 문제를 한번 보시죠.

문제는 다음과 같습니다: 원 A는 원 B 반지름의 1/3이다. 원 A가 원 B를 따라 한 바퀴를 돌아 원점으로 왔을 때 원 A는 몇바퀴 돌았는가?

출제자를 포함하여 모든 사람들은 그냥 '원 B의 반지름보다 원 A가 1/3배 작으니까, 세번 돌았겠지?'하고 (B)를 골랐으나...


오늘은 이 신기한 역설을 직접 계산과 함께 낱낱이 파헤쳐 보겠습니다.

 

 

1. 상황 설정 – 두 동전의 만남

실험 설정:

반지름이 같은 두 개의 동전 A, B가 있다고 합시다.
동전 A는 정지해 있고, 동전 B는 동전 A의 외곽에 맞닿은 채로 한 바퀴를 굴러갑니다.
마찰이 충분해 미끄러짐 없이 굴러간다고 가정합니다.

질문:
동전 B가 한 바퀴 굴러가면, 몇 도 회전했을까요?

 

 

2. 직관의 오류 – "한 바퀴니까 360도?" ❌


많은 사람들은 이렇게 생각합니다:

"동전 B가 동전 A의 바깥둘레를 따라 한 바퀴 돌았으니, 360도 회전했겠지!"

하지만 실제 실험을 해보면, 동전 B는 720도, 즉 두 바퀴를 돌게 됩니다.

이것이 바로 Coin Paradox입니다.


 

3. 왜 2바퀴가 되는가? – 시각적 직관


다음과 같은 비유를 생각해보면 이해가 쉽습니다:

동전 B가 단순히 바닥을 따라 굴러간다면 1바퀴 회전합니다.
그러나 원형 경로를 따라 회전하면 자신의 회전 중심 또한 회전하게 되므로 추가적인 회전이 더해집니다.

좀 더 자세히 말해서
1. 동전 자체의 중심을 기준으로 한 '자전(Rotation)'
이것은 우리가 직관적으로 생각하는 회전입니다. 굴러가는 동전은 고정된 동전의 둘레(2
pir)만큼의 거리를 이동합니다. 굴러가는 동전의 둘레도 똑같이 2
pir이므로, 이 거리만큼 굴러가면서 스스로의 중심에 대해 정확히 한 바퀴를 돕니다. 여기까지는 모두가 동의하는 부분입니다.

2. 고정된 동전의 중심을 기준으로 한 '공전(Revolution)'
이것이 바로 우리가 놓치기 쉬운 '숨겨진 한 바퀴'입니다. 굴러가는 동전의 '중심점' 자체도 고정된 동전의 중심점을 기준으로 원을 그리며 움직입니다. 즉, 동전이 스스로 도는 것과 별개로, 동전 자체가 거대한 원궤도를 따라 공전하는 셈이죠.

이해가 어렵다면, 동전을 전혀 굴리지 않고 그냥 옆면이 미끄러지게만 하면서 한 바퀴 돌려보세요. 연필을 잡고 옆면이 항상 같은 방향을 보게 하면서 캔 주위를 한 바퀴 돌리는 것과 같습니다. 출발점으로 돌아왔을 때, 동전은 어느새 한 바퀴를 돌아 처음과 같은 방향을 보고 있을 겁니다. 이 움직임이 바로 공전으로 인한 한 바퀴입니다.

이 현상은 지구가 자전과 공전을 동시에 하는 구조와도 유사합니다.
지구는 1년 동안 태양을 한 바퀴 공전하면서,
자신은 365.25회 자전합니다.

결론: 자전 + 공전 = 두 바퀴
결국, 우리가 관찰하는 동전의 총회전수는 이 두 가지 움직임의 합입니다.

총회전수 = 자전(1바퀴) + 공전(1바퀴) = 2바퀴

즉, 굴러가면서 스스로 한 바퀴를 돌고(자전), 그와 동시에 다른 동전 주위를 돌면서 위치가 변해 저절로 한 바퀴가 추가된(공전) 것입니다.

 

다시 말해, 동전 B가 굴러가는 거리는 동전 A의 원주 만큼입니다. 따라서 동전 A를 펴서 직선으로 만들면 동전 B는 딱 한바퀴만 회전 할 것이나, 동전 A가 원이니까 동전 B가 A를 따라 한번 더 도는 효과가 생기는 것이죠!(결론적으로는 한바퀴 더 도는것이나, 매 순간 이 '공전하는 양'만큼이 동전 B의 회전에 추가되기 때문에, 실제 회전하는 모습은 더 신기한 상황이죠!)

 

그리고 SAT문제도 따라서 3바퀴가 아닌, 4바퀴가 됩니다.

이렇게 보면 이해가 쉬우시겠죠?

 

 

4. 수학으로 증명하기: 왜 '플러스 1'이 생길까?

직관적인 설명을 넘어, 수학을 통해 이 현상을 명확히 증명해 보겠습니다. 두 가지 접근법이 있습니다.

 

접근법 1: 자전 + 공전 모델

3번에서 설명한 개념을 수식으로 옮겨보겠습니다.

 

1] 반지름이 같은 경우

원주 길이 계산:
동전 A의 반지름: $ r $

따라서 원주: $ 2 \pi r $

동전 B는 동전 A의 원주를 따라 굴러가야 하므로, 굴러간 거리도 $ 2 \pi r $ 입니다.

그런데 이때 중요한 점은, 이 굴러간 거리만큼 접선 방향으로 회전하게 되는 것 외에, 곡선을 따라가면서 생기는 추가 회전 효과도 있다는 점입니다.

진짜 회전 각도는?
동전 B가 굴러간 선형 거리는 
$ 2 \pi r $

동전 B 하나의 자체 원주 길이도 
$ 2 \pi r $

그렇다면 미끄러짐 없이 굴렀을 경우, 동전 B는 총 몇 바퀴 돌았을까요?

$ \frac{굴러간 거리}{자기 원주} = \frac{2 \pi r}{2 \pi r} = 1바퀴 $

이게 끝이 아닙니다.
동전 B는 곡선을 따라 회전하면서 자기 자신의 위치도 회전하기 때문에, 추가적으로 1바퀴 더 회전하게 됩니다.

총 회전 각도:
총 회전 = 1(접선 방향 굴림(자전량))+1(곡선 회전(공전량)) = 2바퀴 = 720°

 

2] 반지름이 다른 경우


동전 B가 동전 A보다 더 작거나 클 경우에도, 유사한 계산이 가능합니다.

예를 들어, 동전 A의 반지름이 $ r_a $, 동전 B의 반지름이 $ r_b $라면,


굴러간 거리: $ 2 \pi r_a $ (고정된 동전의 원주)

자기 원주: $ 2 \pi r_b $ (굴러가는 동전의 원주)


회전 수 $ \frac{2\pi r_a}{2\pi r_b} +1 = \frac{r_a}{r_b} +1 $

즉, 동전 B는 $ \frac{r_a}{r_b}(자전량) +1(공전량) $ 바퀴 회전합니다.

 

접근법 2: '중심의 이동 경로'로 한 번에 증명하기 (가장 확실한 방법)


여기까지 따라오셨어도 "움직이는 동전 B는 결국 $ 2 \pi r_b $ 만큼 움직이는데! 이러면 한바퀴지!"라고 하실 수 있습니다.
그렇다면 '동전 B의 중심'이 이동하는 거리를 따져보는 것도 의미가 있겠습니다.
결국 동전 B의 중심이 이동하는 거리를 동전 B의 원주로 나눈 것이 엄밀한 의미에서의 '동전 B의 회전수'일테니까요!
동전 B의 중심이 이동한 거리는 동전 A의 중심에서 동전 B의 중심까지가 반지름인 원의 둘레의 길이와 같습니다.
즉, 동전 A의 반지름을 $ r_a $, 동전 B의 반지름을 $ r_b $라고한다면

  1. 고정된 동전 A의 중심에서 굴러가는 동전 B의 중심까지의 거리는 항상 $ r_a+r_b $ 입니다.
  2. 동전 B의 중심은 이 거리()를 반지름으로 하는 거대한 원을 그리며 한 바퀴 돕니다.
  3. 따라서 동전 B의 중심이 움직인 총거리는 이 거대한 원의 둘레인 $ 2 \pi (r_a+r_b) $ 입니다.

동전 B의 총회전수는 '중심이 이동한 거리'를 '자기 자신의 둘레'로 나눈 값이므로,
$ \frac{2 \pi (r_a+r_b)}{2 \pi r_b} $
이걸 다시 계산하면
$ \frac{r_a}{r_b} +1 $
이 되고, 이것은 바로 지금까지 우리가 고찰해왔던 결과와 일치합니다.

이처럼, '중심의 경로'라는 하나의 기준으로 계산하니 '공전'에 해당하는 +1이 수식에서 저절로 나타납니다. 이로써 논쟁은 완벽하게 마무리됩니다.

 

 

5. 결론 – 회전의 패러독스


Coin Paradox는 단순한 거리 계산이 아니라, 곡선 경로에서의 회전 중심 변화까지 고려해야 이해할 수 있는 현상입니다.

이는 물리학, 미분기하학, 동역학 시스템 등 여러 분야에서 응용되며, 직관과 실제 결과가 충돌할 때 수학이 왜 중요한지를 잘 보여주는 사례입니다.

이 간단한 역설은 우리에게 고정관념을 깨고, 현상을 여러 관점에서 분석하는 것의 중요성을 알려줍니다. 단순한 머리싸움 퀴즈를 넘어, 물리학의 자전과 공전, 기준 좌표계의 개념을 직관적으로 이해할 수 있는 훌륭한 예시랍니다.

반응형
반응형

사이클로이드(Cycloid) 회전체의 표면적(겉넓이) 구하기(회전체적분, 겉넓이적분)

 

사이클로이드(Cycloid) 시리즈 목차

 

 

0. 서론

자 오늘은 대망의 마지막시간!

사이클로이드의 선 길이, 넓이, 회전체 부피까지 알아봤으면 그다음은 무엇? 바로바로 표면적이다~

그럼 바로 알아보도록하죠~

 

 

1. 어떻게 구할건데?

표면적은 원기둥의 옆 넓이에서 힌트를 얻어보면 되는데, 원기둥의 옆 넓이는 원기둥의 원주길이($ 2 \pi r $)에다가 높이를 곱한 것이잖아요?

그러면 이걸 그래프로 가져와보면~

저번에 구하면서 생각해 봤듯이 이 회전체는 아주 얇은 원판으로 이루어져 있을테니 이 원판의 옆넓이를 구해보면 되겠슴다.

원판의 옆 넓이는 위에서 봤듯이 원주길이에 높이를 곱한것인데, 적분을 하려면 여기서 일반적인 높이 대신 미소높이(아주아주 작은 높이)를 곱해주면 되겠죠?

자 회전체에서 원판의 반지름은 바로 $ y $죠, 그리고 높이는? 전에 선 길이를 적분할때처럼 아주 미소한 변화량만큼의 곡선길이 일겁니다.($ \sqrt{dx^2 + dy^2} $)

그리고 이거를 매개변수 $ t $에 대해서 0부터 $ 2 \pi $까지 싹 모으면 짜잔, 옆넓이 즉 표면적이 나오겠군요!

 

2. 구해보자

즉, $ r = y, \ y = r(1 - \cos t), \ dh = \sqrt{dx^2 + dy^2}  $ 여기서 dh는 미소 높이를 의미합니다.

식으로 써보면

$ S = \int_0^{2\pi} 2\pi y \ dh $

$ S = 2 \pi \int_0^{2 \pi} y * \sqrt{(\frac{dx}{dt})^2 + (\frac{dy}{dt})^2} \ dt $

$ S = 2 \pi r \int_0^{2 \pi} (1 - \cos t) * \sqrt{(\frac{dx}{dt})^2 + (\frac{dy}{dt})^2} dt $

이렇게 매개변수 식이 최종적으로 정리가 되겠습니다.

 

여기서, $ \frac{dx}{dt}=r(1 - \cos t,) \ \frac{dy}{dt} = r\sin t $ 니까

$ S = 2 \pi r \int_0^{2 \pi} (1 - \cos t) * r\sqrt{(1 - \cos t)^2 + (\sin t)^2} dt $

$ S = 2 \pi r^2 \int_0^{2 \pi} (1 - \cos t) * \sqrt{(1 - \cos t)^2 + (\sin t)^2} dt $

 

$ (1 - \cos t)^2 $ 풀어주고,

$ S = 2 \pi r^2 \int_0^{2 \pi} (1 - \cos t) * \sqrt{1 - 2\cos t + (\cos t)^2 + (\sin t)^2} dt $

$ (\cos t)^2 + (\sin t)^2 = 1 $이니까

$ S = 2 \pi r^2 \int_0^{2 \pi} (1 - \cos t) * \sqrt{1 - 2\cos t + 1} dt $

$ S = 2 \pi r^2 \int_0^{2 \pi} (1 - \cos t) * \sqrt{2 - 2\cos t} dt $

$ S = 2 \pi r^2 \int_0^{2 \pi} (1 - \cos t) * \sqrt{2(1 - \cos t)} dt $

$ S = 2 \pi r^2 \int_0^{2 \pi} (1 - \cos t) * \sqrt{2(2\sin^2 \frac{t}{2})} dt \quad \leftarrow \cos (\frac{t}{2}+\frac{t}{2}) = \cos^2 \frac{t}{2} + \sin^2 \frac{t}{2} = 1 - 2\sin^2 \frac{t}{2} = 2\cos^2 \frac{t}{2} -1 $

$ S = 4 \pi r^2 \int_0^{2 \pi} (1 - \cos t) * \sqrt{\sin^2 \frac{t}{2}} dt $

원래 $ \sqrt{A^2} = |A| $지만, 적분 구간 $ t \in [0, 2\pi] $에서 $ \frac{t}{2} $의 범위는 $ [0, \pi] $가 되고, 이 범위에서 $ \sin \frac{t}{2} \ge 0$ 이므로 절댓값 없이 정리가 가능합니다.

$ S = 4 \pi r^2 \int_0^{2 \pi} (1 - \cos t) * \sin \frac{t}{2} dt $

 

아까와 마찬가지로 $ \cos t = 1 - 2\sin^2 \frac{t}{2} $로 바꿔주면,

$ S = 4 \pi r^2 \int_0^{2 \pi} 2 \sin^2 \frac{t}{2} * \sin \frac{t}{2} dt $

$ S = 8 \pi r^2 \int_0^{2 \pi} \sin^2 \frac{t}{2} * \sin \frac{t}{2} dt $

$ S = 8 \pi r^2 \int_0^{2 \pi} \sin^3 \frac{t}{2} dt $

이렇게 간단하게 정리가 됩니다.

그런데, 저번에도 말씀드렸다시피 삼각함수의 세제곱은 바로 적분으로 풀 수가 없으니 찢어줍시다.

 

$ S = 8 \pi r^2 \int_0^{2 \pi} \sin^2 \frac{t}{2} * \sin \frac{t}{2} dt $

삼각함수 항등식에서 $ (\cos t)^2 + (\sin t)^2 = 1 $이니까 $ (\cos \frac{t}{2})^2 + (\sin \frac{t}{2})^2 = 1 $이겠죠?

$ S = 8 \pi r^2 \int_0^{2 \pi} (1 - \cos^2 \frac{t}{2}) * \sin \frac{t}{2} dt \quad \leftarrow \cos \frac{t}{2} = u, -\frac{1}{2} \sin \frac{t}{2} dt = du \Leftrightarrow \sin \frac{t}{2} dt = -2du $

그리고나서 치환해줍니다.

$ S = 8 \pi r^2 \int (1 - u^2) * (-2) du $

이제 엄청 쉽게 풀릴 일만 남은 것 같죠?

아, 저번처럼 치환했다가 다시 돌아올거라 아래끝 위끝은 치환값으로 계산 안합니다.

치환 하고 적분한 다음 다시 원래대로 안돌리고 그 상태에서 값을 구하기위해 하는게 사실상 아래끝 위끝 값을 치환값으로 바꿔주는건데, 저희는 그냥 적분 후 다시 삼각함수로 돌리겠습니다.(즉, 아래끝 위끝 치환값은 계산 안하고 진행)

 

$ S = -16 \pi r^2 \int (1 - u^2) du $

$ S = -16 \pi r^2 (\int 1 du - \int u^2 du) $

$ S = -16 \pi r^2 (u - \frac{1}{3}u^3) $

$ S = -16 \pi r^2 (\cos \frac{t}{2}]_0^{2 \pi} - \frac{1}{3}(\cos \frac{t}{2})^3]_0^{2 \pi}) \quad \leftarrow \cos \frac{t}{2} = u $

보시다시피, 치환값을 다시 원래대로 돌립니다. 적분구간은 그대로겠죠?

 

$ S = -16 \pi r^2 ((-1 - 1) - \frac{1}{3}(-1 - 1)) $

$ S = -16 \pi r^2 (-2 + \frac{2}{3}) $

$ S = -16 \pi r^2 (-\frac{6}{3} + \frac{2}{3}) $

$ S = -16 \pi r^2 * -\frac{4}{3} $

$ S = \frac{64}{3} \pi r^2 $

 

3. 결론

따라서, 사이클로이드의 회전체의 표면적(겉넓이)는 $ \frac{64}{3} \pi r^2 $ 이라는 것이 밝혀졌습니다!

반응형
반응형

사이클로이드(Cycloid)의 부피 구하기(회전체적분, 부피적분)

 

사이클로이드(Cycloid) 시리즈 목차

 

 

0. 서론

우리는 앞서 사이클로이드의 호의 길이(사이클로이드(Cycloid)의 길이 구하기(선적분))면적(사이클로이드의 면적구하기(면적분))을 구해보았습니다.

이번엔 세번째 시간으로 사이클로이드의 부피에 대해서 알아봅시다!

 

 

1. 부피?

사이클로이드는 2차원 평면에 있는데 왠 부피?라고 하신다면, 적분에는 항상 따라붙는 세가지가 선적분! 면적분! 회천체적분! 입니다.

즉, 2차원 평면에 있는 '면'을 x축 주위로 회전시키면 3차원 입체가 만들어지고, 그 부피를 적분으로 구할 수 있는거죠!

그리고 지금 우리는 이 사이클로이드를 x축을 기준으로 한바퀴 돌려서 소위 '럭비공'과 같은 모양으로 만들 예정입니다.

요렇게 생긴 곡선을

x축 기준으로 요렇게 회전시키는거죠.

대략 3D로 보면 이런 느낌이겠죠?

 

 

2. 회전체의 부피 공식 설정

자, 일단 '회전'하면 그 단면은 항상 '원'이 되겠죠?

그럼 적분의 모토와도 같이, 면을 쫘좌좌좍 모아가면 부피가 되겠네요!(뭐, 엄밀히는 면*미소높이 하여 아주 작은 원통들을 모아가는 거겠지만요..)

일단 원의 넓이는 $ \pi r^2 $으로 정의됩니다. 여기서 $ r $은 반지름이죠.

우리는 현재, x축을 기준으로 한바퀴 돌려서 만들었으니, 반지름은 바로 이 곡선의 높이가 될 겁니다.

이전 포스팅에서 확인하실 수 있듯이 현재 이 곡선의 높이 y는 $ y = r(1-\cos t)$ 이렇게 정의 되어 있으므로,

회전체의 단면의 원의 넓이는 $ \pi r^2 = \pi (r(1-\cos t))^2$이 되겠네요.

그리고 여기서 아주 작은 미소부피(dV)를 구하기위해 원 넓이에다가 아주 미소한 높이를 곱해줘야 하겠습니다.

현재 회전체의 부피를 x축을 따라가며 구하고 있으므로 이 원통(원기둥)의 높이는 바로 $ dx $가 되겠네요.

즉, $ dV = \pi (r(1-\cos t))^2 dx $ 되겠습니다.

그리고 이 미소부피들을 싹 다 적분하면, 회전체의 부피가 나오겠죠?

즉, $ \int dV = \int \pi (r(1-\cos t))^2 dx $입니다.

그러나 여기서 본식은 매개변수 표현인데 바로 $ dx $를 써서 계산이 불가능 하기때문에, 과거 포스팅에서 정리했던 내용들을 다시 상기해보면, $ dx = r(1-\cos t)dt $입니다.

적분을 위한 준비는 끝났습니다. 다시한번 정리해보죠.

 

적분의 아래끝은 0 위끝은 $ 2 \pi $, $ y = r(1-\cos t)$, $ dx = r(1-\cos t)dt $

 

이제 이걸 이용해서 수식으로 정리해주면,

$ V = \int_0^{2 \pi} dV = \pi \int_0^{2 \pi} (r(1-\cos t))^2 r(1-\cos t) dt $

이렇게 정리가 되겠습니다.

수식은 다 세워졌네요. 이제 정리하며 풀기만하면 끝입니다.

 

 

3. 적분 계산

$ \pi \int_0^{2 \pi} (r(1-\cos t))^2 r(1-\cos t) dt $

이 수식을 다시 깔끔하게 정리하면

$ \pi r^3 \int_0^{2 \pi} (1-\cos t)^3 dt $

요렇게 세제곱 형식으로 묶을 수 있을겁니다.

그리고 세제곱을 다시 풀어주면

$ \pi r^3 \int_0^{2 \pi} (1-3\cos t+3\cos^2 t-\cos^3 t) dt $

이렇게 풀 수 있고,

삼각항수 항등식에서 $ \cos^2 t = \frac{1 + \cos 2t}{2} $ 이므로

$ \pi r^3 \int_0^{2 \pi} (1-3\cos t+\frac{3}{2}(\cos 2t+1)-\cos^3 t) dt $

$ \pi r^3 \int_0^{2 \pi} (\frac{5}{2}-3\cos t+\frac{3}{2}\cos 2t-\cos^3 t) dt $

이렇게 정리가 되겠군요.

이제 적분은 선형결합에 대해 분배될 수 있으므로,

$ \pi r^3 \left( \int_0^{2 \pi} \frac{5}{2} \ dt-3\int_0^{2 \pi} \cos t \ dt+\frac{3}{2}\int_0^{2 \pi}\cos 2t \ dt-\int_0^{2 \pi} \cos^3 t \ dt \right) $

여기서, $ \cos^3 t $는 직접적으로 적분할 수가 없으니, 찢어줍시다.

$ \pi r^3 \left( \frac{5}{2} \int_0^{2 \pi} dt-3\int_0^{2 \pi} \cos t \ dt+\frac{3}{2}\int_0^{2 \pi}\cos 2t \ dt-\int_0^{2 \pi} \cos^2 t \cdot \cos t \ dt \right) $

이러면 약간의 빛이 보입니다. 삼각항수 항등식 $ \cos^2 t + \sin^2 t = 1 \Leftrightarrow \cos^2 t = 1-\sin^2 t $을 쓰면

$ \pi r^3 \left( \frac{5}{2} \int_0^{2 \pi} dt-3\int_0^{2 \pi} \cos t \ dt+\frac{3}{2}\int_0^{2 \pi}\cos 2t \ dt-\int_0^{2 \pi} (1-\sin^2 t) \cdot \cos t \ dt \right) $

그리고 $ \sin t $를 $ u $로 치환하면, 사실 치환한 아래끝 위끝이 모두 값이 0이 되면서 적분결과가 0이 되어버리지만 조금 더 수학적 재미를 위해 끝을 임의로 놓고 계산진행해보겠습니다.(구조를 보기 위해 양 끝에 임의기호 @, * 사용)

$ \pi r^3 \left( \frac{5}{2} \int_0^{2 \pi} dt-3\int_0^{2 \pi} \cos t \ dt+\frac{3}{2}\int_0^{2 \pi}\cos 2t \ dt-\int_{@}^{*} (1-u^2) du \right) \leftarrow u = \sin t,\ du = \cos t dt $

$ \pi r^3 \left( \frac{5}{2} \int_0^{2 \pi} dt-3\int_0^{2 \pi} \cos t \ dt+\frac{3}{2}\int_0^{2 \pi}\cos 2t \ dt-(\int_{@}^{*} du - \int_{@}^{*} u^2 du) \right) $

$ \pi r^3 \left( \frac{5}{2} \int_0^{2 \pi} dt-3\int_0^{2 \pi} \cos t \ dt+\frac{3}{2}\int_0^{2 \pi}\cos 2t \ dt-(u\vert_{@}^{*} - \frac{1}{3} u^3\vert_{@}^{*}) \right) $

$ \pi r^3 \left( \frac{5}{2} \int_0^{2 \pi} dt-3\int_0^{2 \pi} \cos t \ dt+\frac{3}{2}\int_0^{2 \pi}\cos 2t \ dt- \left( \sin t \vert_0^{2\pi} - \frac{1}{3} \sin^3 t \vert_0^{2\pi} \right) \right) \leftarrow u = \sin t $ (+치환에서 다시 돌아왔으니 적분구간 다시 전과 같은 구간으로 살려주기)

여기서 바로 $ \sin t $에 값 대입하면 0 나오지만, 그냥 수식 그대로 끌고가 볼께요. 이제 다 적분해줍니다.

$ \pi r^3 \left( \frac{5}{2} t \vert_0^{2 \pi} -3 \sin t \vert_0^{2 \pi}+\frac{3}{4}\sin 2t\vert_0^{2 \pi} \ dt- \sin t \vert_0^{2\pi} + \frac{1}{3} \sin^3 t \vert_0^{2\pi} \right) $

적분 풀면

$ \pi r^3 \left( \frac{5}{2} \cdot 2\pi-0+0-0+0 \right) $

즉, 살아 남은 항은 첫번째 항 뿐이므로

$ 5 \pi^2 r^3 $

이 됩니다.

사실 모든게 0으로 정리되는 걸 보여드리고 싶어 이렇게 진행했는데, 사실... 0에서 $ 2\pi $까지 $ \cos $함수의 홀수승 적분은 전부 0이라서

$ \pi r^3 \left( \int_0^{2 \pi} \frac{5}{2} \ dt-3\int_0^{2 \pi} \cos t \ dt+\frac{3}{2}\int_0^{2 \pi}\cos 2t \ dt-\int_0^{2 \pi} \cos^3 t \ dt \right) $

이렇게 정리된 순간 $ \cos $적분은 전부 사라지니 사실상 이 단계에서 계산이 끝난거나 다름없긴 합니다...

 

 

4. 결론

사이클로이드 회전체의 부피 $ V $ 는 $ 5 \pi^2 r^3 $입니다.

반응형
반응형

연산의 정의부터 군, 환, 체까지 – 닫힘성에서 시작하는 대수 구조의 세계

 

0. 들어가며

우리는 고등학교 수학 시간에 처음으로 연산이라는 개념을 접합니다.

특히 "자연수끼리 더하면 자연수다" 또는 "자연수끼리 나누면 자연수가 아니다"라는 식으로 연산에서 '닫혀 있다', '열려 있다'는 개념을 처음 접했던 기억이 있을 것입니다.(고등학교 수학시간에 너무 뜬금없이 나왔던 그거 말입니다..)

이렇게 연산의 성질을 분석하는 과정은 고등학교, 대학교를 지나면서 더 정교해지고 추상화됩니다.

결국 하나의 연산 혹은 여러 연산이 어떤 성질을 만족하는지를 기준으로, 군(group), 환(ring), 체(field) 같은 수학적 구조로 발전하게 됩니다.

 

 

1. 연산이란?

연산(operation)이란, 어떤 집합에 정의된 규칙으로서, 집합의 원소들을 입력받아 결과를 내는 함수입니다.

  • 단항 연산: 원소 1개 → 예: 음수, 제곱근
  • 이항 연산: 원소 2개 → 예: 덧셈, 곱셈

가장 흔한 이항 연산의 예는 다음과 같습니다:

  • 정수의 덧셈: ∀a,b∈ℤ, a + b ∈ ℤ → 닫혀 있음 (여기서 ∀는 '모든' 이라는 뜻이고, ∈는 속한다는 뜻입니다)
  • 자연수의 뺄셈: 3 - 5 = -2 ∉ ℕ → 닫혀 있지 않음

 

 

2. 연산의 성질

이항 연산에 대해 주요하게 다루는 성질은 다음과 같습니다:

  • 닫힘성: 결과가 다시 같은 집합에 속함
  • 결합법칙: (a * b) * c = a * (b * c)
  • 항등원: a * e = a = e * a
  • 역원: a * a⁻¹ = e
  • 교환법칙: a * b = b * a

 

 

3. 주요 대수적 구조 비교표

구조 결합법칙 항등원 역원 가환성 분배법칙 설명 / 예시
마그마
(Magma)
임의의 이항연산만 있는 집합
예: (S, *)
반군
(Semigroup)
결합법칙 만족
예: (ℕ, +)
모노이드
(Monoid)
항등원 존재
예: (ℕ, +, 0)

(Group)
모든 원소가 역원 가짐
예: (ℤ, +)
아벨군
(Abelian Group)
가환군
예: (ℝ, +)
준군
(Quasigroup)
항등원 없이도 양쪽 해 존재
예: 라틴방진 구조
루프
(Loop)
항등원 + 준군
예: 옥타니온

(Ring)
✅ (덧셈)
❌ (곱셈)
✅ (덧셈)
❌ (곱셈)
✅ (덧셈)
❌ (곱셈)
두 연산 +, × 보유
덧셈은 아벨군
곱셈은 결합 + 분배 법칙 만족
곱셈 항등원은 필수가 아님(전통적)
곱셈 항등원 없는 환을 rng로 정의(현대적)

예: (ℤ, +, ×), (2ℤ, +, ×)
가환환
(Commutative
  Ring)
✅ (덧셈)
❌ (곱셈)
✅ (덧셈)
❌ (곱셈)
환 + 곱셈 가환성
곱셈 항등원은 선택적
예: (ℝ[x], +, ×)
단환
(Ring with Unity)
✅ (덧셈)
❌ (곱셈)
✅ (덧셈)
❌ (곱셈)
일반적인 환에
곱셈 항등원(1) 포함
예: (ℤ, +, ×), (ℚ[x], +, ×)
정역
(Integral Domain)
✅ (덧셈)
❌ (곱셈)
가환 단환
+ 제로인멸성
예: (ℤ, +, ×)
디비전링
(Division Ring)
✅ (덧셈)
✅ (곱셈: 0 제외)
✅ (덧셈)
❌ (곱셈)
모든 0이 아닌 원소가 곱셈 역원을 가짐
곱셈은 가환이 아님
예: 쿼터니언 ℍ

(Field)
✅ (덧셈)
✅ (곱셈: 0제외)
정역 + 곱셈역원 존재
예: (ℚ, +, ×), (ℝ, +, ×), (𝔽ₚ)

※ 참고: 모든 곱셈 결과가 0이 되는 '제로환(zero ring)'이라는 극단적인 구조도 있으나, 보통은 정역이나 체와 같은 구조에 포함되지 않으므로 이 글에서는 생략합니다.

 

4. 예시로 보는 구조들

  • ℕ (자연수): 덧셈에 대해 닫혀 있음 → 반군
  • ℤ (정수): 덧셈에 대해 아벨군, 곱셈은 결합법칙만 → 환
  • ℚ (유리수): 덧셈과 곱셈 모두 아벨군 (0 제외) → 체
  • n × n 정방행렬: 덧셈에 대해 아벨군, 곱셈에 대해 모노이드 → 환(종합적으로)

 

 

5. 마무리

하나의 연산으로부터 시작해 여러 가지 성질을 차례로 추가하면, 대수학의 주요한 구조들이 자연스럽게 나타납니다.

마그마 → 반군 → 모노이드 → 군 → 아벨군 → 환 → 정역 → 체 순으로 점점 더 많은 조건이 요구됩니다.

 

이러한 분류는 단순히 집합과 연산의 조합이 아니라, 구조 전체가 어떤 논리적 규칙을 따르는지를 보여주는 강력한 언어입니다.

우리가 흔히 다루는 숫자나 행렬도 사실 이 구조의 일부이며, 연산의 정의와 성질을 이해함으로써 훨씬 깊이 있는 수학 공부가 가능해집니다.

 

 

6. 참고 수식

  • 연산의 닫힘성: ∀a, b ∈ S, a * b ∈ S  
  • 결합법칙: (a * b) * c = a * (b * c)  
  • 항등원: ∃e ∈ S, ∀a ∈ S, e * a = a * e = a  (∃표시는 ~가 존재할때 라는 뜻입니다)
  • 역원: ∀a ∈ S, ∃a⁻¹ ∈ S, a * a⁻¹ = e  
  • 교환법칙: ∀a, b ∈ S, a * b = b * a
반응형
반응형

모츠킨 수열(Motzkin sequence)

 

0. 서론

카탈란 수열과 비슷하지만 또 재밌는 수열이 한가지 있습니다. 바로 모츠킨 수열(Motzkin numbers)인데요

오늘은 이 모츠킨 수열을 한번 살펴보도록 하겠습니다.

카탈란 수열에 +a한 수열이므로, 사실 카탈란 수열(https://omnil.tistory.com/221)시리즈를 전부 읽고 오시는 걸 추천드립니다.

 

 

1. 모츠킨 수열이란?

조합론에서 등장하는 아름다운 수열 중 하나가 모츠킨 수열(Motzkin numbers)입니다. 이 수열은 특정한 경로를 세는 문제나 괄호 구조, 평면 그래프의 엣지 수와도 관련이 있어, 카탈란 수열과 함께 종종 등장합니다.

카탈란 수열과 마찬가지로 테오도르 모츠킨(Theodore Motzkin)이 1948년 체계화해 발표한 것을 계기로 명명된 수열입니다.

 

 

2. 정의

모츠킨 수열 $M_n$은

1) 제일 간단하게 카탈란 수열(https://omnil.tistory.com/221)의 Dyck path에서 우상향(↗), 우하향(↘) 외에 평행이동(→)이 추가된 수열입니다.

2) 다음 조건을 만족하는 경로의 수로 정의됩니다:

시작점 $(0,0)$에서 시작하여 $(n,0)$에서 끝나는 경로 중,

  1. 한 번에 $(1,1)$ (↗), $(1,0)$ (→), $(1,-1)$ (↘) 이동 가능하고
  2. 절대 음의 높이(음수 y좌표)를 가지지 않는 경로의 개수.

즉, 위로 올라가거나 수평으로 가거나 내려가되, 절대로 수평선((0,0)~(n,0)) 아래로 내려가지 않는 경로의 개수를 셉니다.

 

 

3. 예시

$ M_0 = 1, \ M_1 = 1, \ M_2 = 2, \ M_3 = 4, \ M_4 = 9, \ M_5 = 21, \ M_6 = 51, \ \cdots $

카탈란 수보다 증가속도가 느리다고 생각할수도 있지만, 사실은 경우의 수가 한가지 더 늘어나서 더 빠르게 증가합니다.

그러나 항 수로 보면 느리게 증가하게 보이는 이유는, 카탈란 수와는 다르게 조건이 홀수개 이므로 수열 자체가 $ n \rightarrow 2n $으로 정의되던 카탈란 수열과 다르게 $ n \rightarrow n $으로 정의되기 때문입니다.

실제로 짝수항만 놓고보면 카탈란 수열보다 더 빠르게 증가함을 알 수 있습니다.

 

 

4. 점화식

모츠킨 수열을 다음과 같은 점화식을 만족합니다.

$ M_0 = 1, \ M_1 = 1, \ M_n = M_{n-1} + \sum \limits _{k=0} ^{n-2} M_kM_{n-2-k} \quad \operatorname{for} \ n \ge 2$

1) 첫 시작이 수평(→)이라면, 단순히 경로가 하나 줄어든 것이므로 $ M_{n-1} $ 값을 가집니다.

2) 첫 시작이 수평(→)이 아니라면, 무조건 우상향(↗)으로 시작해야하며, 이것은 카탈란 수의 점화식과 동일한 모양을 갖습니다.

단, 카탈란 수열은 무조건 총 경로가 짝수개여야만 하므로 점화식에서 -1만 빼 주어도 1쌍(시작:우상향, 끝:우하향)이 빠지는 결과가 나오지만, 모츠킨 수열은 총 경로가 홀수개여도 되므로, 점화식에서 -2(시작:우상향, 끝:우하향)를 빼주어야 합니다.

 

 

5. 생성함수

점화식을 알고있으니, 생성함수도 구할 수 있습니다.

카탈란 수열과 비슷하게 생성함수를 구해보면

$ M(x) = \sum \limits _{n=0} ^\infty M_n x^n = \frac{1-x-\sqrt{1-2x-3x^2}}{2x^2} $

으로 구해집니다만.. 카탈란 수보다 근호 안쪽이 한 차수 늘어난 걸 보면, 생성함수로 일반항 찾기는 아주 쉽지 않아보입니다.

일단 생성함수도 구할 수 있다 정도로만 생각하시고 넘어가시죠

사실 모츠킨수열은 조합론적 수열이다보니 경우의 수로 일반항 구하는게 더 쉽습니다.(카탈란 수열에서도 경우의 수로 구하는게 훨씬 쉬웠죠?)

 

 

6. 일반항

모츠킨 수열의 일반항은

$ M_n = \sum \limits_{k=0}^{[n/2]} \ _{n}\operatorname{C}_{2k} \ C_k$

여기서 왼쪽 C는 조합이고, 오른쪽 C는 카탈란 수 인데, 헛갈리니까 binomial 표현으로 바꿔주면

$ M_n = \sum \limits_{k=0}^{[n/2]} \binom{n}{2k} \ C_k$

이 됩니다.

여기서  
- $ \binom{n}{2k} $는 전체 n칸 중에 길이 2k짜리 구간을 선택하는 방법의 수를 나타내며,  
- $ C_k $는 카탈란 수로, 길이 2k인 Dyck path의 개수를 의미합니다.



이 식을 조합적으로 해석하면 다음과 같습니다.

1. 전체 경로의 길이는 n입니다.  
   우리는 이 길이를 Dyck path 구간(길이 2씩 짝을 이루는 구간)과 수평선(→)으로 나눠 생각합니다.

2. 짝수 영역 선택하기:  
   Dyck path는 길이가 항상 짝수여야 하므로, 2k ≤ n인 k에 대해서만 고려할 수 있습니다.  
   즉, 가능한 k의 범위는 0 ≤ k ≤ [n/2]입니다.(여기서 대괄호는 '가우스 기호'혹은 '가우스 함수'라고 불리며, '기호 안의 값을 넘지 않는 최대 정수'를 의미합니다. 내림(floor)과 동일합니다. 즉, [2.5] = 2입니다.)[여기서 이 기호는 짝수 2k가 전체 길이 n을 넘지 않게 제한하는 역할을 합니다.]

3. $ \binom{n}{2k} $는 길이 n 중에서 길이 2k짜리 블록이 들어가는 위치를 고르는 방법입니다.

4. $ C_k $는 선택된 2k칸에 대해 Dyck path를 구성하는 방법의 수입니다.

5. 남은 n - 2k칸은 모두 수평선(→)으로 채우면 됩니다.

즉,  
- 각 k마다  
  $ \binom{n}{2k} $: Dyck path가 들어갈 위치 조합 ×  
  $ C_k $: 그 위치에 Dyck path를 실제로 배치하는 방법  
을 곱해서 전체 경로의 수를 계산하는 것입니다.

 

예를 들어 n = 3이라면,  
가능한 k는 0 또는 1입니다.

- k = 0: 전부 수평선(→) → 1가지  
- k = 1:  
  $ \binom{3}{2} $ = 3 (길이 2짜리 블록 하나를 어디 넣을지 선택) ×  
  C₁ = 1  
  → 총 3가지

따라서,

$ M_3 = \binom{3}{0}·C_0 + \binom{3}{2}·C_1 = 1·1 + 3·1 = 4 $

 

다시 정리해보자면

$ M_n = \sum \limits_{k=0}^{[n/2]} \binom{n}{2k} \ C_k$

- k는 Dyck path로 채울 수 있는 짝수 영역의 개수  
- binom(n, 2k)는 그 위치를 고르는 조합  
- $ C_k $는 그 영역에 실제 Dyck path를 채우는 방법의 수

라는 조합적 해석을 갖습니다.

 

여기서 카탈란 수열 $ C_k $는 $ \frac{1}{k+1}\binom{2k}{k} $이므로 전체 풀어쓰면

$ M_n = \sum \limits_{k=0}^{[n/2]} \binom{n}{2k} \cdot \frac{1}{k+1}\binom{2k}{k}$

 

결국, 카탈란 수열을 나눠서 얘들이 어디에 쏙쏙 배치될지만 결정하는게 모츠킨 수열이네요~

 

 

7. 결론

모츠킨 수열의 점화식: $ M_0 = 1, \ M_1 = 1, \ M_n = M_{n-1} + \sum \limits _{k=0} ^{n-2} M_kM_{n-2-k} \quad \operatorname{for} \ n \ge 2$

모츠킨 수열의 일반항: $ M_n = \sum \limits_{k=0}^{[n/2]} \binom{n}{2k} \cdot \frac{1}{k+1}\binom{2k}{k}$

카탈란 수열을 심도있게 공부해봤다면, 너무나도 쉽게 카탈란 수가 들어갈 공간만 계산해주면 바로 모츠킨 수열의 일반항이 나온다는 사실을 알 수가 있답니다~

반응형
반응형

신입생의 꿈과 대학교 2학년의 꿈(Freshman's dream & Sophomore's dream)

 

 

0. 서론

과거 작성하였던 0에서 1사이의 x^x(x의 x승) 적분 값 계산(integral from 0 to 1 x to the power x dx) 포스팅이 있습니다.

고등학생 때 미적분을 공부하다 궁금했었는데, 결국 그 당시에 해결하지는 못하고 나중에 대학교를 졸업하고 나서야 우연히 해결방법을 접하고 신기한 마음에 포스팅을 올렸었죠.

그러나 그때까지도 이게 정확히 뭔지 몰랐다가, 요근래 정확한 명칭을 알게되었습니다.

바로 "대학교 2학년생의 꿈(Sophomore's dream)"이라는 이름이더군요.

수학자들이 붙인 이름입니다.

이걸 보면 모든 학문이 한번에 짠하고 완성되는 경우는 없는 것 같습니다.

뭔가 하나씩 하나씩 시간이 지나며 완성되는 느낌이랄까요?

 

그런데 왜 하필 "대학교 2학년생의 꿈(Sophomore's dream)"일까요?

"대학교 1학년생의 꿈(신입생의 꿈, Freshman's dream)"도 있을까요?

혹시 다른 "꿈" 시리즈들도 있을까요?

 

이 포스팅의 시작은 바로 여기서 부터입니다.

 

 

1. 신입생의 꿈 혹은 대학교 1학년생의 꿈(Freshman's dream)

1-1. 정의

대학교 1학년생의 꿈은 다음과 같습니다.

$ (x+y)^p = x^p + y^p $

 

1-2. 유래

사실 곱셈공식을 처음 배울 때 처음 실수하는 구간이죠.

$ 3(x+y) = 3x+3y $와 같이 분배법칙에 익숙했던 우리 모두가 한번쯤은 거쳐가지 않았을까요

그리고 한편으론 '이렇게 쉬웠으면 얼마나 좋아~'싶은 바람이기도 하죠.(왜 '바람'이냐면, 아시잖아요? 일반적인 상황에서 p가 1인 경우를 제외하고는 이항계수와 각 항의 곱의 조합으로 인하여 저렇게 심플하게 나올 수가 없답니다)

그래서 어떻게 보자면, 수학자들이 "초심자들의 실수를 장난스럽게 놀리기 위해 + 초심자들의 바람"을 담아서 이것을 신입생의 꿈(Freshman's dream)이라고 부르기 시작했습니다.

"전 세계적으로 곱셈공식은 대학교 입학 전에 배우는데 왜 '신입생'이냐"고 하신다면, 사실 처음 붙인 사람의 의도를 알지 못하는 한 정확하게 알 수는 없지만 유추해보자면

  1. 대학교육의 '초심자'의 의미
  2. 제대로 학문하는 사람(교수)이 처음 보는 학생
  3. 이전까지는 '기본'적인 것들을 배웠다면 정말 대학교에서 본격적인 '수학'이라는 학문에 처음 들어온 뉴비

뭐 이정도의 느낌으로 신입생의 꿈 혹은 대학교1학년생의 꿈이라고 불렀겠죠?

대략 용어가 처음 등장한건 1940년대, 본격적으로 교재에까지 올라온 건 1974년이라고하니, 그렇게 엄청 오래된 용어는 아닙니다.

 

1-3. 그냥 헛소리일 뿐인가?

그러나 일반적으로는 성립하지 않는 저 식도 특수한 환경에서는 성립하게 됩니다.

아주 간단하게 설명해서, 특정 수가 p가 되면 0이 되는 공간에서 p가 소수일 때 저 등식은 성립합니다.

가령 p가 2가 되면 0이 되는 공간이 있다고 해봅시다.

0은 0이고, 1은 1이고, 2는 0입니다.

여기서 $ (x + y)^2 $은 $ x^2 + 2xy + y^2 $으로 전개되지만, 공간 정의에서 2는 0이 되므로 결국 $ x^2 + 0 + y^2 = x^2 + y^2 $이 됩니다.

따라서 신입생의 꿈이 성립하는거죠.

 

여기서부터는 좀더 나아가는 부분입니다. 가볍게 읽고 싶으시다면 건너 뛰셔도 좋습니다. 읽다가 복잡하시면 그냥 넘어가셔도 좋습니다.

더보기

수학적으로 엄밀하려면 물론 여러 조건들이 붙어야 합니다.

수학적으로 엄밀한 신입생의 꿈 정의는 "단위원이 있는 가환환 공간에서 표수 p에 대해 p가 소수일 때 신입생의 꿈 식은 성립한다"입니다.

1-3-1) 단위원이 있는 가환환(Commutative ring with unity)

일단 공간은 단위원이 있는 가환환(Commutative ring with unity)이어야 합니다.

이야 첫 단어부터 엄청 어렵죠?

단위원이란 unit element로, 동그라미 원이 아니라 항등원 같은 '원소'를 나타내는 말입니다. 뜻도 항등원이랑 비슷한데, 보통 곱셈의 항등원을 단위원이라고 표현하는 경우가 많습니다.

가환환이란 쉽게 생각해서 가환 즉 '교환이 가능한 고리'라는 건데요.

즉 '고리'란건 뭐 영역을 잡다보니 나온말로, 나중가면 '체(영역)'이란 것도 나옵니다.

크게 그냥 '영역을 나타내는 말이구나~'하고 생각하면 되지만, 왜 하필 'ring'이라고 붙였을까 생각해보면

"덧셈과 곱셈을 통해 만들어지는 여러 연산 결과들이 '서로 연결되어 닫힌 구조(closed structure)'를 만든다는 점에서, 마치 연산 결과들이 하나의 고리를 이루듯이 연결되어 있다"는 비유적 표현이지 않을까 싶긴하네요.

그리고 여기서 나오는 '여러 연산'을 또 정의하는 부분이 "덧셈으로는 을 이루고, 곱셈으로는 결합법칙이 만족되며, 분배법칙도 있는 연산 구조"입니다.

뺄셈, 나눗셈이 덧셈과 곱셈의 역연산이라는걸 생각하면 일단, 덧셈과 곱셈만으로 환을 정의하는 건 알겠습니다.

그리고 곱셈에 대해서 이 '환(ring)'은 이렇게 요구하죠 '너는 그냥 결합법칙, 분배법칙만 만족하면 돼'라고요.

근데, 여기서 덧셈에 대해서는 '군을 이룬다'는게 뭔 말일까요?

은 group으로 환이 성립하기 위한 군은 '가환군'이라고 합니다.

즉, '환'은 다음과 같이 요구합니다.

'덧셈은 가환군을 만족시킬 것, 곱셈은 결합법칙, 분배법칙을 만족할 것'

그럼 또 가환군은 뭔가요?

가환군은 네가지 조건을 만족하는 것입니다.

  1. 결합법칙 성립
  2. 항등원 존재
  3. 역원 존재  [여기까지가 '군'의 조건입니다]
  4. 교환법칙 성립 [이것까지 만족하면 '가환군' 입니다]

그리고 덧셈에 대해서는 가환군을 만족해야 한다고 했으므로

  1. 결합법칙 성립: $ (a + b) + c = a + (b + c) $
  2. 항등원 존재: $ a + 0 = a $
  3. 역원 존재: $ a + (-a) = 0 $
  4. 교환법칙 성립: $ a + b = b + a $

요 네가지가 성립하면 덧셈에 대해서 가환군이 만족됩니다.

자, 여기까지가 '환(ring)'이 되기 위한 조건이었습니다.

엄청 복잡하죠?

그러면 가환환이란 무엇이냐?

결국 위에서 정의한 '환'에 '가환' 즉 교환법칙까지 성립하게하면 '가환환'이 됩니다.

아까 환은 덧셈은 가환군을 만족해야하고, 곱셈은 단순히 결합법칙, 분배법칙만 만족하면 된다. 고 했으니

가환환은 덧셈은 가환군을 만족해야하고, 곱셈은 단순히 결합법칙, 분배법칙, 교환법칙까지 만족하면 된다. 입니다.

이렇게 해서 가환환까지는 정의가 끝났는데, 그럼 다시 처음으로 돌아가서 왜 "'단위원'이 있는"이라는 조건이 붙었을까요?

잘 보시면 가환환의 정의에서 곱셈은 '항등원'과 '역원'조건이 없습니다.

왜 없는고 하면, 이것까지 만족시키기가 굉장히 까다롭거든요(그래서 이것까지 만족하는 영역을 '체(field)'라고 따로 부릅니다)

그러나 여기서, 우리는 곱셈의 항등원(=단위원)은 필요하기 때문에(나중에 표수의 정의에서 쓰입니다), '가환환'조건에 따로 '단위원'을 추가시킨겁니다.

우와 여기까지가 공간정의 였습니다.

왜 이런 공간정의가 필요하냐면, 곱셈공식이 위와같은 연산규칙들을 따라야 우리가 원하는 모양대로 정리가 되기 때문에 그렇습니다.


1-3-2) 표수 p(Characteristic p)

표수(characteristic)라는건 쉽게말해 mod(나머지) 연산을 하는 제수(divisor)입니다.

이것도 엄밀하게는 "환 또는 체의 항등원 1을 반복 덧셈했을 때 0이 되는 최소 자연수"라는 정의를 가지고 있으나, 현재 우리가 논의하고 있는 유한환에 대해서는 쉽게 위와같은 정의로 이해해도 됩니다.(결국 유한환에서는 같은 얘기거든요..)

예시로 보는게 더 쉽습니다 이건

p=2,

  • 1 = 1 $ \Leftrightarrow $ 1 mod 2 = 1
  • 1+1=0 $ \Leftrightarrow $ 2 mod 2 = 0

p=3

  • 1 = 1 $ \Leftrightarrow $ 1 mod 3 = 1
  • 1+1=2 $ \Leftrightarrow $ 2 mod 3 = 2
  • 1+1+1=0 $ \Leftrightarrow $ 3 mod 3 = 0

바로 이해되시죠? 이름만 어렵습니다.

 

1-3-3) p가 소수일때

그럼 왜 p가 소수일때만 이 식은 성립하는 걸까요?

이항정리를 보면, 그 답이 나옵니다.

이항계수는 아래와 같이 정의됩니다.

$ \binom{p}{k} = \ _{p}C_k = \frac{p!}{k!(p-k)!} $

여기서, 우리는 $ x^p, \ y^p $의 계수인 1, 즉 $ k $가 0이나, $ p $가 아닌 항들에 대해서 볼 것이므로 $ 0 < k < p $조건이 붙겠죠.

그리고 이 수식을 다시 써보면

$ \frac{p \cdot (p-1) \cdots (p-k)!}{k!(p-k)!} = \frac{_{p}P_k}{k!} $로 정리할 수 있겠죠?

여기서, $ p $가 소수이면, 분모의 어떤 수와도 약분되지 않으므로 $ p $가 분자에 존재하게 됩니다.

반대로 $ p $가 합성수이면, 분모의 어떤 수와도 약분되므로, $ p $가 분자에 존재하지 않게됩니다.

따라서, $ p $가 소수라면, 계수는 무조건 $ p $의 배수를 계수로 가지게 됩니다.

그리고 표수가 $ p $였기 때문에, 이 항들은 모두 0이 되버리게 되죠.

 

이로써, 위의 엄밀한 정의를 따른다면 무조건 신입생의 꿈(Freshman's dream)은 성립합니다.

 

 

2. 대학교 2학년생의 꿈(Shopomore's dream)

자, 그럼 대학교 2학년생의 꿈은 뭘까요?

2-1. 정의

$ \int^1_0 x^{-x} dx = \sum \limits _{n=1}^\infty \frac{1}{n^n} $

$ \int^1_0 x^x dx = \sum \limits _{n=1}^\infty \frac{(-1)^{n+1}}{n^n} = - \sum \limits _{n=1}^\infty (-n)^{-n} $

위의 두 식을 대학교 2학년의 꿈이라고 합니다.

그리고 위키피디아 등 여러 문헌에서 두 식을 1697년 요한 베르누이(Johann Bernoulli)가 발견했다고 저술하고 있습니다.

여담으로 요한 베르누이는, 우리에게 익숙한 '베르누이의 정리'를 발표한 다니엘 베르누이의 아버지 입니다.

 

2-2. 유래

그럼 진짜로 요한 베르누이는 이 두 식을 발표했을까요?

현재 문헌상에서 찾을 수 있는 것은 1742년에 총 4권으로 출간된 "Opera omnia"입니다.

Jean(Johann) Bernoulli가 그동안 저술한 것을 모아서 출간한 전집이죠.

그리고 여기서 Vol 3, pp 376-383에 "대학교 2학년의 꿈" 식의 증명이 등장합니다.

(원문은 구글 아카이브(https://archive.org/details/johannisbernoul00berngoog/page/n406/mode/1up)에서 확인하실 수 있습니다. 세상좋아졌어요.. 1742년 출간된 책을 인터넷으로 볼 수 있다니...)

1697년 악타 에루디토룸(Acta Eruditorum) 3월호에 실린 논문의 내용을 다시 정리하여 소개하고 있죠.

이 논문에서 요한 베르누이는 "지수함수 계산법의 원리(Principia calculi exponentialium)는 내가 처음 고안해낸 것으로, 이후 1697년 3월호 "Acta Eruditorum"에 발표했다"라고 밝히고 있습니다.

그리고 내용을 좀 더 살펴보면, 사실은 본인은 이 증명을 이미 예전에 발견하였으나 따로 알리지는 않고있었지만 라이프니츠 등 다른 수학자들이 요청하여 공개한다고 밝히고 있습니다.

그리고 뒤이어 나오는 증명은 $ \int_0^1 x^x dx $를 급수로 풀어내는 증명입니다.

 

우리는 이전 포스팅(https://omnil.tistory.com/173)에서 감마함수를 이용하여 식변형 만을 가지고 이를 풀었었는데요,

실제로 요한 베르누이는 이 적분을

  1. 로그변환($ x^x = e^{x \cdot \ln x} $)
  2. 매클로린 급수 전개
  3. 항별 부분적분
  4. x = 1 대입

의 방법으로 구하고 있습니다.(이후에는 일반항 $ x^n(\ln x)^m $에 대한 일반화된 적분 규칙을 정립하고, 논문을 마무리짓습니다.)

더불어, 이 식은 매우 빠르게 수렴하기 때문에 앞 몇 항만 계산해도 소수점 아래 10자리까지 계산할 수 있다고 밝혔습니다.

즉, 요한 베르누이의 논문에서는

$ \int^1_0 x^x dx = \sum \limits _{n=1}^\infty \frac{(-1)^{n+1}}{n^n} = - \sum \limits _{n=1}^\infty (-n)^{-n} $

이 식만 등장한다고 볼 수 있죠.

 

2-3. 검증

그렇다면, $ \int^1_0 x^{-x} dx = \sum \limits _{n=1}^\infty \frac{1}{n^n} $ 이 식은 어디서 나온걸까요? 후대에 다른 수학자가 임의로 넣은 걸까요?

사실 베르누이의 방식을 따르던, 저희가 구했던 방식을 따르던 첫 함수를 $ x^{-x} $로 놓고 풀면, 아주 간단하게 식이 유도됩니다.

따라서 베르누이가 발견했다고도 볼 수 있죠(베르누이가 이 함수를 적분할 수 있는 방법을 찾은거나 마찬가지니까요)

더불어 오히려 처음 구한 $ x^x $보다 그 식이 너무나도 깔끔하고 딱 보기에 좌항과 우항이 적분이냐 급수냐의 차이만 있을 뿐 식이 똑같기 때문에 놀라움을 자아낼 수 있죠.

$ \int^1_0 \frac{1}{x^{x}} dx = \sum \limits _{n=1}^\infty \frac{1}{n^n} $

그리고 이것을 바탕으로 대학교 2학년의 꿈(Sophormore's dream)이라는 언어유희가 탄생합니다.

첫 언급은 Borwein의 저술에 2004년에 등장하는 것으로 알려져 있습니다.

 

2-4. 신입생의 꿈 vs 대학교 2학년의 꿈

신입생의 꿈이라는 말은 위에서 '직관적으로 될 것 같지만 되지 않는 등식'을 일종의 '장난+그들의 염원'을 담아서 장난식으로 붙였다고 했습니다.

여기서 대학교 2학년의 꿈이라는 말은 반대로 '직관적으로 이게 돼!?' 싶은 등식이 '실제로 성립하는' 놀라움을 담아 붙인 셈입니다.

 

 

3. 다른 꿈 시리즈?

인터넷을 돌아다니다보면 '초등학생의 꿈'이니 뭐니 여러 '꿈'시리즈가 보이는 듯도 싶은데, 세계적으로 통용되는 보편적인 개념이나 용어는 아니고, 오히려 "'신입생의 꿈'처럼 어찌보면 '억지'인 상황을 제시하고, 어떤 특수한 상황에서는 성립한다는 것을 제시하는" 스타일입니다.

대표적으로 '초등학생의 꿈'은 과학잡지 등에서 기고로 실렸던 흔적을 찾을 수 있습니다.(뭐 사실 문제는 만들기 나름이지요. 신입생의 꿈 스타일이면 다 '~~꿈'이라고 할 수 있지 않을까요)

 

억지인 상황:

분수의 덧셈에서 통분을 하지않고, 분모끼리 분자끼리 더하는 상황(현실적으로는 성립하지 않지만, 직관적으로 '이렇게 해도 되지 않나!?'싶은 오류 상황)

 

특수한 해:

어떠한 집합 $ F_n $를 정의합시다.

이 집합은 0과 1사이의 기약분수의 모임입니다.

그리고 여기서 분모가 n 이하인 것들을 크기 순서대로 배열하기로 합시다.

수식으로 표현해보자면,

$ F_n = \left\{ \frac{a}{b} \,\middle|\, 0 \leq \frac{a}{b} \leq 1,\ \gcd(a,b) = 1,\ b \leq n \right\} $

이 됩니다. 여기서 gcd는 최대공약수(Greatest Common Divisor)로, 최대공약수가 1이라는 말은 두 수가 서로소(coprime)이라는 뜻이고 분수로 확장되면 기약분수를 나타내는 말이 되겠죠?

참고로 이 집합의 이름은 Farey set이라고 부른답니다.

예시로 볼까요?

  • $ F_1 = \left\{ \frac{0}{1}, \frac{1}{1} \right\} $
  • $ F_2 = \left\{\frac{0}{1}, \frac{1}{2}, \frac{1}{1} \right\} $
  • $ F_3 = \left\{\frac{0}{1}, \frac{1}{3}, \frac{1}{2}, \frac{2}{3}, \frac{1}{1} \right\} $

그리고 이 집합의 연속된 세 수를 고르면, 첫항과 세번째항의 '초등학생의 꿈' 연산의 결과가 두번째 항이 되는 것을 알 수 있습니다.

 

 

4. 결론

역사적 시간으로 다시 정리해보자면,

  1. 베르누이가 1697년에 $ \int^1_0 x^x dx = \sum \limits _{n=1}^\infty (-1)^{n+1}n^{-n} = - \sum \limits _{n=1}^\infty (-n)^{-n} $을 발견
  2. 1940~70년대 신입생의 꿈이라는 말이 만들어짐(초심자의 실수+그들의 바람 을 표현한 용어(직관적으로 될 것 같은데 안된다))
  3. 2004년 Borwein등의 저술에서 베르누이가 발견한 내용에 대학교 2학년생의 꿈이라는 용어를 붙임(신입생의 꿈과는 반대로 '직관적으로 맞는거 같은데... 맞는다!' 느낌)[여기서 원래 베르누이의 발견은 $ \int_0^1 x^x dx $이었지만, 약간 바꾸어서 더 아름다운 형태인 $ \int_0^1 x^{-x} dx $를 대표적인 식으로 표현(사실상 약간의 식변형이라 베르누이 논문에 직접 언급되지는 않지만 베르누이가 발견했다고해도 틀린말은 아님)]
  4. 이후에 다른 '꿈'들이 있었지만, 세계적으로 통용되는 것들은 아님

이렇게 되겠네요

 

 

5. 마무리

어떻게 오늘 포스팅도 즐거우셨나요? 우리모두 꿈을 꿔보도록 합시다~

반응형
반응형

정규분포의 확률밀도함수(Probability Density Function, PDF) 증명

 

0. 서론

확률밀도함수(PDF), 그 중에서도 정규분포함수가 왜 너무나도 당연하게 유도되는지를 증명해보려고 합니다.

신기하게도 하나하나 따라가다보면, 우리가 아는 그 유명한 종 모양 그래프가 나온답니다.

 

1. 정규분포의 함수 모양은 어떻게 생겼나?

아시는 분들은 대충 종 모양이라고 알고 계시겠고, 더욱 자세히 아시는 분들은 적어도 이 함수가 e의 지수함수꼴이라는 것은 알고계실겁니다.

그러나 그게 왜 그렇게 나오는지는 모르시는 경우가 많을 것이라 생각됩니다. 그럼 정말 '무지'에서 시작해서 이 그래프를 찾아가보도록 하겠습니다.

 

2. 조건들을 확인하자

우리가 아는 정규분포의 pdf의 조건들은 다음과 같습니다.

  1. $ \int_{-\infty}^\infty f(x) dx = 1 $ : 함수의 전체 넓이는 1(=전체 확률은 1)
  2. $ \int_{-\infty}^\infty x \cdot f(x) dx = \mu $ : 확률변수 x의 기댓값은 평균($ \mu $)
  3. $ \int_{-\infty}^\infty (x-\mu)^2 \cdot f(x) dx = \sigma^2 $ : 확률변수 x의 분산은 표준편차($ \sigma $)의 제곱
  4. $ \mu $를 기준으로 좌우 대칭
  5. 최대한 자연적인 분포(분포가 치우침이 없고 편향되지 않음)

이 조건들을 가지고 바로 함수의 모양을 찾아볼까요?

 

3. 최대한 자연적이다?

최대한 자연스러운 분포란 무엇일까요?

예를 들어, 동전을 던진다고 가정해봅시다.

가장 자연스러운 상황은 앞면이 나올 확률이 0.5, 뒷면도 0.5인 경우입니다.
왜냐하면 결과를 전혀 예측할 수 없기 때문이죠. (어느 쪽이 나올지 도무지 알 수 없음)

반면, 만약 앞면이 나올 확률이 0.99, 뒷면은 0.01이라면 어떨까요?
이건 거의 항상 앞면이 나오는 인위적인 상황으로, 결과를 예측하기 매우 쉽습니다.
더 이상 ‘무작위’라기보다는 ‘조작된’ 느낌이 들죠.

이처럼 우리가 말하는 ‘자연스러운 분포’
결과를 예측하기 가장 어려운 상태,
불확실성이 최대인 상태라고 할 수 있습니다.

그런데 생각해봅시다.

앞면이 나왔을 때 더 놀라운 경우는 어느 쪽일까요?

  • 확률이 0.5인 공정한 동전?
  • 아니면 0.99로 앞면이 나오는 조작된 동전?

당연히 전자입니다.

공정한 동전에서는 앞면과 뒷면이 동일한 가능성을 가지기 때문에,
결과가 나왔을 때 우리는 순간적으로 “아! 앞면이 나왔네!” 하고 반응하게 되죠.
반대로 조작된 동전에서는 앞면이 나와도 별로 새로울 것이 없습니다.
애초에 그럴 거라 거의 확신하고 있었으니까요.

이런 “놀라움의 크기”를 다른 말로 표현하면,
우리가 그 순간 “새롭게 알게 된 정보의 양”,
정보량이라고 할 수 있습니다.

정리해보면 이렇게 연결됩니다:

불확실성이 크다 = 예측이 어렵다 = 놀라움이 크다 = 정보량이 크다

그리고 정보이론에서는 이것을 '엔트로피(entropy)'라고 부릅니다. 정보량이 크면 엔트로피가 큽니다.

[엔트로피의 원래 의미에서도 무질서도가 증가하는게 엔트로피가 크다고 하잖아요? 무질서할수록 우리가 알아야할 정보량은 커집니다.]

 

자, 그럼 정리되었습니다. 정규분포의 pdf는 엔트로피가 최대가 되어야 합니다.

 

 

4. 엔트로피는 어떻게 정의되는가

엔트로피는 샤논 엔트로피 공식(Shannon entropy formula)으로 구할 수 있습니다.

정보이론에서 샤논이라는 분이 엔트로피(불확실성)을 정량적으로 측정하기 위해 제안한 공식이죠.

수식을 보면

$ H(X) = - \sum p_i \log_b p_i $

이와 같습니다.

여기서 b가 2이면 bit로 나오고, e이면 nat, 10이면 hartley라고 하는데, 10은 거의 안쓰니까 크게 신경 안쓰셔도 됩니다.

p는 확률이죠.

이 수식은 정보이론에서 파생되었기 때문에 bit로 계산되는 이산적 공식이지만, 이 개념을 이용해서 연속적으로도 활용할 수 있습니다.

또한 보통 연속적으로 사용할때는 b가 e인 nat(natural unit of information) 단위로 쓰이지만, 이 단위가 크게 중요한 부분은 아닙니다.

중요한건 이 공식으로 연속함수의 불확실성을 나타낼 것이라는 점입니다.

$ H[f] = - \int f(x) \ln f(x) dx $

이제 이 공식에서 f(x)가 가장 불확실함을 나타내는 함수를 찾으면 됩니다. 그렇다면 H[f] 즉, 함수 f의 엔트로피가 최대가 되면 되겠죠?

 

 

5. 값이 최대가 아니라, 함수가 최대라구요?

여기서 값이 최대인 것을 찾는 방법이 미분법이라고 한다면, 함수가 최대인 것을 찾는 방법은 변분법이라고 불립니다.

그러면 바로 H[f]를 바로 변분법을 쓰면 될까요?

아니겠죠..? 위에서 조건들이 엄청 많았는데 그것들을 무시하고 찾으면 안되는 거잖아요?

그렇다면 위의 조건들을 어떻게 반영할 것이냐.. 하면 여기서 라그랑주 승수법이라는것이 나옵니다.

어떤 함수에 대해서 각 조건들에 라그랑주 승수를 곱해서 원 함수에서 더하거나 빼서 그 함수를 조건짓는 겁니다.

그렇게 해서 중간에 나오는 식을 '라그랑지안'이라고 부릅니다.

그렇다면 H[f]에서 각 조건들을 빼주면 되겠죠?

$ \mathcal{L} = - \int f(x) \ln f(x) dx - \lambda_0 ( \int f(x) dx -1 ) - \lambda_1 ( \int x \cdot f(x) dx - \mu ) - \lambda_2 ( \int (x-\mu)^2 \cdot f(x) dx - \sigma^2 ) $

이렇게 정리될겁니다.

그리고 여기에서 변분법을 적용하여(함수로 미분하는 겁니다) 이 값이 0인 점을 찾으면 미분처럼 극값을 주는 함수를 찾을 수 있습니다.

$ \frac{\delta \mathcal{L}}{\delta f(x)} = - (1 + \ln f(x)) - \lambda_0 - \lambda_1 \cdot x - \lambda_2 \cdot (x-\mu)^2 = 0 $

으로 나올테고, 이를 정리하면

$ \ln f(x) = -1 - \lambda_0 - \lambda_1 \cdot x - \lambda_2 \cdot (x-\mu)^2 $

이 되고, 이를 다시 f(x)로 표현하면

$ f(x) = e^{-1 - \lambda_0 - \lambda_1 \cdot x - \lambda_2 \cdot (x-\mu)^2} $

$ f(x) = Ae^{- \lambda_1 \cdot x - \lambda_2 \cdot (x-\mu)^2} $

이렇게 정리할 수 있습니다.

그리고 여기서 '함수는 평균을 기준으로 좌우 대칭이다'라는 조건에 의해 $ \lambda_1 $은 0이 되어야만 합니다. x가 살아있으면 이 함수는 좌우 대칭이 깨지기 때문이죠. 따라서 다시 써보면

$ f(x) = Ae^{- \lambda_2 \cdot (x-\mu)^2} $

이렇게 정리가 됩니다.

그리고 이것을 통해서 정말 신기하게도, 이 함수의 '개형'을 알게 되었습니다.

그러면 이제 $ \lambda_2 $와 A만 알면 완벽한 정규분포식을 알 수 있겠군요!?

 

 

6. $ \lambda_2 $와 A 찾으러 떠나세~

여기서 다시한번 정리해보죠. 정규분포함수의 pdf는 $ f(x) = Ae^{- \lambda_2 \cdot (x-\mu)^2} $입니다.

그렇다면,

조건1:

조건 $ \int_{-\infty}^\infty f(x) dx = 1 $에서, f(x)를 대입하면

$ \int_{-\infty}^\infty Ae^{- \lambda_2 \cdot (x-\mu)^2} dx =1  $

이렇게 정리가되고, 이것을 풀면 $ \lambda_2 $와 A를 구할 수 있겠네요.

일단, A는 상수계수이므로 적분기호 밖으로 뺄 수 있을테니, $ \lambda_2 $부터 구해보도록하죠.

$ A \int_{-\infty}^\infty e^{- \lambda_2 \cdot (x-\mu)^2} dx = 1 $

그러나 여기서 안타까운 상황에 직면합니다.

$ e^{x^2} $꼴의 적분은 자명한 원시함수가 없음이 밝혀져있죠.(리우빌의 정리(Liouville’s theorem on integration in finite terms)에 의해 증명됩니다.)

그러면 풀지 못하냐.. 하면 우리 엄청나신 가우스님께서 이걸 약간의 트릭으로 아주 멋지게 풀어내십니다.

일단 $ x-\mu $를 $ u $로 치환해줍니다.

$ \int _{-\infty}^\infty e^{-\lambda_2 u^2} du $

여기서 해를 $ I $라고 하면 식은 다시

$ I = \int _{-\infty}^\infty e^{-\lambda_2 u^2} du $

이렇게 쓸 수 있습니다.

그리고 여기서 양변을 제곱해줍니다.

적분 변수를 구분해주기위해 다른 문자인 x, y를 씁니다. 여기서 x는 위에서의 x와 상관이 없습니다.(잠깐 쓰고 사라질 친구들이라 그냥 x쓰겠습니다)

$ I^2 = \left( \int _{-\infty}^\infty e^{-\lambda_2 x^2} dx \right)\left( \int _{-\infty}^\infty e^{-\lambda_2 y^2} dy \right) $

적분을 합치고, 수식을 정리하면

$ I^2 = \iint _{\mathbb{R^2}} e^{-\lambda_2 (x^2+y^2)} dx dy $

여기서 $ \mathbb{R^2} $는 '실수*실수 모든 영역에서'라는 뜻으로 $ \int _{-\infty}^\infty\int _{-\infty}^\infty = \iint_{\mathbb{R^2}} $입니다.

여기서 $ x^2+y^2 = r^2 $이라는, 원의 방정식이자 극좌표 표기 형식으로 바꿔보면,

$ dx dy $의 경우 미소 면적을 뜻하는 것인데, 극좌표 형식에서는 미소한 $ \theta $에 대해 부채꼴의 호의 길이인 $ rd\theta $와 $ dr$의 곱으로 표현할 수 있으므로 둘이 치환되며,

구간의 경우 $ r $이 0부터 무한대까지, 그리고 $ \theta $가 0에서 $2\pi$까지면 실수영역에서 $ \mathbb{R^2} $를 커버하므로 이와같이 치환하면 수식은

$ I^2 = \int_{0}^{2\pi}\int _{0}^\infty e^{-\lambda_2 r^2} rdrd\theta $

이와같이 바뀝니다.

여기서 안쪽 적분인

$\int _{0}^\infty e^{-\lambda_2 r^2} rdr$

부터 적분하면, $ \lambda_2 r^2 = v $,  $ 2\lambda_2 rdr = dv \Leftrightarrow rdr = \frac{dv}{2\lambda_2} $로 치환하면

$\frac{1}{2\lambda_2}\int_0^\infty e^{-v} dv $

이렇게 변형이 되고, $ \int_0^\infty e^{-v} dv = 1 $이므로

안쪽적분은 $\frac{1}{2\lambda_2}$가 나옵니다.

이제 바깥쪽 적분으로 들어가면

$ \frac{1}{2\lambda_2} \int_0^{2\pi}d\theta $이므로

$ I^2 = \frac{2\pi}{2\lambda_2} $

$ I = \sqrt{\frac{\pi}{\lambda_2}} $

가 됩니다.

$ A \int_{-\infty}^\infty e^{- \lambda_2 \cdot (x-\mu)^2} dx = 1 $

여기에서 적분부분이 $ I $이므로, $ A\sqrt{\frac{\pi}{\lambda_2}} = 1 $

$ A = \sqrt{\frac{\lambda_2}{\pi}} $

 

조건2:

여기서 저희는 분산조건도 만족시켜야 합니다.

$ \int_{-\infty}^\infty (x-\mu)^2 \cdot f(x) dx = \sigma^2 $

f(x)에 $ Ae^{- \lambda_2 \cdot (x-\mu)^2} $대입하고, 마찬가지로 $ x-\mu $를 $u$로 치환하면

$ \int_{-\infty}^\infty u^2 \cdot Ae^{- \lambda_2 \cdot u^2} du = \sigma^2 $

여기서 A를 적분 밖으로 빼면

$ A \int_{-\infty}^\infty u^2 \cdot e^{- \lambda_2 \cdot u^2} du = \sigma^2 $

요런식이 나오는데, 여기서 부분적분해야하나?라는 생각이 들수도 있지만, 아주 멋있는 해법이 있습니다.

아까

$ I = \int _{-\infty}^\infty e^{-\lambda_2 u^2} du = \sqrt{\frac{\pi}{\lambda_2}} $

였죠?

이걸 바로 $ \lambda_2 $로 미분해줍니다.

$ \frac{dI}{d\lambda_2} = \frac{d}{d\lambda_2}\int _{-\infty}^\infty e^{-\lambda_2 u^2} du = \int _{-\infty}^\infty \frac{d}{d\lambda_2}e^{-\lambda_2 u^2} du = \int_{-\infty}^\infty (-u^2) \cdot e^{- \lambda_2 \cdot u^2} du $

따라서

$ \int_{-\infty}^\infty u^2 \cdot e^{- \lambda_2 \cdot u^2} du = -\frac{d}{d\lambda_2}\sqrt{\frac{\pi}{\lambda_2}} $

$ = -\sqrt{\pi} \frac{d}{d\lambda_2} \lambda_2^{-\frac{1}{2}} $

$ = -\sqrt{\pi} (-\frac{1}{2}) \lambda_2^{-\frac{3}{2}} $

$ = \frac{1}{2}\sqrt{\frac{\pi}{\lambda_2^3}} $

$ = \frac{1}{2\lambda_2}\sqrt{\frac{\pi}{\lambda_2}} $

다시정리하면,

$ A \frac{1}{2\lambda_2}\sqrt{\frac{\pi}{\lambda_2}} = \sigma^2 $

위에서 $ A = \sqrt{\frac{\lambda_2}{\pi}} $이었으므로

$ \sqrt{\frac{\lambda_2}{\pi}} \frac{1}{2\lambda_2}\sqrt{\frac{\pi}{\lambda_2}} = \sigma^2 $

$ \frac{1}{2\lambda_2} = \sigma^2 $

$ \lambda_2 = \frac{1}{2\sigma^2} $

이렇게 $ \lambda_2 $가 구해지고, A는

$ A = \sqrt{\frac{\lambda_2}{\pi}} $

이므로 여기에 대입하면

$ A = \sqrt{\frac{1}{2\pi\sigma^2}} $

$ = \frac{1}{\sqrt{2\pi\sigma^2}} $

 

 

7. 결론

따라서 유도된 정규분포 pdf는

$ f(x) = \frac{1}{\sqrt{2\pi\sigma^2}}e^{- \frac{(x-\mu)^2}{2\sigma^2}} $

이와 같습니다.

 

완전 무에서부터 조건들만 가지고 정규분포 pdf가 증명되는게 너무 신기하지 않나요?

반응형
반응형

생성함수(Generating Function)란?(feat. 멱급수(power series))

 

0. 서론

생성함수(Generating function)에 대해 그 의미가 생소한 분들이 많은 것 같아 추가로 이 포스팅을 기획하였습니다.

이전까지 글들이 좀 더 수학적으로 엄밀하고, 수식을 통해서 논지가 진행되었던 것에서 이번 포스팅은 조금 탈피해보려고 합니다.

아무래도 개념적인 부분을 다루고, 심지어 생소한 개념이다보니 최대한 쉽게 써보려고 하는데요.

여기서 예시로 들거나 대화를 하는 듯한 부분은 하나의 과장이자 허구이니 진지하게 받아들이시지는 마시고, '아~ 그냥 이래서 이렇게 되었던 거구나~'정도로만 이해해주시면 감사하겠습니다.(진짜 저런 대담이 오갔다거나 저게 진짜 기원이라고 믿으시면 안됩니다... 흐름만 봐주세요..)

그럼 시작해보겠습니다.

 

 

1. '등비수열의 합' 공식을 아시나요?

혹시 '등비수열의 합' 혹은 '등비급수' 공식을 알고 계신가요?

고등학교에서 처음 나오는 부분이라, 고등학교 교육을 지나쳐 오신 분들은 조금 친숙하시거나 적어도 '아.. 그런것도 있긴했었다...' 하실테고 아직 고등학교 교육을 이수하지 못하신 분들이라면 '엥?'이라고 하실수도 있으실 겁니다.

결론적으로 공식만 써보면 다음과 같습니다.

$ \sum \limits _{n=0}^{\infty} ar^n = \frac{a}{1-r} $

여기서 a는 초항(제일 처음 항), r은 공비 죠.

그리고 여기서 r은 $ | r | < 1 $입니다. 이래야만 수렴하거든요.(간단히 쓰기로 했으니까 자세한 내용은 생략하겠습니다만, 부분합 공식에서 극한을 취해보면 $ | r | < 1 $인 경우에만 수렴한답니다.)

 

1-1. 등비급수 공식을 직접 유도해보자~

이 공식은 고등학교에서 두가지 방식으로 유도합니다.

1) 등비 수열의 부분합 공식에서 n에 극한을 취해서 구한다.

2) r을 하나 곱해서 빼서 구한다.

여기서 두번째 구하는 방법을 한번 볼까요?

먼저 어떤 등비수열의 무한급수가 있다고 해 봅시다. 그리고 이 친구를 그냥 $ S $라고 놓을께요.

편의상 초항 a는 1로 놓겠습니다.

$ \sum \limits _{n=0}^{\infty} r^n = \sum \limits _{n=0}^{\infty} r^n = 1 + r + r^2 + \cdots = S $

그리고 여기서 $ S $에 $ r $을 하나 곱해봅시다.

$ r+r^2+r^3+\cdots = rS $

오 근데 위 식과 아래 식을 잘 보면 항이 서로 뺄 수 있을 것 같이 생기지 않았나요? 바로 빼봅시다

$ 1 + r + r^2 + \cdots - (r+r^2+r^3+\cdots) = 1 = S - rS $

$ 1= S-rS \Leftrightarrow 1 = (1-r)S $

다시정리하면,

$ \frac{1}{1-r} = S \Leftrightarrow \frac{1}{1-r} = 1 + r + r^2 + \cdots $

여기서 초항 a를 편의상 1로 놓고 계산했지만, 다시 살려줘서 양변에 곱해주면

$ \frac{a}{1-r} = a(1 + r + r^2 + \cdots) = a \sum \limits _{n=0}^{\infty} r^n = \sum \limits _{n=0}^{\infty} ar^n $

바로 우리가 처음 보았던 바로 등비수열의 합 공식이 짜란 하고 펼쳐집니다.

 

1-2. 근데 이걸 다시 곱해보면?

근데, 이 수식에서 분모를 다시 양변 곱해볼 생각 해보신분 계신가요?

$ \frac{1}{1-r} = 1 + r + r^2 + \cdots $

바로 이부분에서요.

'무한한데 어떻게 분배하냐~~~'라고 하실수도 있지만, 잘 보면 분배는 (1-r)에서 1곱한 급수 - r곱한 급수가 된답니다.

$ (1+r+r^2+\cdots)(1-r) = (1+r+r^2+\cdots) - r(1+r+r^2+\cdots) = (1+r+r^2+\cdots) - (r+r^2+r^3+\cdots) $

이렇게 분배가 되구요.. 수식을 잘 보고 뺄셈을 해보시면... 1만 남는걸 알 수 있습니다.

(여기서 '빼는 항 개수가 안맞잖아요~'라고 하신 당신은 엄청난 재능러! 그러나 무한의 공간에서는 말 그대로 '무한'하기 때문에 항 수에 대한 1:1 매칭이 의미가 없답니다! 관심있는 분들은 '힐베르트 호텔'을 한번 찾아보세요!)

그럼 수식을 다시 써보면

$ \frac{1}{1-r} = 1+r+r^2+\cdots \Leftrightarrow 1 = (1+r+r^2+\cdots)(1-r) = 1 $

엥? $ 1 = 1 $이라는 너무나도 기묘한? 이상한? 결과가 나왔네요?

뭐 별거 없습니다. 그냥 '당연하다~'이소립니다.

"좌변이 1이고, 우변도 계산하면 1이니까 둘은 같잖아! 그러니까 너의 식변형은 맞아~"

라고 알려주는거나 마찬가지지요.

결국 저 무한한 등비 수열이 더하기로 연결되어있는 걸 '단 하나의 수식'으로 표현할 수 있다는 거죠!

그럼 이 당연한걸 왜 해봤냐면요...

 

 

2. r을 확장해보자~

이제 수학자들이 이런 생각을 하기 시작합니다.

 

"오호 신기한지고... 어떻게 무한한 더하기를 이 단 하나의 공식으로 표현할 수 있는겐가..."
"오호오호 너무나 신기한지고... 아니 그러면 '값'을 넣으면 '값'이 나오는 r이라는 '공비' 대신에 의문스러운 '무언가'를 나타내는 문자 x를 써보면 어떠할까?"

 

그렇게 문자 x로 확장을 해봤는데? 어머어머 이게 x라도 딱 맞는거에요~~ 1=1이 나와버렸다니까요~~ (궁금하시면 직접 x로 바꿔서 풀어보셔도 됩니다만.. 어차피 r이나 x나... 글자만 바뀐거니까 결과도 동일하겠죠...?)

 

 

3. x에다가 무슨 장난을 칠 수 있을까... 계수?

거기다 이게 "아니 공비(r)라고 하는 틀에 갖혀서는 무조건 공비의 조건을 만족해야만 수식이 수렴하면서 값이 나왔기에 그냥 그런갑다~~ 했는데, 이걸 x라고 놔버리고보니 우항이 x의 거듭제곱꼴이되면서 x의 계수가 다시 또 어떤 등비수열을 나타낼 수 있잖아!? 오마나 세상에나 만상에나!!"

"봐봐, 봐봐, x라고 하는 자리에 2x를 넣으면, x의 계수가 바로 공비가 2인 수열이 만들어진다니까!?"

아주 난리가 납니다. 완전히 새로운 접근이 되어버린거죠.

이제 무한한 수열을 단 하나의 수식으로 '압축'해서 표현할 수 있는 방법이 생긴겁니다. 혁신이었죠.

그리고 여기서 다시 잘 살펴보면 x는 '어떤 미지의 수'를 뜻하는게 아니라 진짜 말그대로 '그냥 무언가'를 뜻하는 걸로 출발해서 이와같은 결실을 맺었기에, 그리고 그 '그냥 무언가'를 몇 제곱 했는지가 바로 그 계수를 몇제곱했는지랑 같은 의미가 되며, 그냥 'n번째'를 나타내는 '$ x^n $'으로의 의미가 생기게 됩니다.

 

 

4. 계수가 할말이 있대~~ 집중~~

근데 여기서 수학자들이 또 아주 재밌는 사실을 발견합니다.

 

"근데, 꼭 등비수열만 이렇게 나타낼 수 있는걸까?"

 

그러면서 계수를 이제부터 (등비수열의 정의 $ a_n = ar^n $에서)

$ ar^n $으로 보지 않고 $ a_n $으로 봐버리는 겁니다. 발상의 전환! 집중과 선택!

그러면 바로 이 급수 비스므리한 수식은! 안타깝게도 등식이 깨져버립니다.

좌변의 수식이 바로 '등비급수'를 나타내는 수식이었기 때문이죠...

그러나 하늘이 무너져도 솟아날 구멍은 있다! 어떤 수학자가 발상의 전환을 해버립니다

 

"어? 그럼 그냥 좌변을 '나도 모르는 수식 무언가😵‍💫'라고 놓아버리면 우변도 바꿔도 되지 않을까?

아니 그러면... 반대로 생각해보면...

우변의 계수가 등비수열이었으니까 -> 좌변의 수식이 등비수열을 나타내는 수식

그렇다면

우변의 계수가 'ㅁㄴㅇㄹ'수열이면 -> 좌변의 수식이 'ㅁㄴㅇㄹ'수열을 나타내는 수식(일명 '나도 모르는 수식 무언가😵‍💫')

이 되어버리는 거네!?

그러면 이번엔 좌변이 '수식 무언가'니까 대애충 '수식이에요'하는 모냥으로 함수처럼 A(x) 이런식으로 써놓고, 우변의 계수에 내가 알고싶은 수식의 일반항 넣고 계산해서 계산이 되어버리면, 그 계산된게 '수식무언가'겠네!?!?!?!?

오 마이 갓!!"

 

이렇게 깨달음을 얻은 그들... 다시한번 심호흡하며 그동안 깨달은걸 다시한번 검토해봅니다.

 

1) 등비급수를 구하는 공식을 찾았다!

2) 거기에다가 공비대신에 문자 써도 성립하던데?

3) 어? 근데 문자 옆에 계수 쓰면 그 계수를 공비로 가지는 등비수열이 나와

4) 지금 이건 등비급수 공식을 가지고 계수가 등비수열을 나타내는걸 만들어낸거나 마찬가지네?

5) 여기서 등비수열을 또 일반항 $ a_n $으로도 표현할 수 있잖아?

6) 그렇다면 일반항 $ a_n $에 대해서 표시가 된다면, 아무 수열이나 다 쓸수있는거아냐?

7) 어? 그럼 '나도모르는 공식' 무언가는 계수가 'ㅁㄴㅇㄹ'수열을 나타낼 수도 있지 않을까?

8) 6번 7번을 섞어서 생각해보면, 'ㅁㄴㅇㄹ'수열을 넣고 계산해서 어떤 특정한 공식이 나온다면 그게 바로 그 수열의 '공식'이네!?

9) 반대로 이 공식을 $ a_n $으로 표시할 수 있으면, 이게 바로 그 수열의 일반항이 되는건가아아아아아아!!!!

 

한번 더 검토하고는 '유레카!'를 외치며, 그들은 자신들이 맞았음을 확신하고는 이내 계수에 온갖 수열을 다 넣어봅니다.

 

가장 간단한 등차수열도 넣어봅니다.

 

등차수열의 일반항은 다음과 같습니다.

$ a_n = a + (n-1)d \quad (n \ge 1) $

보통은 수열의 첫 항을 1항이라고 표시해서 이런 식이 나오는데, 그냥 첫 항을 0이라고 놔버리면 수식은 좀 더 간단해집니다.

$ a_n = a + nd \quad (n \ge 0) $

 

아까 우항을 아래와 같이 표기할 수 있다고 그랬습니다.

$ \sum\limits_{n=0}^{\infty} a_n x^n $

여기다 등차수열의 일반항을 대입해보면

$ \sum\limits_{n=0}^{\infty} \left(a + nd\right) x^n $

이렇게 될 겁니다.

근데 여기서 이 친구는 우항이었죠?

 

좌항은 '분명히 무슨 공식이 있을텐데...?'수준입니다. 그래서 그냥 '수식 비스므리한 무언가'라고 $ A(x) $라고 써주겠습니다.

그렇다면 완성된 수식은

$ A(x) = \sum\limits_{n=0}^{\infty} \left(a + nd\right) x^n $

사실상 급수수식

$ \frac{1}{1-rx} = \sum\limits_{n=0}^{\infty} r^n x^n $

과 다를바가 없습니다.(수식의 비슷한 정도를 위해 문자 x로 바꾼 버전으로 썼습니다)

다른점이라면 등비수열 수식은 이미 우리가 등비급수 수식을 통해 유도해 내려오면서 좌변을 알 뿐이고, 등차수열은 좌변을 모르니까 A(x)라고 놨을 뿐이죠.

 

개념 포스팅이니 자세한 유도는 생략하겠습니다만, 결국 풀어보면

$ A(x) = \frac{a}{1 - x} + \frac{d\,x}{(1 - x)^2} $

이렇게 됩니다. 결론은 '우리가 뭔지 몰라서 A(x)로 놨던 수식은 사실은 $ \frac{a}{1 - x} + \frac{d\,x}{(1 - x)^2} $ 였어~'

라는 뜻입니다.

 

그리고 이걸

$ \frac{1}{1-rx} = \sum\limits_{n=0}^{\infty} r^n x^n $

요런식으로 표현해보면

$ \frac{a}{1 - x} + \frac{d\,x}{(1 - x)^2} = \sum\limits_{n=0}^{\infty} \left(a + nd\right) x^n $

 

즉, 등차수열을 계수로 가지는 급수는 좌항과 같은 '단 하나의 수식'으로 표현 가능하대요~ 라는 의미가 되죠.

어머 이게 풀려버렸습니다. 등차수열이 또 단 하나의 수식으로 표현되어버립니다.

 

"와 미쳤다. 우효~ 이거 우리가 어마어마한걸 발견해버린거 아니냐고~~😱🔍"

 

수학자들은 신이났습니다.

그리곤 진짜 별의 별 수열들을 다 넣어보는데.... 어머나.. 모두다 단 하나의 수식으로 압축이 되어버리는거있죠~~~

이렇게 수열을 하나의 수식으로 다 표현할 수 있게 되자, 수학자들은 이 놀라운 방식을 아예 이름을 붙이기로 합니다.

거기다 왠지 '거창한 이름'을 지어주고 싶어졌죠.

 

 

5. 너의 이름은 생성함수니라~

그래서 이름도 아주 거창하게 '생성함수(generating function)'라고 지어버립니다.

처음 듣는 사람 아주 기죽게말이죠..

그러나 실상은 별거없어요.

  • '생성' : 아 이걸로 무한한 수열을 만들어 낼 수(생성할 수) 있어~
  • '함수' : 아 수식 비스므리한거니까 함수야~ 그리고 우항이 x의 거듭제곱으로 표현되어버려서 미적분이나 덧셈, 뺄셈, 곱셈, 나눗셈 등등 함수처럼 다룰 수 있어~ 그러니까 좌항 너는 이제부터 함수여~

라서 그냥 생성함수입니다.

그리고 좌항에 하나의 수식으로 표현되는 부분은 생성함수라고 이름 붙여줬으니, 우항에 x의 거듭제곱이 덧셈으로 연결되어있는 이 부분을 "그래 너네는 거듭제곱이 계속 더해지니까 '거듭제곱 급수' 혹은 거듭제곱이 계속 나오니까 power(거듭제곱) series(나열)라고 불러주마"라고 해버렸습니다. 한자로 거듭제곱이 '멱'이라서 멱급수라고도 하죠.

 

 

6. 모일 모처에서는...

동시에 다른곳에서는 다른 수학자들이 다른 고민을 하고 있었습니다.

 

"'초월함수(transcendental function)'가 너무 어려워!!! 크악!!!"

 

여기서 초월함수란, '유한한' 다항식의 합으로 표현가능한 대수적 함수를 '초월(transcendental)'했다는 뜻에서 붙인 함수에요. 말 그대로 $ e^x $, sin x, ln x 등을 말하는 거죠.

 

수학자들은 이 초월함수를 어떻게든 대수적 함수(유한 개의 다항식의 합으로 나타낼 수 있는 함수)로 나타내보려했으나 모두 실패했답니다... 그리고는 '초월함수'란 이름을 붙이고 백기를 들...려고 했으나! 일부 수학자가 이를 벅벅 갈면서

"너가 초월함수면 다야? 너가 어디 다항함수로 '근사'까지 할 수 없나 보자!"

라며 이 초월함수를 다항식으로 비슷하게 만들어보려고 애씁니다.

그리고 결국 '무한한' 다항식의 합. 바로 급수로 이 초월함수를 근사해 내는데 마침내 성공합니다.(테일러 급수(Taylor series), 매클로린 급수(Maclaurin series) 등)

정말 집념이 대단합니다.

 

그런데, 이 급수... 잘 보면 '무한한 다항식의 합' 즉, x의 거듭제곱의 합으로 표현이 됩니다. 그래서 이 수학자들은 여기에 '멱급수(power series)'라고 이름을 붙였죠. 영어 그대로 보자면 power 힘!이 아니라 거듭제곱!의 series 연속 이란 뜻이죠.

그런데 이거.... 어디서 본거 같지 않나요?

 

 

7. 대충돌

네, '수열의 압축법' 즉, 생성함수를 찾아낸 쪽도 x의 거듭제곱의 합으로 수열을 나타내고, 초월함수를 근사하는 방법을 찾아낸 쪽도 x의 거듭제곱의 합으로 함수를 근사합니다.

이제 이 둘이 옥신각신 싸웁니다.

 

누가 먼저냐...는건 관심도 없고, 이거 용어를 뭐라할지 싸웁니다.

서로 같은 용어를 쓰면 이게 생성함수에서 사용하는건지, 함수근사에서 사용하는건지 헛갈리잖아요?

그래서 결국 우여곡절 끝에 양측이 합의를 합니다.

 

초월함수측: 잘 보니까 우리 x의 사용법에 차이가 있는 것 같다. 우리는 x에 실제 값을 대입해서 함수처럼 쓴다. 그러니까 초월함수를 근사할 수 있지.

생성함수측: 그래 맞아. 우리는 x를 그냥 '문자'이자 그 거듭제곱이 '몇 번째인지'를 알려주는 색인으로만 쓰지 직접 값을 대입하지 않는다. 그러면 너네들이 진짜 값을 대입하니까 '멱급수(power series)'는 니네가 가져라.

초월함수측: 먼저 그렇게 선뜻 내주다니 고마운걸? 그럼 우리는 더 멋있는 이름을 지어주마. 아주 엘레강스하고 포멀하게~ 너네는 x를 실제 값으로 안쓰고 '형식적'으로 쓰니까 형식적 멱급수(formal power series)라고 붙여주마

생성함수측: 오우 왕년에 이름 쫌 지어보셨나봐?

양측: 호호호 오호호

 

뭐 실제로 이랬는지는 알 수 없지만... 어찌됐든 이러한 이유로 생성함수에서 사용하는 멱급수는 형식적 멱급수, 즉 x 자체에 특정 값을 대입하는 해석적 방식이 아닌 그냥 자리만 표기해주는 형식적 방식이 된 것입니다.

 

 

8. 결론

그래서 생성함수란 무엇이냐 하면,

1) 무한한 수열을 단 하나의 수식으로 압축시킨 것
2) 그러나 여기서 x는 형식적(색인같은)일 뿐 어떤 값을 가지진 않는다.

요 두가지로 표현할 수 있겠습니다. 

 

 

9. 더 나아가기

여기서 위에서 살짝 언급이 되었던 부분이 있습니다.

 

"일반항을 넣고 계산해서 생성함수를 알 수 있었으면, 반대로 생성함수를 알면 일반항을 알 수 있겠네?"

 

라는 구절이 있었죠.(뭐 물론 토시하나 안틀리고 저렇게 나오진 않았습니다만..)

네, 바로 이부분이 "계수추출"이라고 불리는 부분인데...

보통 수열은 처음부터 일반항이 정의가 되는데, 처음부터 일반항이 정의되지 않은 수열 이를테면 점화식으로만 정의되는 수열 같은 경우에많이 쓰는 개념입니다.

 

위에서 따라 내려왔던 일반항->생성함수 보다는, 생성함수->일반항(계수추출)을 주로 쓰게 되는데요.

1) 점화식으로 정의된 수열을 멱급수로 나타내고(우항의 형식으로 표현하고) 이를 계산해서 생성함수를 알아냅니다.

2) 그리고 그 생성함수를 가지고 반대로 일반항을 찾아냅니다.

즉, [점화식->멱급수의 계수로 대입(우항 스타일)->생성함수 찾아내기(우항으로 좌항 스타일 찾기)->일반항 찾아내기(계수추출:생성함수에서 일반항 찾기)]의 구조를 가진답니다.

결국 생성함수로 '압축!'했다가 '변형풀기!'한거죠.

 

 

10. 마무리

결국 생성함수는 수학자들이 수열을 다루는 방식에 큰 전환을 가져온 도구입니다.

무한한 수열을 단 하나의 수식으로 압축할 수 있다는 것만으로도 놀랍지만, 그 수식을 조작함으로써 일반항을 찾아내고 점화식을 해석할 수 있다는 점은 더욱 강력하죠.

이제 우리는 단순히 수열을 나열하는 것이 아니라, 수열을 '다룰 수 있는' 시대에 들어선 것입니다.

 

어떻게 최대한 수식사용을 지양하고 개념설명에 충실하려 노력했습니다만... 조금 이해가 되셨을지 모르겠습니다.

 

뭐라고 끝내야하지... 우리존재 화이팅요!💪📚

반응형

+ Recent posts