제목: 수학이 필요한 순간
부제: 인간은 얼마나 깊게 생각할 수 있는가
저자: 김민형
솔직히 제목보다는 부제에 끌려서 산 책이다. 모든 학문은 철학으로 수렴한다고 했던가? 인문학의 정점은 철학이고, 이공계의 정점은 수학이라 들었다. 그리고 그 학문은 서로 통한다고 들었다. 과연 그 말이 맞는지 궁금해서 읽기 시작했다.
저자는 수학을 어려워 하는 사람들에게 쉽게 수학게 접할 수 있게, 그리고 더 나아가서 수학은 결국 삶을 사고하는 방식이라는 것을 이야기 하기 위해 이 책을 썼다고 한다.
과연 그 목적을 이루었을까? 결론부터 말하자면 미안하지만 조금은 실패한 것 같다. 책의 시작은 좋다. "수학은 무엇인가?", "역사를 바꾼 3가지 수학적 발견", "확률론의 선과 악"에서는 아주 쉽게 수학이 이 세상에서 가지는 위치가 무엇인지를 쉽게 설명한다. 대화 형식으로 쓰여져서 마치 아리스토텔레스, 플라톤과 같이 제자가 스승에게 질의 응답을 하는 형태로 쓰여졌다. 그래서 그런지 초반에는 쉽게 주제에 접근하고 이해하기 쉽게 수학에 대해 다른 학문과 엮여서 설명이 되기에 흥미롭게 접근할 수 있다.
그런데 뒤로 갈 수록, 그 대화를 하는 제자가 더 이상 나를 대변하는 제자가 아닌 것이 느껴지기 시작한다. 마치 이미 대본을 써 놓은 듯, 나였다면 하지 못했을 질문들을 하기 시작하며 괴리감이 느껴져간다. 마치 학부생이 아닌, 석사 아니, 박사 과정의 제자와 함께 대화를 하면서 독자인 나는 살짝 뒤로 밀려나고 나 보다 더 뛰어난 두 사람의 대화를 그냥 옆에서 듣는 느낌이 강하다.
하지만 수학에서 출발한 이야기가, 물리학, 생물학, 철학, 심지어 정치까지 이어지며 이야기가 전개되는 것은 지적인 충족감을 만족시킨다. 하지만 그것도 계속 수식과 논리학으로 이어지면 나의 정신은 점점 책에서 가출한다. 책을 읽고 있지만 정신은 다른데로 팔리는데 이것이 책이 의도한 바라면 칭찬을 하겠지만 다른 곳으로 정신이 팔리는게 어릴 적 수학을 배우면서 머얼리, 정신이 팔리는 것과 다르지 않아 책의 후반부는 조금은 아쉽다.
저자가 목표한 것 처럼, 쉽게 수학, 아니 수학적 사고방식을 전달하고자 했다면 뒷 부분에서 조금은 더 쉽게 접근 할 수 있는 방법을 제시하는 것이 좋았을 것 같다. 하지만, 이보다 더 쉽게 풀 수 없었을 것 같다는 생각도 든다.
그냥 수학을 왜 내가 공부해야 하지? 라는 생각이 든다면 한번 쯤 읽어보면 좋을 것 같다. 결국 모든 학문은 수학적으로 증명해야 그 학문이 견고하다는 믿음을 줄 수 있을 것 같아 보인다. 결국, 수학은 내가 무슨 학문을 하든, 그 학문이 범용적으로 쓰임새가 있다는 것을 증명하기 위해 필요해 보인다. 그것이 경제가 되었든, 정치가 되었든 말이다.
2019년 1월 13일 일요일
2019년 1월 6일 일요일
[독서] 빅데이터 시대, 「데이터 분석의 힘」
올해 첫 독서로 고른 책은 이토 고이치로의 「데이터 분석의 힘」이라는 책이다. 빅데이터가 유행하면서 수 많은 데이터 분석 책이 나왔는데 내가 이 책을 골랐던 이유는 이 책의 부제 때문이었다. "그 많은 숫자들은 어떻게 전략이 되는가" 요즘 회사에서 새로운 솔루션 기획을 하며 데이터 분석의 필요성이 있던 터라 한번 읽어보자는 가벼운 생각에 읽기 시작했다.
이책의 장점이자 저자가 밝힌 목표는 수식 없이 데이터 분석을 이야기한다는 사실이다. 데이터 분석에 필연적으로 따라오는 것이 통계적 분석 기법이며, 이 통계적 분석을 위해서는 아주 간단하게라도 수학 공식이 따라오게 되는데 이 책에서는 거의 공식이 등장하지 않는다. 공식이 나오더라도 X가 Y에 비례한다 정도로 언급되기 때문에 숫자나 공식에 알러지가 있는 사람들이 읽기에 적합하다.
하지만 그래서 그런지 사례를 분석할 때 왜 그렇게 나올 수 밖에 없는지 구체적인 이유를 알고 싶을 수 있지만 그 수준까지 내려가지는 않는다. 다행이 저자가 책 뒷쪽에 부록으로 "더 알고 싶은 이들을 위한 참고도서" 정도는 제시하고 있어서 더 궁금한 사람들은 그 책들을 참고하면 되지만, 솔직히 추천 하는 책들은 거의 논문 수준이거나 대학교 교재 같은 책들이라 조금 아쉽다.
본문의 내용은 크게 데이터 분석 기법 중 "인과관계"를 분석할 수 있는 방법들을 설명한다. 데이터를 분석하면서 "상관관계"가 존재한다고 반드시 그것이 "인과관계"가 될 수 없다는 사실을 매우 강조하며 이러한 "상관관계"가 "인과관계"가 되기 위한 조건이나 분석 방법을 말해준다. RCT(Randomized Controlled Trial) 분석, RD디자인(Regression Discontinuity Design), 집군분석(Bunching Analysis), 패널 데이터 분석(Panel Data Method)를 한 장(Chapter)씩 할애하여 설명한다. 각 장에서는 실제 저자가 참여했던 데이터 분석 사례들을 제시하고 어떤 식으로 분석을 했는지를 설명하고, 각 장의 마지막에는 해당 분석 기법의 장점과 제약사항, 단점을 설명하는 패턴으로 이루어져있다.
이 책을 읽으면서 든 생각은 작년에 회사 내부 MBA 과정 중 하나였던 마케팅 분석에서 배운 데이터 분석을 공부하기 전에 이 책을 먼저 읽었으면 좋았을 것 같다는 생각을 했다. MBA 과정에서 데이터 분석은 기본적인 내용 보다는 갑자기 분석으로 넘어가버려 내가 분석을 배우면서도 왜 이런식으로 분석을 해야하는지 내 나름대로 깨우쳐야 했는데 이 책을 먼저 읽었더라면 더 쉽게 접근하고, 더 쉽게 이해하고 더 흥미롭게 공부할 수 있었을 텐데 그 부분이 아쉽다.
결국은 데이터를 수집할 때 어떠한 데이터를 수집하느냐 부터 출발을 해야 하고, 그러기 위해서는 데이터 분석을 통해 무엇을 얻을 것인지가 명확하게 들어나있지 않으면 시작부터 잘못 될 수 있기에 초기에 목표를 분명하게 하는 것이 중요하다 하겠다.
참고로 이런식으로 무언가 새로운 기술, 또는 기존에 있던 기술이라도 일반인들이 쉽게 읽을 수 있도록 접근하는 책들을 보면 대부분 저자가 일본인이다. 물론 우리나라도 기초과학 분야에서 이런 시도들이 많이 일어나고 있지만 조금 더 저변이 확대되면 좋겠다는 생각을 해본다.
이책의 장점이자 저자가 밝힌 목표는 수식 없이 데이터 분석을 이야기한다는 사실이다. 데이터 분석에 필연적으로 따라오는 것이 통계적 분석 기법이며, 이 통계적 분석을 위해서는 아주 간단하게라도 수학 공식이 따라오게 되는데 이 책에서는 거의 공식이 등장하지 않는다. 공식이 나오더라도 X가 Y에 비례한다 정도로 언급되기 때문에 숫자나 공식에 알러지가 있는 사람들이 읽기에 적합하다.
하지만 그래서 그런지 사례를 분석할 때 왜 그렇게 나올 수 밖에 없는지 구체적인 이유를 알고 싶을 수 있지만 그 수준까지 내려가지는 않는다. 다행이 저자가 책 뒷쪽에 부록으로 "더 알고 싶은 이들을 위한 참고도서" 정도는 제시하고 있어서 더 궁금한 사람들은 그 책들을 참고하면 되지만, 솔직히 추천 하는 책들은 거의 논문 수준이거나 대학교 교재 같은 책들이라 조금 아쉽다.
본문의 내용은 크게 데이터 분석 기법 중 "인과관계"를 분석할 수 있는 방법들을 설명한다. 데이터를 분석하면서 "상관관계"가 존재한다고 반드시 그것이 "인과관계"가 될 수 없다는 사실을 매우 강조하며 이러한 "상관관계"가 "인과관계"가 되기 위한 조건이나 분석 방법을 말해준다. RCT(Randomized Controlled Trial) 분석, RD디자인(Regression Discontinuity Design), 집군분석(Bunching Analysis), 패널 데이터 분석(Panel Data Method)를 한 장(Chapter)씩 할애하여 설명한다. 각 장에서는 실제 저자가 참여했던 데이터 분석 사례들을 제시하고 어떤 식으로 분석을 했는지를 설명하고, 각 장의 마지막에는 해당 분석 기법의 장점과 제약사항, 단점을 설명하는 패턴으로 이루어져있다.
이 책을 읽으면서 든 생각은 작년에 회사 내부 MBA 과정 중 하나였던 마케팅 분석에서 배운 데이터 분석을 공부하기 전에 이 책을 먼저 읽었으면 좋았을 것 같다는 생각을 했다. MBA 과정에서 데이터 분석은 기본적인 내용 보다는 갑자기 분석으로 넘어가버려 내가 분석을 배우면서도 왜 이런식으로 분석을 해야하는지 내 나름대로 깨우쳐야 했는데 이 책을 먼저 읽었더라면 더 쉽게 접근하고, 더 쉽게 이해하고 더 흥미롭게 공부할 수 있었을 텐데 그 부분이 아쉽다.
결국은 데이터를 수집할 때 어떠한 데이터를 수집하느냐 부터 출발을 해야 하고, 그러기 위해서는 데이터 분석을 통해 무엇을 얻을 것인지가 명확하게 들어나있지 않으면 시작부터 잘못 될 수 있기에 초기에 목표를 분명하게 하는 것이 중요하다 하겠다.
참고로 이런식으로 무언가 새로운 기술, 또는 기존에 있던 기술이라도 일반인들이 쉽게 읽을 수 있도록 접근하는 책들을 보면 대부분 저자가 일본인이다. 물론 우리나라도 기초과학 분야에서 이런 시도들이 많이 일어나고 있지만 조금 더 저변이 확대되면 좋겠다는 생각을 해본다.
2019년 1월 3일 목요일
AWS 자격증 공부로 인한 세뇌
아직 AWS Security 자격증 후기를 작성하지 않았는데, 그 전에 공부하면서 느꼈던 다른 생각을 잠시 공유해본다. 처음에는 업무상 요즘 클라우드 보안과 관련된 요구가 많아 개인적으로 공부를 하면서 기왕에 공부하는거 뭔가 남기기라도 하자라는 생각으로 자격증 공부까지 하게 되었다.
그래서 별 생각 없이 공부를 하다가 어느날 문득 업무 회의 중 나도 모르게 AWS 입장을 내가 대변하고 있다는 사실을 깨닫게 된다. 아니! 내가 왜? 곰곰히 생각해보니 이 자격증 준비가 나의 생각과 사상을 서서히 변화시키고 있었던것이다! (이걸 느끼고 살짝 소름이 돋았다.)
이 기법(?)을 외국 기업들이 많이 활용하고, 특히 플랫폼 기업들이 많이 사용하게 된다. 일반적으로 플랫폼 기업들은 자신의 플랫폼에 많은 개발자들을 끌어들이고, 자신의 플랫폼에서 더 많은 상호작용이 일어날 수 있도록 생태계를 만들게 된다. 플랫폼을 가진 기업은 그 기업 자체가 모든 기능을 최종 고격에게 제공하기 어려우므로 3rd Party 들이 가능한 많이 참여해야만 한다. 많은 고객이 확보되면 그 고객을 타겟으로 하는 3rd Party 제품들이 많이 나오고, 그러한 제품들이 많은 곳으로 더 많은 고객이 모여들고, 이런 선순환을 이루는 것이 목표다.
이런 선순환을 가져가기 위해 3rd Party들이 자신의 플랫폼에 쉽게 적응하고 그들 만의 Value Chain, 즉 생태계를 만들어야 하는데 그것을 지원하기 위한 수단중 하나가 바로 교육이고, 그 교육 체계를 조금 더 세련되게 다듬은게 자격증 제도라고 생각한다. 이러한 자격증 제도로 3rd Party 들이 플랫폼 소유자와 무관하게 그들만의 Value Chain을 그 플랫폼 전문가들을 활용하여 만들어 나갈 수 있게 된다. (게다가 자격증 제도는 그것 자체로 돈도 벌 수 있다! 물론 수익보다는 그 제도를 운영하기 위한 비용이기는 하겠지만)
그런데 이런 자격증 제도와 나의 AWS에 대한 사상의 변화가 무슨 상관일까? 예를 들면, AWS 자격증 시험 내용 중 매우 중요한 영역 중에 하나가 AWS와 고객의 책임 소재와 관련된 내용이다. 이 내용은 AWS Cloud Practitioner 자격증 뿐만 아니라 AWS Security Specialty 자격증 시험에도 출제가 되는 내용이다. 흔히 "Shared Responsibility Model" (공유 책임 모델)로 표현되는데 어디까지가 AWS의 책임이고, 어디까지가 고객의 책임인지를 반복해서 학습시킨다.
나는 분명 고객의 입장임에도, 자격증 공부를 하다보면 나도 모르는 사이 자연스럽게 "아, 여기까지는 AWS의 책임은 아니지, 그렇고 말고"라는 생각이 떠오르게 된다. 이게 잘못되었다는 것은 아니지만 세상에 AWS 편인 사람이 한 명 더 탄생하게 되는거다. 그것도 적진 한 가운데 내 편이 떡하니 생기는 것과 다름 없다.
그리고 Security 자격 시험에서는 반복적으로 기밀정보, 핵심비밀, 민감한 정보를 AWS에 올려서 서비스를 할 때 보호대책들에 대해서 묻곤 하는데, 이는 여태까지 국내외에서 Public Cloud 서비스를 꺼려했던 이유중 가장 큰 이유인 기업 밖으로 중요정보를 전송하는, 즉 퍼블릭 클라우드에 기업정보를 이전하는데 대한 막연한 두려움을 아예 없는 샘 치고, 한 단계를 건너 뛰어서 이미 AWS 서비스를 이용하고 있다는 가정하에 보호대책들을 제시하도록 한다는 것이다. 별거 아닌 것 같지만 이렇게 학습하고 공부한 사람은 AWS의 보호대책 틀 안에서 사고를 하게 된다. 어떻게 하면 더 나은 보안 수준을 제공할 수 있을 것이냐? 이 고민을 AWS 서비스를 이용해서 어떻게 구현 할 것인가로 조금 더 좁혀진 시야로 바라보게 된다.
여튼 이렇게 내 사고의 전환 과정을 실제 느껴보니 더 무섭다는 생각이 들면서도, 다른 한 편으로는 뭐 기왕 이렇게 된거 그냥 AWS에 다 맡겨버리면 편하겠네라는 생각이 들기도 한다. 이렇게 불과 몇 개월 사이에 Public Cloud를 바라보는 관점이 변하게 되는 이유는 내가 자발적이고 적극적으로 그 사상을 학습했기 때문이라고 생각한다.
한편으로 안타까운 것은, 이러한 플랫폼을 다루는 기업이 국내에는 그다지 많지 않다는 것이다. 물론 다음, 네이버 등 메이저 포탈 사들이 있고 실제 네이버는 네이버 클라우드 플랫폼 관련 자격증도 있긴 있다. (https://www.ncloud.com/support/certExam 아직 오픈 전이며 19년 초에 오픈 예정이라고 함) 하지만 그 플랫폼 생태계를 꾸려나가는데 있어 조금 더 노력이 필요하다.
답은 쉽다. 해당 플랫폼에서 대박나는 3rd Party 제품이 있으면 된다. 아주 머언 옛날, 카카오 게임에서 대박을 쳤던 "드래곤 플라이트"라는 게임이 출시된 후 그 게임이 카카오 게임에서 벌어들인 수익이 회자되던 때가 있었다. 그 대박 소문 뒤에 카카오 게임에서 수 많은 게임들이 출시되기 시작했고, 게임 개발사 & 개발자들은 카카오 게임 플랫폼으로 몰려 갔었다. (이는 아이폰 출시 후 앱스토에서 대박을 터트린 앱들 덕분에 수 많은 개발자들이 앱스토어로 달려간것과 같다.)
글이 좀 옆길로 새긴 했는데, 결론은 외국 기업의 플랫폼 생태계 전략은 두렵다 정도로 마무리 하겠다.
2019년 1월 1일 화요일
2018년 책 읽기 정리
올해는 전체적으로 60권 책읽기 목표는 달성했다. 과거에는 매년 100권씩 읽기를 목표로 세우고 실패하기를 반복하다가 2018년은 현실적인 목표로 매달 5권씩, 12개월 동안 5 * 12 = 60 권 읽기로 목표를 하향 조절했었다.
그런데 실제 목표를 달성하는 과정에서는 아쉬움이 많이 남는다. 매달 5권 씩 꾸준히 읽을 생각이었는데 연 초에 생각보다 많이 읽기 시작해서 60권 초과 달성을 당연시하다보니 연말에 가서 마음이 풀어졌는지 10월, 11월에는 단 한권도 읽지 못했다.
물론 회사 업무가 그 때 조금 집중되어 있긴 했지만 아예 한 권도 읽지 않았다는 것은 변명의 여지가 없다. 초심을 유지하는 것이 이렇게 힘든 일일줄이야... 그나마 다행이었던 것은 여름 휴가 때 많은 책들을 읽을 수 있었다는 것 정도로 위안을 삼아본다.
2019년에는 수량 측면에서는 이정도 목표(60권)를 유지하고 대신 책을 읽고 그 책이 나에게 정말 스며들도록 독후감을 쓰던지, 리뷰를 작성하던지, 그것도 아니면 책을 읽기 전과 후를 비교하는 글을 쓰던지 해서 조금 더 기억에 남길 수 있도록 방향을 잡아야겠다.
책 정리의 기술? 관련하여 많은 글들을 읽어 보았지만 중요한건 실천이라 내가 실천할 수 있는 작은 것들을 찾아보는 한 해가 될 것 같다.
※ 책읽기 앱은 "책꽂이+"
그런데 실제 목표를 달성하는 과정에서는 아쉬움이 많이 남는다. 매달 5권 씩 꾸준히 읽을 생각이었는데 연 초에 생각보다 많이 읽기 시작해서 60권 초과 달성을 당연시하다보니 연말에 가서 마음이 풀어졌는지 10월, 11월에는 단 한권도 읽지 못했다.
물론 회사 업무가 그 때 조금 집중되어 있긴 했지만 아예 한 권도 읽지 않았다는 것은 변명의 여지가 없다. 초심을 유지하는 것이 이렇게 힘든 일일줄이야... 그나마 다행이었던 것은 여름 휴가 때 많은 책들을 읽을 수 있었다는 것 정도로 위안을 삼아본다.
2019년에는 수량 측면에서는 이정도 목표(60권)를 유지하고 대신 책을 읽고 그 책이 나에게 정말 스며들도록 독후감을 쓰던지, 리뷰를 작성하던지, 그것도 아니면 책을 읽기 전과 후를 비교하는 글을 쓰던지 해서 조금 더 기억에 남길 수 있도록 방향을 잡아야겠다.
책 정리의 기술? 관련하여 많은 글들을 읽어 보았지만 중요한건 실천이라 내가 실천할 수 있는 작은 것들을 찾아보는 한 해가 될 것 같다.
피드 구독하기:
글 (Atom)