‘자연 과학에서 가장 중요한 기본 법칙과 사실은 모두 발견되었다.’

1894년 미국의 물리학자 마이컬슨(1907년 노벨물리학상 수상자)은 이렇게 말했다고 한다. 하지만 이 말은 뒤이을 ‘현대 물리학의 혁명’이라는 20세기 초 물리학의 압도적인 발전으로 완전히 틀린 말이 되었다.
이 현대 물리학의 혁명이란 바로 상대성이론과 양자물리학의 태동이다. 양자역학의 시발점이 된 막스 플랑크의 플랑크 상수의 발견과 공간과 시간이 완전히 재편된 아인슈타인의 상대성이론을 시작으로, 하이젠베르크의 불확정성 원리와 슈뢰딩거의 방정식으로 정립된 양자역학의 발전은 뉴턴식 과학적 결정론으로 치부되는 고전물리학의 관념을 폐기시켰다. 이에 더해 폴 디랙이 상대론의 원리와 양자역학이 서로 연관되도록 재구성을 하였고, 뒤이어 리처드 파인만등의 과학자들의 연구로 상대론적 양자장론은 현재와 같은 완전한 경지에 이르렀다. 이러한 상대론과 양자론의 융합은 뒤이을 기본입자의 발견에 초석이 됨으로써 지난 120년간 물리학의 발전은 그야말로 쉼 없이 진행되어왔다...(출판사 서평 중)

 

— 옮긴이의 말 from <딥 다운 씽즈> —

바야흐로 데이터로 호흡하는 시대입니다. 데이터는 공기처럼, 그만큼 일상 환경을 늘 에워싸고 있어 중요하다는 아우성으로 귀에 딱지가 앉을 정도지만, 한편 잘 보이지도 않습니다. 안 보이는 데이터 속에서 볼 수 있는 무엇인가를 찾아 나서는 물결은 갈수록 거셀 것입니다. 보이는 것이 다가 아니라는 사실은 누구나 잘 아니까요. 다가 아닌 그 무엇 중 아마도 사람의 마음을 읽어 내는 데 대다수의 관심이 큰 편이겠지만, 그에 못지않은 열정과 투혼, 호기심으로 자연의, 가장 깊은 세상의 마음을 읽어 내는 데 몰입하는 수많은 주연과 조연의 이야기가, 바로 여기서 드라마틱하게 전개됩니다. 데이터만 넘치도록 많다고 해서, 또 이를 다루는 기술을 개발한다고 해서, 그 알아내고 싶은 마음이 쉽게 저절로 드러나지도 않으니 궁금증은 더해만 갑니다. 이런 궁금증에 휩싸이다 보면 수학과 기초과학이란 비범한 소수의 ‘덕질’만은 아니라는 친근감으로 어느덧 기분이 포근해질 수도 있습니다.

 

이 이야기는 빅 데이터 세상을 앞당긴 개척자들의 역사기도 합니다. CERN에서 지금의 소셜 미디어와 플랫폼 시대 등을 촉발한 원류적 계기가 된 (월드 와이드) 웹이 탄생한 배경이 본문에도 나오지만, 너무 큰 나머지 아예 토목구조물이라 칭해야 어울릴 입자가속기의 둘레가 27km에 이르는 등 몇몇 기준으로 지상에서 가장 큰 조직인 CERN은 빅 데이터 ‘비즈니스’의 성공을 추구하는 (비)영리 주체들의 영원한 효시 또는 모범적인 사례연구 대상이겠습니다. CERN이 물리학, 그것도 입자물리학 연구소라 하니, 우리가 일상(가령, 병원 등)에서 혜택을 누리는, 그리고 끊임없이 한계를 초월하며 미래 변화를 선도하게 하는 첨단 기술들의 산실이라는 사실은 무척 생소할지도 모르겠습니다.

 

CERN은 프랑스어의 약어로 “Conseil Européen pour la Recherche Nucléaire”를 나타내는데 영어로는 European Council (또는 Organization) for Nuclear Research에 해당합니다. (원자)핵 연구를 위한 유럽의 비영리 기구라는 뜻으로 채택된 명명은 CERN이 탄생할 1950년대 당시에는 물리학계 연구의 미시적 수준이 원자핵보다 더 깊이 들어가기 어려웠던 영향입니다(1970년대 핵무기 개발을 불세출한 이휘소와 같은 입자물리학자가 주도했다는, 맹랑하게 와전된 신화는 적어도 CERN의 탄생 전 맨해튼 프로젝트 시절까지만이라도 돌아가야 미미하게나마 말이 될 법합니다). CERN의 발족에는 제2차 세계대전 중 시작된 유럽의 두뇌 유출을 막을 목적, 그리고 과학자들의 비군사적 순수 연구를 구심점으로 하여 전후 유럽이 하나되었으면 하는 평화적 기대도 수반되었습니다. 오늘날까지도 이 약어는 상징처럼 굳어져 그대로 쓰이지만 흔하게는 유럽입자물리학연구소(European Laboratory for Particle Physics)로 통합니다. 

 

CERN의 LHC와 같은 가속기는 입자물리학 실험용이지만 거대한 첨단 스마트 데이터 팩토리입니다. LHC는 스몰하기로도, 빅하기로도, 정밀하기로도 최고인 실재들이 살아 움직이는 환경입니다. 정교한 운영과 분석을 위해서는 주변의 제네바 호수 수위, 제네바로 드나드는 TGV의 시간표까지도 고려되니까요. CERN에서 고단하면서도 신나게 활동하는 과학자, 공학자, 기술자들은 각자 전문 분야에서 발군의 역량을 갖춘 인재들이며 그 가운데서도 특히 (입자)물리학자들은 과학적 지식과 기술, 사고 체계로 단련되어 있는 동시에, 방대한 데이터를 피상적 수준 너머로 다루는 데 필요한, 가령, 머신 러닝이나 데이터 마이닝 알고리즘의 이해도와 구현, 협업을 위한 커뮤니케이션 능력 등의 실용적 전문성에서도, 학자인지 개발자인지 구분이 어려울 만큼 남다릅니다. 따라서 어떻게 이처럼 다재다능한 기술과 역량을 발휘하는 개개인이 있을 수 있을까, 하고 전형적인 인사(human resources) 관리나 정보기술(IT)의 역량 요소 관점에서는 과장이 심하다고 느껴질 수 있습니다. 

 

그렇지만 이는 장기간 실제 경험 속에서 조직되고 체득된바, 물리학적 문제를 해결하려면 일명 ‘빅 데이터’ 문제를 풀기 위한, 기존에 존재하지 않던 기술이나 해법도 연구·개발하지 않을 수 없음에, 결코 이상한 일은 아닙니다. 이처럼 민간이나 공공, 미디어에서 근래 들어 떠들썩해지기 오래 전부터 빅 사이언스적인 응용수학 또는 이·공학 분야에서 훨씬 앞서 시작된 흐름은 (종이와 연필만이 연구 수단인 일부 이론학자들을 제외한) 기초 연구자들이 자연스럽게 갖출 수밖에 없는 데이터 과학자 특유의 면모와 자질, 차별화된 경험으로 직결되지만, 어떤 까닭에서인지 (혹은 원조들은 굳이 데이터 과학이라는 꼬리표를 동원하지 않아서인지) 이런 비밀 아닌 비밀이 사회적으로 우리나라 산업계 등에서는 덜 알려진 영향으로 동떨어진 데서 적임자를 찾는 시행착오도 제법 잦은 듯합니다.

 

이는 입자물리학계에서 다년간 축적되는 고유한 역량과 기술, 태도, 시야 등을 지은이가 짚어 둔 대목에서 곱씹어 보더라도 어느 정도 짐작할 수 있습니다. 비즈니스, 연구 및 교육 등의 현장에서 데이터를 깊이 파헤치는 과학기술적 수요가 급증함에 따라 속속 신설되고 있는 전문대학원이나 관련 전공 프로그램, 사설 기업 교육처럼 단기 속성적인 인재 양성 경로 선택의 폭만 아무리 양적으로 팽창한들, 기존에 통했던 시각이나 접근으로는 인재 가뭄 현상이 금방 풀릴 수 있는 이슈가 아닙니다. 아무리 빼어난 인재들이 모인 공룡 기업에서라도 신입사원부터 대리까지 주니어 직급마저 데이터 ‘과학’자로 뽑겠다거나 그렇게 활약 중이라고 내세우기 급급한 발상은 야심적이다 못해 SF적이라 해야겠습니다. 누구나 알 만한 모 그룹의 수장께서 1~2년 안에 사내 데이터 과학자를 천 명 양성하겠다고 공언한 포부도 비현실적이기는 마찬가지입니다. 기업의 통상적인 인재개발 프레임이나 유수의 대학원을 통해 집중 훈련을 받더라도 하루아침에는 데이터 과학자만의 경쟁우위에 기반하여 현장의 가치를 창출할 수 있을 만큼 과학적, 비판적 사고력과 문제 해결 마인드가 함양되기 거의 불가능하기에 백화점식으로 특수한 몇몇 빅 데이터 기술이나 분석 도구, 방법론에 밝아진 정도만으로는, 시민 과학자와 직업 과학자가 엄연히 다르듯이 쟁쟁한 전문가 대열에 낄 수 없기 때문입니다. 

 

결국 데이터 과학이라는 불투명한 표현을 아예 안 쓰는 편이 안전하게 오해를 훨씬 더 줄이지 않을까, 하는 생각마저 듭니다. 데이터 과학이라는 말과 현상의 대홍수 속에서 막상은 오히려 과학의 전통과 본질이 흐려지거나 경시되는 바람에 데이터 과학이 아닌 것을 데이터 과학으로 오인한다면, 치열하고 살벌한 전장에 차고 나가는 칼이 실상과는 판이한데도 마치 엑스칼리버와 같은 명검이라고 착각하는 셈이랄까요. 그렇다면, 그 결과는 어떠할까요? 과학(자)의 역할과 특징에 대한 몰이해가 유례없이 심각한 위험이나 피해로 불거지는 시대입니다. 이에 입자물리학이라는 철두철미한 과학 연구의 무대를 통해 시대에 필요한 인재들이 어떻게 적절히 발굴되고 성장하는지 선명히 재인식되기를 기대합니다. 곳곳의 학교나 기업, 기관에서 초점과 본질이 흐트러진 교육이나 인재 영입, 양성과 배치, 조직 구성의 맹점에 빠지지 않음으로써 처참한 비용 낭비나 가치 훼손을 최소화하거나 반대로 실효성을 더욱 키울 혜안이 입자물리학 교양서를 관통하는 동안 전이될 수 있어도 좋겠습니다. 

 

본작에서는 입자가속기를 생성원(source)으로 하여 쏟아지는 빅 데이터의 실체와 이를 다루는 데 필요한 방법론, 선도적 기술이 상술되지는 않습니다. 시의적 관점에서 볼 때 입자물리학자들의 첨단 활동을, 아무도 해결해 본 적이 없던 기술적 난제들이 왜 발생했고 해결되어야만 했는지, 난관을 어떻게 돌파했는지 등을 아우르는 다채로운 실용적 측면이 생략되어 퍽 아쉬움으로 남기도 합니다. 물론 핵심이 되는 원론적 언급은 놓치지 않고 있어 더러 위로는 됨에도, 지은이의 이야기 솜씨라면 후속작에서 이런 세부 역시 더 널리 소개되기를 바라 마지않습니다. 더해 보자면, 요즘 급부상하는 머신 러닝 분야의 preprint(사전 논문)도 대거 몰리는 디지털 서고이자 배포 서버인 arXiv.org 역시, 원래는 입자물리학계의 격한 경쟁으로 기민한 소통이 절실해진 가운데 한 양자장론 학자의 착안으로 탄생, 개량되면서 심사 전 e-print 공유 문화가 경계 너머로도 활발해진 내막까지 말입니다.

 

불가피하게 테크놀로지 이야기로 흘렀습니다만, 이는 뭐니 뭐니 해도, 과학 연구 과정에서 필연적으로 잇따르는 측면입니다. 곧 그 중요한 핵심은 입자물리학에서 해결하고자 마주하는 문제들 자체겠습니다. 가령, (이젠 풀렸지만) 이론적인 힉스 보손이 실재하는가? 힉스의 질량은 실제로 얼마일까? 게이지 대칭의 남은 가능성은 어디까지일까? (지은이도 주제의 성격상 간단히만 언급하고 넘어간 입자물리학의 중대사 한 가지로) 중력은 왜 그렇게 황당무계할 정도로 약할 수밖에 없는가?

 

하여, 근본적 수수께끼들, 즉 어떤 입자들이 존재하는지, 그런 입자들이 어떤 원리나 법칙을 따르는지 실험으로 규명하려는 노력의 파노라마가 자아내는 고소한 묘미는 물론, 다양한 가설, 번뜩이는 반전의 상상으로 기존 통념이나 상식을 기상천외하게 깨트린 모델이나 이론을 만들어 가며 자연의 마음을 헤아리는 과정, 곧 과학적 사고와 문제 해결 방식의 진수를 맛보는 짜릿함에 빠지게 될 것입니다. 확고한 과학적 사고 체계의 확산은 데이터, 사실에 의거한 합리적 의사결정이 필요한 순간과 장면, 언제 어디서나 문·이과를 막론하고 가치가 크겠습니다. 바로 최대 다수가 행복해지는 지름길일 듯합니다.

 

더욱이 우주의 근본을 구성하는 입자들의 미시 세계에 깊이 들어가려면, 확률·통계적 사고를 거치지 않을 수 없어서 지은이의 스토리를 따라가다 보면 자연스럽고 아름답게 그 관점을 경험할 터라, 빅 데이터 시대에, 소위 제4차 산업혁명 시대에 꼭 필요하다는 교양과 사고 체계의 실속도 각자 처하신 일상에서 누릴 수 있다면 더 기쁘겠습니다. 아울러 팬데믹의 영향으로 변화와 불확실성이 더욱 극심해지는 속도에, 대세에 압도당하고 우왕좌왕하기보다는, 수학자들과 물리학자들이 역사적 스케일의 줏대와 끈기로 기본에 충실하며 변함없을 진리를 추구하는 활약상 속에서, 난세일수록 더 단단히 지켜 갈 가치들을 통찰하는 뜻깊은 경험을 향한 바람도 곁들입니다.

 

하지만, 이 모든 이야기를 뛰어넘는 더한 의미와 재미가 있을까요? 아마 그렇다면, 이것이 너와 나의 이야기라는 것, 아닐까요. 우리 모두는, 때론 기기묘묘한 특성까지 보이는 기본 입자들로 구성되어 있으니까요!