44개 중앙부처의 데이터를 관리하는 정부통합전산센터와 민간전문가들과 함께 우리나라 행정에 빅데이터가 어떻게 적용되고 활용되고 있으며 좀 더 발전할 수 있는 방향은 무엇인지 함께 머리를 맞대었다.
지방자치_ 사실 일반인들은 정부통합전산센터가 어떤 곳인지 잘 모르는 것 같은데요. 간단한 소개를 부탁드립니다.
조소연(정부통합전산센터 운영기획관)_ 정부통합전산센터는 44개 중앙부처 데이터를 8000개의 서버에 집적화해 통합·관리하는 곳으로 한 해 유지비만 1000억 원을 사용합니다. 개별부처가 별도로 서버를 운영하는 것에 비해 규모의 경제가 발생해 예산도 절감되고, 클라우드 컴퓨팅 등 시대 조류에 발 빠르게 대응할 수 있습니다. 작년 5월 빅데이터과도 신설해 국가와 지자체에 빅데이터 개념을 보급하고 교육하며 공무원들이 직접활용할 수 있는 틀인 빅데이터 분석 공통 플랫폼인 혜안(insight.go.kr) 제공했습니다.
지방자치_ 그렇군요. 빅데이터, 우리 일상에는 얼마나 접목돼 활용되고 있는지 궁금합니다.
김광순((주)디멘드 대표)_ 민간에서는 헬스케어 분야에 많이 활용되고 있습니다. 건강 관련 데이터가 많으면건강을 더 잘 관리할 수 있는데, 그 분야가 활발히 발전했습니다.
김이식(KT 플랫폼사업기획실 상무)_ 취업에 관심 있는 대학생이나 청년들은 빅데이터가 산업 전반의 대세가되고 있는 것을 빠르고 느끼고 있습니다.
최광식(인천광역시 정보통신보안담당관 빅데이터 팀장)_인천시는 작년 1월 빅데이터팀이 생겼는데요. 유명 백화점이나 카드사의 고객맞춤형 서비스가 빅데이터 기반으로 된 것으로 알고 있습니다.
이원석(연세대학교 컴퓨터과학과 교수)_ 초반에는 SNS 데이터를 기반으로 하는 키워드 분석을 빅데이터 분석으로 알았는데, 이제 일반화되었고요. 요새는 상권 분석이나 관광에도 접목합니다. 인공지능이나 사물인터넷도 빅데이터 기반이지만 잘 못 느끼고 있습니다.
김광순_ ‘빅’ 자가 들어가 중압감이 있는데, ‘데이터 기반’이라고 하는 게 맞습니다. 전기 고지서에 보면 전기사용량과 함께 소비패턴을 비교분석해 주는데 그게 빅데이터입니다.
조소연_ 연말 정산이나 기상청 일기예보도 빅데이터 분석 제공서비스입니다. 마케팅 분야에 많이 활용되는데정부나 지자체 정책 수립에도 적용돼 의미 있는 결과를 도출합니다.
정부만(한국정보화진흥원 정부3.0지원본부장)_ 빅데이터는 우리 생활 속에 내실화돼 있는데, 민간에서는 개인화·맞춤형 서비스로, 공공에서는 생활밀착·생활체감형으로 관광이나 보건의료 서비스에 많이 활용됩니다.과학적 의사결정 서비스를 제공하는 게 중요한 이슈입니다.
김광순_ 빅데이터는 획기적으로 패러다임을 바꾸는 과정입니다. 경험이나 전문가에 의존해 의사결정을 하는것에서 데이터 기반, 즉 사실(Fact) 기반 의사결정으로 변하는 것이죠.
조소연_ 올해 ‘알파고’가 빅데이터의 가장 큰 이슈였는데요. 30만 건의 자료를 기반으로 하는 인공지능이 바둑 천재 이세돌을 누른 빅데이터의 위력을 단적으로 보여준 사례입니다.
지방자치_ 우리나라의 빅데이터 분석이 어느 정도 수준에 올랐는데, 국민들은 좀 덜 체감하고 있는 것 같습니다. 저부터 그런데요. 제가 너무 시대에 뒤떨어진 건가요?(웃음)
김이식_ 우리가 몰랐던 것 중 빅데이터 기반으로 운영되는 게 많은데요. 서울시 심야버스노선이 그렇습니다. 서울시와 KT는 심야버스 노선을 그릴 때 기지국 통계기록을 분석해 가장 사람들이 많이 모이는 곳을 빅데이터로 분석해 최적화된 노선을 그렸습니다.
지방자치_ 공공기관이 빅데이터를 적극 활용해야 할 텐데요. 해외 사례는 없는지요?
이원석_ 세계 최대 유료 동영상 스트리밍 서비스인 넷플릭스(www.netflix.com)는 22억 명의 사용자 클릭 수를 바탕으로 사용자 맞춤형 서비스(캐릭터, 배우 등)를 성공적으로 내놓았어요. 우리나라는 2013년부터 빅데이터 시범사업을 계속 확대했는데, 작년 경기도 아파트 관리비 빅데이터 분석을 표준모델로 정리해 전국에 퍼질 것입니다. 해운대구 등 지자체 단위에서도 시범사업을 하는데, 앞으로 실제 사업도 추진할 것입니다.
조소연_ 서울시나 경기도가 빅데이터를 많이 활용하는데, 미국은 2011년도 오바마 행정부가 과학기술자문회의에서 빅데이터 R&D 이니셔티브 정책을 수립해 연간2억 달러(2000억 원) 정도의 예산을 빅데이터 분석이나활용 등에 배분했습니다. 덕분에 전방위적으로 빅데이터 정책이 확산됐고, 개인정보와 빅데이터 오남용 문제를 거쳐 빅데이터 분석의 사각지대에 있는 사람들에게까지도 기회를 균등하게 제공하도록 정책적 고려를 하게 되었습니다. 미국은 빅데이터가 상당히 진화된 상태인데, 우리는 여전히 개인정보보호문제가 이슈화되고있는 상황입니다.
정부만_ 미국이나 유럽은 안전 분야에서 빅데이터를 많이 활용하고 있습니다. 탈세 방지나 범죄 DNA를 기반으로 범죄 지도를 작성해 범인과 실제 용의자를 잘 매칭해주고 산불이나 산림에도 많이 활용됩니다. 싱가포르는 빅데이터로 국가위험 관리시스템을 구축해 재난이나 테러나 전염병 등을 미리 예측하고 예방하는 쪽으로 많이 활용되고 있습니다.
김광순_ 데이터가 여기저기서 많이 생성된다는 것은 스마트폰과 톨게이트에서 하이패스로 지나는 사람이 많다는 것입니다. 일단 데이터가 많이 생성되고 기술이 좋아지는 게 모든 것의 출발점입니다. 우리 주변에 빅데이터로 활용할 게 무궁무진합니다.
지방자치_ 공공기관에 빅데이터를 적극 활용하면 좋겠네요. 애로사항은 없으신가요?
정부만_ 제일 중요한 게 누가 책임감 있게 빅데이터를 관리할지가 중요한 문제입니다. 데이터를 체계적으로관리하려면 돈이 들 수밖에 없는데, 그 돈을 기업과 공공분야에 잘 배분해줘야 합니다. 빅데이터 관련 법적 근거도 부족하고 똑같은 분석결과를 여러 곳에서 진행하는게 문제입니다. 비슷한 빅데이터 분석시스템은 공유·확산하고 빅데이터 솔루션과 소프트웨어를 잘 개발하며 해당 도메인에 전문 지식과 식견을 갖춘 전문가가많이 필요합니다. 데이터 수집부터 활용까지 전체 라이프 사이클에 맞는 표준화된 플랫폼을 만들어야 합니다.
이원석_ 현재는 자기 데이터만 가지고 자급자족하는 데이터 원시시대인데, 이제 남의 데이터를 사서 쓰는 유통시대로 가야 합니다. 데이터 생태계를 키워 선순환을 시켜야 합니다. 사실 어느 곳이든 전산센터 운영계에가면무슨 데이터가 있는지도 모를 정도로 정돈이 안 돼 있습니다. 표준화도 추진해야 합니다. ‘알파고’의 출연으로 양질의 데이터를 꺼내서 사용하고 기계학습으로 빅데이터가 운영돼 다른 차원의 장이 열렸습니다.
조소연_ 정부나 공공부문에 정보량이 엄청나기 때문에 이를 먼저 개방하는 게 중요합니다. 정부3.0이 정보공유를 강조한 시책이지만 민감한 정보 개방이 잘 이뤄지지 않아요. 이를 독려해 좀 더 빅데이터 활용을 할 수있도록 법적 조치를 추진해 빅데이터 시대 성숙의 조건을 만들어야 합니다. 행정자치부가 준비한 법령과 공공기관민감 정보의 개인 비식별화조치 등을 통해 산업기반에 활용될 수 있고 부가가치를 높이도록 해야 합니다.
지방자치_ 지자체는 사정이 어떤가요?
최광식_ 내부 직원들끼리도 자세한 자료나 내부 문서 공개를 꺼립니다. 빅데이터 업무에 대한 협조가 소극적입니다. 빅데이터는 아무래도 예산을 들여 외부에서 데이터를사와야 하는데, 예산상 어려움이 많습니다. 전문지식을 가진 사람을 꾸준히 양성하고 분석하게 해야 합니다.
김이식_ 빅데이터는 일단 데이터가 있어야 할수 있습니다. 자기 데이터만 가지고는 성과를 내기 어렵습니다.결과물의 수준이 굉장히 낮죠. 데이터 교환으로 수준을 높여야 하는데, 개인정보보호 때문에 잘 안 됩니다. 행정자치부가 발표한 개인정보보호 가이드라인 덕분에 어느 정도 빅데이터 분석을 할 수 있는 기반은 닦았는데요. 가장 큰 애로사항은 양질의 데이터를 구하기 힘들다는 것입니다. 일차적으로 법적으로 안되고 이차적으로 돈 주고 사야 하는 문제입니다.
지방자치_ 지자체끼리라도 공유하고 협업하면 좋은 결과를 얻을 수 있지 않을까요?
최광식_ 공공데이터는 부족한 점이 있습니다. 예를 들어 외부관광객이 유입해 들어오면 어디서 무엇을 하는지 알지 못합니다. 이동통신사나 카드사를 통해 위치와 구입한 물건 데이터를 알고 안내판을 설치하든 관광정책이나 캠페인을 해야 하는데 그러지 못하고 있습니다.
지방자치_ 여러 애로사항이 많은데요. 교수님께서 시원하게 해결점을 좀 제시해주시죠.
이원석_ 올 6월 행정자치부가 노력해주신 게 상당히 중요한 터닝포인트인데요. 아직 좋은 사례는 없습니다. 제가 11월부터 빅데이터 유통 플랫폼 과제에 참여해 빅데이터를 비식별화하고 유통시키는 것을 목표로 하는데요. 개인정보보호법에 어긋나지 않으면서 데이터를 유통시키는 두 마리의 토끼를 잡으려 합니다. 내년 초반이면 결과가 나올 것같습니다.
지방자치_ 이게 결국 지속가능해야 할텐데요. 그동안 용두사미된 게 많지 않습니까? 어떠세요?
조소연_ 일단 모범사례를 만드는 게 중요합니다. 정보 간 칸막이를 없애 다양한 데이터를 결합해 의미 있는 분석이 나오도록 해야 합니다. 개인정보보호법을 어기지 않으면서 부가가치를 얻어낼 수 있는 방법에 대해 컨설팅을 하고 있습니다. 좋은 사례를 만들어 유의미한 결과를 만들어내고, 다른 지자체와 여러 국가기관에도 파급시키겠습니다.
지방자치_ 굉장히 노력을 많이 하시는 것 같은데, 기대를 좀 하겠습니다. ‘구슬이 서 말이라도 꿰어야 보배’인데, 일선 현장에서 어려움을 어떻게 잘 극복하면 좋을지 제안을 부탁드립니다.
김광순_ 빅데이터 표준화가 정말 중요한데요. 특히 건강정보 표준화가 필요합니다. 의료 검사를 하면 데이터가 공유되고 소통돼야 하는데, 그러지 못해 중복검사를 하고 매번 검증을 받아야 합니다. 이제 정부가 드라이브를 걸어 표준화시키고 데이터를 유통·생성하는 구조를 만들어야 합니다.
이원석_ 정보화사회에서는 코딩이나 프로그램 개발이 중요했지만 이제 정보를 이해하고 사용하는 것에 익숙해지는 노력이 더 중요합니다. 모든 분이 코딩을 하고, 분석을 하고, 데이터를 개방할 필요는 없습니다. 인공지능과 IOT시대에는 우리가 만들어놓은 정보시스템 내에서 가공되어 나오는 산출물을 서비스합니다. 자기경험과 데이터 기반의 해석이 합쳐져 최적화된 의사결정을 할 수 있도록 해야 합니다.
지방자치_ 그러려면 공무원들이 빅데이터에 대한 생각의 전환도 필요하겠네요.
최광식_ 지자체끼리 빅데이터 결과물을 공유하고 활용하도록 하는 MOU를 맺어 노력했습니다. 중앙에서도 교육, 업무연찬회, 세미나 등을 통해 빅데이터를 폭넓게 교육하도록 해야 합니다. 혜안 플랫폼은 지자체가 공동으로 사용해 비용도 줄이고 잘 활용하면 좋겠습니다.
이원석_ 교육을 한다면 기존 방식과는 다른 차원이 필요합니다. 인공지능과 IoT시대에는 데이터를 어떻게 교육할지 장기적으로 준비해야 합니다. 시범사업을 넓게 퍼뜨려 일상생활에 들어오게 해야 하고 대상이나 예제를 보고 이해하는 교육을 해야 합니다.
김이식_ 남의 데이터도 활용하는 데이터유통시대가 되면 물 반 고기 반일 정도로 다양한 분석을 할 수 있습니다. 2013년도 서울시와 KT가 심야버스노선을 그릴 때 교통 업무를 통신데이터와 결합해 효과가 날 거라고는 아무도 생각하지 못했습니다. 2014년 조류독감과 구제역이 터졌을 때 농림축산식품부와 세계 최초로 빅데이터를 분석해 감염확산을 막아냈습니다. 이 사례를 UN에서 발표하기도 했는데요. 그동안 조류독감은 학자들의 영역이라고 생각했지만 차량 데이터와 결합해 수십 년동안 못 푼 문제를 풀게 된 것입니다. 앞으로 메르스 등 민감한 전염병을 근본적으로 막을 방법이 빅데이터 분석에 있습니다. 특히 통신사 로밍 데이터를 사용하면 국가 간 이동을 정확히 알 수 있어 위험지역에서 누가 왔는지 정확히 알 수 있습니다. 이 시스템도 복지부와 함께 세계 최초로 만들었습니다. 다양한 데이터가 결합돼 짝을 맺다보니 세계 최초 사례가 다양하게 나오는 것입니다.
정부만_ 지식경제시대, 정보경제시대, 데이터 경제시대가 도래했습니다. 지식과 정보를 많이 가지고 잘 활용하는 사람이 돈을 벌고 유능한 시대입니다. 거버넌스가 반드시 필요합니다. 공무원들도 빅데이터 활용능력에대한 실제적인 교육을 받아야 하고 데이터의 질을 평소에 제대로 잘 갖추고 표준화를 잘해야 합니다. 한의원에 약재를 넣어두는 서랍을 플랫폼이라고 하면 각 약초를 사용하기 편하게 정한 위치에 넣어야지 온갖 약재를 섞어 놓고 좋은 약을 추출하려고 하면 비용도 많이 들고 애로사항도 많습니다. 이런 플랫폼을 잘 만드는 노력을 해나가면 데이터 경제 시대에도 우리나라가 큰 역할을 할 것입니다.
조소연_ 개인적·조직적 차원에서 접근해야 합니다. 개인적 차원에서는 과학적·분석적·계량적·증거중심의 행정 을 해야하고 관행대로 행정을 하지 않아야 합니다. 예를 들어 집단행동이 발생하면 어떤 변수가 영향을 주는지 궁금증과 호기심을 가지고 증거중심행정을 한다면 빅데이터 기반 통계 중심 행정이 자리 잡을 것입니다.이제 패러다임 전환이 필요합니다. 조직적·제도적 차원에서 보면 통계나 빅데이터 전담 직원을 지정해 빅데이터 분석을 조직에 확산하고 빅데이터분석과처럼 한 부서에만 지정해 국한하지 말고 범정부조직의 전반적인 DNA로 승화시키도록 획기적인 조치를 해야 합니다. 정기적인 교육과 일정 수당이나 인센티브를 줘 활성화시키면 좋겠습니다. 또한 빅데이터 경진대회 등을 조직 자체에서 매년 정례화시켜 빅데이터에 대한 관심을활성화시켜야 합니다. 셋째 조직적 차원에서 민·관·학 거버넌스가 중요합니다. 컨퍼런스 등을 만들어 빅데이터에 대한 논의를 활성화시켜 정보공유의 장을 만들고 지원센터와 빅데이터 활용 자문을 할 수 있는 SOC를만들어주면 좋겠습니다.
지방자치_ 이건 대통령 공약으로 내세워야 할 것 같네요.
이원석_ 우리나라는 성숙한 정보사회로 장·단점이 있지만 자만심도 갖고 있는 것 같아요. 데이터 시대는 또 다른 게임의 장입니다. 앞으로 인공지능과 사물인터넷을 생각하면 빅데이터는 선택이 아닌 필수입니다. 개별적으로 잘하는 것도 중요하지만 국가적으로 빅데이터 전략을 어디선가 만들어야 합니다. 민관과 함께 실행에옮겨야 합니다. 민관이 협의해 국가빅데이터 전략 장기 로드맵을 갖고 진행해야 합니다.
김광순_ 이제 힘 있는 사람을 통해 감으로만 돌아갔던 시대에서 과학적 사실을 바탕으로 의사결정을 하는 사회로 큰 변화의 흐름 속에 있습니다.
최광식_ 몇 년 동안 축적된 민원과 관련 데이터를 분석해 시민들이 체감할 수 있는 빅데이터 정책을 추진해나가는데요. 데이터 수집이 굉장히 어려웠습니다. 어떤 시스템과 데이터를 구해야 할지 명확히 해야 하고 어떤 방식으로 활용할지도 생각해야 합니다.
김이식_ 빅데이터 시대가 도래했는데, 새로운 것에 잘 적응해야 할 입장에서 굉장히 잘하고 싶고 스트레스받기도 합니다. 중국 루쉰이 쓴 희망에 관한 시가 우리가 해야 할 일을 보여주는데요. “희망이란 길과 같아서 본래 있다고도 할 수 없고, 없다고도 할 수 없다. 사람들이 다니다보면 생겨나는 것이다”. 빅데이터도 똑같습니다. 빅데이터가 있다고도 할 수 없고 없다고 할 수 없습니다. 사람들이 다니다보면 길처럼 생겨나는 것입니다.한번 길을 가게 되면 그 길을 따라 사람들이 조금씩 길을 넓히고 그 영역이 꽤 커질 것입니다. 조급해하지 말고 이렇게 가다보면 큰 길이 생겨날 것입니다.
정부만_ 주민들이 행복하려면 일단 격차가 없어야 합니다. 격차를 최소화하고 데이터 경제 시대에는 데이터를 많이 활용하는 사람과 그렇지 않은 사람 간의 격차를 염두에 두고 데이터 경제 시대로 꾸려나가면 좋겠습니다. 전 국민이 데이터 활용 역량을 제고하고 잘 갖출 수 있도록 개인과 조직, 기업과 정부의 관점에서 함께고민해야 합니다.
조소연_ 무엇보다 수요자 중심의 행정을 한다는 생각에서 출발해야 합니다. 국민을 위해 어떻게 하면 편리하게 할지 필요성을 느끼게 하는 수요자 중심의 행정과 패러다임 전환이 필요합니다. 정부조직이 현안 과제를중심으로 단기적으로 돼 있어 시계가 좁고 큰 틀로 보지 못합니다. 좀 더 시간을 갖고 기획과제를 연구하듯이외국사례도 연구하고 다양한 경험 데이터를 분석해야 합니다. 무엇보다 행정을 단편적으로 대응하기보다 구조적으로 분석하고 좀 더 새로운 틀과 혁신적인 사고로 접근할 때 빅데이터의 길이 활짝 열릴 것입니다.
지방자치_ 주민 행복을 위한 길을 여러분들이 만들어주시면 가능하다고 생각합니다. 좀 더 적극적인 실행을부탁드리며 마무리하겠습니다. 감사합니다.