공익데이터실험실 가을스프린트 회고



연사: 클루KLOU (뉴스타파 데이터분석팀)


데이터 액티비즘이란, 데이터를 수집하고 분석하여 이를 통해 정치적인 목적을 달성하려는 활동이라고 할 수 있습니다. 이 데이터 액티비즘과 관련하여 공익데이터 실험실 가을스프린트에서 진행된 네 개의 프로젝트들은 아주 의미 있는 사례입니다. 이 프로젝트들의 진행과정과 결과를 평가하면서 각각의 강점과 한계, 그리고 함의들을 짚어보고자 합니다. 또한 앞으로도 진행될 공익데이터 실험실에 대해서도 일정한 교훈과 제언을 제시해보고자 합니다.



공익데이터 실험실 가을 스프린트


스몰빅 팀의 <국내 장애아동의 차별 없는 놀 권리 증진을 위한 그린 북(Green Book)> 프로젝트

스몰빅 팀의 경우 우선 멤버들 중에 시민단체 활동가들이 많았기에, 팀원들이 활동 경험이 있다는 게 강점이었습니다. 반면 다들 데이터를 다뤄본 경험은 부족한 상태였습니다. 그렇기에 실제로 스몰빅 팀은 프로젝트 과정에서 지속적으로 빠띠나 자문회의에 데이터 시각화와 관련된 기술적 도움을 많이 요구했습니다. 하지만 기술적인 것보다 더 근본적인 부분이 프로젝트의 발목을 잡았습니다.

스몰빅 팀은 자원봉사자 그룹을 조직하여 놀이시설들의 현장조사를 통해 데이터를 수집했습니다. 놀이시설들을 평가할 지표를 설정하고 해당 지표를 통해 시설들의 등급을 분류해 시민들에게 정보를 제공하고자 했습니다. 그러나 문제는 애초에 장애 친화적인 시설들이 거의 전무하다는 점이었습니다. 즉, “괜찮은 시설이 어디에 있는지” 정보를 제공하려던 초기의 목적과 달리, “좋은 시설이 한 곳도 없다”는 메시지가 프로젝트의 결론이 되어버린 것이죠. 핵심 메시지가 데이터 바깥에 위치하게 된 상황이었습니다.

그럼에도 현장조사를 통해 수집한 데이터들을 맵핑 형태로 시각화하여 공개했습니다. 또 노션 페이지에 그동안 조사했던 이상적인 놀이터의 모습을 담아내 소개하고자 했습니다. 그러면서 이슈레이징을 통해 강서구의 장애 친화적이지 못한 놀이시설들을 개선하려는 노력도 진행했습니다. 그 결과 강서구청은 내년 1월부터 장애아동도 이용 가능한 놀이시설 조성을 위한 사업들을 추진할 예정이라고 합니다. 이러한 성과는 스몰빅 팀원들이 활동가로서의 경험이 있었기 때문에 만들어낼 수 있었던 것으로 보입니다.

처음에는 스몰빅 팀의 프로젝트가 순항할 것으로 기대됐습니다. 무엇보다 프로젝트의 핵심 질문이 뚜렷했기에 장애아동들이 이용할 수 있는 놀이시설이라는 대상을 분명히 설정할 수 있었기 때문입니다. 또한 프로젝트의 문제의식이 사회적 공감대가 높아 사회적으로 지지받을 수 있는 이슈였습니다. 비록 스몰빅 팀은 데이터에 대한 지식과 기술이 부족하긴 했지만, 자문회의를 통해 부족한 부분을 어느 정도 메울 수 있었습니다. 이는 공익데이터 실험실의 앞으로의 운영과 관련해서도 함의가 있는 대목일 것입니다. 문제 해결의 의지가 있고 분명하게 문제를 설정한다면, 데이터와 관련한 지식이 부족한 시민들이라도 충분히 데이터를 통한 액티비즘은 가능합니다. 공익데이터 실험실은 이런 시민들에게 필요한 지식과 기술을 배울 기회들을 제공해 줄 수 있을 것입니다.



스몰빅 팀 프로젝트 결과물


최지 님의 <내가 버린 쓰레기 어디로 갈까> 프로젝트

최지 님의 프로젝트 역시 아주 뚜렷한 질문과 대상을 갖고 있었습니다. 쓰레기 처리 과정에 대해 시민들이 접할 수 있는 정보가 부족하고, 그로 인해 시민들의 무지 속에서 계속 사회적 문제가 발생하는 상황에 문제의식의 갖고 있었습니다. 이러한 문제의식으로부터, 쓰레기 처리 과정과 규모들에 대한 데이터를 수집해 이를 시각화하여 시민들에게 보여주고 싶다는 것이 프로젝트의 목적이었습니다. 최지 님은 데이터에 대한 지식과 기술은 부족했지만, 프로젝트 이전에도 지속적으로 쓰레기와 관련된 데이터와 정보들을 모아오고 있었습니다. 또한 자문회의를 거치면서 쓰레기 관련 데이터가 굉장히 많다는 것도 여러 번 확인할 수 있었습니다. 따라서 필요한 정보에 대한 구체적인 상이 뚜렷했기에 프로젝트가 순항할 것으로 예상됐습니다.

실제로 정보를 수집하는 과정이 굉장히 빠르게 진행됐습니다. 프로젝트를 시작하고 1~2주만에 쓰레기 수거 및 처리 업체명 등의 정보들을 입수했습니다. 정보공개청구를 통해서 수집한 데이터들의 빈 곳을 메울 수 있는 데이터들을 지자체에 요구했습니다. 이후에는 이렇게 모인 데이터들을 어떻게 처리할 수 있을지가 주요한 고민거리였습니다.

그러던 도중 쓰레기 분야의 전문가와 미팅을 거치면서 데이터에는 드러나지 않았던 문제들을 알게 됐습니다. 무엇보다도 체계적으로 모아진 데이터들이 실제로는 아주 부실하게 관리되고 있었고, 데이터 생성 과정에서 오류가 있었습니다. 결국 프로젝트 초기에 순항할 것이라 기대됐던 것과는 달리, 수집한 데이터들로는 무언가를 보여주기 어렵겠다는 결론에 다다랐습니다.

비록 처음에 구상했던 결과물을 내지는 못하게 되었지만, 최지 님은 현재 보고서를 작성하면서 프로젝트 과정에서 알게 된 쓰레기와 관련한 많은 디테일한 지식들과 시행착오의 과정들을 담아내고자 하고 있습니다. 최지 님은 해당 분야에 대한 지식이 부족하여 데이터의 의미를 제대로 평가할 수가 없었던 상태에서 프로젝트를 시작했기에 시행착오를 거칠 수밖에 없었습니다. 그래서 프로젝트 과정을 통해 얻게 된 지식들을 잘 정리하고 공유하는 것으로도 큰 의미가 있을 것입니다. 다음번에 비슷한 문제의식을 갖고 쓰레기에 대한 실태를 조사하거나 문제를 해결하려는 누군가에게 더 나은 출발선을 제공해줄 수 있을 것으로 기대됩니다.



최지 님 프로젝트 결과물


셰도우핀즈의 <크롤 앤 스티치Crawl and Stitch> 프로젝트

셰도우핀즈는 오랫동안 페미니즘 활동을 해온 그룹입니다. 이들이 처음 구상했던 프로젝트는 아주 범위가 넓고 다양한 이슈에 걸쳐 있었습니다. 그렇기에 셰도우핀즈는 처음에 총 세 가지 안을 제시했습니다. 첫째는 스토킹과 관련된 데이터들을 수집해 정리하고 거기서 빠져 있는 게 무엇인지 파악해서 채워보는 것, 둘째는 대부분 거의 솜방망이 처벌에 그쳐왔던 스토킹 범죄에 대한 재판의 판결문들을 수집하고 분석하는 것, 마지막으로는 스토킹 범죄와 관련된 언론 보도들을 수집하고 분석해보는 것이었습니다. 스토킹 범죄와 관련되어 정리된 통계들이 거의 전무하다시피 한 상황 등의 현실적 제약 조건 속에서, 셰도우핀즈의 <크롤 앤 스티치Crawl and Stitch> 프로젝트는 언론 보도들을 대상으로 설정하게 되었습니다.

셰도우핀즈 팀은 이미 1년 전부터 스토킹 범죄와 관련된 언론보도들을 수집하면서 보도들에 나타난 무네점들을 인식하고 있었습니다. 스토킹 범죄 피해자에 대한 오도된 피해자상을 부과하면서 자극적인 언어들을 사용하거나, 가해자에게 서사를 부과하는 방식으로 범죄를 사소한 일탈로 합리화하는 경우가 다반사였습니다. 셰도우핀즈는 언론보도의 이런 문제들을 하나하나 정리하고 분석한 결과를 시민들에게 공유함으로써, 스토킹 범죄에 대한 인식을 바로잡고, 나아가 국회에서 스토킹 범죄 처벌법을 통과시키는 데 기여하고자 했습니다.

그럼에도 셰도우핀즈는 굉장히 하고 싶은 게 많은 팀이었기에 이를 좁혀나가고 풀어나가는 과정에서 어려움을 많이 겪었습니다. 주어진 기간에 비해 프로젝트의 범위가 넓었기에 상당한 노동이 투여되어야 했습니다. 하지만 놀랍게도 셰도우핀즈 팀은 많은 양의 작업을 실제로 해냈고, 정말 다양하고 많은 데이터들을 확보할 수 있었습니다. 하지만 이후 결과물을 만들어내는 과정에서 수집된 데이터들 중 버려지는 것들이 많았다는 점이 아쉬움으로 남습니다. 처음부터 프로젝트의 목적을 명확하게 설정하지 못했기에 셰도우핀즈 팀의 노고가 결과물에 온전히 반영되지 못했습니다. 애초에 프로젝트의 방향을 좀 더 좁히고, 결과물의 이상적인 형태를 먼저 구상해본 다음 작업을 진행했다면 좀 더 효율적이고 쉬운 작업 과정을 거칠 수 있었을 것 같습니다.

마지막으로 셰도우핀즈 팀의 작업 과정에서 특기할만한 점은 프로젝트 관리 툴의 이점을 톡톡히 보았다는 것입니다. 관리 툴을 사용해 방대한 업무량을 효율적으로 관리하고 협업을 진행할 수 있었습니다. 이는 다음번의 공익데이터 실험실의 팀 단위 프로젝트에서 업무 관리를 위한 툴을 제안해주는 것도 중요할 것이라는 교훈을 남겨줍니다.



셰도우핀즈 팀 프로젝트 결과물


이근희 님의 <이웃을 지켜내는 끼니를 찾아가는 WAF(We are full when we are full)> 프로젝트

이근희 님의 프로젝트는 코로나19로 인해 무료급식소 운영이 중단됨에 따라 가난한 노년층을 위한 무료급식이 끊기는 상황을 데이터로 파악해 보고자 했습니다. 이렇듯 문제의식이 아주 뚜렷하고, 또 이미 기존에 언론 보도를 통해 해당 이슈가 다뤄졌기 때문에 데이터로 현황을 확인하는 어렵지 않은 프로젝트가 될 것이라 판단됐습니다. 데이터 확보는 정보공개청구가 주요한 과정이 될 것이고, 전반적으로 순조롭게 프로젝트가 진행될 수 있을 것으로 보였습니다. 하지만 예상과는 달리 그리 순탄하게 이뤄지지 않았습니다.

정보공개청구 과정은 빠르게 진행됐습니다. 무료급식을 제공하는 시설들에서 언제 무료급식이 중단됐고 재개되었는지, 보통 몇 명의 인원이 무료급식을 제공받는지 등에 대해 정보공개청구를 했습니다. 그러나 정보공개청구 이후 양적인 데이터만으로는 실태를 자세히 파악하기 어려워 질적인 이해가 필요하다고 판단했습니다. 그렇기에 각 무료급식 제공 시설들에 전화를 걸어 좀 더 자세한 맥락을 알아보고자 했습니다.

놀랍게도 여러 번의 전화통화를 통해 알아낸 사실은 실제 무료급식이 중단된 적이 없다는 것이었습니다. 급식 제공 시설들은 음식을 구매하여 전달하는 등 무료급식 시설 운영이 어려운 상황에서 이를 대체 및 보완할 수 있는 방법을 강구해왔던 것입니다. 기존의 언론보도나 양적인 데이터로는 정확히 알 수 없었던 맥락이었습니다. 프로젝트의 출발점에서 전제했던 문제 상황 자체가 실은 발생하지 않은 셈이었습니다.

결국 프로젝트의 방향성이 수정되어야 했습니다. 프로젝트 관리는 체계적으로 진행되었고 수집한 자료들은 잘 정리됐지만, 중간에 예상치 못한 사실을 알게 되면서 방향을 수정하게 됐습니다. 프로젝트를 통해 모아온 데이터들을 기반으로 하여 지자체별로 식량안전 인덱스를 구성해 보여주는 것으로 방향을 재설정했습니다. 각 지역별로 저소득층 노년층의 인구, 해당 인구 대비 경로식당 및 무료급식 시설의 비율 등을 분석하고 시각화하여 웹페이지를 통해 공유하였습니다.

이는 어떤 지자체가 식량위기에 강하고 또 약한지를 평가할 수 있는 데이터라는 점에서 추분한 성과를 남겼다고 할 수 있습니다. 다만 만약 애초에 해당 분야의 전문가와 먼저 접촉하여 상황과 맥락을 파악한 뒤에 프로젝트를 구상했다면, 시행착오의 과정을 줄이고 더 개선된 프로젝트를 진행할 수 있었을 거란 점이 아쉬움으로 남습니다.



이근희 님 프로젝트 결과물



가을 스프린트 프로젝트들의 교훈과 함의

이상 네 개의 프로젝트들에서 발견되는 몇 가지 쟁점들을 언급해 볼 수 있겠습니다. 우선은 데이터를 활용하는 기술 문제입니다. 프로젝트를 진행한 팀들 다수가 데이터에 관한 기술적 지식이 부족한 상태에서 시작했습니다. 하지만 가을 스프린트가 끝나는 시점에서 다시 복기를 해본다면, 기술에 대한 지식이 부족하다는 것이 프로젝트 진행을 불가능하게 만드는 요인은 아니었습니다. 오히려 기술을 잘 안다고 하더라도 프로젝트가 잘 진행되지 않는 경우가 있었습니다. 무엇보다 최선의 최종형태를 먼저 구상해 보는 것이 중요했고, 그것을 구현해내기 위한 최선의 기술을 활용하는 것은 다음 문제였습니다. 한정된 시간과 자원을 바탕으로 가능한 수준으로 기술을 사용하는 것이 중요하다는 점을 확인할 수 있었습니다.

프로젝트 진행 과정에서의 기술이나 도구 등도 중요했습니다. 시간과 역량이 부족한 상황에서 프로젝트 관리 기법을 잘 사용함으로써 효율적으로 업무를 수행할 필요가 있었습니다. 또한 슬랙을 통해 빠띠와 협업하고 정보를 공유하는 것, 좀 더 형식을 다듬더라도 항해일지를 통해 프로젝트 진행 과정을 기록하는 것 등은 유효한 방식이었습니다. 매주 마다 한 번씩 온라인 자문회의를 진행한 것도, 마치 숙제검사를 하듯 프로젝트의 진도를 확인하게 함으로써 각 팀들에게 작업을 강제하게 하는 효과를 냈습니다.

다음으로 도메인 지식의 중요성을 절감할 수 있었습니다. 프로젝트의 문제의식과 관련된 분야에 대한 지식을 파악하는 선행 작업이, 프로젝트의 본격적인 시작 전에 반드시 필요합니다. 그리고 일정하게 쌓인 도메인 지식을 바탕으로, 정말로 중요한 질문을 찾는 게 중요합니다. 핵심을 찌르는 질문, 즉 명확한 방향성을 설정하지 못하면 프로젝트가 계속 표류하게 됩니다.

마지막으로는 스토리텔링의 중요성을 꼽고 싶습니다. 데이터는 프로젝트의 문제의식과 주장에 설득력을 부여하는 수단에 지나지 않습니다. 더 근본적인 것은 날카롭고 유의미한 문제의식과 그 문제의식을 풀어내며 데이터들을 꿰어낼 수 있는 스토리텔링입니다. 스토리텔링이 효과적이고 설득력이 있을 수록 실제 사회문제를 해결하는 데 크게 기여할 수 있습니다. 이와 관련한 사례로 뉴스타파의 ‘가짜 학회’ 보도를 들 수 있습니다. 뉴스타파는 이른바 ‘가짜 학술단체’를 통해 예산을 낭비하고 논문 발표 실적을 축적해왔던 학계의 관행을 보도하였습니다. 우선 학회들을 전수 조사하여서 가짜 학회와 논문 실적 등을 확인하였고, 이러한 데이터를 바탕으로 스토리텔링을 통해 보도의 설득력을 높였습니다. 그 결과 정부의 대대적인 조사를 이끌어내었고, 결과적으로 학계에서 가짜학회에서의 논문발표가 학술적 성과로 활용되는 것을 막는 데 기여할 수 있었습니다.



가짜학회 보도 사례 (뉴스타파)

[아카이브] 공익데이터실험실