Table Talk.
Pick
#
55
2024.05.30
사회문제 해결을 위한 데이터 활용법
오늘의 키워드
#기술/과학
#비영리/활동가
#창작/연구
오늘의 질문
행사 안내
오늘의 키워드
#기술/과학
#비영리/활동가
#창작/연구
오늘의 질문
당신이 생각하는 공공의 공간은 무엇인가요?
Table Talk - Pick 55호 섬네일.

👀 에디터 노트

우리에게 나이팅게일은 ‘백의의 천사’로 알려졌지만, 동시에 유능한 데이터 과학자이기도 합니다. 1850년 크림전쟁에서 나이팅게일은 병사들이 놓여있는 열악하고 비위생적인 환경이 사망과 연관됨을 깨닫고 병사들의 사망 원인을 기록하기 시작합니다. 병원의 입원, 부상, 질병, 사망 데이터를 수집하고, 전투로 인한 부상보다 전염병과 영양실조 등으로 숨지는 환자가 더 많다는 사실을 깨닫습니다. 병원을 청결한 상태로 바꿔야 한다는 주장을 관철하기 위해 ‘로즈 다이어그램(장미 도표)’이라는 멋진 데이터 시각화 자료도 만들죠. 그녀의 뛰어난 ‘데이터 리터러시’ 능력 덕분에 수많은 군사의 목숨을 구할 수 있었습니다.

데이터는 이미 주변 곳곳에 존재합니다. 매일 사용하는 스마트폰, 인터넷 검색, 소셜미디어 활동 등은 모두 데이터를 생성하죠. 그러나 제대로 된 접근과 분석, 활용법이 없다면 그저 ‘잡동사니 정보’에 불과합니다. 이번 호는 임팩트 생태계에서 어떻게 데이터를 활용할 수 있는지 다룹니다. 데이터가 복잡한 사회문제를 해결하는 데 어떤 도움이 될 수 있을까요? 소음과 신호가 섞여 있는 데이터 덩어리에서 어떻게 신호만 발라내고 적용할 수 있을까요?

👉 긴 글은 PDF로도 받아볼 수 있어요.


Pick 코너 로고. 사회혁신 사례와 모델을 소개하는 Table Talk - Pick

📊 임팩트의 근거를 만드는 데이터

우리는 데이터가 공기처럼 흐르는 시대에 살고 있습니다. 신뢰와 투명성이 중요한 가치로 떠오르면서, 객관적인 근거를 제공하는 데이터가 곳곳에서 필수 자원으로 자리 잡고 있습니다. 어떤 문제를 해결하는 일도 마찬가지입니다. 잘못된 결정은 문제를 지속시키는 것을 넘어, 더 큰 문제로 발전시키기 때문이죠. 그런데 데이터 자체로 문제 해결의 근거가 되는 경우는 희소합니다. 데이터에 ‘분석’이라는 일종의 노력이 더해져야 ‘정보’와 ‘지식’이라는 도구를 얻을 수 있고, 이를 활용해 적절한 의사결정을 할 때 비로소 데이터를 근거로 활용할 수 있죠.

하단부터 Data - Information - Knowledge - Wisdom 순서대로 적힌 형태의 피라미드 모형.
DIKW(Data, Information, Knowledge, Wisdom) 피라미드

저와 같은 데이터 분석가(혹은 데이터 과학자)들은 누군가의 수요에 맞춰, 혹은 어떤 문제를 해결하기 위해 데이터를 정보로 가공하는 일을 하고 있습니다. 때로는 분석을 통해 의사결정을 직접 제안하거나 필요한 솔루션을 개발하는 일도 해야 합니다. 그러한 이유에서 (말장난 같을 수 있지만) 데이터 분석가들에게 데이터는 존재의 조건입니다. 지역에 따라 생산하는 농수산물이 다르듯, 데이터를 획득하는 환경이나 획득한 데이터의 종류와 형태에 따라 분석가의 역할과 목표가 달라집니다.

사회문제를 해결하는 임팩트 섹터의 데이터를 분석하는 일도 생태계의 특징을 이해하고 접근해야 합니다. 다행히도 저는 여러 임팩트 지향 조직들(사회적 기업, NGO, ESG 팀 등)과 함께 일하면서 다양한 장벽에 부딪혀 보기도 하고, 그 장벽을 넘어 보기도 하면서 이 땅에서 생성되는 데이터에 대해 조금은 알게 된 것 같습니다. 제가 경험한 사례들을 바탕으로 임팩트 생태계의 특징을 데이터 분석의 관점에서 톺아보고, 여러분이 실무에서 참고하실 수 있는 간단한 인사이트들도 나눠보려 합니다.

먼저 ‘임팩트’라는 용어를 이해하면 데이터가 필요한 다양한 상황과 방법론을 이해하는 것이 수월해집니다. 임팩트는 말 그대로 개인이나 조직이 사회 혹은 환경에 미치는 영향력(impact)으로 정의됩니다. 이 영향력이 항상 긍정적이지 않기 때문에 문제가 발생하고, 의도적이지 않게 기후 위기와 같은 사회적 차원의 큰 문제로 이어지기도 합니다. 궁극적으로는 부정적인 영향력을 잘 관리하고 긍정적인 영향력을 만들어 세상을 지속가능한 방향으로 변화시켜 가는 것이 임팩트라는 용어의 사회적 함의라고 할 수 있습니다.

📌 임팩트에 대한 정의
  • UN : 임팩트는 사람들의 삶의 변화를 의미한다. 여기에는 어린이 성인, 가족 또는 지역사회의 지식, 기술, 행동, 건강 또는 생활 조건의 변화가 포함될 수 있다. 그러한 변화는 직접적이든 간접적이든, 의도했든 의도하지 않았든 개입에 의해 생성되며, 인구 집단에 대한 긍정적이거나 부정적인 장기적 영향을 의미한다. 이러한 영향은 경제적, 사회 문화적, 제도적, 환경적, 기술적 또는 기타 유형일 수 있으며, 긍정적인 영향은 구제적으로 합의된 개발 목표, 국가 개발 목표(헌법에 명시된 인권 포함), 국제 협약 및 조약에 대한 국가 약속과 어느 정도 관련이 있어야 한다.

  • EU : 영향 평가 과정에서 영향이르는 용어는 주어진 정책 옵션/개입의 구현 및 적용으로 인해 발생할 것으로 예상되는 모든 변화를 설명한다. 이러한 영향은 다양한 기관에 걸쳐 발생할 수 있고 다양한 행위자에게 영향을 미치며 다양한 규모(지방, 지역, 국가 및 EU)와 관련될 수 있다. 평가 맥락에서 영향은 특정 개입으로 인해 장기적으로 발생하는 변화를 의미한다.

  • IMP : 임팩트란 조직이 초래한 결과의 변화를 의미한다. 영향은 긍정적일 수도 있고 부정적일 수도 있으며, 의도적이거나 의도하지 않았을 수도 있다. 성과(Outcome)는 어떤 사건이나 행동의 결과로 한 그룹의 사람들이 경험하는 행복의 수준 또는 자연환경의 상태다. 임팩트 관리는 기업이 사람과 지구에 미치는 긍정적인 영향과 부정적인 영향을 파악한 다음 부정적인 영향은 줄이고 긍정적인 영향은 늘리는 프로세스이다.

임팩트 비즈니스, 임팩트 투자 등 임팩트를 접두어로 하는 시장의 용어들은 대부분 긍정적인 임팩트를 만들어 내는 활동들을 일컫습니다. 즉, 대상으로 하는 상황이나 주체의 문제에 어떻게 개입하고, 얼마나 좋은 방향으로 변화시켰는지가 중요한 기준이 되는 행위입니다. 임팩트를 창출하는 과정은 일반적으로 다음과 같은 세 단계로 설명할 수 있습니다.

📌 임팩트 창출 과정과 단계별 핵심 질문
  • 문제 정의 (Define Problem)some text
    • 누구의 문제인가?
    • 진짜 문제가 맞는가?
    • 얼마나 심각한 문제인가?
    • 관련된 이해관계자들은 누구인가?

  • 솔루션 기획과 실행 (Solution Design & Excute)some text
    • 문제가 발생하는 근본적인 원인은 무엇인가?
    • 원인을 해소할 방법은 무엇인가?
    • 변화의 이론은 무엇인가?
    • 방법을 적용하기 위한 투입 자원은 무엇이며 얼마나 되는가?

  • 측정과 관리 (Measurement & Management)some text
    • 측정해야할 지표는 무엇인가?
    • 측정은 어떻게 진행할 것인가?
    • 활동을 통해 만든 결과가 유의한 변화를 만들었는가?
    • 성과를 통해 어떤 의사결정을 할 것인가?(어떻게 활용할 것인가?)

임팩트 창출 과정의 각 단계가 전체 결과에 영향을 미치기 때문에 근거 기반의 의사결정(Evidence-driven decision)이 필요합니다. 데이터 분석은 단계별 핵심 질문들에 답을 내리기 위한 많은 근거를 제공합니다. 데이터를 통해 사회문제 해결을 지원하며 임팩트를 창출하는 과정을 사례와 함께 살펴보도록 하겠습니다.

🛣️ 문제 안에 답이 있고, 데이터 안에 길이 있다.

조카에게 조립식 레고 장난감을 사주면, 조립 중간쯤 이르러 다시 해체하는 모습을 자주 보게 됩니다. 그 모습 뒤에는 밟혀 구겨진 조립 설명도가 있기 마련이죠. 모든 일에는 순서가 있습니다. 그리고 시작을 잘하여 기초를 든든하게 하는 것이 좋은 과정을 만드는 비결입니다. 문제를 정의하는 것은 임팩트를 창출하는 과정의 시작이자 기틀이 됩니다. 문제 해결의 대가인 아인슈타인도 100중의 99의 노력을, 문제를 정의하는 데 들였다고 하죠.

문제정의 과정에서 데이터 분석의 중요한 역할은 생각하고 있는 문제가 진짜 문제가 맞는지, 얼마나 심각한 문제인지에 관해 설명할 수 있는 근거를 마련하는 것입니다.

최근 제가 도와드린 곳은 합주, 공방, 요리 등 여러 가지 활동을 할 수 있는 도서관 공간을 활용해 아동과 청소년의 경험 기회를 넓히는 사업을 하고 있었습니다. 이들은 학교나 거주지와의 거리가 공간 활용과 접근성에 영향을 미치는지를 궁금해했습니다.

누적 이용 일수, 이용 시간, 최다 연속 이용 주 수를 기준으로 충성 이용자와 일반 이용자를 분류하고, 거주지와 학교를 포함한 변수들의 관계를 분석했습니다.  과연 어떤 결과가 나왔을까요? 예상 외로 거리가 먼 것은 이용도에 큰 영향을 미치지 않았습니다. 충성 이용자들은 학교나 집이 멀어도 찾아왔습니다.

‍이후 설문조사를 통해 확인한 결과, 이용도에 가장 큰 영향을 미치는 것은 도서관 운영자, 그리고 그곳에서 만나는 친구들과의 ‘관계’라는 것을 발견했습니다. 이를 토대로 해당 조직은 아이들과의 관계의 중요성을 재확인하고, 이들과의 관계를 더 쉽고 긴밀히 쌓는 방법을 더욱 고민하기 시작했습니다.

이용도 관련 4가지 변수를 차원 축소한 그래프, K-means 알고리즘 활용 열성/비열성 용자 분류 그래프, 분석 결과 해석 그래프.
문제정의 검토를 위한 데이터 분석 과정 개요 (그래프를 자세히 보고 싶다면 👉Click)

🤔 어떤 문제를 먼저 해결해야 할까.

최근 문제의 우선순위를 세우는 일을 의뢰하는 조직도 많습니다. ‘어떤 문제를 먼저 해결해야 하는지’가 주된 고민이죠. 대기업의 지속가능경영 팀에서는 이해관계자 설문조사를 중심으로 기업과 관련된 다양한 이슈 중 중대한 것이 무엇인지를 분석하는 중대성 평가(Materiality Assessment)를 진행합니다. 하지만, 중대성 평가는 설문조사를 진행할 수 있는 재원이나 이해관계자 풀(pool)이 존재하지 않는다면 진행하기 어려운 방법입니다. 특히 시시각각 변화하는 사회문제와 관련 이슈에 발 빠른 대응이 중요한 비영리 조직에서는 이러한 평가에 시의성이 담겨야 합니다.

미디어 빅데이터 분석은 위와 같은 수요를 만족시키는 적합한 방법론입니다. 미디어(ex. 뉴스, SNS)에서 쌓이는 데이터는 사회에 대한 대중의 인식과 깊은 관련이 있죠. 2010년 들어 본격적인 인터넷의 발전과 뉴미디어 시대가 열리면서 사회의 소식이 미디어에 실리고 대중의 인식으로 연결되는 속도가 급격하게 빨라졌습니다. 풍성히 쌓여가는 데이터를 들여다보면 사회문제가 대중의 인식 속에 어떤 구조로 자리 잡는지 알 수 있고, ‘어떤 문제를 가장 심각하게 여기고 있을까’와 같은 질문에 답을 추론할 수 있습니다. 다만, 방대한 빅데이터를 어떻게 수집하며, 텍스트로 이뤄진 데이터를 어떻게 분석하느냐가 관건입니다.


최근 트리플라잇에서 KISTEP과 진행한 ‘인구구조 변화 관련 과학기술정책 어젠다 발굴’ 연구가 대표적인데요. 최근 이슈가 되고 있는 고령화, 저출산 현상과 관련하여 R&D 측면에서 필요한 정책 어젠다를 찾고 준비하는 것이 목적이었습니다. 저는 ‘빅카인즈(BigKinds)’와 크롤링을 통해 수집한 약 40만 건의 텍스트 데이터와 토픽 모델링* 기법을 통해 인구구조 변화 관련 사회적 이슈들을 발굴하고, 각 이슈의 트렌드 특성을 바탕으로 우선순위를 도출하는 역할로 연구에 참여했습니다.

*토픽 모델링 : 문서들의 집합에서 추상적인 주제를 찾아내기 위한 자연어 처리(NLP) 방법론으로, 문서에 포함된 단어의 분포를 토대로 특정 주제를 추론한다.

인구구조를 중대 영역(1사분면), 확산 영역(2사분면), 잠재 영역(3사분면), 만성 영역(4사분면) 으로 분석한 그래프. x축은 연평균 빈도, y축은 연평균 빈도 증가량.
인구구조 변화 관련 이슈 트렌드 분석 결과. 자세한 연구 내용은 여기에서 확인하실 수 있습니다.

토픽 모델링을 통해 추론한 30여 개 이슈 중 과학기술과 연계성이 높은 17개 이슈를 선정한 뒤, 각 이슈가 사회 속에 확산된 정도와 그 속도를 분석했습니다. 이러한 트렌드 정보는 이슈의 우선순위를 선정하는 데 중요한 역할을 합니다. 예를 들어, 현재 사회의 주목도가 높으면서 5년 전부터 빠른 속도로 확산하는 이슈를 먼저 해결해야 하는 이슈로 채택할 수 있습니다(중대 영역). 혹은, 확산 속도는 빠르지만 아직 대중들의 인지도가 낮은 이슈는 특정 사건과 함께 핵심 어젠다가 될 가능성이 높으므로 실시간 모니터링을 담당 부서에 요청할 수 있습니다(확산 영역).

이렇듯 데이터 분석은 제대로 된 문제를 정의하는 일과, 문제와 관련된 이슈를 발굴하고 전략적 우선순위를 선정하는 일 등, 사회문제 해결의 시작점에서 활용될 수 있습니다. 그렇다면, 이렇게 주목된 문제들을 실제로 해결하는 과정에서는 어떤 식으로 의사결정을 지원할까요?

사회문제 해결을 위한 데이터 활용법
사회문제 해결을 위한 데이터 활용법
사회문제 해결을 위한 데이터 활용법
사회문제 해결을 위한 데이터 활용법
사회문제 해결을 위한 데이터 활용법
사회문제 해결을 위한 데이터 활용법
No items found.
(재)행복나눔재단 SIT(Social Innovators Table)팀
서울시 용산구 장문로 60 (동빙고동) 02-333-3963
수신거부 Unsubscribe
URL 복사 완료