2020년 3월 코로나19 대유행으로 인해 전 세계가 봉쇄됐을 때, 미국의 칼리지와 대학은 빠르게 온라인 학습으로 전환했습니다. 대부분의 대학생들은 이미 하이브리드 과정(대면 교육 과정에는 대개 온라인 학습도 포함됨)에 익숙해져 있었지만, 교육자들은 온라인 학습의 장기화가 고등 교육의 질을 떨어뜨리고 등록을 위태롭게 할 것이라는 것을 알고 있었습니다. 행정 관계자들은 학생들이 가능한 한 빨리 캠퍼스로 돌아오기를 원했고, 안전한 대면 학습 환경을 만드는 것을 최우선 과제로 삼았습니다.
미국에서 가장 명성 있는 공립 대학 중 하나인 퍼듀 대학교(Purdue University)는 공학과 컴퓨터 과학 프로그램으로 널리 인정 받고 있습니다. 행정 관계자들은 학내의 기술적 노하우가 효과적인 접촉 추적 시스템을 제공할 수 있다는 것을 발견했습니다.
대학 경영진은 퍼듀 졸업생이자 기관 데이터 분석 및 평가(Institutional Data Analytics + Assessment, 이하 IDA+A)의 수석 데이터 과학자인 이안 피틀라츠(Ian Pytlarz)에게 아이디어를 요청했습니다. IDA+A는 등록부터 학생 유치, 학업 성공, 캠퍼스 운영에 이르기까지 모든 것에 대한 증거 기반 결정을 지원하기 위한 연구와 통계 및 예측 분석을 수행합니다. 피틀라츠는 퍼듀 대학교에 캠퍼스 커뮤니티의 상태에 대한 정확한 시야를 제공하는 분석, 평가, 거버넌스 중심의 데이터 사이언티스트 팀을 이끌고 있습니다.
"우리는 사실상 모든 것에 접근할 수 있습니다."라고 피틀라츠는 말합니다. "우리는 성적, 수업에 누가 누구와 들어와 있는지, 수업 일정, 모든 출입문 출입 기록, 모든 식사 결제, 모든 체육관 결제, 친목회 및 클럽 하우스 기록, 그리고 우리 와이파이 네트워크 내의 모든 무선 거래를 볼 수 있습니다."
정상적인 조건 하에서, 이러한 대량의 데이터는 퍼듀가 수업 일정 작성, 식당에서의 식사 제공, 캠퍼스 시설에 대한 접근성 확보, 성적 처리, 그리고 원활한 정보 기술 자원 유지에 이르기까지 대학들이 보통 하는 모든 것을 할 수 있게 해줍니다. 하지만 팬데믹 기간 동안, 퍼듀는 학생들의 안전을 지키기 위해 이 데이터를 사용했습니다.
대학이 팬데믹 초기에 문을 닫았을 때 피틀라츠와 그의 데이터 사이언티스트 팀은 바빴습니다. 피틀라츠는 "나는 상황이 심각하며, 우리가 무언가 큰 일을 해내지 않으면 엉망이 될 것이라는 사실을 알고 있었습니다."라고 말합니다. 학교가 장기적인 폐쇄를 피하기로 결정한 상황에서, 피틀라츠는 문제를 해결할 유일한 방법이 대담하고 창의적인 해결책임을 알고 있었습니다. "우리가 문을 닫았을 때, 우리는 세계에서 가장 정교한 디지털 접촉 추적 시스템 중 하나가 될 것을 개발하기 시작했습니다."
이러한 이질적이고 단절된 데이터 소스를 학생 행동 및 연락 패턴에 대한 포괄적인 동의 기반 맵으로 변환하기 위해 피틀라츠는 수백만 개의 데이터 포인트 간의 관계를 밝힐 수 있는 솔루션이 필요했습니다. "저는 누가 누구와 어디서 시간을 보냈는지 이해하고 바이러스 감염이 발생할 수 있는 지점을 정확하게 예측함으로써 위험을 완화할 수 있다는 것을 알았습니다." 하지만 이런 관계를 맺는 것은 쉽지 않았습니다. 이렇게 많은 종류의 데이터를 분석하려면 산업적인 강력한 솔루션이 필요했습니다.
피틀라츠는 대학의 다른 운영 프로젝트에 사용되는 대량 병렬 처리(MPP) 데이터베이스인 VMware 그린플럼(Greenplum)을 잘 알고 있었습니다. 연락처 추적 시스템을 만들기 위해 이 솔루션을 기반으로 구축하는 것은 합리적이었습니다. 그는 "우리는 이미 VMware 그린플럼을 대학에서 모든 종류의 데이터에 대한 그레이박스(gray box)로 사용하고 있었습니다."라며, "모든 무선 액세스 포인트 로그를 통해 학생들이 오랫동안 함께 있는 장소와 시간을 확인할 수 있는 솔루션을 만들 수 있기 때문에 나는 이것을 연락처 추적 시스템의 기반으로 사용할 수 있다는 것을 알고 있었습니다. 이는 임원 및 의료진이 원하는 모든 데이터에 접근할 수 있음을 의미합니다."라고 말했습니다.
피틀라츠는 그린플럼을 이용해 서버 클러스터가 단일 데이터베이스 슈퍼컴퓨터로 작동함으로써 쿼리를 기하급수적으로 빠르게 수행할 수 있는 시스템을 설계했습니다. 퍼듀 대학교는 학생 상호 작용과 접촉에 대한 데이터로 생성된 수백만 개의 데이터 포인트를 수집하고 신속하게 처리함으로써 코로나 양성 반응을 보인 학생을 신속하게 식별하고 격리할 수 있었습니다.
피틀라츠는 "현장 테스트 시설에서 약 1시간마다 들어오는 테스트 결과가 시스템에 들어가면 전체 목록에서 모든 중요한 접촉 데이터를 추출하여 의료 팀에 보냅니다."라고 말합니다. "그리고 이 모든 것은 우리가 양성 반응을 얻은 후 5분 이내에 완료됩니다. 의료진은 항상 누가 위험에 처해 있는지, 누가 검사를 받아야 하는지, 누가 기숙사에서 나와 격리 수용소로 옮겨야 하는지에 대한 매우 최신 정보를 가지고 있었습니다."라고 피틀라츠는 말합니다. "그리고 전체 팬데믹 기간 동안 바로 우리가 그 정보를 제공했습니다. 대학 임원들이 팬데믹 기간 동안 내린 모든 결정은 우리 시스템에서 지속적으로 흘러나오는 데이터를 기반으로 이루어졌습니다. 그리고 우리는 한 번도 대규모 감염이 없었습니다."
접촉 추적 시스템의 개발을 지원하기 위해 정보 사일로를 없애는 것은 다른 사일로 또한 없애는 데 도움이 되었습니다. 피틀라츠는 "팬데믹이 닥쳤을 때, 우리는 이러한 사일로를 없애기 시작했습니다. 왜냐하면 팬데믹이 기관 전체에 상당한 의지를 불러일으켰기 때문입니다."라고 말합니다. 캠퍼스 전체의 다양한 인원들이 부서와 운영 시스템 사이에 있는 문들을 열도록 지원함으로써, IDA+A는 퍼듀 대학교에서 데이터를 사용할 수 있는 더 많은 방법들을 찾고 대학의 다른 사업 방식들도 개선했습니다.
피틀라츠는 "우리는 현재 에너지 및 시설물 분야와 협력해 발전소 효율성을 개선하고 있습니다."라고 말합니다. "퍼듀 대학교는 자체 발전소를 운영합니다. 우리가 보일러 제조사라고 불리는 데는 이유가 있습니다. 우리는 많은 보일러를 가지고 있습니다." 피틀라츠와 그의 데이터 사이언티스트 팀은 시설물 효율을 분석하기 위해 접촉 추적 시스템을 개발하는 데 사용한 원칙을 활용했습니다. "우리의 연간 시설물 예산은 약 2천만 달러입니다. 만약 우리가 거기서 몇 퍼센트 포인트를 줄일 수 있다면, 절약되는 액수는 상당할 것입니다."라고 그는 말합니다.
그렇다면 전력 효율의 향상이 어떻게 학생들의 삶을 개선할 수 있을까요? 피틀라츠는 "지난 10년 동안 퍼듀 대학교는 2012년 학비로 등록금을 동결했습니다."라고 말합니다. "우리는 학생들이 더 저렴한 학비로 교육을 받고 더 나은 가치를 누릴 수 있도록 매일 일하고 있습니다."
자세한 내용은 퍼듀 대학교의 케이스 스터디를 참조하세요.