학술.논문류

빅데이터의 사례와 프라이버시 침해 위험

甘冥堂 2020. 6. 25. 10:15

2020학년도 1학기 과제물(온라인 제출용)

교과목명 : 정보사회와 디지털문화

 

과 제 명 : 빅데이터의 사례와 빅데이터를 활용함으로써 그를 통해 소비자들이 어떤 편리함을 얻을 수 있었으며, 빅데이터의 활용으로 인해 소비자들의 프라이버시가 침해될 위험성에는 어떤 것이 있는지 분석하시오.

 

목차

1.빅데이터의 사례

2.빅데이터를 활용함으로써 그를 통해 소비자들이 얻는 편리함

3.빅데이터의 활용으로 인해 소비자들의 프라이버시가 침해될 위험성

 

들어가며

 

빅데이터는 기존 데이터베이스 관리도구로 데이터를 수집, 저장, 관리, 분석할 수 있는 역량을 넘어서는 대용량의 데이터 집합 및 이런 데이터로부터 가치를 추출하고 결과를 분석하는 기술을 말한다.

 

빅데이터는 대량의 다양한 정보뿐만 아니라 신속한 정보의 수집 및 처리속도를 갖추며 나아가 데이터 분석을 통해 비즈니스 가치를 찾아내게 된다. 데이터 분석을 했지만 비즈니스적 가치가 없다면 그건 빅데이터라고 할 수 없다.

 

스마트폰과 태블릿, 각종 무선기기가 대세로 떠오르고 있다. 그만큼 많은 정보가 생성되고 있는데, 실제로 전 세계 데이터는 매년 40%이상씩 증가하고 있다. 어마어마한 양의 데이터가 매년 증가하고 있는 것이다. 빅데이터가 발전하면서 현대사회의 변화를 더욱 정확하게 예측하여 효율적으로 관리할 수 있게 되었으며, 개인 구성원마다 맞춤형 정보를 제공, 관리, 분석이 가능함에 따라 과거에 불가능했던 다음과 같은 기술이 실현되고 있다.

 

본론

 

1.빅데이터의 사례

1) 2014년 월드컵과 2016년 올림픽을 준비하는 리우데자네이루는 지능형운영센터(IOC)를 통해 도시 관리와 긴급 대응 시스템을 갖추었다. IBM의 분석 솔루션이 적용된 지능형운영센터에는 교통, 전력, 홍수, 산사태 등의 자연재해와 수자원 등을 통합 관리할 수 있는 체계가 갖추어져 있다. IBM이 제공한 고해상도 날씨 예측 시스템은 날씨와 관련한 방대한 데이터를 분석해 폭우를 48시간 이전에 예측한다.

 

싱가포르는 차량의 기하급수적인 증가로 인한 교통체증을 줄이기 위해 교통량 예측 시스템을 도입하였다. 싱가포르는 이 시스템을 통해 85% 이상의 정확성으로 교통량을 측정하고 있다.

 

2) 20163월 한국에서 있었던 알파고와 이세돌 9단의 바둑 대결은 인간과 인공지능의 대결이었을 뿐만 아니라 인간과 빅데이터의 대결이기도 했다. 알파고는 프로 바둑기사의 기보 3000만 수를 학습한 뒤 이 빅데이터에서 대국 상황에 맞는 패턴을 추출해 내었고, 패턴 가운데에서 승리 확률을 예측하여 최적의 한 수를 선정하는 방식으로 대국을 했던 것으로, 전형적인 빅데이터 활용의 사례였다. 결과적으로 이세돌 9단이 빅데이터에서 찾아볼 수 없을 신수를 두어 이긴 한 판을 제외하고는 알파고가 4승을 거두었다.

 

3)기업은 빅데이터를 기반으로 고객의 행동을 미리 예측해 생산성을 향상시키고 경쟁력을 강화할 수 있다. 미디어 콘텐츠 유통기업인 미국의 넷플릭스(Netflix)는 이용자가 대여한 영화목록을 기반으로 새로운 영화를 추천하는 시스템을 개발했는데, 이것이 넷플릭스의 관객의 증가를 낳아 큰 성과를 거두었다.

 

공공부문에서도 빅데이터를 활용하고 있다. 미국 연방수사국은 유전자데이터를 활용해 단시간에 범인을 검거하는 시스템을 운영하고 있으며, 영국과 오스트레일리아 등에서는 공공부문의 데이터를 공개해 투명한 행정을 지향하고 국민의 알권리를 충족시키며 업무처리에 시간과 자원을 절약하고 있다.

 

4)신한카드의 위성호 사장은 "빅데이터를 활용해 고객 한 분 한 분께 맞춤 솔루션을 제공하며 고객중심의 경영을 하기 위해 노력할 것" 이라며 빅데이터를 회사 경영에 적극 반영하기로 하는 등 빅데이터 활용에 적극적으로 나서고 있다.

또한 삼성카드는 지난달 카드업계에서 처음으로 빅데이터를 활용한 개인별 맞춤형 서비스를 제공한다고 밝혔다. 빅데이터를 기반으로 회원들에게 할인과 포인트 적립 등 맞춤형 혜택을 자동으로 연결해주는 신개념 서비스를 본격적으로 개시할 예정이라고 한다.

 

5)아마존은 다양한 품목을 판매하는 미국의 온라인 쇼핑몰 기업이다. 아마존도 빅데이터 활용의 역사가 깊은데, 소비자들의 패턴을 분석하여 누가, 언제, 어떤 상품을 구입할 것인지 미리 예측하여 소비자가 배송요청을 하기 이전에 미리 배송준비를 할 수 있는 시스템을 개발하였다.

 

6)구글은 접근 할 수있는 모든 웹페이지를 탐색하여 제목과 내용이 얼마나 밀접한 관계를 가지는지 분석한다. 데이터 양이 많을수록 정보의 품질이 좋아진다고 생각하기 때문에 구글 번역은 수억 건의 문장과 번역문을 데이터베이스화 하여 번역시 유사한 문장과 어구를 기존에 축적된 데이터를 바탕으로 추론해 나가는 통계적 기법을 개발하였다.

 

7)이 밖에도 패션브랜드에서는 수요 예측과 매장 별 재고산출, 상품 가격결정, 운송까지 실시간으로 파악하기 위해 빅데이터를 활용하며, 유투브, 넷플릭스, 기업 경영, 마케팅, 기상정보, 보안관리 등 많은 분야에서 빅데이터를 활용하는 사례가 매우 많다.

 

 

2.빅데이터를 활용함으로써 그를 통해 소비자들이 얻는 편리함

 

1)예방의학과: 존 스노우가 빅 데이터를 활용해 콜레라를 퇴치한 이후, 각종 전염병 전파과정의 기본적인 규명방법으로 사용되고 있다.

 

2)검색엔진의 검색어 분포도를 통한 데이터 추출: 특정 사용자가 검색하는 검색어 패턴이나 클릭해서 본 적이 있는 각종 인터넷 광고들의 통계를 내서 정확도 순서로 맞춰 리스트를 출력해 주는데, 이것이 빅 데이터 응용의 기본 개념이다. 유튜브 메인화면을 유저가 그동안 재생했던 영상을 데이터삼아 추천영상을 띄운다거나, 의료로 적용하면 특정 지역에서 감기 또는 감기약 등의 검색어를 사용하는 빈도가 늘어난다고 하면 해당 지역에 감기약의 공급을 늘릴 필요가 있다.

 

3)도시학연구: 다수의 표본을 상대하는 도시학 연구에서도 필수적인 과정이다. 엄청난 숫자의 장소와 인구, 이동 동향 등을 한꺼번에 처리하는 빅데이터 프로세싱과 GIS를 통해 지리상에 나타내기도 한다.

 

4)시내버스 노선 통계: 이전에는 요금함을 일일이 뒤져서 액수 다 세고 그리고 어디서 내리는지도 알 수 없었으나 수도권 통합 요금 도입으로 인해 내릴 때 카드를 찍는 것이 일반화되어 승하차량을 좀 더 간편히 알 수 있게 되어 시내버스 노선을 새로 짤 경우 유용하게 사용될 수 있다.

 

5)심리/동향 분석: SNS 포스팅이나 인터넷 광고 클릭 성향 등을 통한 맞춤형 정보 제공.

 

6)정당 후보의 선거 유세: SNS속 빅 데이터의 분석으로 유권자 개개인의 특성과 성향을 분류하고 이에 따라 마이크로 타기팅이 가능해 진다. 실제로 2012 미국 대선에서 민주당 오바마 당시 후보가 사용했던 선거 전략으로, 1억 건의 빅 데이터 분석을 통해 유권자의 정당 지지 성향, 관심 공약, 투표율 등을 고려하여 약 600종류의 이메일로 선거활동을 한 바 있다.

 

7)인터넷 사기 탐지: 거래 데이터 및 평가도 기준으로 필터링도 가능하다. 남아프리카의 보험사 Santam 사에서는 예측 분석과 위험 세분화 등을 통해 발견한 패턴으로 보험사기를 좀 더 빠르게 적발하고, 보험사기 확률이 낮은 건에 대한 처리 속도를 개선해 고객 만족도 역시 높였다.

 

8)인공지능 구현: 대표적으로 알파고가 있었으며, 블리자드 엔터테인먼트도 자사의 게임 플레이를 취합해 사용함으로써 인공지능 구현 수준이 높다는 평을 받고 있다.

 

9) 그밖에 높은 조회수 이끌어내기. 각종 네트워크 모니터링. 인간 게놈 분석을 통한 맞춤 의학의 실현 등이 있다.

 

3.빅데이터의 활용으로 인해 소비자들의 프라이버시가 침해될 위험성

 

데이터의 양이 지나치게 늘어난 사회에 살다 보니, 당연하게도 빅 데이터의 치명적 약점으로 사생활 침해나 개인정보 유출의 문제가 발생할 수 있다. 게다가 사회가 감당하기 어려울 만큼 데이터가 폭증하고 있는데 이걸 관리할 전문인력이 없다는 것도 문제이다. 데이터를 분석하던 회사가 망해 버리면 그 데이터는 어디로 가느냐도 문제이며. 역으로 다른 곳으로 정보가 흘러들어가 개인을 상세히 분석가능한 정보를 사기업이나 조직이 확보하고 이용할 가능성도 있다.

 

빅 데이터는 많은 데이터를 모으는 것이 우선적이고 이 때문에 많은 개인정보 사용 동의자들이 필요하다. 거대한 기업일수록 더 많은 개인정보를 얻을 수 있고, 이러한 데이터 격차는 줄어들지 않는다.

 

개인 식별이 불가능한 개인정보를 수집하는 것에도 방심하면 안 된다. 여러 기업들에게서 얻은 성별, 나이, 국적, 선호하는 것들 등을 중심으로 특정인을 식별하는 것은 크게 어려운 일은 아니다. 특히 한국은 주민등록번호가 있기에 이런 조금 구멍 난 정보들로 개인을 재구성하는 것에 무리가 없다는 지적을 받고 있다. 게다가 이미 유출된 개인정보가 엄청난 상황이니 기업들이 가진 개인정보가 아니어도 한 사람의 상세한 개인정보를 짜맞추는 것은 쉬운 일이다.

 

CCTV 등 동의하지 않은 정보수집 장치를 통해 개인의 동선 등의 개인정보를 파악할 수도 있고 이에 대한 제약은 미진하다.

 

미국 밥슨대학교 토마스 데이븐포트 교수는 빅데이터의 활용으로 인해 소비자들의 프라이버시가 침해될 위험성에 대해 다음과 같이 말했다. 그는 '세계 3대 경영 전략 애널리스트'라고 불리는 경영계 명사다.

 

"투명성이 중요하다. 정보를 어떻게 활용할 것이고 어떤 정보 갖고 있는지 공개해야 한다고 본다. 그 대가로 뭘 받을 수 있을지 공개해야 한다고 생각한다. 구글의 예를 들면, 트레이드오프를 하기가 상당히 쉽다. 한국에서도 지메일(gmail) 많이 사용하고 있는 것으로 안다. 이런 데이터를 이용해 때론 광고를 보내기도 한다. 이게 좋다고 생각하지는 않지만, 이용자 입장에서 자신의 정보가 어떤 결과를 부르고, 어떻게 사용하는지는 알고 있다. 투명성을 보장하고 대신 소비자가 뭘 얻을 수 있는 지를 명확하게 공개해야 한다고 본다."

 

 

맺으며

 

세계 경제포럼은 2012년 떠오르는 10대 기술 중 그 첫 번째를 빅데이터 기술로 선정했으며 우리나라 지식경제부 R&D 전략기획단은 IT 10대 핵심기술 가운데 하나로 빅데이터를 선정하기도 했다.

팬트랜드 교수는 테이터에 기반을 둔 사회물리학이 주도하는 사회를 운영하면 전염병을 추적 예방하고, 금융위기를 예측해 충격을 완화하고, 천연자원을 지혜롭게 소비할 수 있다며 위험을 피해 신중하게 항해를 계속해 나가는 꿈은 곧 현실이 될 것이라고 말했다.

 

개인의 프라이버시 보호측면에서 분명한 것은 필요에 따라 익명으로 활동하거나 남아 있을 자유의 박탈은 편리의 증대나 경제적 부가가치의 생산으로 보상될 수 있는 문제가 아니라는 것이다. 평소 잘 인식하지 못하지만, 익명으로 숨어 있을 권리는 프라이버시의 문제를 넘어 민주주의의 근간이기도 하다.

따라서 개인정보를 기업의 이윤추구와 정보권력의 통제 욕망에 무방비로 맡기는 것은 현대 산업사회에서 인간의 실존을 뿌리부터 흔드는 재앙이라 할 수 있다

 

이상으로 빅데이터의 사례와 그 편리성, 그리고 프라이버시 노출 위험에 대해 간략히 살펴보았다.

 

 

참고자료

 

1)국립중앙과학관: 빅데이터 과학관

2)다음백과

3)http://blog.naver.com/ridesafe

4)namu.wiki/w/빅 데이터 프로세싱. 나무위키

5)Newsis. 경기도 창조혁신센터에서 열린 2015빅 포럼. 토마스 데이븐포트교수

6)창조적인 사람들은 어떻게 행동하는가 (2015) 펜트랜드 저) 중앙일보 게재.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

'학술.논문류' 카테고리의 다른 글

정보사회와 디지털문화  (0) 2020.06.25
행복에 이르는 지혜  (0) 2020.06.25
세계의 도시 - 서안과 낙양  (0) 2020.06.10
건강과 건강 불평등  (0) 2020.05.10
세계의 도시 - 뉴욕  (0) 2020.05.03