데이터가 삶의 전반에 점점 더 많은 영향을 미치고 있다. 데이터 가치가 넓고 중요해 짐에 따라 데이터 문해력은 이제 선택이 아니라 필수적인 영역으로 자리잡고 있다. 데이터 문해력에 대해 알아보자 !
데이터란 무엇인가?
1. 데이터는 우리 생활 모든 곳에 존재한다.
1) 데이터란 우리가 일상에서 관찰할 수 있는 모든것을 말한다 ex)온도, 풍량, 소리, 움직임 등등..
- 이런 데이터들을 바탕으로 우리가 사회나 기업에서 의미있는 인사이트들을 도출할 수 있다.
- 오프라인에서 얻은 데이터들을 온라인으로 데이터화 하는 것을 Digitization 이라고 한다.
2. 데이터의 크기 변화
1) 웹과 모바일 폰의 상용량 증가에 따라 데이터의 크기가 폭발적으로 성장하고 있다.
- 그에 때라 큰 데이터를 처리할 수 있는 기술들도 빠르게 성장하고 있다. (분산처리 시스템 등)
데이터 팀의 미션과 발전 단계
1. 데이터 조직의 최종적인 목표
1) 신뢰할 수 있는 데이터를 바탕으로 부가 가치를 생성하는 것이다.
- 데이터를 잘 못 사용하면 오히려 잘 못된 결과를 도출하거나 개인정보를 유출하는 등 안 좋은 영향을 줄 수 있기 때문에 신뢰할 수 있는 데이터를 바탕으로 신중하게 사용되어야 한다.
2. 데이터 조직이 하는 일
- Decision Science(데이터 분석가)
1) 고품질 데이터를 기반으로 의사 결정권자에게 입력 제공
2) 데이터를 고려한 결정(data informed decisions), 데이터 기반 결정(data driven deciseions) 등의 방법이 있다
- 데이터는 과거에 머물러 있는 지표이기 때문에 의사결정 등을 위해 데이터를 활용할 때는 data informed decisions 방법을 추천한다.
3) 데이터 기반 지표 정의, 대시보드와 리포트 생성 등의 방법들을 통해 데이터를 의사결정하는데에 활용한다.
- Prodct Science(데이터 과학자)
1) 고품질 데이터를 기반으로 사용자 서비스 경험 개선 혹은 프로세스 최적화
- ex) 개인화를 바탕으로 한 추천과 검색 기능 제공, 스마트팩토리의 경우 공정과정 최적화 등
3. 데이터 팀의 발전
- 데이터 인프라 구축
1) 데이터 인프라 구축은 데이터 엔지니어의 역할이다
- ETL(Extrac/Transform/Load) 라는 방법을 활용하여 회사 내/외에 있는 데이터들로 데이터 인프라를 구축한다.
2) 처리하는 데이터의 크기가 커지면 빅데이터 처리 기술 습득이 필요하다 (spark, hadoop 등)
3) 데이터 인프라 로는 데이터 레이크(Data Lake), 데이터 웨어하우스(Data Warehouse) 등이 있다.
- 데이터 분석 수행
1) 데이터 분석은 ETL된 데이터를 조합하여 새로운 정보 생성(ELT), 좋은 지표 정의, 대시보드 생성/ 관리. 데이터 기반 리포트 작성 등의 일을 말한다.
- 데이터 과학 적용
1) 데이터 엔지니어가 구축해 놓은 데이터 인프라를 토대로 머신러닝 모델을 만들어 사용자 경험 개선, 스마트 펙토리 최적화 등화 같은 업무를 수행
클라우드란 무엇인가?
클라우드란 컴퓨팅 자원(하드웨어, 소프트웨어)을 네트웍을 통해 서비스 형태로 사용하는 것 이다.
클라우드의 장점
1) 초기 투자 비용이 크게 줄어든다
2) 리소스 준비를 위한 대기시간이 대폭 감소한다
3) 노를 리소스 제거로 비용을 감소시길 수 있다
4) 글로벌 확장에 용이하다
데이터 문해력의 정의와 중요성
1. 데이터 문해력이란 ?
1) 보통 문해력이란 글을 읽고 쓰는 능력을 말한다. 데이터 문해력은 데이터를 이해하고 활용할 수 있는 능력을 말한다.
- 기업 도메인과 성숙도에 따라 굉장히 다양한 수준이 존재한다.
2) 데이터 기반 의사 결정, 데이터 기반 제품 개선, 데이터 기반 생산성 증대 등의 능력을 말한다고 볼 수도 있다.