빅 데이터!
빅 데이터(Big data)는 데이터베이스 관리도구로 데이터를 수집, 저장, 관리, 분석하는 것을 넘어서 대량의 데이터로 부터 가치를 추출하고 결과를 분석하는 기술을 의미합니다.
인간이 빅 데이터를 활용하고자 하는 의지는 몇 년에 생겨난 것이 아니라 수천년 또는 수 만년 인간의 역사와 그 결이 같다고 합니다.
예를 들면, 우리나라에서는 '동의보감' 이나 중국의 '주역'은 빅 데이터를 활용하여 우리의 삶의 질을 높이려는 시도라고 보여집니다.
특히 오늘날 자본주의라는 체제에서 자본이 곧 권력으로 주식 시장, 금융 시장 등에 빅 데이터를 활용하려는 움직임은 여러 정보를 통해 알 수 있습니다.
나의 경우도 구글의 웹로그 분석! '애널리틱스'를 어떻게 활용해야 하는가? 하는 고민에서 출발하였습니다.
내가 운영하는 다양한 웹 사이트에 방문자를 더 많이 모시는 것은 나의 비전과 직결되어 있으며, 방문자들이 어떤 정보를 좋아하는지 면밀히 분석해야하는데, 인간이 나는 게으르고 멍청한 구석이 많기 때문에 스스로 신뢰도가 떨어진다고 생각합니다.
그렇게 고민을 하던 중 출발지점을 찾을 수 있었습니다.
무료 통계 프로그램 R
'R'이라는 프로그램은 많은 빅 데이터 분석가들이 추천하는 프로그램이었습니다.
빅 데이터를 분석하는 것은 거창한 통계 프로그램이 아니라고 해도, '엑셀' 이나 계산기로도 못하는 것은 아닙니다.
그러나 만약 처리할 데이터가 많다면 기계적으로 처리가 쉽지 않습니다.
빅 데이터 자료를 기계적으로 처리하려면 '프로그래밍'이 필요하며, 데이터 마이닝을 통해 유용한 정보를 추출하는 것이 필요하게 됩니다.
이런 행위를 'R'이 도와준다고 합니다.
R 프로그램 다운로드
프로그램 설치는 일반적인 프로그램과 비슷하여 'Skip' 하도록 하겠습니다.
'R'을 실행한 화면입니다.
GUI 화면의 '윈도우 cmd' 같은 프로그램이 출력되었습니다.
솔직히 사용하는 방법은 전혀 모릅니다.
그래서 'R의 설치 및 기본 사용법' 이라는 매뉴얼을 링크합니다.
RStudio
R을 설치하니 비주얼이 매우 불편합니다. 그래서 'RStudio'라는 프로그램을 있습니다.
'RStudio'의 출력 화면입니다. 그냥 'R' 보다는 약간 더 매끄러운 느낌입니다.
저는 통계와 데이터 분석 등은 전혀 모르는 문외한입니다. 앞으로 관심을 가지고 배워야하는 학문이자 기술입니다.
다양한 세미나 또는 독학을 해야할 것이라 생각이 듭니다.
아마도 이 포스팅을 보시는 많은 분들도 저의 비슷한 처지가 아닐까 생각합니다.
다행히 저 같은 사람을 위해서 많은 분들이 자료를 제공해주시고 있습니다.
또 유투브를 찾아보니 조금은 도움이 될 정보들이 있었습니다.
세상은 급변하고 있습니다. 시간이 지날 수록 빅 데이터 활용은 더욱 중요한 과제가 될 것이라 생각합니다.
그래서 이제라도 통계부터 밣아가려고 합니다.
마소의 비지니스 분석 도구! Power BI (파워 비아이)를 소개합니다. (0) | 2020.03.28 |
---|---|
📊 마케터라면 꼭 알아야 할 빅데이터 분석 사이트 (6) | 2019.11.03 |
Naver Labs! 네이버 인공신경망 번역기 (0) | 2016.10.19 |
TensorFlow - 기계 지능에 대한 오픈 소스 소프트웨어 라이브러리 (0) | 2016.10.06 |
Google Deepmind! 인공지능 그리고 알파고 (0) | 2016.02.18 |