최카피가 운영하는 꿀팁 블로그

빅 데이터!

빅 데이터(Big data)는 데이터베이스 관리도구로 데이터를 수집, 저장, 관리, 분석하는 것을 넘어서 대량의 데이터로 부터 가치를 추출하고 결과를 분석하는 기술을 의미합니다.


인간이 빅 데이터를 활용하고자 하는 의지는 몇 년에 생겨난 것이 아니라 수천년 또는 수 만년 인간의 역사와 그 결이 같다고 합니다.


예를 들면, 우리나라에서는 '동의보감' 이나 중국의 '주역'은 빅 데이터를 활용하여 우리의 삶의 질을 높이려는 시도라고 보여집니다.


특히 오늘날 자본주의라는 체제에서 자본이 곧 권력으로 주식 시장, 금융 시장 등에 빅 데이터를 활용하려는 움직임은 여러 정보를 통해 알 수 있습니다.


나의 경우도 구글의 웹로그 분석! '애널리틱스'를 어떻게 활용해야 하는가? 하는 고민에서 출발하였습니다.


내가 운영하는 다양한 웹 사이트에 방문자를 더 많이 모시는 것은 나의 비전과 직결되어 있으며, 방문자들이 어떤 정보를 좋아하는지 면밀히 분석해야하는데, 인간이 나는 게으르고 멍청한 구석이 많기 때문에 스스로 신뢰도가 떨어진다고 생각합니다.


그렇게 고민을 하던 중 출발지점을 찾을 수 있었습니다.



무료 통계 프로그램 R

'R'이라는 프로그램은 많은 빅 데이터 분석가들이 추천하는 프로그램이었습니다.

빅 데이터를 분석하는 것은 거창한 통계 프로그램이 아니라고 해도, '엑셀' 이나 계산기로도 못하는 것은 아닙니다.

그러나 만약 처리할 데이터가 많다면 기계적으로 처리가 쉽지 않습니다.

빅 데이터 자료를 기계적으로 처리하려면 '프로그래밍'이 필요하며, 데이터 마이닝을 통해 유용한 정보를 추출하는 것이 필요하게 됩니다.

이런 행위를 'R'이 도와준다고 합니다.


R 프로그램 다운로드

윈도우용 R

Os용 R

리눅스용 R


프로그램 설치는 일반적인 프로그램과 비슷하여 'Skip' 하도록 하겠습니다.



'R'을 실행한 화면입니다.

GUI 화면의 '윈도우 cmd' 같은 프로그램이 출력되었습니다.

솔직히 사용하는 방법은 전혀 모릅니다.

그래서 'R의 설치 및 기본 사용법' 이라는 매뉴얼을 링크합니다.

[R의 설치 및 기본 사용법]



RStudio

R을 설치하니 비주얼이 매우 불편합니다. 그래서 'RStudio'라는 프로그램을 있습니다.

[RStudio 다운로드]



'RStudio'의 출력 화면입니다. 그냥 'R' 보다는 약간 더 매끄러운 느낌입니다.


저는 통계와 데이터 분석 등은 전혀 모르는 문외한입니다. 앞으로 관심을 가지고 배워야하는 학문이자 기술입니다.

다양한 세미나 또는 독학을 해야할 것이라 생각이 듭니다.


아마도 이 포스팅을 보시는 많은 분들도 저의 비슷한 처지가 아닐까 생각합니다.

다행히 저 같은 사람을 위해서 많은 분들이 자료를 제공해주시고 있습니다.

'Free eBook on R'

또 유투브를 찾아보니 조금은 도움이 될 정보들이 있었습니다.


세상은 급변하고 있습니다. 시간이 지날 수록 빅 데이터 활용은 더욱 중요한 과제가 될 것이라 생각합니다.


그래서 이제라도 통계부터 밣아가려고 합니다.


사업자 정보 표시
이북스펍 | 최현 | 경기도 고양시 일산서구 | 사업자 등록번호 : 124-46-31530 | TEL : 070-7510-8779 | Mail : lsychh@eBookspub.co.kr | 통신판매신고번호 : 제2012-고양일산서-0250호 | 사이버몰의 이용약관 바로가기

이 글을 공유합시다

facebook twitter googleplus kakaoTalk kakaostory naver band