IT/빅데이터 분석

빅데이터 전문가 되는 방법 (분석툴 파이썬, R 비교)

모아 2021. 1. 10. 15:01
반응형

#빅데이터 전문가 되는방법 #빅데이터 전문가 #빅데이터 분석 #빅데이터 파이썬 #빅데이터 R

오늘은 빅데이터 전문가가 되기 위해 R, 파이썬, SAS 등 다양한 분석 툴 중 어떤 것을 공부하면 좋을지 정리를 해보겠습니다.

 자신의 맞는 분석툴을 골라 빅데이터 전문가가 될 수 있는 시작을 해보세요

 

빅데이터 분석이란?

4차 산업혁명 열풍 이후, 빅데이터는 각종 산업에서는 축적된 데이터를 얼마나 활용할 수 있는지가 기업 성공의 승패를 좌지우지할 정도로 많은 관심을 일으키고 있습니다.

그래서 요즘은 더더욱 빅데이터 전문가에 대한 관심이 대학교, 직장 여러곳에서 증가하고 있습니다. 

 

저는 빅데이터 관련 석사로 오랫동안 데이터 학문에 대해 공부를 하였는데, 그래서인지 더더욱 이 데이터 과학 분야에 대한 사회의 관심과 활용이 점차 중요해지고 있다는 것을 몸소 체험하고 있는 거 같습니다.

빅데이터 전문가가 되기 위해 아직도 업무를 하면서 노력하고 있습니다.

 

얼마나 커야 빅 데이터라고 할 수 있을까?

이 질문에 답은 없는 거 같습니다.

빅데이터가 무엇인지 정의함에 있어서 데이터의 크기보다 그 데이터를 활용해 얼마나 유의미한 결과를 도출할 수 있는지가 훨씬 중요하다고 생각합니다.

 

과거에는 문맥이 담긴 텍스트 데이터나 사진, 동영상과 같은 비정형적 데이터는 분석이나 처리가 어려웠지만 빅데이터 기술의 발달로 이러한 비정형 데이터들을 분석하는 것이 가능해졌습니다.

   

빅데이터 기술은 인터넷과 컴퓨터 환경의 발달로 엄청난 속도로 성장하고 있는 분야가 되었습니다.

 

그렇기 때문에 제가 입학했을 당시보다 훨씬 많은 대학들이 데이터 과학과 관련된 학과를 개설하였고, 분석 기술이나 방법도 훨씬 고도화되어 정교해지고 있습니다.

 

그렇다면 데이터 과학을 입문하는 자들이 먼저 고민하는 부분이 “어떤 분석 툴을 활용해 공부를 시작할까?” 일것입니다.

제가 학습했던 분야기도 하고, 많은 데이터 분석가들이 활용하는 R과 파이썬에 대해 비교해서 알려드리지만, 제가 드리고 싶은 말은

 

빅데이터 전문가가 되기 위해

무엇이 되었든 하나를 잡고 일단 해봐라!! 입니다.

 

저는 두 가지 분석 프로그램을 사용해봤었고, R을 먼저 접하게 되었습니다.

그래서인지 R 프로그램이 익숙해져서 파이썬보다는 R을 주로 활용했었습니다.

하지만 제 주변에 파이썬으로 먼저 데이터 분석을 공부했던 사람들은 또 그 프로그램 환경에 익숙해 파이썬을 추천해주고 있습니다.

 

무엇이 되었든 한 가지를 선택해 꾸준히 익숙해질 때까지 해보신다면

어느 경지 이상이 된다면 어떤 프로그램이 더 좋다 나쁘다는 의미가 없다는 생각이 듭니다.

 

그렇다면 빅데이터 전문가의 시작! 

R과 파이썬 둘 중 무엇으로 데이터 분석 학습을 시작할 것인가? 

파이썬은 데이터 분석 뿐만 아니라 범용 개발언어이고, R은 데이터분석 전부야를 다룰 수 있지만 특히 통계 쪽으로 특화된 패키지가 많습니다.

파이썬을 활용해 데이터 분석뿐만 아니라, 웹,웹, 앱 개발, 업무자동화업무 자동화, OCR 등 다양한 분야에서 사용되고 있는 것들을 봐왔습니다.

반대로 R 프로그램을 활용해 통계 논문이나, 데이터 분석 시각화 자료 도출 등의 결과물을 내는 사람도 많이 봐왔습니다.

 

그래서 사용자 본인이 R이나 파이썬이냐 선택을 할 때

통계 기초 분석 데이터 분석을 학습하신다면 저는 개인적으로 R을 먼저 해보라고 추천을 드립니다.

저는 개인적으로 R 프로그램이 더 쉬웠습니다.

파이썬은 학습하실 때 터미널, 쉘이라는 단어에서부터 어려움을 느끼며 사용자가 개발자를 전재로 만들어진 언어 같지만R은 그런 거 전혀 모르고 시작한 제가 익히기에 적당하였습니다. 하지만 분석 알고리즘 등의 패키지 수를 보면 python 생태계가 훨씬 큽니다.

이 말은 어렵지만 익히기만 하면 활용할 수 있는 고도화된 방법이 많이 있다는 점이 파이썬의 장점이라고 생각합니다.

 

빅데이터 전문가에게는

파이썬이 요즘 더 인기가 많다?

언어에 대한 인기도는 분석 툴을 고민하는 사람에게 중요한 이슈입니다.

공부를 해보신 분들은 알겠지만, 분명 학습과정에서 어려움을 느끼기 마련일 텐데,, 사용자들이 많다는 점은 구글링이나 패키지 예문 등도 많아 참고할게 많다는 점이 좋은 점입니다..

몇 년 전부터R보다 파이썬을 더 많이 사용한다는 얘기를 들은 적이 있는데 저는 이런 이유가 인공지능 분야의 관심이 많아졌기 때문이라 생각합니다. 파이썬이 딥러닝 분야로는 더 좋다고 합니다.

R을 사용했었다면 파이썬은 금방 배울 수 있나요?

파이썬과 R은 공생관계입니다. 파이썬 패키지 중 pandasR의 기본 자료형인 data.frame을 모방한 패키지이며, R에는 reticulate 패키지가 pythonnative-wrapper 패키지로 동작합니다.

그렇기 때문에 파이썬 패키지 모두를 R에서 사용할 수 있고, 파이썬에서도 마찬가지로 rpy2 패키지로 R을 모두 사용할 수 있습니다.

 

마지막 요약!

파이썬은 범용 개발 언어라는 특성이 있어, 좀 더 일반적인 개발을 함께 할 계획이라면 파이썬을 추천합니다..

(파이썬은 프로그래밍 지식이 더 필요하고, 동일한 분석을 하는 데 더 많은 작업을 수행해야 함)

그리고 데이터를 분석하는데 목적이 있다면 R을 추천드립니다.

반응형