IT/빅데이터 분석

R을 활용한 빅데이터 분석 (여러값으로 구성된 변수 만들기, 문자 변수 만들기, 주석 생성, 환경 설정)

모아 2021. 3. 14. 20:48
반응형

오늘은 R 스튜디오를 활용하여,

1. 여러값으로 구성된 변수 만들기

2. 문자로 된 변수 만들기

3. 몇가지 꿀팁 R 기능을 소개하겠습니다.

 

지난시간에는 간단한 상수 변수 만들기를 배웠습니다.

moa-study.tistory.com/67

 

[빅데이터 분석가가 되기위한] R을 활용한 빅데이터 분석 (R스크립트 만들기, 간단한 숫자 변수

오늘은 R 스튜디오를 직접 실습하여, 1. 새로운 R스크립트 만들기 2. 간단한 숫자 변수 만들기 3. 몇가지 꿀팁 R 기능을 소개하겠습니다. R스튜디오를 실행하고, 다음과 같은 화면이 나타날것입니

moa-study.tistory.com

 

오늘은 한가지 그릇에 여러 개의 값을 넣는 것을 알려드리겠습니다.

c( ) 함수를 사용할 것인데 여기서 C는 '합치다(combine)'의 앞 글자입니다.

화면에서처럼 var라는 변수명에 1,2,3,4,5 상수 5개를 넣었습니다.

그리고 변수값이 잘 들어갔는지 var 입력 후 ctrl + enter 를 치면 다음과 같이 잘 들어갔음을 확인할 수 있습니다.

이때 값을 직접 1,2,3,4,5 입력하는 경우도 있지만 다음과 같이 입력하는 방법도 있습니다.

이런 경우 1부터 5까지 정수값을 연속으로 생성한다는 뜻 입니다.

다른 방법으로는 seq 함수를 이용할 수 있습니다.

seq() 함수는 '연속(sequence)'의 앞 글자를 딴 함수입니다.

seq 함수를 응용하여 다른 값들도 한번 만들어 보겠습니다.

seq 함수 안에는 by 라는 파라미터를 사용할 수 있는데, 'by=n' 을 사용하면 n 간격으로 값을 생성한다는 뜻 입니다.

다음 예시를 한번 보겠습니다.

seq() 함수에서 1부터 20까지 연속함수를 생성하는데 간격은 3으로 하여 생성한다는 의미입니다.

그리하여, 결과값은 1, 4, 7, 10, 13, 16, 19 가 생성되었습니다.

지금까지의 실습으로 var, var1, var2, var3  총 4개의 그릇을 만들었고, 각각 값들을 넣었습니다.

이제 생성된 변수들끼리 더하거나 빼거나 할 수 있음을 보여드리겠습니다.

첫번째, ex1은 var 와 var1 함수값이 차례대로 더해져 2,4,6,8,10 값을 생성하였고,

빼면 0,0,0,0,0 을 생성하였습니다.

그리고 마지막으로 var1 변수 전체에 3을 더하면 4,5,6,7,8 값이 생성됨을 알 수있습니다.

** 중요 **

만약 var1 + var3 을 하게되면 다음과 같이 에러가 나타납니다.

왜 그럴까요?

var1에는 1,2,3,4,5 총 5개의 값이 있는데, var3에는 1,4,7,10,13,16,19 총 7개의 값이 있습니다.

변수값끼리 더할때는 그 변수의 갯수가 일치하여야 한다는 점 기억하세요!!

 

다음으로는 문자로 된 변수를 생성해 보겠습니다.

상수때처럼 단일 문자도 다음과 같이 생성할 수 있습니다.

이때 문자를 생성할 때는 반드시 " " (큰따옴표)를 입력하고 값을 넣어야 합니다.

넣지 않으면 에러 납니다.

단일 문자를 생성했다면 이번에는 상수때처럼 c( ) 함수를 이용해 여러 문자값을 만들어 보겠습니다.

상수로 이루어진 값들을 변수값에 대한 사칙연산이 적용되었지만 문자로 된 변수는 연산할 수 없다는 점

기억해주세요.

 

마지막으로 오늘 알려드릴 R 스튜디오 꿀팁을 알려드립니다.

바로 '주석' 달기와 '환경설정' 입니다.

코딩으로 업무를 하는 사람들은 가장 먼저 체크하는 부분이 아마 이것 일겁니다.

주석은 한마디로 내가 작성한 코딩값에 대한 부가 설명인데, ctrl + enter를 통해 코딩한 값을 실행시켜도, 

주석처리 된 부분은 실행이 되지 않습니다.

내가 나중에 이 코딩한 부분을 어떤 목적으로 했는지 기록해놓거나, 어떤 의미가 있는지 등등 작성해 놓는것인데 

아마 빅데이터 분석은 여러 사람과 협업을 이루는 과정이 많아서 

주석을 통해 다른 분석자가 알아보고, 소통할 수 있는 중요한 기록이라고 봐도 무방할 것입니다.

주석을 다는 방법은 다음과 같이 샵(#)을 입력한 뒤에 작성하면 됩니다.

 

그리고 환경설정은 상단에 [Tool] -> [global option] 으로 들어갑니다.

다음의 global option 창이 뜨는데 오늘은 글자크기, 테마, 글씨체, 화면 크기 등을 설정할 수 있는 

apperance만 확인해 보겠습니다.

원하는 글자크기 및 테마를 설정하고 apply 를 누르면 적용됩니다.

오늘도 R 스튜디오를 통해 기본적인 분석 기초를 배워봤는데, 눈으로 여러번 보는 것보다 

직접 2-3번 입력해 보는 것이 가장 빠르게 실력이 느는 방법입니다.

 

* 제가 실습하는 교재는 이지스 퍼블리싱 출판사의 'Do it 쉽게 배우는 R 데이터 분석' 

느린생각 출판사의 'R까기 2'를 참고하여 작성하는점 말씀드리며, 초보자분이 따라하기에 훌륭한 교재라고 생각합니다.

 

반응형