
-빅데이터(Big Data)
(개념) 대량의 다양한 데이터들의 모음
Volume(규모) : 거대한 규모 (기가->테라바이트)
Variety(종류) : 다양한 종류와 범위 (text, 이미지, 영상...)
Velocity(속도): 빠른 데이터 축적 (SNS글, 센서 데이터..)
=> 거대한 규모의 다양한 데이터를 빠른
-데이터의 유형:정형,비정형,반정형
정형: 구조화된 데이터, 예시) 엑셀, 데이터베이스 테이블
비정형: 비구조화 데이터, 예시)text, 이미지, 동셩상..
반정형: 반구조화(json, xml 규칙은 있지만 완적한 테이블형태 X) 예시) http응답데이터 등
-빅데이터 처리과정
수집 > 저장 > 처리 > 분석 > 시각화 > 활용
수집: 외부 리소스로부터 데이터는 모으는 과정
저장: 정형/비정형 데이터를 시스템에 정의 저장
처리: 데이터 전처리/정제
분석: 다양한 분석방법(R,통계,머신러닝 등)
시각화: 보고서/리포트/그래픽
활용: 영업/예측/추천 등
-빅데이터 활용 사례
유통업: 고객 구매 데이터를 분석해 할인 쿠폰 타겟팅.
의료: 환자 진단 기록을 분석해 질병 예측.
금융: 거래 데이터를 분석해 사기 탐지.
엔터테인먼트: 넷플릭스 영화 추천 시스템.
-R의 특징
1. 통계학자가 만든 언어로 데이터 분석에 특화, 다양한 통계산출이 가능
2. 그래픽 처리 기능이 뛰어나다.(시각화 기능 강력)
3. 다양한 패키지 제공(다른 사람들이 만들어 놓은 기능)
4. 한글에 취약. 윈도우 계정이름, 폴더이름을 한글로 사용하면 오류 발생 가능
5. 사용자 간의 커뮤니티가 발달되어 있다.
6. 오픈소스, 무료 사용 가능
: R은 데이터를 분석하고, 통계 처리와 그래프를 쉽게 만들어주는 무료 도구
-R(vs Python)
R, 파이썬(python) -> 무료
통계분석 소프트웨어(프로그램) -> SAS, SPSS-> 유료
*R: 프로그래밍 언어이나 파이썬에 비해 데이터분석(통계분석)에 특화
*파이선(Python): 프로그래밍 언어로 데이터분석 뿐만 아니라
어플리케이션 개발등 범용적 사용 가능
-R 설치
구글 검색: R
홈페이지: https://www.r-project.org/
한국 다운로드 페이지 검색: ctrl + f -> korea
다운로드 경로
: https://cran.r-project.org/mirrors.html
: https://cran.yu.ac.kr/
> Download R for Windows
> install R for the first time.
> Download R-4.5.1 for Windows (86 megabytes, 64 bit)
* R-4.5.1-win.exe 실행 (resource 옮기기 실행)
(설치언어 한국어, 경로변경없이 그대로 설치)
삭제시: 제어판에서 app 삭제
-R Studio
R을 편하게 사용하기 위한 IDE(통합개발환경) 소프트웨어
IDE(Integrated Development Environment)
: 다양한 언어지원, 프로그래밍 통합개발환경, 코드개발 지원하는 다양한 기능제공
-R Studio 설치
구글 검색: R Studio
홈페이지: https://posit.co/download/rstudio-desktop/
(R 부터 설치해야함)
> 2. install R Studio
: DOWNLOAD RSTUDIO DESKTOP FOR WINDOWS 선택
: RStudio-2025.05.1-513.exe (resource 옮기고 실행)
설정/경로 변경없이 다음/다음 실행
-R Studio UI(User Interface) 설명
구성:
상단메뉴
탭메뉴(Env, His, Conn, Tut)
Console, Teminal
Files, Help ...
1.Script: 스크립트 파일 view, 코드 작성하는 공간
2.Environment:현재 사용중인 데이터 표시
3.Console: 코드 실행결과 표시
4.Files: 작업공간 안의 파일 목록 표시
프로젝트 생성하기(작업공간을 별도 지정), 우측상단 메뉴
> create project from existing directory
스크립트 파일
소스코드를 작성, 재사용 가능(Console 작성시 재사용불가)
* 새파일 생성(+메뉴버튼 or file->new file->R script)
(저장하기) file->save or ctrl+s
(파일이름) day01.R 저장
설정변경
- 패널 위치변경: tools > global options > Pane Layout
source | console
Environ | Files
- 명령어가 길어져서 줄바꿈: tools > global options > Code
[체크]soft-wrap source file
화면에서 자동 줄바꿈 설정(안되있으면 스크롤로 넘겨야함)
- 글씨체 설정: tools > global options > Appearance
- 기본 workspace설정 : tools > global options > General
- 인코딩 설정: tools > global options > Code > Saving
https://link.coupang.com/a/cO29Z4
모두를 위한 R 데이터 분석 입문 - 프로그래밍 언어 | 쿠팡
쿠팡에서 모두를 위한 R 데이터 분석 입문 구매하고 더 많은 혜택을 받으세요! 지금 할인중인 다른 프로그래밍 언어 제품도 바로 쿠팡에서 확인할 수 있습니다.
www.coupang.com
이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다.
'프로그래밍 > R' 카테고리의 다른 글
| R언어, 제어문 (0) | 2025.09.20 |
|---|---|
| R 매트릭스 (matrix, 행렬) (0) | 2025.09.14 |
| R언어 벡터 (0) | 2025.09.09 |
| R 연산자 (1) | 2025.09.08 |
| 컴퓨터 기초, 프로그래밍 기초(변수, 자료형) (0) | 2025.09.07 |