전체 글(122)
-
Python 코드로 구현해보는 기초 통계 2. Variation, Standard Deviation
두 집합의 평균이 같으면 각 집합이 가진 원소의 값도 같을까? 아니다. 아래와 같이 각기 다른 원소를 가진 아래의 벡터 A와 B는 mean과 median이 5로 동일하다. 이렇게 평균과 중위수는 집합을 대표할 순 있지만 이 숫자만으로 집합의 다양성을 설명할 수는 없으므로 이를 보완하기 위해 분산(variation)이라는 개념이 존재한다. 분산은 흩어진 정도, 즉 다양성의 정도를 나타내는데, 이 분산이라는 것을 파악하기 위하여 범위, 편차, 분산, 표준편차 개념이 있다.. :) 더 깊게 들어가면 공분산, 백분위수 등등..이 있지만 오늘은 일단 범위, 편차, 분산, 표준 편차를 보는 것으로. Range : 범위, 데이터 중 가장 큰 값과 가장 작은 값의 차이 (but 분산도를 표현하는데에는 한계를 가짐) D..
2022.02.21 -
[R] R에서 CSV파일 불러오는 법 (Mac)
library(ggplot2) ggplot(Regression,aes(x = X , y = y)) + geom_point() + geom_smooth(method = 'lm') + theme_classic() 출처 : wikidocs
2022.02.20 -
Python코드로 구현해보는 기초 통계 1. arithmeric mean, median, mode
정량 자료 데이터셋은 자료가 어디에 많이 모여있는지를 설명하는 3가지의 숫자로 대표하여 표현할 수 있다. 1) 산술 평균(arithmetic mean), 2) 중앙치(median), 3)최빈치(mode) The arithmetic mean is one measure of the central tendency of a sample. * 산술 평균(arithmetic mean) 흔히 말하는 평균(ex. 기말 고사 평균 점수) = 숫자의 총합을 개수로 나눈 것. 극단치(outlier)에 의해 영향을 많이 받는다. ㄴ Outlier? 자료 분석의 적절성을 위협하는 변수값, 통상적으로 표준화된 잔차의 분석에서 개체의 변수값이 0(평균)으로부터 ±3 표준편차밖에 위치하는 사례나, 일반적인 경향에서 벗어나는 사례를..
2022.02.19 -
20210218_SQL 기초 8 (기타 SQL 내장 함수)
* 조건문 IF(수식, 참일때 리턴값, 거짓일때 리턴값) 수식의 참/거짓을 판단하여 정해준 파라미터 반환함 IFNULL(수식1,수식2) 수식1이 NULL이 아니면 수식1을 반환하고, NULL이면 수식2로 반환함 NULLIF(수식1,수식2) 파라미터끼리 같으면 NULL 반환, 파라미터끼리 다르면 수식1 반환 CASE~WHEN~ELSE~END 구문 CASE 이후 작성한 입력값을 WHEN~이후 구문과 일치하는지 판별하여 일치하는 구문의 코드를 실행함. 일치하는 구간이 없으면 ELSE 쪽 자료로 반환. + 구문이 끝나는 시점에 END라는 키워드 작성하며, 컬럼명 지정을 위해 alias를 붙여준다. * 문자열 함수 ASCII(문자) 해당 문자의 아스키 코드로 변환하여 표현 CHAR(숫자) BLOB으로 반환 (해당..
2022.02.18 -
20210218_SQL 기초 8 (SQL로 객체 지향 프로그래밍도 할 수 있을까)
SQL에서도 변수 선언이 가능할까? - 가능합니다. SQL에서도 JAVA나 파이썬처럼 변수를 선언하여 객체 지향 프로그래밍이 가능하며, 변수를 지정할 때는 아래의 문법을 사용한다. SET @변수명 = 값; -- 변수 선언 SELECT @변수명; -- 선언한 변수 호출 SELECT @변수1 + @변수2 -- SELECT 구문을 이용하여 변수끼리 연산 SELECT 구문을 통해 변수와 테이블 데이터를 함께 나열하는 것도 가능하다. 예를 들어 @myVar4라는 변수 값에 '가수의 이름 =>'이라는 값을 넣어주고, 자료 조회 시 @myVar4와 userTbl의 user_name을 조회하면 다음과 같은 결과를 얻을 수 있다. 단, 쿼리문 작성 시 limit 뒤에 변수를 사용하는 것은 불가한데, 이러한 문제는 PRE..
2022.02.18 -
20210217_SQL 기초 7 (JOIN 구문)
고정 불변하는 주민 번호처럼, 컴퓨터 상에서도 변하지 말아야할 값들이 있다. SQL에서 테이블을 만들 때는 이런 변화하지 않아야 하는 값에 PRIMARY KEY를 걸어준다. PRIMARY KEY는 테이블을 새로 만들 때마다 변화하는 값이 아니므로 테이블과 테이블 사이에서 공유되며, 이때 테이블 간 연결되는 PRIMARY KEY(기본키)는 FOREIGN KEY(외래키)라고 부른다. 아래의 코드 블럭에서는 userTbl과 buyTbl이 기본키로 user_id를 공유하며, buyTbl를 만드는 코드에서 먼저 선언된 userTbl의 기본키를 외래키로 선언하여 연결시켜주었다. CREATE TABLE userTbl ( user_id varchar(8) primary key, user_name varchar(10) ..
2022.02.17