본문 바로가기
[3유형] 회귀 분석 [3유형 목차]더보기1. 가설검정① 가설검정② 단일표본검정③ 대응표본검정④ 독립표본검정2. 범주형 데이터 분석① 카이제곱 검정② 적합도 검정③ 독립성 검정3. 회귀 분석① 회귀 분석② 상관관계③ 단순선형회귀④ 다중선형회귀4. 분산분석① 분산 분석② 일원 분산 분석③ 이원 분산 분석1. 회귀분석2. 상관관계① 기본df.corr() # 피어슨df.corr(method = 'spearman') # 스피어맨df.corr(method = 'kendall') # 켄달타우② t검정 (p-val from scipy import statsstats.pearsonr(df['열이름1'], df['열이름2']) # 피어슨stats.spearmanr(df['열이름1'], df['열이름2']) # 스피어맨stats.kendall.. 2024. 11. 28.
[3유형] 범주형 데이터 분석 [3유형 목차]더보기1. 가설검정① 가설검정② 단일표본검정③ 대응표본검정④ 독립표본검정2. 범주형 데이터 분석① 카이제곱 검정② 적합도 검정③ 독립성 검정3. 회귀 분석① 회귀 분석② 상관관계③ 단순선형회귀④ 다중선형회귀4. 분산분석① 분산 분석② 일원 분산 분석③ 이원 분산 분석1. 카이제곱 검정from scipy import stats 2. 적합도 검정 - 관찰도수와 기대도수의 차이① 관찰값과 기대값을 빈도(count)로 변경# 관찰빈도리스트 생성# 기대빈도리스트 생성② 검정scipy.stats.chisquare(관찰빈도리스트, 기대빈도리스트) 3. 독립성 검정 - 두 변수가 서로 독립적인지 확인①-1 (데이터 프레임이 없다면) 데이터 프레임 만들기import pandas as pd# 첫번째 방법ta.. 2024. 11. 27.
[3유형] 가설검정 [3유형 목차]더보기1. 가설검정① 가설검정② 단일표본검정③ 대응표본검정④ 독립표본검정2. 범주형 데이터 분석① 카이제곱 검정② 접합도 검정③ 독립성 검정3. 회귀 분석① 회귀 분석② 상관관계③ 단순선형회귀④ 다중선형회귀4. 분산분석① 분산 분석② 일원 분산 분석③ 이원 분산 분석1. 가설검정from scipy import stats단일표본검정모집단 1개한 그룹예)대응표본검정모집단 2개 (같은 집단)같은 그룹예)독립표본검정모집단 2개서로 다른 그룹예) 2. 단일표본검정① 정규성 검정stats.shapiro(data)# 귀무가설: 정규성을 만족한다② 단일 표본 검정 (정규성 만족할 때)stats.ttest_1samp(data, 기대값) # 양측검정stats.ttest_1samp(data, 기대값, alte.. 2024. 11. 27.
[1유형] 구름 모의 환경 정답 from sklearn.preprocessing import MinMaxScaler mm = MinMaxScaler()df['qsec'] = mm.fit_transform(df[['qsec']])* 2차원 데이터프레임 형태로 작성해야함 print(len(df.loc[df['qsec'] > 0.5])) 2024. 11. 18.
[2유형] 분류 및 회귀 1. 분류ex. 남, 여/ 생존, 사망평가지표: accuracy_score, f1_score, roc_auc_score2. 회귀ex. 가격 / 수치평가지표: RMSE, 결정계 문제풀이 순서1. 데이터 로드 및 확인2. 결측값 또는 라벨인코딩 (문자열을 수치형으로 바꾸는 작업)3. 모델링 및 학습4. 모델의 성능평가5. 테스트 모델 예측6. 테스트 결과 제출 및 확인 2024. 11. 11.
[Database] Insert into select, select into, View, DTL(Data Transactional Language) 1. insert into select - 테이블이 있는 상태에서 다른 테이블의 레코드를 검색해서 집어넣기 - 동일한 스키마를 전제 - 한번에 여러개의 레코드를 넣는 방법 2. select into - 테이블이 없는 상태에서 다른 테이블의 레코드를 검색해서 집어넣기 - MySQL에서는 지원하지 않음 - MySQL: create table as select 사용 3. View - 쉽게 말해서 임시 테이블 - select 쿼리 값을 뷰에 저장하고 일반 테이브로가 동일하게 사용 - 라이프사이클(수명)이 상대적으로 짧음 - 원본데이터가 수정되면 View의 내용은 바뀌게 혹은 바뀌지 않게(default) 설정할 수 있음 - 기본적으로 view는 읽기 전용이지만 업데이트/ 수정/ 추가 가능한 view 존재 4. 트.. 2022. 4. 19.
[Database] DDL 제약조건, DCL(Data Control Language), DML 1. DDL에서의 제약조건 - 제약조건을 지정해서 조건에 맞는 레코드만 입력되도록 하는 것 (1) Null/ Not Null (2) Unique - 같은 값이 있으면 안됨 (ex. 주민번호) (3) PK (기본키) - Not Null + Unique (4) FK (외래키) (5) Check - MySql에서는 8.0ver 부터 가능 (6) Default - 따로 지정하지 않으면 기본 값이 들어감 (7) Auto_Increment - 자동으로 값 증가 - Oracle에는 없음 2. DCL - 권한 부여: grant - 권한 반영: flush - 권한확인: show grant - 권한삭제: revoke 3. DML (1) Group By - 집계함수 - 개별 쿼리가 아닌 그룹별 통계값(count, avg, .. 2022. 4. 19.
[Database] DDL(Data Definition Language)/ Join 1. DDL - Create DB - Drop DB - Backup DB - Create Table - Drop Table - Alter Table 2. 조인 (1) 개념 - 여러 테이블을 합해서 큰 테이블로 만드는 연산 - 테이블이 여러 개로 나눠진 상태에서 원하는 데이터를 찾으려면 테이블을 합쳐서 필요한 데이터 검색 - 조인은 테이블 단위 연산 - 레코드를 합치는 것이 아님 - 표준조인에서는 조인 과정에서 각 테이블 간의 공통 컬럼이 있어야 함 - 공통컬럼을 외래키라고 함 (2) 특징 - 2개 이상의 테이블을 합쳐 큰 테이블을 만드는 데, 이때 외래키와 Nested-loop Join 방식 사용 (기본) - 널 값의 허용 여부에 따라 내부조인(Inner Join)과 외부조인(Outer Join)으로 나.. 2022. 4. 19.
[Database] DML(Data Manupulation Language) 1 1. 비교문(Select) - 같다: = cf) == - 같지 않다: cf) != - > / >= / 2022. 4. 19.