| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | ||||||
| 2 | 3 | 4 | 5 | 6 | 7 | 8 |
| 9 | 10 | 11 | 12 | 13 | 14 | 15 |
| 16 | 17 | 18 | 19 | 20 | 21 | 22 |
| 23 | 24 | 25 | 26 | 27 | 28 | 29 |
| 30 |
- contrasts can be applied only to factors with 2 or more levels
- 분류
- 이상치
- 워홀
- 선형성
- R
- 이변량 분석
- KNNImputer
- cook's distance
- 엑셀
- 전처리
- 예측
- 회귀분석
- sql
- 회귀모형
- disgusting
- 등분산성
- VIF
- 오류
- 기본가정
- 코딩테스트
- 다중공선성
- by oneself
- 등분산검정
- 정규성
- 기술통계분석
- 언어분석
- 자기상관
- 디시전트리
- post man
- Today
- Total
목록전체 글 (35)
excelsu의 공부 기록 블로그
tendency 경향, 성향 enterprise 기업, 산업 unincorporate 비법인의 corporate 기업의 contain 들어있다, 억누르다 establishments 시설, 설립 eliminating 제거의 operation 작동 non-observed activities 비상식적행동 assume 추정하다 comperhensive 종합적 approximate 비슷하다 significantly 상당히 situated 위치해있는 principal 주요한 inferences 추론 carried out 실행된 deriv 파생시키다 comprise 구성하다 restrictions 제한사항 therefore 그러므로 aggregates 합계, 집계 ideal 이상적인 engage 사로잡다,고용하다 p..
연속형 변수끼리 관계를 볼때는 피어슨 상관관계 범주형 변수끼리 관계를 볼때는 카이제곱 검정 범주형 변수에 대해서 연속형 변수를 분석하고 싶을 때는 t-test,분산분석 연속형 변수에 대해서 범주형 변수를 분석하고 싶을 때는 정확한 분석 방법은 아니지만 로지스틱 분석의 p-value값을 확인한다.
2022.7.9에 오픽 시험을 쳤다. 시험 준비?는 오픽노잼 IM시리즈를 봤는데 이마저도 다 보진 않고 8~9화쯤 까지밖에 안봤던거같다. https://www.youtube.com/watch?v=Urq4VO63X24&list=PL9Ieg7fw1BJKxNwPU3G2hdpM75nGIwyAB 시험을 되게 급하게 봤는데 사실 2020년쯤 오픽공부를 하고 시험을 계속 미루고 미루다보니 결국 안치게 됐었다. 그래서 이번엔 공부를 많이 못하더라도 경험삼아 시험한번 쳐보자는 마음이었다. 실제로 오픽공부는 거의 하지못했다. 시험치고 나와서도 망한거같으니 다음시험을 준비하자고 생각할정도였는데 뜬금없이 IH가 나왔다. 어떻게 이 점수가 나왔는지 생각해보고 공유해보기 위해 작성한다. 토익점수는 적기에 민망할 정도로 형편없는 ..
동물 타입별로 몇마리가 있는지 확인하는 sql문을 작성하면 된다. 이때 고양이를 먼저 출력하도록 해야한다. --count(*)으로 각 데이터 카운트 SELECT animal_type, count(*) FROM animal_ins --그룹바이 문으로 동물타입 별로 묶어서 계산하게 해준다 GROUP BY animal_type --동물타입별로 정렬하여 dog 보다 cat이 먼저 나오도록 지정한다. --animal_type이라고 작성하지않고 1이라고 작성해도 첫열에따라 정렬해주기때문에 1으로 적어도 된다. ORDER BY animal_tyep --고양이와 강아지를 지정하고 싶다면 where 절에 animal_type='cat' or animal_type='dog'를 써주면 된다.
나간 기록 animal_outs는 있지만, 들어온 기록 animal_ins의 데이터가 없어진상황 animal_outs의 연결되지 않은 데이터를 출력하는 문제이다. --테이블명.컬럼명 으로 불러옴 SELECT animal_outs.ANIMAL_ID,animal_outs.NAME --FROM 테이블1 LEFT OUTER JOIN 테이블2 ON 기본키 외래키 연결 --LEFT RIGHT 조인이 헷갈릴때는 JOIN을 기준으로 왼쪽을 가져오면 테이블1 오른쪽이면 테이블2 --animal_outs의 정보를 가져와야하기때문에 LEFT FROM animal_outs LEFT OUTER JOIN animal_ins ON animal_outs.animal_id=animal_ins.animal_id --ins의 값이 없는 ..
데이터의 이상치 판단에 있어 일반적인 데이터의 경향에 벗어남 정도를 판단할 근거를 찾는 것은 매우 중요하다. 그러나 완전히 정의되어 있는 기준은 없으며 오히려 수치의 관계보다는 그 자료의 도메인 지식과 관련된 종합적 판단이 우선되어야 한다. 일반적인 기준에서 데이터의 이상치 유무와 그에 대한 적절한 조정은 그 의미를 먼저 고려하여 조정하여야 한다. 이러한 이상치를 판단하는 일반적인 기준으론 박스플롯을 계산하는 Q1 - 1.5*IQR or Q3 + 1.5*IQR로 판단을 하거나 표준화된 잔차의 절대값이 3이상인 경우 이상값이라고 판단 되어지며 영향점을 측정하는 도구로 여러 가지가 있는데 그 중에서 cook’s D 값이 1보다 큰경우나 DFFIT의 절대값이 2보다 큰경우 또 다른 값에 비해서 2배 이상 클 ..
CV(coefficient of variation)=변동계수=표준편차/평균 낮을수록 변동값이적어서 평균과 비슷한값을볼수있다.(안정적인 데이터이다.) 표준편차를 비교할 때 사용할 수 있다.(상대적인차이를 동일한 평균의 값으로 비교해볼 수 있다.)