Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 다중공선성
- 자기상관
- VIF
- sql
- 기술통계분석
- contrasts can be applied only to factors with 2 or more levels
- 등분산검정
- 선형성
- post man
- 언어분석
- cook's distance
- KNNImputer
- 워홀
- 분류
- 회귀분석
- disgusting
- 예측
- 등분산성
- by oneself
- 정규성
- 기본가정
- 코딩테스트
- 이상치
- 전처리
- 회귀모형
- 엑셀
- 이변량 분석
- R
- 디시전트리
- 오류
Archives
- Today
- Total
목록언어분석 (1)
excelsu의 공부 기록 블로그
Tf-idf 사용 언어 데이터 분석
TF-IDF(단어 빈도-역 문서 빈도, Term Frequency-Inverse Document Frequency) TF-IDF는 단어의 빈도와 역 문서 빈도(DF에 특정 식을 취함)를 사용하여 DTM 내의 각 단어들마다 중요한 정도를 가중치로 주는 방법입니다. 우선 DTM을 만든 후, TF-IDF 가중치를 부여합니다. TF-IDF는 주로 문서의 유사도를 구하는 작업, 검색 시스템에서 검색 결과의 중요도를 정하는 작업, 문서 내에서 특정 단어의 중요도를 구하는 작업 등에 쓰일 수 있습니다. TF-IDF는 TF와 IDF를 곱한 값을 의미합니다. 가상의 음성인식 데이터를 분류해야하는 문제 컬럼 : contents, label import os import numpy as np import pandas as ..
파이썬/언어
2022. 6. 22. 16:01