Python/Python 실습
-
[Python] Feature 순위 매기기 (ANOVA F-검정)Python/Python 실습 2025. 8. 17. 21:10
ANOVA (분산분석) 정의분산을 분석하여, 두 개 이상의 그룹의 평균을 비교하는데 사용되는 방법이다. AVOVA는 그룹 평균 간의 변동량과 그룹 내 변동량을 비교한다. 그룹 간 변동이 그룹 내 변동보다 크면, 그룹 평균이 다를 가능성이 높다는 것을 나타낸다. 예를 들어, 모든 치와와는 가볍고, 모든 세인트 버나드는 무겁다고 한다면, 무게 Feature가 치와와와 세인트 버나드 그룹을 분류하는데 유의미한 차이를 만든다는 것을 의미한다. 결론적으로 ANOVA-F 검정은 각 Feature가 Class 분류에 얼마나 유의미한 차이를 만드는지 통계적으로 측정하는 값이라고 할 수 있다. ANOVA-F 검정 기반 Feature 순위 매기기 예제코드from sklearn.datasets import load_iris..
-
[Python] Decision Tree 구성하기Python/Python 실습 2025. 8. 8. 16:38
Decision Tree 정의Decision Tree (의사결정나무)는 직관적이고, 널리 쓰이는 지도 학습 알고리즘 중 하나다. 데이터를 분류하고 예측하는데 활용할 수 있다. 데이터를 기준 (Feature)로 질문을 계속하면서, 트리 형태로 분기해 나가는 알고리즘이다. 최종적으로 분류나 수치 예측 결과에 도달한다. Decision Tree 개념- Node : 하나의 질문 또는 분기점- Root Node : 맨 상위에 있는 Node, 첫 질문- Leaf Node : 맨 마지막, 자식이 없는 Node- Branch : 질문 결과에 따라 나뉘는 경로- Depth : 질문의 단계수. 너무 깊으면 과적합 위험 Decision Tree 절차- 데이터를 나누는 질문을 선택할 때, 가능한 순수하게 만들기 위해 사용된다..
-
[Python] 파이썬 설치하기, VSCODE 가상 환경 구축Python/Python 실습 2025. 7. 26. 20:30
파이썬 설치하기Windows OS에서 파이썬을 활용하기 위해서는 먼저 Python를 설치해야한다. 먼저 파이썬 공식 사이트 Download Python | Python.org에 접속한다. 이후 파이썬 설치파일을 다운로드 및 실행한다. 저장 경로를 설정하지 않을 경우, AppData 폴더에 파이썬 실행파일이 저장되게 된다. 파이썬은 관리하기 쉬운 경로에 설치하는 것이 낫기 때문에 Custom installation를 통해, 저장 경로를 기억하기 쉬운 곳으로 변경해준다. 또한 계정 권한과 환경 변수 등록도 체크하도록 하자. D드라이브에 Python_venv 폴더를 만들고 해당 경로에 설치했다. VSCODE 파이썬 가상환경 구축 VSCODE를 실행한다. 그리고 New File를 통해 파이썬 파일을 생성한다..
-
[Python] p-value 의미와 사용 방법Python/Python 실습 2024. 10. 9. 14:58
귀무가설 정의통계학에서 가설 검정 (가설 합당성 검증) 할 때 사용한다. 관찰된 데이터가 귀무 가설 (Null hypothesis) 하에서 나타날 확률을 의미한다. 여기서 귀무가설이란, 영가설이라고도 하며, 처음부터 버릴 것을 예상하는 가설이다. 대립가설이란, 귀무가설에 대립되는 가설이다. - 예제: 30대 남자의 평균 몸무게는 20대 남자의 평균 몸무게보다 높을 것이다.- 귀무가설: 30대 남자의 평균 몸무게는 20대 남자의 평균 몸무게보다 같거나 낮다.- 대립가설: 30대 남자의 평균 몸무게는 20대 남자의 평균 몸무게보다 높다. p-value 정의p-value는 "유의 확률"이며, 쉽게 말해서 의미가 있을 확률이다. 그리고 귀무 가설의 기각 (= 버림)를 판단할 때, 활용된다. 만약 p-value가..