파이썬 핵심 문법 정리
2025. 9. 18. 20:14ㆍ개발/텍스트마이닝과 언어모델
반응형
1. 파이썬의 특징
- 인터프리터 언어: 컴파일 없이 실행.
- 동적 타이핑: 변수 자료형 자동 결정.
- 들여쓰기 기반 문법: 블록 구분.
- main 함수 강제 없음: if __name__ == "__main__": 관례 사용.
- 세미콜론 불필요, 다중 할당, 값 교환 가능.
- Colab/Jupyter에서 셀 단위 실행 및 런타임 리셋으로 메모리 초기화.
2. 변수와 자료형
- 모든 값은 객체(Object), 변수는 참조 역할.
- 기본 자료형: int, float, str, bool.
- 컨테이너 자료형:
- list: 가변, 인덱스로 접근, append, del, sort, slicing.
- tuple: 불변, 읽기 전용, 메모리 효율적.
- dict: {key: value} 구조, 키로 접근.
- set: 중복 없는 집합, 순서 없음, 중복 제거에 효과적.
- 사용자 정의 자료형: class로 생성.
3. 제어 구조
- 조건문: if, elif, else.
- 논리 연산자: and, or, not.
- 반복문:
- for: iterable 순회 (range, list, dict 등).
- while: 조건 기반 반복.
- 반복 제어: break, continue.
- 유용한 함수: enumerate, zip.
- 컴프리헨션:
- 리스트 [x**2 for x in nums if 조건]
- 딕셔너리 {k: v for k, v in ...}
4. 함수
- def로 정의, return으로 값 반환.
- 매개변수:
- 위치 인자, 키워드 인자.
- *args: 튜플로 가변 인자.
- **kwargs: 딕셔너리로 가변 인자.
- 함수 활용: 데이터 가공, 조건 검증 → 리스트 컴프리헨션과 결합 가능.
5. 파일 입출력
- 텍스트 파일:
- with open(filename, mode) → 자동 close.
- read, readlines, write.
- CSV 파일:
- csv.reader: 각 행을 리스트로 읽음.
- csv.writer: 행 단위 쓰기.
- 대용량 처리 시 스트리밍 가능 (메모리 절약).
- 실습 예제: Titanic 데이터 → 생존자·사망자 수, 티켓 등급별 통계.
👉 핵심은 파이썬의 기본 문법(자료형, 제어 구조, 함수, 파일 처리)을 빠르게 복습하고, 텍스트마이닝 실습에 바로 활용할 수 있도록 하는 것.
반응형
'개발 > 텍스트마이닝과 언어모델' 카테고리의 다른 글
텍스트 데이터의 이해와 전처리 (1) | 2025.09.18 |
---|